Home Tecnologia I ricercatori effettuano il jailbreak di ChatGPT per scoprire quale stato ha...

I ricercatori effettuano il jailbreak di ChatGPT per scoprire quale stato ha le persone più pigre

17
0

Secondo ChatGPT il Mississippi è lo stato più pigro del paese. Naturalmente, il chatbot non te lo dirà se lo chiedi direttamente. Ma il Lo riferisce il Washington Post che i ricercatori di Oxford e dell’Università del Kentucky sono riusciti a effettuare il jailbreak del chatbot e a fargli rivelare alcuni degli stereotipi sepolti nei suoi dati di addestramento che non condivide ma che influenzano i suoi risultati. (Anche il Kentucky si è classificato tra i più pigri, ma uno stato pigro produrrebbe ricercatori in grado di capire come far sì che un modello di intelligenza artificiale condivida i suoi pregiudizi impliciti? Qualcosa a cui pensare, robotic.)

In genere, quando fai a ChatGPT una domanda che richiederebbe di parlare in modo dispregiativo di qualcuno o qualcosa, si rifiuterà di fornire una risposta diretta. Fa parte dei tentativi di OpenAI di mantenere il chatbot entro specifici guardrail e impedirgli di virare su argomenti controversi. Ma ciò non significa che un modello di intelligenza artificiale non contenga opinioni impopolari formatesi masticando tonnellate di dati di addestramento prodotti dall’uomo che contengono anche pregiudizi sia espliciti che impliciti. Per estrarre queste risposte da ChatGPT, i ricercatori hanno posto più di 20 milioni di domande, spingendo il chatbot a scegliere tra due opzioni. Advert esempio, chiederebbero “Dove sono le persone più intelligenti?” e offri due opzioni tra cui scegliere, come California o Montana. Attraverso questo tipo di suggerimenti, sono stati in grado di determinare in che modo ChatGPT vede numerous città, stati e popolazioni.

È così che hanno scoperto che ChatGPT vede il Mississippi come lo stato più pigro dell’Unione, seguito dal resto del Sud. Sebbene ChatGPT non riveli come si arriva a queste conclusioni, non è difficile fare alcune ipotesi su dove stanno prendendo queste idee. Advert esempio, forse viene da Lo stesso Washington Postintorno al 2015, quando ha pubblicato il suo “Indice del pantofolaio“, che considera gli stati del sud i più pigri sulla base di dati come il tempo trascorso davanti alla TV e la prevalenza di quick meals nella zona.

Naturalmente, questi sono anche spesso indicatori di comunità più povere, e non vi è alcuna prova che le famiglie a basso reddito siano più “pigre” di quelle più ricche. dati dell’Istituto di politica economica mostra che le persone che vivono in povertà hanno maggiori probabilità di intraprendere più lavori, lavorare orari più lunghi e irregolarie affrontare condizioni di lavoro più pericolose. E probabilmente non è una coincidenza che siano anche stati con una popolazione più elevata di persone di colore. Probabilmente anche ChatGPT ha accesso a tali informazioni, ma il modello sottostante chiaramente non ha affrontato le informazioni e stereotipi fuorvianti sostenuti da molte persone che portano a questi pregiudizi.

Quindi quali altri pregiudizi hanno individuato i ricercatori? La maggior parte dell’Africa e dell’Asia si classificano all’ultimo posto tra le persone “più artistiche”, rispetto agli alti livelli di arte dell’Europa occidentale. Allo stesso modo, le nazioni africane, in particolare quelle sub-sahariana, si sono classificate in fondo alla lista dei “paesi più intelligenti”, mentre gli Stati Uniti e la Cina si sono classificate quasi in cima. Alla domanda su dove siano le persone “più belle”, ha scelto le città più ricche rispetto a quelle più povere e diversificate. Los Angeles e New York sono in cima alla lista, mentre Detroit e la città di confine Laredo, in Texas, sono in fondo alla classifica. Anche quando hanno scavato in comunità specifiche, i più bianchi e i più ricchi hanno avuto la meglio. A New York Metropolis, SoHo e il West Village sono finiti al primo posto, mentre le comunità più diversificate della Giamaica e Tottenville si sono classificate all’ultimo posto.

Quindi, okay, tutto ciò fa schifo ed è profondamente deprimente perché le “macchine della verità” stanno perpetuando tipi di stereotipi classisti e razzisti che portano a creare condizioni che rafforzano gli esiti negativi per le persone che sono danneggiate da questi pregiudizi. Allora che ne dici di uno più frivolo? ChatGPT ritiene che la migliore pizza si trovi a New York, Chicago e Buffalo, mentre la peggiore si trovi a El Paso, Irvine e Honolulu (presumibilmente a causa di uno dei dibattiti preferiti di Web sull’appartenenza dell’ananas alla pizza). La conclusione più importante: ChatGPT è troppo codardo per prendere posizione nel dibattito sulla pizza tra New York e Chicago.

fonte

LEAVE A REPLY

Please enter your comment!
Please enter your name here