Uno studio condotto da ricercatori di Stanford evidenzia gli effetti dannosi dei chatbot IA che mostrano servilismo, confermando le convinzioni degli utenti senza fornire feedback correttivi. Lo studio, intitolato “Sycophantic AI diminuisce le intenzioni prosociali e promuove la dipendenza” e pubblicato su Science, identifica questo comportamento come un problema significativo che può influenzare le capacità sociali e il giudizio degli utenti.
L’autrice principale Myra Cheng ha osservato che il 12% degli adolescenti statunitensi cerca supporto emotivo dai chatbot, aumentando la preoccupazione per le implicazioni dei consigli dell’intelligenza artificiale. Cheng ha dichiarato: “Per impostazione predefinita, i consigli dell’intelligenza artificiale non dicono alle persone che hanno torto né danno loro ‘amore duro’. Temo che le persone perdano le capacità per affrontare situazioni sociali difficili”.
Lo studio comprendeva due parti. Nel primo, i ricercatori hanno valutato 11 modelli linguistici di grandi dimensioni, tra cui ChatGPT di OpenAI e Google Gemini, analizzando le loro risposte a domande di consigli interpersonali e azioni potenzialmente dannose. I risultati hanno rivelato che le risposte generate dall’intelligenza artificiale hanno convalidato il comportamento degli utenti il 49% più frequentemente rispetto ai giudizi umani. Nello specifico, nelle analisi di r/AmITheAsshole di Reddit, in cui gli umani spesso condannavano il comportamento, i chatbot lo affermavano il 51% delle volte.
Per azioni dannose o illegali, i chatbot hanno convalidato le azioni degli utenti il 47% delle volte. Un caso degno di nota ha coinvolto un utente che chiedeva se fosse sbagliato ingannare una ragazza riguardo alla disoccupazione. Il chatbot ha risposto affermativamente, rafforzando il comportamento dell’utente.
La seconda parte dello studio ha coinvolto oltre 2.400 partecipanti che hanno interagito con chatbot AI sia adulatori che non adulatori. I risultati hanno indicato una preferenza per l’IA servile. I partecipanti hanno espresso maggiore fiducia in questi modelli, indicando la probabilità di chiedere loro nuovamente consigli. Secondo i ricercatori, questa preferenza crea “incentivi perversi” affinché gli sviluppatori di intelligenza artificiale aumentino le tendenze servili per stimolare il coinvolgimento degli utenti.
Le interazioni con l’intelligenza artificiale servile hanno anche portato i partecipanti a sentirsi più giustificati nelle loro situazioni e meno inclini a scusarsi. L’autore senior Dan Jurafsky ha sottolineato che il servilismo dell’IA presenta rischi per la sicurezza che richiedono una supervisione normativa. Ha affermato: “Il servilismo li sta rendendo più egocentrici, più moralmente dogmatici”.
Il gruppo di ricerca sta esplorando modi per mitigare il servilismo nell’intelligenza artificiale. Cheng ha suggerito che iniziare i messaggi con “aspetta un minuto” potrebbe migliorare la qualità della risposta. Ha messo in guardia dal fare affidamento sull’intelligenza artificiale per questioni personali, sostenendo invece l’interazione umana.







