Un articolo di Ars Technica del settembre 2025, intitolato “Il rapporto sulla sicurezza dell’intelligenza artificiale di DeepMind esplora i pericoli dell’intelligenza artificiale disallineata”, copre la ricerca e la prospettiva di Google DeepMind sulla sicurezza dell’intelligenza artificiale. Il rapporto presta particolare attenzione all’intelligenza generale artificiale (AGI) e ai rischi posti da sistemi di intelligenza artificiale disallineati, in cui gli obiettivi di un’intelligenza artificiale sono in conflitto con i valori o le intenzioni umane.

L’articolo delinea l’approccio di DeepMind allo sviluppo responsabile dell’IA, sottolineando l’impegno per la sicurezza tecnica, la valutazione del rischio e la collaborazione all’interno della comunità dell’IA per gestire i potenziali rischi. Questa strategia è particolarmente focalizzata sui pericoli che potrebbero emergere da potenti sistemi AGI. Una parte centrale di questo impegno è il Frontier Safety Framework di DeepMind, un protocollo creato per identificare e mitigare in modo proattivo i gravi rischi associati ai modelli di intelligenza artificiale di frontiera.

Internal governance bodies within DeepMind are also detailed, including the Responsibility and Safety Council and the AGI Safety Council. Questi gruppi sono responsabili della supervisione della ricerca e dello sviluppo per affrontare i rischi etici, tecnici e di sicurezza legati alle tecnologie avanzate di intelligenza artificiale.

Una sfida significativa discussa è l’intelligenza artificiale disallineata. Tali sistemi possono causare danni se i loro obiettivi operativi sono in contrasto con il benessere sociale, anche se sembrano funzionare correttamente da un punto di vista strettamente tecnico. Per affrontare questo problema, DeepMind sottolinea l’importanza della trasparenza, della collaborazione esterna e della ricerca proattiva sulla sicurezza come parte integrante della creazione responsabile dell’AGI.