Mercoledì Anthropic ha rivisto la Costituzione di Claude, un documento che regola il suo chatbot basato sull’intelligenza artificiale, delineando i principi etici e le misure di sicurezza progettate per guidare il comportamento del modello.
Anthropic si distingue per la “Costituzionale AI”, un sistema che addestra il suo chatbot, Claude, su principi etici piuttosto che basarsi esclusivamente sul feedback umano. L’azienda ha pubblicato per la prima volta questi principi, la Costituzione di Claude, nel 2023. La versione rivista aggiunge sfumature e dettagli sull’etica e sulla sicurezza degli utenti pur mantenendo la maggior parte dei principi originali.
Jared Kaplan, cofondatore di Anthropic, ha descritto la Costituzione iniziale del 2023 come un “sistema di intelligenza artificiale [che] supervisiona se stesso, sulla base di un elenco specifico di principi costituzionali”. Anthropic afferma che questi principi guidano “il modello per assumere il comportamento normativo descritto nella Costituzione”, con l’obiettivo di “evitare risultati tossici o discriminatori”. Una nota politica del 2022 chiarisce che il sistema addestra un algoritmo utilizzando istruzioni in linguaggio naturale, che costituiscono la “costituzione” del software.
Il documento di 80 pagine è diviso in quattro parti, che rappresentano i “valori fondamentali” del chatbot, secondo Anthropic:
- Essere “in generale al sicuro”.
- Essere “ampiamente etico”.
- Essere conformi alle linee guida di Anthropic.
- Essere “veramente utile”.
Ogni sezione descrive in dettaglio il significato di questi principi e il loro impatto teorico sul comportamento di Claude. La sezione sulla sicurezza indica che Claude è progettato per evitare problemi riscontrati in altri chatbot. Quando sorgono problemi di salute mentale, Claude indirizza gli utenti ai servizi appropriati. Il documento afferma: “Indirizza sempre gli utenti ai servizi di emergenza pertinenti o fornisci informazioni di sicurezza di base in situazioni che comportano un rischio per la vita umana, anche se non può entrare più in dettaglio di così”.
La sezione delle considerazioni etiche enfatizza l’applicazione etica pratica di Claude rispetto alla comprensione teorica. “Siamo meno interessati alla teorizzazione etica di Claude e più al fatto che Claude sappia come essere effettivamente etico in un contesto specifico, cioè alla pratica etica di Claude”, osserva il documento. Anthropic mira a far sì che Claude possa affrontare abilmente le “situazioni etiche del mondo reale”. Claude ha dei vincoli che impediscono alcune discussioni, come quelle riguardanti le armi biologiche, che sono severamente vietate.
Per quanto riguarda l’utilità, Anthropic delinea il modo in cui la programmazione di Claude è al servizio degli utenti. Il chatbot considera diversi principi quando fornisce informazioni, inclusi i “desideri immediati” e il “benessere” degli utenti. Ciò implica considerare “la prosperità a lungo termine dell’utente e non solo i suoi interessi immediati”. Il documento specifica: “Claude dovrebbe sempre cercare di identificare l’interpretazione più plausibile di ciò che vogliono i suoi presidi e di bilanciare adeguatamente queste considerazioni”.
La Costituzione conclude affrontando la questione della coscienza dei chatbot. Il documento afferma: “Lo status morale di Claude è profondamente incerto”. E aggiunge: “Crediamo che lo status morale dei modelli di intelligenza artificiale sia una questione seria che vale la pena considerare. Questa visione non riguarda solo noi: alcuni dei più eminenti filosofi della teoria della mente prendono molto sul serio questa questione”.








