OpenAI afferma che gli errori di salute del ChatGPT gratuito sono diminuiti del 71%.

OpenAI ha lanciato GPT-5.5 Instant come modello predefinito per gli utenti ChatGPT gratuiti, sostenendo che ora corrisponde alle prestazioni dei suoi modelli Thinking di frontiera sulle query sanitarie basate su valutazioni interne. Le informazioni sanitarie sono state oggetto di un attento esame, in particolare dopo che un’indagine del Guardian ha citato inesattezze nelle panoramiche AI di Google, spingendo Google a ritirare tali funzionalità per alcune domande relative alla salute.

OpenAI ha affermato che i suoi aggiornamenti rappresentano un miglioramento nell’accuratezza delle informazioni sanitarie. Questo cambiamento consente a un vasto pubblico di accedere alle risposte mediche da ChatGPT senza reindirizzare a fonti esterne, il che potrebbe avere un impatto sugli editori e sui SEO nel settore sanitario.

L’azienda ha evidenziato i progressi compiuti rispetto ai benchmark HealthBench e HealthBench Professional, sottolineando che GPT-5.5 Instant supera il suo predecessore, GPT-5.3 Instant. OpenAI ha inoltre segnalato una diminuzione del 71% delle risposte sanitarie segnalate per potenziali problemi di fattualità nell’arco di due mesi, facendo riferimento ai loro sistemi di monitoraggio del traffico in tempo reale.

Una valutazione separata ha comportato il confronto delle risposte generate da GPT-5.5 Instant con quelle scritte dai medici in 3.500 conversazioni sanitarie rappresentative. Nelle valutazioni, un gruppo di medici ha valutato le risposte del modello di intelligenza artificiale superiori a quelle fornite da medici umani in termini di accuratezza, comunicazione e completezza.

OpenAI ha affermato che GPT-5.5 Instant dimostra meno modalità di errore rispetto alle versioni precedenti e risposte umane, sottolineando meno segnali d’allarme mancati e una ridotta probabilità di non riuscire a cercare contesto aggiuntivo da parte degli utenti. HealthBench è stato sviluppato utilizzando il contributo della rete di medici dell’azienda e utilizza rubriche create dai medici per la valutazione.

OpenAI collabora con oltre 260 medici in 60 paesi, che hanno esaminato collettivamente più di 700.000 risposte di esempio. Sebbene questa cifra sia stata costantemente citata sin dal lancio di ChatGPT Health a gennaio, non sono stati rilasciati risultati di revisione indipendente.

Secondo OpenAI, le domande su salute e benessere rappresentano una parte significativa delle interazioni ChatGPT, con oltre 230 milioni di utenti che pongono settimanalmente domande relative alla salute. Inoltre, le discussioni sulla salute sono classificate in base a rigide politiche che vietano la pubblicità durante le conversazioni su salute, salute mentale o politica.

La richiesta del mercato di informazioni sanitarie tramite il livello gratuito di ChatGPT potrebbe aumentare la pressione zero-click sugli editori, poiché le risposte generate dall’intelligenza artificiale vedono un maggiore coinvolgimento, secondo quanto riferito il più alto tra le categorie analizzate nelle panoramiche AI di Google. Le affermazioni di OpenAI riguardanti l’accuratezza delle risposte sanitarie attualmente mancano di validazione da parte di terzi, sollevando preoccupazioni sull’affidabilità delle sue valutazioni.

L’annuncio non ha chiarito in che modo questi aggiornamenti potrebbero influenzare i protocolli di citazione, suggerendo che l’onere di verificare le risposte e affrontare le perdite di traffico potrebbe spostarsi sugli operatori sanitari.

Credito immagine in primo piano

OpenAI afferma che gli errori di salute del ChatGPT gratuito sono diminuiti del 71%.

Related Stories

Apple porta controlli vocali Siri più personali nella beta 3

Lo studio antropico rileva che i modelli di Claude formano uno spazio di lavoro interno che assomiglia alla coscienza

Apple attiva Siri AI su Apple Watch in watchOS 27 beta 3

Midjourney spinge Disney e altri a rivelare l’uso interno dell’intelligenza artificiale in una causa legale