Perplexity ha annunciato un aggiornamento al suo strumento Deep Research, ora in esecuzione sul modello Claude Opus 4.5 di Anthropic. L’aggiornamento combina il ragionamento avanzato del modello con il motore di ricerca proprietario e l’infrastruttura sandbox di Perplexity. Gli abbonati Max potranno accedervi immediatamente, con l’implementazione anche per gli utenti Pro nei prossimi giorni.

L’azienda ha anche rilasciato DRACO, un punto di riferimento open source per la valutazione degli agenti di ricerca approfondita. DRACO, che sta per Deep Research Accuracy, Completeness and Objectivity benchmark, copre 100 attività in 10 ambiti: accademico, finanza, diritto, medicina, tecnologia, conoscenza generale, progettazione UX, assistente personale, acquisti e ago nel pagliaio. I compiti vengono valutati in base a circa 40 criteri definiti dagli esperti in quattro aree: accuratezza fattuale, ampiezza e profondità dell’analisi, qualità della presentazione e qualità delle citazioni.

Deep Research di Perplexity ha ottenuto un punteggio normalizzato del 67,15% su DRACO, davanti a Google Gemini Deep Research al 58,97% e OpenAI Deep Research con il modello o3 al 52,06%. I risultati sono rimasti coerenti tra i modelli Judge GPT-5.2 e Sonnet-4.5. Perplessità in testa di 9-12 punti percentuali in Medicina, Cultura generale e Tecnologia rispetto al miglior sistema successivo. Ha registrato i suoi punteggi migliori in Giurisprudenza all’86,0% e Academic all’80,2%.

DRACO attinge dalle richieste anonime di Perplexity Deep Research, ampliate in compiti complessi e aperti che riflettono le reali esigenze di ricerca. Il benchmark valuta l’efficienza insieme alla qualità. Perplexity Deep Research ha fornito la latenza media più bassa di 459,6 secondi ottenendo la massima precisione.

L’aggiornamento si basa sul lancio di Deep Research nel febbraio 2025, che ha aggiunto query multi-pass e verifica cross-source. In January 2025, Perplexity signed a reported $750 million cloud deal with Microsoft. Il CEO Aravind Srinivas ha affermato che “per la finanza in particolare, l’accuratezza dei dati è un must e la posta in gioco è alta”. L’azienda utilizza Deep Research per fornire analisi di livello di ricerca rispetto ai concorrenti, tra cui Google e OpenAI.


Credito immagine in primo piano