OpenAI ha recentemente concluso il suo evento di 12 giorni noto come “Shipmas”, durante il quale sono stati annunciati notevoli sviluppi nel campo dell’intelligenza artificiale. Per segnare la fine di questa manifestazione, è stato presentato o3, il nuovo modello di ragionamento dell’azienda, che promette di essere estremamente avanzato.
Il nuovo modello di ragionamento o3 di OpenAI
Ma cosa è successo a o2? Questo modello è stato riposto nel dimenticatoio insieme a Windows 9, OnePlus 4 e iPhone 9. La scelta di OpenAI di passare direttamente a o3 è stata motivata dalla presenza di una compagnia di telecomunicazioni britannica chiamata O2, così da evitare possibili complicazioni legali in futuro.
o3 si distingue per la sua capacità di trattare le informazioni in modo più analitico. A differenza di un modello tradizionale, che fornisce una risposta immediata, un modello di ragionamento come o3 scompone il processo decisionale, mostrando tutti i passaggi che conducono alla conclusione. Un esempio di questo tipo di modelli è il Gemini 2.0 Flash Thinking di Google, utile per chi è interessato a capire in profondità il ragionamento sottostante alle risposte generate.
Prestazioni eccezionali di o3
o3 rappresenta un traguardo significativo per OpenAI, evidenziando capacità cognitive superiori. Le statistiche rilasciate dall’azienda attestano che il modello supera di gran lunga le capacità umane, almeno in parte. Ad esempio, sottoposto ai test di codifica SWE-Bench Verified, o3 ha superato o1 del 22,8%. Inoltre, nel benchmark GPQA Diamond di scienze, ha ottenuto un punteggio del 87,7%. Infine, nel celebre AIME (American Invitational Mathematics Examination), ha sbagliato solo una delle 15 domande, dimostrando così di affrontare con successo una delle competizioni matematiche più impegnative.
Questi risultati indicano come OpenAI abbia raggiunto un livello di innovazione e prestazioni notevole. Non è ancora chiaro quando il pubblico potrà accedere a questo modello. Al momento, rimane da attendere in quanto o1 è ancora recentemente introdotto sul mercato.
Lascia un commento