È stato recentemente annunciato l’arrivo di Gemini 2.0 Flash Thinking da parte di Google, il primo modello di ragionamento dell’azienda. Questa versione aggiornata e sperimentale è ora disponibile per test e offre nuove funzionalità per migliorare l’analisi e la risoluzione di problemi complessi.
sviluppo e funzionalità di Gemini 2.0
Fondato su Gemini 2.0 Flash, rilasciato all’inizio dello stesso mese, questo modello si distingue per la sua capacità di mostrare esplicitamente il proprio processo di pensiero, facilitando così una performance di ragionamento superiore. In particolare, le principali innovazioni includono:
- Un contesto di 1 milione di token (passato da 32K), utile per l’analisi di codici o set di documenti complessi;
- Supporto per l’esecuzione nativa di codice per un uso migliorato degli strumenti;
- Generazione di output con token più lunghi;
- Una minore frequenza di contraddizioni nel modello, riducendo il rischio di incoerenze tra pensiero e risposta.
esperienza utente migliorata
È stato anche implementato il tool di esecuzione codice, permettendo al modello di scrivere ed eseguire codice durante la risposta, migliorando ulteriormente l’interattività e l’efficacia.
performance e risultati
Rispetto alla versione precedente, Exp 1219, Gemini 2.0 ha mostrato performance superiori nei benchmark di ragionamento matematico, scientifico e multimodale, registrando punteggi del 73.3% nei test di matematica AIME2024 e del 74.2% nei test scientifici GPQA Diamond.
commenti e tendenze future
Il CEO di DeepMind, Demis Hassabis, ha evidenziato il rapido progresso di questo progetto, indicando che l’azienda ha un chiaro obiettivo nel migliorare i sistemi di pianificazione da oltre dieci anni. Inoltre, Sundar Pichai ha sottolineato che il processo di scalabilità del pensiero nel modello è promettente e continuerà a essere sottoposto a progressi futuri.
Gemini 2.0 Flash Thinking Experimental è ora gratuito per i test in Google AI Studio, accompagnato da un aggiornamento dell’interfaccia mobile per un’esperienza utente ottimizzata.
altri articoli su Gemini:
- Gemini overlay redesign in beta
- Semplificazione della homepage dell’app Gemini
- Prossime funzionalità per l’app Gemini
We’ve also enabled code execution as a tool, so the model can decide to write and execute code during its response. You can enable it in the sidebar in AI Studio!
Here’s a fun example where the model ballparks the solution with a formula, but writes some python code to arrive at… pic.twitter.com/j8wNp8Yn27
— Jack Rae (@jack_w_rae) January 21, 2025
We just shipped an updated Google AI Studio mobile experience. It’s time to prompt! 🚢 pic.twitter.com/68XYUqs0Wi
— Logan Kilpatrick (@OfficialLoganK) January 17, 2025
Lascia un commento