La nuova versione di Gemini, denominata Gemini 2.5 Flash, è stata lanciata in anteprima da Google, presentando innovazioni significative per gli sviluppatori. Questa versione introduce un sistema di budget di pensiero, che consente ai programmatori di controllare il livello di ragionamento a seconda delle esigenze specifiche del prompt.
caratteristiche principali di gemini 2.5 flash
Tutti i modelli della famiglia Gemini 2.5 sono dotati di capacità di ragionamento avanzato, permettendo loro di riflettere prima di fornire una risposta. Questo approccio migliora la precisione e le prestazioni, risultando particolarmente utile per compiti che richiedono un ragionamento complesso, come la risoluzione di problemi matematici o l’analisi di domande di ricerca.
Il modello esegue un processo di “pensiero” per comprendere meglio la richiesta e pianificare le risposte.
per gli sviluppatori
I modelli Flash sono riconosciuti per la loro velocità e costi contenuti; con Gemini 2.5 Flash non ci saranno variazioni in questo aspetto, ma si aggiungono nuove funzionalità che consentono agli sviluppatori di impostare budget specifici per bilanciare costo e qualità delle risposte generate.
Le specifiche chiave per Gemini 2.5 Flash in anteprima includono:
- Limiti Rate: 1000 RPM / 10,000 RPD (Tier a pagamento), 10 RPM / 500 RPD (Tier gratuito)
- Cortezza della conoscenza: Gennaio 2025
- Modalità d’ingresso: Testo, Immagini, Video, Audio
- Modalità d’uscita: Testo
- Finestra contestuale: 1 milione di token
- Lunghezza massima output: 64K token
controllo del razionamento nel modello
I programmatori possono gestire il numero massimo di token generabili durante il processo decisionale da zero fino a 24.576 token. È disponibile un cursore nella Google AI Studio e Vertex AI per facilitare questa operazione. Se non viene specificato alcun budget, il modello decide autonomamente quanto “pensare” in base alla complessità percepita del compito.
esempi pratici di ragionamento
Ecco alcuni esempi che illustrano diversi livelli di ragionamento richiesti dai prompt:
- Pensiero minimo:
- “Grazie” in spagnolo;
- Quante province ha il Canada?
- Pensiero medio:
- Lancio due dadi. Qual è la probabilità che sommino sette?
- Mio gym ha orari disponibili per basket tra le 9-15 nei giorni MWF e tra le 14-20 martedì e sabato. Crea un programma affinché possa giocare cinque ore nei giorni feriali.
- Pensiero alto:
- Esempi più complessi richiederebbero analisi dettagliate rispetto a semplici riassunti.
Sarà possibile provare Gemini 2.5 Flash su Google AI Studio e Vertex AI mentre Google continuerà ad apportare miglioramenti prima della disponibilità generale per utilizzo completo.
app gemini: novità e funzionalità
Anche l’app Gemini beneficerà delle funzionalità sperimentali offerte da Gemini 2.5 Flash, inclusa l’adattabilità automatica del livello di ragionamento in base alla complessità dei prompt ricevuti dagli utenti finali.
A lancio avvenuto, tutte le capacità dell’app Gemini saranno supportate mentre questo modello sostituirà il precedente (Gemini 2.0 Flash Thinking).
Lascia un commento