Il mondo della tecnologia si è concentrato sulla Generative AI nel 2023, attirando l’attenzione per le sue innegabili potenzialità. Con l’inizio del 2024, si è assistito a una certa stagnazione, portando a un’evoluzione più incrementale delle soluzioni. A distanza di un anno dal lancio di Gemini 1.0, focalizzato principalmente sull’intelligenza artificiale multimodale, Google ha introdotto la nuova versione Gemini 2.0, pronta a connettere il passato multimodale con un futuro basato su agenti autonomi.
novità di gemini 2.0
Oggi, Google ha annunciato ufficialmente Gemini 2.0, presentando una serie di miglioramenti significativi, tra cui l’integrazione nativa della gestione di immagini e audio, nonché l’accesso a strumenti esterni come Google Search. Questi aggiornamenti rappresentano un passo avanti importante nella capacità dell’IA di interagire direttamente con diversi tipi di media, migliorando così l’esperienza utente.
capacità multimodali
Grazie alle nuove abilità native di gestione di immagini e audio, Gemini 2.0 permette di comprendere visual e sonori con la stessa facilità del testo. Questo segna un’importante evoluzione per l’approccio multimodale di Google, poiché ora l’IA può elaborare foto e suoni senza doverli convertire in testo. Inoltre, Gemini è capace di generare contenuti audio e visivi in modo fluido.
gemini esempio di futuro agentic dell’IA
Una delle sfide più significative del settore è lo sviluppo di agenti in grado di affrontare compiti complessi automaticamente. Gemini 2.0 mira a soddisfare queste esigenze fornendo l’accesso a Google Search, Maps e Lens, supportando attività come la prenotazione di ristoranti in modo autonomo. Con l’emergere di queste tecnologie, si possono realizzare operazioni considerando input e output multimodali.
nuovi agenti in gemini
In parallelo, Google ha rivelato i primi agenti previsti per Gemini. Tra questi, un agente per gli sviluppatori chiamato Jules e Project Mariner, destinato a semplificare le operazioni online per gli utenti. Sebbene non sia stata fornita una tempistica per il rilascio, entrambi i progetti promettono di ampliare le capacità dell’intelligenza artificiale.
disponibilità e accesso a gemini 2.0
A partire da oggi, Gemini 2.0 inizierà a essere disponibile su desktop e mobile, con accesso semplificato tramite un menu a tendina. Inoltre, le funzionalità saranno rese disponibili anche per l’assistente Android di Google, consentendo agli utenti di attivare diverse funzioni con un semplice comando.
Lascia un commento