Google ha recentemente presentato Ironwood, il settimo modello della sua serie di Tensor Processing Unit (TPU), durante l’evento Cloud Next 2025. Questa nuova generazione promette prestazioni elevate e un’efficienza energetica senza precedenti, rappresentando un passo significativo nell’evoluzione dell’intelligenza artificiale.
ironwood: il nuovo TPU di Google
Ironwood è descritto come il “più performante e scalabile acceleratore AI personalizzato” sviluppato fino ad oggi da Google. Questo dispositivo è progettato specificamente per l’inferenza, segnando una transizione verso modelli di intelligenza artificiale più proattivi rispetto a quelli reattivi tradizionali.
Con Ironwood, si entra in una nuova era in cui gli agenti AI non solo forniscono dati ma generano attivamente intuizioni e risposte.
La progettazione del TPU Ironwood tiene conto delle esigenze dei modelli complessi, come i Large Language Models (LLMs) e le Mixture of Experts (MoEs). Questi richiedono un’elaborazione parallela massiccia e accesso efficiente alla memoria, ottenuto riducendo la movimentazione dei dati e la latenza durante le operazioni tensoriali.
I requisiti computazionali di questi modelli superano la capacità di qualsiasi singolo chip; per questo motivo sono stati creati reti ICI a bassa latenza e alta larghezza di banda per garantire comunicazioni coordinate tra i chip.
gemini 2.5 flash: il modello versatile
Gemini 2.5 Flash è considerato il “modello da lavoro” di Google. Questo sistema ottimizza la latenza e i costi, permettendo un ragionamento dinamico e controllabile. Sarà disponibile su Vertex AI con funzionalità che consentono l’adattamento automatico del tempo di elaborazione in base alla complessità delle richieste.
Questa flessibilità consente una gestione efficace delle applicazioni ad alto volume, come i servizi clienti o l’elaborazione in tempo reale delle informazioni.
gen ai models: innovazioni nella musica e nel video
Google ha reso disponibile Lyria, un modello testo-a-musica che genera audio ad alta fedeltà. Questo strumento permette alle aziende di creare colonne sonore personalizzate rapidamente.
Lyria elimina ostacoli nella produzione musicale, consentendo la creazione veloce di tracce musicali allineate con l’identità del brand.
- Lyria: Modello testo-a-musica per generare audio personalizzato.
- Veo 2: Strumento con capacità avanzate di editing video.
- Imagen 3: Miglioramenti nelle funzionalità di editing delle immagini con focus su ricostruzione ed eliminazione oggetti.
- Chirp 3: Modello audio con voci HD in oltre 35 lingue per personalizzazione nei call center.
Anche sul fronte della sicurezza, DeepMind ha introdotto SynthID, che integra filigrane invisibili in ogni contenuto prodotto dai nuovi modelli AI per garantire un utilizzo responsabile delle tecnologie emergenti.
Lascia un commento