Novità di google sugli strumenti di generazione audio e video con intelligenza artificiale

Google ha recentemente presentato una serie di aggiornamenti per le sue piattaforme di intelligenza artificiale, con l’obiettivo di migliorare gli strumenti di generazione video e immagine. Tra le novità spiccano Imagen 3, Veo 2, Chirp e Lyria, che si propongono come soluzioni innovative nel mercato dell’AI generativa per le imprese.

novità per gli strumenti AI Imagen 3 e Veo 2

Il generatore di immagini Imagen 3 ha ricevuto un potenziamento significativo nella sua capacità di generazione. Questo aggiornamento include funzionalità avanzate di inpainting, che permettono la ricostruzione delle porzioni mancanti o danneggiate di una foto. Inoltre, è stato semplificato il processo di rimozione degli oggetti indesiderati dalle immagini.

Per quanto riguarda il modello video Veo 2, sono state introdotte nuove opzioni per l’editing e la personalizzazione degli effetti visivi. Gli utenti ora possono impartire dettagliate indicazioni sulla telecamera nelle scene generate dall’AI. È possibile anche impostare il ritmo per creare clip in time-lapse o nello stile dei droni, nonché interpolare tra fotogrammi specificati all’inizio e alla fine.

  • Imagen 3 – Generatore testo-immagine
  • Veo 2 – Modello video con direzioni della telecamera

aggiornamenti per i generatori audio Lyria e Chirp 3

Lyria, un modello AI per la musica basato su testo, è attualmente disponibile in anteprima privata all’interno del toolkit Vertex AI Media Studio. Questo strumento consente agli utenti di generare brani musicali completi e pronti per la produzione a partire da un semplice input testuale, facilitando così la creazione della colonna sonora per i video generati con Veo 2.

Anche il modello vocale sintetico Chirp 3 ha ricevuto un’importante novità: la funzione “Voce Personalizzata Immediata“. Questa tecnologia è capace di generare voci personalizzate realistiche partendo da soli dieci secondi di registrazione audio. Inoltre, il sistema può identificare accuratamente i singoli oratori in registrazioni con più parlanti, migliorando così le trascrizioni.

  • Lyria – Modello testo-musica
  • Chirp 3 – Modello vocale sintetico con voce personalizzata immediata

Tutti i media generati tramite questi strumenti sono contrassegnati con tecnologia SynthID da Google. È importante notare che tutti i modelli AI dispongono di sistemi integrati di protezione contro la creazione di contenuti dannosi.

Continue reading

NEXT

Huawei pura 80 in arrivo a giugno con miglioramenti alla fotocamera

Nuove informazioni sul lancio della serie Huawei Pura 80: Recenti indiscrezioni indicano che la presentazione dei nuovi smartphone della serie Huawei Pura 80 potrebbe avvenire nel mese di giugno, contrariamente a quanto precedentemente previsto per luglio. Questa notizia genera attesa […]
PREVIOUS

Amazon fire tv stick 4k a soli 25 euro: occasione imperdibile

offerta attuale del fire tv stick 4k Il Fire TV Stick 4K di Amazon è attualmente disponibile a un prezzo vantaggioso di $24.99, un’offerta eccezionale considerando che il costo normale è di $50. Questo rappresenta il miglior prezzo mai registrato […]

Potrebbero interessarti

Commenti

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

I più popolari

Di tendenza