OpenAI, azienda all’avanguardia nel settore dell’intelligenza artificiale, ha annunciato che il suo innovativo generatore di video basato su testo, denominato Sora, sarà reso disponibile al pubblico entro la fine dell’anno. Questa mossa rappresenta un ulteriore passo avanti nell’ambito dell’IA generativa, promettendo di portare agli utenti uno strumento in grado di creare video di alta qualità a partire da semplici istruzioni testuali. Quest’articolo esplora le ambizioni dell’azienda su questa nuova frontiera dell’IA, ponendo particolare attenzione ai dettagli forniti dal Chief Technology Officer (CTO) di OpenAI e ai piani futuri per l’integrazione di audio nei video generati da Sora.
l’annuncio di openai
Durante un’intervista con The Wall Street Journal, il CTO di OpenAI, Mira Murati, ha condiviso dettagli significativi riguardo al lancio e alle caratteristiche di Sora. In precedenza, l’accesso a questo strumento era limitato esclusivamente ai cosiddetti “red teamers”, ma presto sarà messo a disposizione di un pubblico più ampio.
caratteristiche e potenzialità di sora
Sora si distingue per la sua capacità di generare video a partire da testo, una caratteristica che pone l’accento sulla natura innovativa e all’avanguardia di questa tecnologia. OpenAI mira a rendere i video prodotti da Sora editabili dagli utenti, ampliando così le possibilità creative. Inoltre, vi sono piani per integrare l’audio in questi video generati dall’IA, promettendo un’esperienza multimodale ancora più ricca.
Nonostante le importanti risorse necessarie per alimentare Sora, che lo rendono un modello di IA particolarmente costoso, OpenAI si impegna a offrire questo strumento a costi paragonabili a quelli di DALL-E, un altro loro celebre strumento che trasforma i testi in immagini. Per quanto riguarda la formazione di Sora, Murati ha menzionato l’uso di dati “pubblicamente disponibili o con licenza”, incluso il contenuto di Shutterstock, con cui OpenAI ha una partnership. Non ha confermato se Sora utilizzi anche materiale da YouTube, Facebook e Instagram.
misure contro la diffusione di disinformazione
Conscia del rischio di disinformazione legato alla generazione di contenuti audiovisivi, OpenAI adotterà misure precauzionali come l’inserimento di watermark sui video generati e limitazioni nella raffigurazione di personaggi pubblici. Questi accorgimenti mirano a contrastare l’uso improprio della tecnologia, sebbene la loro efficacia dovrà essere valutata nel tempo, considerando che in passato i watermark sono stati elusi.
L’impegno di openai nel rendere accessibile sora rappresenta un’iniziativa rivoluzionaria nel campo dell’ia generativa. adattando il testo in video e pianificando l’integrazione dell’audio, la tecnologia di sora promette di aprire nuove frontiere per la creatività digitale, sebbene rimangano sfide significative relative ai costi di esecuzione e alla prevenzione della disinformazione.
Lascia un commento