L'evoluzione della tecnologia di generazione video tramite intelligenza artificiale è in piena accelerazione, grazie all'emergere di nuovi attori nel settore. Tra questi, Bytedance, noto per il suo popolare social network TikTok, ha recentemente introdotto due innovativi modelli AI che stanno catturando l'attenzione del pubblico e dei professionisti del settore. Questi strumenti non solo mostrano risultati impressionanti, ma potrebbero anche ridefinire il mercato della pubblicità e della produzione video.
Indice dei contenuti
Bytedance e i suoi nuovi modelli AI
Bytedance ha lanciato due modelli di generazione video di elevata sofisticazione: OmniHuman-1 e Goku. OmniHuman-1 è un framework multimodale che trasforma un'immagine singola in un video completo, arricchito da audio e sincronizzazione labiale di altissima qualità. La peculiarità di questo modello risiede nella sua capacità di combinare video e audio in modo impeccabile. Gli utenti possono accedere alla demo su GitHub e ammirare una serie di video creati da un'unica immagine unitamente a un file audio. Le prestazioni in termini di risoluzione e sincronizzazione labiale sono straordinarie, con pochissimi problemi visibili nel risultato finale.
Oltre alla capacità di generare video fotorealistici, OmniHuman-1 è in grado anche di produrre cartoni animati, oggetti animati artificiali, animali e pose complicate. Questo tipo di versatilità rappresenta un importante passo avanti per la tecnologia di generazione video.
L'arrivo di Goku e il suo impatto sul mercato
Il secondo modello, Goku, si distingue per la sua efficienza: con soli 8 miliardi di parametri, è incredibilmente leggero se paragonato ad altri modelli simili. Questo potrebbe indicare un chiaro obiettivo di Bytedance: il mercato della pubblicità. Con questa mossa, l'azienda si inserisce in un mercato estremamente competitivo, affiancandosi ad altri giganti cinesi dell'AI come Alibaba e Tencent. La disponibilità di una massiccia libreria di video raccolti da TikTok offre a Bytedance un vantaggio significativo, permettendo di attingere a un vasto repertorio di contenuti.
I video dimostrativi di Goku, visibili sulla pagina del progetto, mettono in mostra clip progettate per le campagne pubblicitarie sui social media. I contenuti vedono protagonisti uomini e donne intenti a utilizzare prodotti per la bellezza e altri articoli commerciali. Tuttavia, la portata delle applicazioni di questi strumenti va ben oltre la semplice vendita di prodotti; ci si aspetta un impatto anche nel campo dell'arte animata.
Le sfide e le prospettive future dell'AI video
Nonostante le sue straordinarie potenzialità, la generazione video tramite AI presenta ancora notevoli sfide tecniche. I requisiti di calcolo necessari per far funzionare questi modelli sono estremamente elevati. È questo uno dei motivi per cui il modello Sora ha impiegato così tanto tempo per arrivare sul mercato e attualmente sia OmniHuman-1 che Goku sono disponibili solo in laboratorio, senza applicazioni pubbliche accessibili al pubblico in modo diretto.
Un altro esempio è rappresentato da Kling AI, una piattaforma di generazione video accessibile al pubblico, che sta mostrando risultati impressionanti. Perfino clip piuttosto lunghe, generate da semplici richieste testuali, superano le aspettative. La crescita del settore mostra chiaramente che la tecnologia di AI generativa sta contribuendo a mettere in discussione i modelli tradizionali di produzione video.
L'evoluzione nel panorama cinematografico
L'industria cinematografica si trova ora di fronte a una trasformazione radicale. Diverse pubblicazioni hanno già sollevato interrogativi sul futuro delle professioni legate al cinema in un contesto in cui l'intelligenza artificiale sta prendendo piede. Il reportage del Hollywood Reporter, intitolato "Hollywood a un bivio: tutti usano l'AI, ma hanno paura di ammetterlo", enfatizza questa tendenza, affermando che molte posizioni lavorative potrebbero essere a rischio in seguito all'adozione dell'AI nel settore.
Registi e professionisti del settore esprimono preoccupazione per un futuro in cui le produzioni potrebbero avvalersi esclusivamente di attori principali, mentre i personaggi secondari e di sfondo potrebbero essere generati digitalmente. Questo rappresenta un cambiamento drammatico per l'industria cinematografica, che sta accelerando verso un'evoluzione senza precedenti.