OpenAI predstavio Soru, svoj najnoviji AI alat koji pretvara tekst u video zapise

OpenAI je predstavio Soru, njihov najnoviji AI model za generiranje videa, dizajniran za oživljavanje tekstualnih uputa u fotorealističnim videozapisima duljine do jedne minute. Sora se ističe u izradi zamršenih scena s više likova, specifičnim pokretima i preciznim detaljima subjekata i pozadine, pokazujući razumijevanje objekata u fizičkom svijetu i sposobnost tumačenja rekvizita dok stvara izražajne likove.

Prema OpenAI-u, Sora može generirati videozapise na temelju fotografija, popuniti okvire koji nedostaju u postojećim videozapisima ili produljiti njihovo trajanje. Iako se model povremeno može boriti sa simulacijom fizike složenih scena, rezultati su nedvojbeno impresivni. Značajne demo snimke sadržavale su scene poput pogleda iz zraka na Kaliforniju tijekom zlatne groznice i simulirane perspektive iz tokijskog vlaka, prikazujući time Sorine sposobnosti.

Za razliku od svojih prethodnika, kao što je Midjourney, koji se fokusirao na generiranje teksta u sliku, polje AI generiranih videa se brzo razvilo, s modelima generiranja videa kao što su Runway, Pika i Googleov Lumiere. Lumiere, konkurent Sori, također nudi mogućnosti pretvaranja teksta u video tee omogućuje korisnicima i stvaranje videozapisa iz fotografija.

Trenutno dostupna "crvenim timovima" koji procjenjuju potencijalne rizike i štete, Sora je također dostupna vizualnim umjetnicima, dizajnerima i filmašima za povratne informacije. OpenAI prepoznaje potencijalne izazove, uključujući ograničenja modela u preciznoj simulaciji složenih scena i tumačenju određenih uzročno-posljedičnih instanci.

Napad na Google: OpenAI ima planove za razvoj tražilice

OpenAI uvodi vodene žigove na slike napravljene njihovim DALL-E 3 generatorom slika

OpenAI je nedavno najavio i dodavanje vodenih žigova svojem AI alatu za pretvaranje teksta u sliku, DALL-E 3, uz upozorenje da se ti vodeni žigovi mogu lako ukloniti. Kao i kod drugih proizvoda umjetne inteligencije, OpenAI je svjestan implikacija lažnih fotorealističnih videozapisa generiranih umjetnom inteligencijom koji se pogrešno smatraju pravim sadržajem, naglašavajući potrebu za odgovornom upotrebom i razmatranjem mogućih posljedica.

Izvor: The Verge