OpenAI predstavio Soru, svoj najnoviji AI alat koji pretvara tekst u video zapise

OpenAI predstavio revolucionarni AI model koji tekstualne upite pretvara u minutu duge fotorealistične video zapise.

Branimir Vorša | 16.02.2024. / 09:14 komentari
Brodovi u šalici kave, video generiraan AI alatom Sora
Brodovi u šalici kave, video generiraan AI alatom Sora (Foto: OpenAI)

OpenAI je predstavio Soru, njihov najnoviji AI model za generiranje videa, dizajniran za oživljavanje tekstualnih uputa u fotorealističnim videozapisima duljine do jedne minute. Sora se ističe u izradi zamršenih scena s više likova, specifičnim pokretima i preciznim detaljima subjekata i pozadine, pokazujući razumijevanje objekata u fizičkom svijetu i sposobnost tumačenja rekvizita dok stvara izražajne likove.

tri vijesti o kojima se priča Hodanje (Foto: Thinkstock) Bitan je volumen, a ne intezitet Velika norveška studija potvrdila da je Hipokrat bio u pravu: "Ovo je najbolji lijek za čovjeka" Iznenađenje na ekranu, ilustracija Dobro čitajte što piše Oprez! Ugledate li ovo upozorenje na Gmailu, vjerojatno vas pokušavaju hakirati Žena spava u kravetu, ilustracija Za sve koji žive u gradovima Spavajte u mraku, zaštitite srce: Znanstvenici upozoravaju na skrivenu prijetnju

Prema OpenAI-u, Sora može generirati videozapise na temelju fotografija, popuniti okvire koji nedostaju u postojećim videozapisima ili produljiti njihovo trajanje. Iako se model povremeno može boriti sa simulacijom fizike složenih scena, rezultati su nedvojbeno impresivni. Značajne demo snimke sadržavale su scene poput pogleda iz zraka na Kaliforniju tijekom zlatne groznice i simulirane perspektive iz tokijskog vlaka, prikazujući time Sorine sposobnosti.

Za razliku od svojih prethodnika, kao što je Midjourney, koji se fokusirao na generiranje teksta u sliku, polje AI generiranih videa se brzo razvilo, s modelima generiranja videa kao što su Runway, Pika i Googleov Lumiere. Lumiere, konkurent Sori, također nudi mogućnosti pretvaranja teksta u video tee omogućuje korisnicima i stvaranje videozapisa iz fotografija.

Trenutno dostupna "crvenim timovima" koji procjenjuju potencijalne rizike i štete, Sora je također dostupna vizualnim umjetnicima, dizajnerima i filmašima za povratne informacije. OpenAI prepoznaje potencijalne izazove, uključujući ograničenja modela u preciznoj simulaciji složenih scena i tumačenju određenih uzročno-posljedičnih instanci.

ChatGPT, ilustracija Napad na Google: OpenAI ima planove za razvoj tražilice

Primjr novog vodenog žiga na slikama generiranim DALL-E 3 AI alatom OpenAI uvodi vodene žigove na slike napravljene njihovim DALL-E 3 generatorom slika

OpenAI je nedavno najavio i dodavanje vodenih žigova svojem AI alatu za pretvaranje teksta u sliku, DALL-E 3, uz upozorenje da se ti vodeni žigovi mogu lako ukloniti. Kao i kod drugih proizvoda umjetne inteligencije, OpenAI je svjestan implikacija lažnih fotorealističnih videozapisa generiranih umjetnom inteligencijom koji se pogrešno smatraju pravim sadržajem, naglašavajući potrebu za odgovornom upotrebom i razmatranjem mogućih posljedica.

Izvor: The Verge

Vezane vijesti