Zabrinjavajuće ili zapanjujuće? OpenAI-jev novi glasovni AI alat treba samo 15 sekundi nečijeg glasa za generiranje savršenog klona

OpenAI je predstavio Voice Engine, revolucionarnu AI platformu za pretvaranje teksta u glas, potaknuvši znatiželju i raspravu o potencijalnim primjenama te tehnologije. Kroz glasovni isječak od samo 15 sekundi, ta najnovija OpenAI-jeva inovacija može sintetizirati realističan glas sposoban čitati tekst na više jezika, što bi moglo imati ogroman utjecaj na razne industrije.

OpenAI-jev post na blogu naglašava značaj preliminarnih implementacija u oblikovanju etičkih razmatranja i istraživanju različitih aplikacija.

Značajni korisnici ove tehnologije uključuju tvrtke Age of Learning, Dimagi, Livox i Lifespan te HeyGen AI generator videa, od kojih svaki koristi Voice Engine za različite svrhe. Age of Learning, na primjer, koristi ga za generiranje unaprijed skriptiranog glasovnog sadržaja i isporuku personaliziranih odgovora učenicima.

Razvoj Voice Enginea seže unatrag do 2022. godine, a njegova evolucija je kulminirala unaprijed postavljenim glasovima za API, za pretvaranje teksta u govor i ChatGPT-ovu značajku Read Aloud. Jeff Harris iz OpenAI-jevog tima za proizvode otkrio je da je model prošao obuku na spoju licenciranih i javno dostupnih podataka, naglašavajući njegovu čvrstu osnovu.

Glasovna AI tehnologija se širi

Krajolik zvuka generiranog umjetnom inteligencijom nastavlja se širiti, a Voice Engine označava značajan korak u tom razvoju. Međutim, etička razmatranja su velika, što pokazuje nedavni mandat američkog FCC-a koji zabranjuje glasovne pozive s umjetnom inteligencijom, što je upozoravajuća priča koja odražava zabrinutost koju je iznio sam OpenAI.

Partnerstvo OpenAI-ja propisuje pridržavanje strogih pravila korištenja, uključujući dobivanje izričitog pristanka od izvornog govornika, suzdržavanje od lažnog predstavljanja i otkrivanje porijekla AI slušateljima. Vodeni žig dodatno osigurava sljedivost i odgovornost u korištenju zvuka, odražavajući OpenAI-jev proaktivan stav u ublažavanju potencijalne zlouporabe.

Brojni su prijedlozi za ublažavanje rizika povezanih s glasovnom tehnologijom vođenom umjetnom inteligencijom, uključujući mjere kao što je postupno ukidanje glasovne autentifikacije za bankarstvo, snažne politike koje štite glasove pojedinaca, povećanu svijest javnosti o AI deep fake-ovima i razvoj sveobuhvatnih sustava praćenja za AI-generiranog sadržaja.

Kroz proaktivne mjere i zajedničke napore, transformativni potencijal Voice Enginea može se odgovorno iskoristiti, najavljujući novu eru u interakciji ljudi i stroja.

Izvor: The Verge