Kako bi rezultati koje nam daje umjetna inteligencija bili što bolji, potrebna je velika količina podataka, odnosno treniranje AI-a korištenjem tih podataka. Pri tome je od velike važnosti i kvaliteta samih podataka, jer ako umjetnu inteligenciju trenirate na lošim i neispravnim podacima, dobit ćete i rezultate slične kvalitete.
Nakon predstavljanja ChatGPT-a i drugih AI chatbotova, povela se rasprava oko legalnosti treniranja AI-a korištenjem podataka koji su dostupni na internetu. Zbog toga su već podignute neke tužbe te će biti zanimljivo vidjeti njihov ishod, kao i kakvi će se standardi oko treniranja AI na tekstu, slikama i videozapisima dostupnim s mreže postaviti za budućnost.
Posebno je osjetljivo treniranje umjetne inteligencije na fotografijama i videozapisima djece, a kako smo saznali na temelju izvještaja američkih medija, roditelji videa svoje djece tehnološkim kompanijama prodaju za iznose od samo - 50 dolara.
U svrhu testiranja umjetne inteligencije za poboljšanje tehnologije prepoznavanja lica, Google je unajmio kanadsku kompaniju Telus International koja je kontaktirala roditelje i s njima potpisala ugovore o korištenju videozapisa lica njihove djece između 13 i 17 godina starosti. Među inim, roditelji su dali pristanak za prikupljanje osobnih i biometrijskih podataka djece, uključujući oblike kapaka, boju kože i “geometriju lica”. Google se obvezao čuvati te podatke maksimalno pet godina, nakon čega će ih obrisati.
U sklopu projekta koji je, čini se, završio s početkom ove godine, bilo je potrebno snimiti 11 kratkih videozapisa, uključujući i videa na kojima djeca nose kape, maske i naočale. Maksimalno trajanje videa iznosi 40 sekundi, a tijekom snimanja djeteta Telusov moderator bio je prisutan na videopozivu kako bi pomogao pri snimanju.
Iz 404 Medije kontaktirali su Google vezano uz treniranje AI-a na videozapisima djece te su im iz te kompanije odgovorili kako istražuju načine na koje mogu pomoći korisnicima u verifikaciji njihovih godina, dok iz Telusa nisu htjeli govoriti o ovom projektu pozivajući se na povjerljivost podataka.
Izvor: SF Gate