Google je nadogradio svoj chatbot Gemini s novim AI modelom za uređivanje fotografija na temelju zahtjeva i upisa korisnika. Nadogradnja je nazvana Gemini 2.5 Flash Image i dostupna je, među inim, i korisnicima aplikacije Gemini, a prema slikama koje su korisnici objavili na internetu i društvenim mrežama, njegove su mogućnosti prilično impresivne.

tri vijesti o kojima se priča Netflix, ilustracija We're goin' up, up, up… Jeste li ga pogledali? Ovo je najgledaniji film na Netflixu svih vremena Otkrivanje štetnih stanica u tijelu, ilustracija Radikalan i drugačiji pristup S rakom se može "pregovarati": Znanstvenici otkrivaju možda najmoćniju strategiju za svladavanje te smrtonosne bolesti Pandemija, ilustracija Mogu li te promjene nestati? Otkrili neočekivanu posljedicu pandemije: Čak i kod ljudi koji nikada nisu bili zaraženi

Iz Googlea naglašavaju kako je novi model napravljen za “još preciznije uređivanje slika”, pri čemu se zadržava “konzistencija lica, životinja i drugih detalja” te na Tech Crunchu napominju kako je to nešto s čim drugi AI alati imaju problema.

Ova nadogradnja puno bolje obavlja posao te je uređivanje još besprjekornije, a rezultati modela se mogu koristiti za što god želite, objasnila je voditeljica proizvoda za vizualno generiranje modela u Google DeepMindu Nicole Brichtova za ovaj portal te naglasila kako značajno unaprjeđuju ne samo vizualnu kvalitetu, već i sposobnost modela da precizno slijedi upute.

Zaista izvanredno

Dok ovaj model s jedne strane korisnicima daje kreativnu kontrolu i mogućnost uređivanja slika koje žele, s druge strane Google se pobrinuo za određena ograničenja, kako im se ne bi ponovile neke greške iz prošlosti. Podsjetimo, kada je Google predstavio svoj alat za stvaranje slika našao se pod velikim kritikama javnost jer su model trenirali, kako su mnogi zaključili, u woke duhu. Npr. papu je prikazao kao ženu ili osobu tamne boje kože, vikinzi su također bili žene ili azijati, a kako tek komentirati sliku njemačkog vojnika iz drugog svjetskog rata koji je također tamne boje kože.

A koliko je novi model impresivan, možemo vidjeti prema nekim objavama na društvenoj mreži X. Rodrigo Bressane, profesionalni fotograf i stručnjak za umjetnu inteligenciju napisao je kako je proveo “bezbroj sati” na rješenjima za restauraciju i oživljavanje crno-bijelih fotografija prije nego su se pojavila AI rješenja. Koristeći Googleov alat, s bojom je oživio neke od najpoznatijih fotografija u povijesti, a rezultat je impresivan. Ništa se ne može usporediti s ovim. Zaista izvanredno, napisao je na platformi X.

Za nekog tko nikada nije vidio te fotografije, čini se nemogućim znati da je riječ o crno-bijelim slikama kojima je boja naknadno dodana zahvaljujući umjetnoj inteligenciji jer se sve boje čini potpuno realne.