Baš kao što su najavljivali iz Alphabeta, protekli su mjeseci razvijali ono za što tvrde da je "njihov najnapredniji model umjetne inteligencije" pod imenom Gemini.
Ovaj dugo očekivani model umjetne inteligencije, istaknuto je na predstavljanju, sposoban je obraditi različite oblike informacija kao što su audio, video i tekst, ali je sposoban i za sofisticiranije zaključivanje i razumijevanje informacija. Bolje od prethodne Googleove tehnologije.
Ova nova era modela predstavlja jedan od najvećih znanstvenih i inženjerskih napora koje smo poduzeli kao tvrtka, napisao je izvršni direktor Alphabeta Sundar Pichai u službenom blogu.
Kako su istaknuli iz Alphabeta, Gemini modeli bit će dodani već ranije predstavljenom AI asistentu Bardu, a najavljeno je i kako bi početkom sljedeće godine trebala biti objavljena naprednija verzija Geminija upravo putem Barda.
Naime, Alphabet je razvio tri verzije Geminija, od čega svaka ima različitie mogućnosti, ali je i namijenjena različitim korisnicima. Najsnažnija verzija, Gemini Ultra, dizajnirana je za rad u podatkovnim centrima, a najmanja, Gemini Nano, prilagođena radu na mobilnim uređajima.
Gemini je najveći AI model koji je tvrtka Google DeepMind AI jedinica pomogla izraditi, ali je "znatno" jeftiniji za posluživanje korisnicima od tvrtkinih prethodnih, većih modela, izjavio je novinarima potpredsjednik DeepMinda za proizvode Eli Collins. Dakle, nije samo sposobniji, već je i daleko učinkovitiji. Dodao je kako ovaj najnoviji model i dalje troši izuzetnu količinu računalne snage tijekom učenja, ali i dodao kako Google radi na poboljšavanju svog procesa.
Demis Hassabis, izvršni direktor i suosnivač Google DeepMinda, pojasnio je kakve mogućnosti Gemini ima.
Od prirodnog razumijevanja slike, zvuka i videa do matematičkog zaključivanja, izvedba Gemini Ultra-a premašuje trenutne rezultate na 30 od 32 široko korištena akademska mjerila koja se koriste u istraživanju i razvoju velikog jezičnog modela (LLM).
S ocjenom od 90,0%, Gemini Ultra je prvi model koji je nadmašio ljudske stručnjake na MMLU- u (masovno razumijevanje jezika s više zadataka), koji koristi kombinaciju 57 predmeta kao što su matematika, fizika, povijest, pravo, medicina i etika za testiranje oba svijeta znanja i sposobnosti rješavanja problema.
Naš novi referentni pristup MMLU-u omogućuje Geminiju da koristi svoje sposobnosti rasuđivanja kako bi pažljivije razmislio prije nego odgovori na teška pitanja, što dovodi do značajnih poboljšanja u odnosu na samo korištenje prvog dojma, istaknuo je Hassabis.
Dodao je kako su dizajnirali Gemini da bude izvorno multimodalan, unaprijed obučen od početka za različite modalitete, a potom ga fino prilagodili dodatnim multimodalnim podacima.
Iz Alphabeta ističu kako će Bard već od danas početi koristiti Gemini Pro verziju za "naprednije razmišljanje, planiranje, razumijevanje i više". Bit će dostupan na engleskom jeziku u više od 170 zemalja i teritorija, a u budućnosti planiraju proširiti ga na druge modalitete i podržati nove jezike i lokacije.
Vlasnici pametnih telefona Pixel 8 Pro prvi će imati priliku isprobati Gemini Nano u praksi i to kroz nove značajke kao što je Summarize u aplikaciji Recorder i Smart Reply u Gboardu. Najavili su kako će se Gemini Nano koristiti i u aplikacijama za razmjenu poruka - od WhatsAppa na dalje.
Ostali će Gemini moći iskusiti kroz Alphabetove odnosno Googleove proizvode kao što su Search, Ads, Chrome i Duet AI u sljedećim mjesecima.
Već počinjemo eksperimentirati s Geminijem u pretraživanju, gdje čini naše Search Generative Experience (SGE) bržim za korisnike, uz 40% smanjenja latencije na engleskom u SAD-u, uz poboljšanja kvalitete, istaknuli su iz tvrtke.
Što se tiče najjače verzije, Gemini Ultra, na njeno isprobavanje javnost će još malo pričekati.
Za Gemini Ultra trenutačno dovršavamo opsežne provjere povjerenja i sigurnosti, uključujući red-teaming od strane pouzdanih vanjskih strana, i daljnje usavršavanje modela pomoću finog podešavanja i učenja pojačanja iz povratnih informacija (RLHF) od ljudi prije nego što ga učinimo široko dostupnim, pojašnjavaju iz tvrtke.
Gemini Ultra tako će prvo dostupan postati odabranim kupcima, programerima, partnerima i stručnjacima za sigurnost i odgovornost za rano eksperimentiranje i povratne informacije prije nego što postane dostupan razvojnim programerima i poslovnim korisnicima početkom sljedeće godine.
Alphabet je također najavio novu generaciju svojih prilagođenih AI čipova ili jedinica za obradu tenzora (TPU). Cloud TPU v5p dizajniran je za treniranje velikih AI modela, a spojen je u pakete od 8960 čipova.