Meta je objavila dva nova modela jezika otvorenog koda, Llama 4 Scout i Llama 4 Maverick, opisujući ih kao najbolje u svojoj klasi za multimodalnost. Ti novi AI modeli označavaju Metin najnoviji korak u umjetnoj inteligenciji, nudeći mogućnosti koje obrađuju i međusobno povezuju tekst, slike, video i audio.
Osim lansiranja Scouta i Mavericka, Meta je predstavila Llama 4 Behemoth. Tvrtka ga je opisala kao jednog od najpametnijih LLM-ova na svijetu i našeg najmoćnijeg dosad koji služi kao učitelj za naše nove AI modele.
Svi su navedeni modeli bili su uvježbavani na velikim količinama neoznačenog teksta, slika i video podataka kako bi im se omogućilo široko vizualno razumijevanje, ističu u Meti.
Prednosti Mavericka i Scouta
Meta kaže da je Llama 4 njihova prva kohorta modela koji koriste arhitekturu mješavine stručnjaka (engl. mixture of experts ili MoE), koja je računalno učinkovitija za obuku i odgovaranje na upite. MoE arhitektura u osnovi rastavlja zadatke obrade podataka na podzadatke i zatim ih delegira manjim, specijaliziranim "stručnim" modelima.
Maverick je, prema tstiranjima provedenim u Meti, najbolji za slučajeve upotrebe općeg asistenta i razgovora, poput kreativnog pisanja. U meti tvrde da Maverick premašuje modele kao što su OpenAI GPT-4o i Googleov Gemini 2.0 u određenim mjerilima kodiranja, rezoniranja, višejezičnosti, dugog konteksta i slika. S druge strane, Maverick ne drži korak sa snažnijim, novijim modelima kao što su Googleov Gemini 2.5 Pro, Anthropicov Claude 3.7 Sonnet i OpenAI-jev GPT-4.5.
Scout je pak dobar u zadacima poput sažimanja dokumenata i rasuđivanja nad velikim bazama kodova. Taj model ima vrlo veliki kontekstni prozor od 10 milijuna tokena, odnosno jednostavnije rečeno, Scout može primiti slike i milijune riječi, što mu omogućuje obradu i rad s iznimno dugim dokumentima.
Scout može raditi na jednom Nvidia H100 GPU-u, dok Maverick zahtijeva Nvidia H100 DGX sustav ili njegov ekvivalent, ističu iz Mete.
Dramatično više izbalansirani modeli
Isto tako, vrijedno je spomenuti da Llama 4 modeli nisu pravi "razmišljajući" modeli, poput OpenAI-jevih o1 i o3-mini, no iz Mete tvrde da su podesili sve Llama 4 modele da manje odbijaju odgovoriti na sporne upite. Primjerice, ti modeli sada će dati odgovore na vruće političke i socijalne teme,dok su prethodni modeli to prethodno odbijali.
U Meti tvrde isto tako da su Llama 4 dramatično više izbalansirani. Možete računati da će Lllama 4 pružiti korisne, činjenične odgovore bez osuđivanja Nastavljamo činiti Llamu osjetljivijom, tako da odgovara na više pitanja, da može odgovoriti na niz različitih stajališta i ne favorizira neke poglede u odnosu na druge, rekao je glasnogovornik Mete za TechCrunch.
Zabrinutost u pogledu izvedbe i kašnjenja
Prema izvješću The Informationa, koje prenosi agencija Reuters, Meta je prethodno odgađala predstavljanje Llame 4 nakon što su njihova interna testiranja označila slabe performanse u rezoniranju i matematičkim sposobnostima. U izvješću se također navodi da su Meti bili zabrinuti zbog svoje komparativne slabosti u odnosu na modele OpenAI-ja u vođenju realističnih glasovnih razgovora.
Meta odgovara na intenzivnu konkurenciju skaliranjem svoje infrastrukture umjetne inteligencije, obećavajući do 60,3 milijarde eura ulaganja u 2025. godini. To slijedi nakon porasta razvoja umjetne inteligencije u cijeloj industriji koji je pokrenuo OpenAI-jev ChatGPT, koji je preoblikovao tehnološke prioritete i ubrzao ulaganja u strojno učenje.