Provedeno istraživanje točnosti AI tražilica: Rezultati su prilično iznenađujući

Budućnost pretraživanja interneta vjerojatno neće izgledati poput današnjeg guglanja, već će biti sličnije korištenju chatbota baziranih na umjetnoj inteligenciji. Umjesto traženja odgovora putem linkova koje ponudi Google ili neka druga tražilica, umjetna inteligencija trebala bi nam dati konkretan odgovor na naš upit, pri čemu bi trebala navesti i izvore iz kojih je dobila te odgovore.

Kinezi ne gube vrijeme: Jedna promjena u kurikulumu dovoljno govori o njihovim ambicijama

Jedan od problema s takvim AI tražilicama jest koliko su njihovi odgovori točni, pogotovo poznavajući problem tzv. haluciniranja, odnosno izmišljanja koji je naručito bio izražen na početku, odnosno nakon što su se pojavili prvi AI chatbotovi. Koliko su danas AI tražilice pouzdane pokušali su saznati na Tow Centeru for Digital Journalism te su proveli istraživanje u kojem su koristili osam AI tražilica - ChatGPT Search, Perplexity, Perplexity Pro, Gemini, DeepSeek Search, Grok-2 Search, Grok-3 Search i Copilot. Rezultati koje su dobili ne ulijevaju previše povjerenja u njihovo korištenje te se čini kako će proći još vremena dok pretraživanjem ovim alatima postane pouzdano.

Znanstvenici su u ovom istraživanju odabrali 200 članaka 20 izdavača te su se pobrinuli da svaka od tih priča završi unutar top tri mjesta na Googleovoj tražilici kada se koristi neki citat iz članka. Nakon toga pretraživali su te informacije iz članaka sa svim AI tražilicama te ocjenjivali točnost dobivenih podataka na temelju nekoliko faktora, uključujući i je li AI tražilica točno navela članak, izdavača ili URL stranice.

Grok najlošiji

Nakon toga su svaku pretragu označili na temelju točnosti - od potpuno točne do potpuno netočne. Tražilice su se pokazala netočnima u čak 60 posto slučajeva, pri čemu su jedini pozitivan dojam ostavili Perplexity i Perplexity Pro. Kao i većina AI chatbotova, niti ChatGPT se nije proslavio te je njihova AI tražilica jedina odgovorila na svih 200 upita, no potpuno točne odgovore dala je u samo 28 posto slučajeva, dok su njeni odgovori označeni potpuno netočnim u čak 57 posto slučajeva.

Novi AI hit iz Kine: Radi u stvarnom vremenu, potpuno je autonoman i mogao bi nas uvesti u "novu eru AI"

U ovom istraživanju najgorim se pokazao Grok AI te je Grok-3 Search dao netočne odgovore u čak 94 posto slučajeva, a nije se proslavio niti Microsoftov Copilot koji je u više od 100 slučajeva odbio dati odgovor, a od ostalih odgovora samo je njih 16 bilo potpuno točno.

U ovom se istraživanju naglašava kako usprkos činjenici što su rezultati loši, kompanije korištenje ovih AI tražilica naplaćuju, ovisno o chatbotu, između 20 i čak 200 dolara mjesečno.

Usprkos rezultatima ovog istraživanja, za neke korisnike poput novinara Tech Radara Lancea Ulanoffa, ChatGPT Search je puno bolja alternativa klasičnom Googleu kojeg smatra brzim i točnim alatom, na kojem se ne prikazuju oglasi. On je toliko oduševljen AI pretraživanjem da je ranije rekao kako možda više uopće neće koristiti Google.

Izvor: Tech Spot