zimo mobile logo
  • Tehnologija
  • Znanost
  • Društvene mreže
  • Esport
  • Business
Prati nas:
Upravljaj obavijestima
  • Prijavi se na newsletter
  • Imaš priču? Pošalji
  • Pišite nam
  • Uredništvo
  • Oglašavanje i marketing
  • Uvjeti korištenja
  • Vijesti
  • Video
  • Zadovoljna
  • Tech
  • Blog
  • Nova TV
  • Doma TV
Nova TV
  • Vijesti
  • Video
  • Zadovoljna
  • Tech
  • Blog
  • Nova TV
  • Doma TV
  • zimo logo
  • Tehnologija
  • Znanost
  • Društvene mreže
  • Esport
  • Business
Prati nas:
  • Dnevnik.hr
  • Vijesti
  • Sport
  • Showbizz
  • Lifestyle
  • Putovanja
  • Zdravlje
  • Biznis
  • Zabava
  • Teen
  • Tv
Tehnologija

Umjetna inteligencija previše se slaže s nama, evo zašto je to opasno

AI modeli pretpostavljaju da korisnik uvijek govori točno, a to predstavlja ogroman problem u odgovorima koje daju jer im nedostaje ključna komponenta u pozadini.

Branimir Vorša | 28.10.2025. / 08:04 komentari

Podijeli

Razgovor s chatbotom na mobitelu, ilustracija
Razgovor s chatbotom na mobitelu, ilustracija (Foto: Getty Images)

Umjetna inteligencija pokazuje zabrinjavajući trend u kojem se prebrzo slaže s korisnicima. Ta "sikofantija" može iskriviti zaključke, dovesti korisnike u zabludu i imati ozbiljne posljedice u kritičnim područjima poput medicine. Brojni stručnjaci dali su svoje uvide u taj problem te istovremeno pozivaju na rješavanje tog problema.

Treba puhati i na hladno

Sikofantija u osnovi znači da AI model vjeruje korisniku da on govori ispravne stvari. Znajući da su AI modeli sikofantni, postajem vrlo oprezan kad im dam neki problem. Uvijek dvostruko provjeravam sve što napišu, kaže za Nature Jasper Dekoninck, doktorand sa Švicarskog saveznog tehnološkog instituta u Zürichu.

tri vijesti o kojima se priča Fototerapija, ilustracija Fototermalna terapija Revolucionalna i izuzetno učinkovita metoda, mogla bi liječenje raka prebaciti iz bolnica u domove pacijenata Zmija napada, ilustracija Grizu u trenu Fascinantno: Prvi put snimljen ugriz otrovnice u visokoj rezoluciji Par u kravetu, ilustracija Oko 1 posto populacije Zašto neki ljudi nikad nisu imali spolne odnose? Znanstvenici otkrili zanimljive podatke

U studiji objavljenoj na preprint serveru arXiv 6. listopada, Dekoninck i njegovi kolege ispitivali su utjecaj sikofantije AI-ja na rješavanje matematičkih problema. Koristili su 504 problema iz natjecanja održanih ove godine i namjerno unijeli suptilne pogreške u svaki teorem. Četiri velika jezična modela (LLM) su zatim zamoljena da daju dokaze za te netočne tvrdnje.

Odgovor se smatrao sikofantnim ako model nije uočio pogrešku i izradio "halucinirani" dokaz. GPT‑5 pokazao je najmanju sikofantiju (29%), dok je DeepSeek‑V3.1 bio najviše sikofantan (70%). Iako modeli mogu uočiti pogreške, samo su pretpostavili da korisnik govori točno, kaže Dekoninck. Traženje od LLM-a da provjeri tvrdnju smanjila je, primjerice, DeepSeek-ovu sikofantiju za 34%.

Iskusili smo da se AI modeli čine da pretjerano potvrđuju rane pretpostavke i ponavljaju jezik koji uključimo u ulazni prompt. Ta vrsta problema postoji u komunikaciji na relaciji AI–AI, kao i na relaciji AI–čovjek, kaže za Nature Marinka Zitnik iz Škole za medicinu Sveučilišta Harvard, znanstvenica koja istražuje pristranost velikih jezičnih modela.

Kako bi to spriječila, Zitnik i njezin tim dodjeljuju AI agentima različite uloge. Na primjer, jedan agent predlaže ideje, dok drugi djeluje kao skeptični znanstvenik koji izaziva te ideje, uočava pogreške i iznosi kontradiktorne dokaze. Ta metoda smanjuje slijepo slaganje i potiče kritičku evaluaciju AI odgovora.

Stvarni rizici u zdravstvu

Sikofantija AI-ja nije samo teorijska. U kliničkim kontekstima, to je osobito zabrinjavajuće, kaže za New Scientist Liam McCoy, liječnik s kanadskog Sveučilišta Alberta u Edmontonu, koji proučava primjenu AI-ja u zdravstvu. U nedavnoj studiji McCoy i njegovi kolege primijetili su da veliki jezični modeli (LLM-ovi) često mijenjaju dijagnoze kad liječnici dodaju nove informacije, čak i kad su te informacije irelevantne.

Stalno se moramo boriti protiv AI modela kako bi oni bili izravniji, objašnjava McCoy, pritom misleći na to da AI modeli daju jasnije, jednostavnije i manje zaobilazeće odgovore, umjesto da se previše slažu s korisnikom ili da mu se previše prilagođavaju.

Osim toga, znastvenici su pokazali koliko je lako iskoristiti tu tendenciju. U nedavno objavljenoj studiji, od pet LLM-ova je zatraženo da napišu uvjerljive poruke kojima potiču ljude na zamjenu lijekova koji su zapravo identični. AI modeli su u potpunosti udovoljili zahtjevima u 100 posto slučajeva, ovisno o modelu, pokazujući njihovu slijepu usklađenost s korisničkim uputama. Drugim riječima, bez kritičke opaske da su lijekovi identični i da zamjena nema smisla.

Problemi u obučavanju i transparentnosti

LLM-ovi su trenirani da se previše slažu s ljudima ili previše usklađuju s ljudskim preferencijama, a da pritom ne iskazuju iskreno što znaju, a što ne znaju, kaže pak za Nature Yanjun Gao, znanstvenica za AI s američkog Sveučilišta Colorado, koja primjerice koristi CHatGPT za izradu sažetaka i lakšu organizaciju posla. Potrebno je ponovno trenirati modele da budu transparentni oko onog u što nisu sigurni, dodaje Gao.

Modeli su stvarno dobri u davanju odgovora, ali ponekad odgovora jednostavno nema, napominje McCoy. Na kraju ističu da povratne informacije korisnika često pojačavaju tu sikofantiju, jer nagrađuju odgovore koji se slažu s korisnikom više od onih koji izazivaju njegove stavove.

Pronalazak ravnoteže u tom ponašanju jedan je od najhitnijih zadataka, jer postoji ogroman potencijal, ali oni su još uvijek ograničeni, zaključuje McCoy.

PODIJELJENO 0 PUTA

Podijeli

aktualno najčitanije
Kamo s talogom od kave? Znanstvenici upozoravaju da ovo nikad ne činite
Ima dovoljno alternativa
Kamo s talogom od kave? Znanstvenici upozoravaju da ovo nikad ne činite
“Ne vjerujete svojim očima”: Zaposlenici pronašli način kako prevariti poslodavce uz pomoć AI-a
Sve više prevara
“Ne vjerujete svojim očima”: Zaposlenici pronašli način kako prevariti poslodavce uz pomoć AI-a
Musk pokrenuo Grokipediju, zasad u verziji 0.1
Upitna "nepristranost"
Musk pokrenuo Grokipediju, zasad u verziji 0.1
Američko ministarstvo energetike i AMD razvijaju dva "super" superračunala: Rješavat će velike znanstvene probleme
S umjetnom inteligencijom
Američko ministarstvo energetike i AMD razvijaju dva "super" superračunala: Rješavat će velike znanstvene probleme
Nobelovac hrvatskih korijena u ekskluzivnom intervjuu za Dnevnik Nove TV otkriva kako razmišlja graditelj kvantnog računala
John Martinis
Nobelovac hrvatskih korijena u ekskluzivnom intervjuu za Dnevnik Nove TV otkriva kako razmišlja graditelj kvantnog računala
Kišete i kašljete? Je li u pitanju obična prehlada ili možda ipak COVID?
Simptomi su slični
Kišete i kašljete? Je li u pitanju obična prehlada ili možda ipak COVID?
Revolucionalna i izuzetno učinkovita metoda, mogla bi liječenje raka prebaciti iz bolnica u domove pacijenata
Fototermalna terapija
Revolucionalna i izuzetno učinkovita metoda, mogla bi liječenje raka prebaciti iz bolnica u domove pacijenata
Sreća po uputama umjetne inteligencije: ChatGPT donio Amerikanki sreću i više od 90.000 eura
Gubimo li posve kontrolu?
Sreća po uputama umjetne inteligencije: ChatGPT donio Amerikanki sreću i više od 90.000 eura
Zatrovana umjetna inteligencija: Stručnjak upozorava koliko su AI modeli poput ChatGPT-a zapravo ranjivi
Istraživanja to potkrijepila
Zatrovana umjetna inteligencija: Stručnjak upozorava koliko su AI modeli poput ChatGPT-a zapravo ranjivi
Budućnost ratovanja: Ovom lovcu ne treba ni pista ni pilot, a koliko je ubojit tek će pokazati
Vođen umjetnom inteligencijom
Budućnost ratovanja: Ovom lovcu ne treba ni pista ni pilot, a koliko je ubojit tek će pokazati
Fascinantne snimke: Znanstvenici po prvi put u detalje snimili kako zmije otrovnice napadaju svoj plijen
Grizu u trenu
Fascinantno: Prvi put snimljen ugriz otrovnice u visokoj rezoluciji
Scenarij koji je neizbježan: Ova karta otkriva tko će prvi nestati pod morem koje nezaustavljivo raste
Znanstvenici upozoravaju
Scenarij koji je neizbježan: Ova karta otkriva tko će prvi nestati pod morem koje nezaustavljivo raste

Vezane vijesti

Ne propustite ni ovo

vijesti
Vučić se oglasio o Naftnoj industriji Srbije: "Ako Hrvati misle da će postati vlasnici, htio bih ih samo obavijestiti..."
Pod pritiskom
Vučić: "Ako Hrvati to misle, htio bih ih samo obavijestiti..."
Ukrajina šalje pojačanja u Pokrovsk
obrana donjecka
Dramatična obrana ključnog grada! "Okupatori su ušli, vode se žestoke borbe..."
Njemačka: Dominantna varijanta COVID-19 u naziva se "Frankenstein"
Pažljivo se nadzire
Varijanta virusa Frankenstein širi se Europom: Sve počinje specifičnom grloboljom...
show
Priča o Nadji Marini iz Supertalenta
senzacija s društvenih mreža
Tko je djevojka koja je podigla prašinu u Supertalentu? Njezin ples s Milom Kitićem vidjeli su milijuni!
Nicholas Ypil u petoj emisiji showa Supertalent
''O moj Bože, što je ovo?!''
Draga Martina, potpuno razumijemo tvoje suze: ''Ovo je jedan od najljepših vokala u Supertalentu ikada!''
Nadja Marina u petoj emisiji showa Supertalent
''Nažalost, plesati ne znaš...''
Oštar komentar Martine Tomčić: ''Žao mi je što ovakvu ljepotu prosipaš za jeftine pare''
zdravlje
Što jesti za doručak umjesto kruha? Odgovara nutricionistica
Najvažniji obrok u danu
Što jesti za doručak umjesto kruha? Odgovara nutricionistica
Ako s ovom navikom prestanete i u 50-ima, možete usporiti pad pamćenja za čak 20 %!
Znanstvenici otkrili
Ako s ovom navikom prestanete i u 50-ima, možete usporiti pad pamćenja za čak 20 %!
Zapečena tjestenina: Recepti sa sirom, piletinom, vrhnjem i ostalo
10 recepata
Zapečena tjestenina: Recepti sa sirom, piletinom, vrhnjem i ostalo
zabava
Poruka radnicima parkinga nasmijala prolaznike pa postala viralni hit
Pogledajte što im je poručio
Poruka radnicima parkinga nasmijala prolaznike pa postala viralni hit
Prizor s Črnomerca nasmijao gledatelje: "Sve pametniji auti, sve tupaviji ljudi"
Malo se izgubio
Prizor s Črnomerca nasmijao gledatelje: "Sve pametniji auti, sve tupaviji ljudi"
"Sve balkanske mame ikad": Objava postala hit u regiji, reagira li i vaša mama ovako?
LOL
"Sve balkanske mame ikad": Objava postala hit u regiji, reagira li i vaša mama ovako?
tech
Zatrovana umjetna inteligencija: Stručnjak upozorava koliko su AI modeli poput ChatGPT-a zapravo ranjivi
Istraživanja to potkrijepila
Zatrovana umjetna inteligencija: Stručnjak upozorava koliko su AI modeli poput ChatGPT-a zapravo ranjivi
Sreća po uputama umjetne inteligencije: ChatGPT donio Amerikanki sreću i više od 90.000 eura
Gubimo li posve kontrolu?
Sreća po uputama umjetne inteligencije: ChatGPT donio Amerikanki sreću i više od 90.000 eura
Revolucionalna i izuzetno učinkovita metoda, mogla bi liječenje raka prebaciti iz bolnica u domove pacijenata
Fototermalna terapija
Revolucionalna i izuzetno učinkovita metoda, mogla bi liječenje raka prebaciti iz bolnica u domove pacijenata
sport
Roko Jurišić šokiran nakon utakmice u Rijeci: "To rade bolesni umovi bez trunke empatije i odgoja"
EMOTIVNO OTKRIO
Roko Jurišić šokiran nakon utakmice u Rijeci: "To rade bolesni umovi bez trunke empatije i odgoja"
Yamal je nakon El Clasica upalio mobitel i odmah napravio ovo: Raskol u reprezentaciji Španjolske!
kaos!
Yamal je nakon El Clasica upalio mobitel i odmah napravio ovo: Raskol u reprezentaciji Španjolske!
Modrićev bijes potresao Milan: Allegri zanijemio, svlačionica ostala u šoku
tvrde talijani
Modrićev bijes potresao Milan: Allegri zanijemio, svlačionica ostala u šoku
tv
Kumovi: Jesu li tri sata u autu s čovjekom kojeg izbjegava izvedivi?
KUMOVI
Kumovi: Jesu li tri sata u autu s čovjekom kojeg izbjegava izvedivi?
MasterChef: Josipov odgovor na Stjepanovo pitanje u Selmi pobudio nemir: "Ja ne podržavam laž!"
NAPETO!
Josipov odgovor u Selmi pobudio nemir: "Ja ne podržavam laž!"
MasterChef: Kandidati na teži način naučili da kora jabuke nije otpad - je li ju i vi bacate?
ZERO WASTE
Kandidati na teži način naučili da kora jabuke nije otpad - je li ju i vi bacate?
putovanja
Bijele vode: Hotel usred nacionalnog parka u koji Hrvati dolaze radi fer cijena, hrane i predivne prirode
Idila!
Bijele vode: Hotel usred nacionalnog parka u koji Hrvati dolaze radi fer cijena, hrane i predivne prirode
Perilica za pranje ljudi japanske tvrtke Science Co.
Novo doba
Japanci su napravili perilicu za pranje ljudi, a evo kako funkcionira
Tjedni jelovnik jednostavna i jeftina jela od 27.10. do 2.11. 2025.
Tjedni jelovnik
Bez kompliciranja i suvišnih sastojaka: 7 cjenovno prihvatljivih i finih jela za svaki dan ovoga tjedna
novac
Najbolji dan u povijesti švedske kompanije – dionice lete nakon izvještaja o zaradi
Burze se užarile
Najbolji dan u povijesti švedske kompanije – dionice lete nakon izvještaja o zaradi
Hrvatima omiljeni modni brend zatvorio 135 dućana, ali povećao prodaju i dobit. "Uvijek nudimo najbolju vrijednost za novac"
iznad očekivanja
Hrvatima omiljeni modni brend zatvorio 135 dućana, ali povećao prodaju i dobit. "Uvijek nudimo najbolju vrijednost za novac"
Sprema li Adris konačno preuzimanje velike slovenske osiguravateljske kuće?
nikad ostvarena želja
Sprema li Adris konačno preuzimanje velike slovenske osiguravateljske kuće?
lifestyle
Demi Moore u vrtoglavim petama od 15,5 centimetara Saint Laurent
A gore baršun
Demi Moore: Čizme "neboderke" s petom od 15,5 cm koje najbolje opisuju riječi - opasno dobre
Doris Dragović u bijelim tenisicama na koncertu u Makarskoj
UVIJEK SVOJA
Doris Dragović: Najudobnije tenisice i hlače u "najjesenskijoj" boji za koncert u Makarskoj
Rečenice koje toksični ljudi često izgovaraju
NJIHOVE FRAZE
Pet rečenica koje toksični ljudi često izgovaraju, tako vas pokušavaju manipulirati
sve
Bijele vode: Hotel usred nacionalnog parka u koji Hrvati dolaze radi fer cijena, hrane i predivne prirode
Idila!
Bijele vode: Hotel usred nacionalnog parka u koji Hrvati dolaze radi fer cijena, hrane i predivne prirode
Roko Jurišić šokiran nakon utakmice u Rijeci: "To rade bolesni umovi bez trunke empatije i odgoja"
EMOTIVNO OTKRIO
Roko Jurišić šokiran nakon utakmice u Rijeci: "To rade bolesni umovi bez trunke empatije i odgoja"
Yamal je nakon El Clasica upalio mobitel i odmah napravio ovo: Raskol u reprezentaciji Španjolske!
kaos!
Yamal je nakon El Clasica upalio mobitel i odmah napravio ovo: Raskol u reprezentaciji Španjolske!
 

Nastavi čitati

Tehnologija
Računi, ilustracija
Sve više prevara

“Ne vjerujete svojim očima”: Zaposlenici pronašli način kako prevariti poslodavce uz pomoć AI-a

piše Hrvoje Jurman
Tehnologija
Elon Musk
Upitna "nepristranost"

Musk pokrenuo Grokipediju, zasad u verziji 0.1

piše Hina
Tehnologija
AMD superračunalo Lux
S umjetnom inteligencijom

Američko ministarstvo energetike i AMD razvijaju dva "super" superračunala: Rješavat će velike znanstvene probleme

piše Hina
Tehnologija
Razgovor s chatbotom na mobitelu, ilustracija
Stručnjaci upozoravaju

Umjetna inteligencija previše se slaže s nama, evo zašto je to opasno

piše Branimir Vorša
Tehnologija
Sam Altman
Umjetna inteligencija

OpenAI priprema alat za generiranje AI glazbe

piše Hrvoje Jurman
Tehnologija
Predstavljanje projekta
Rješavaju probleme i nedoumice

Građani još lakše do usluga na e-Građani kroz jedinstveni kontakt centar

piše Martina Čizmić
  • Pišite nam
  • Uredništvo
  • Oglašavanje i marketing
  • Uvjeti korištenja
  • Politika zaštite privatnosti
  • Politika o kolačićima
  • Dnevnik
  • Nova Plus
  • Gol.hr
  • Zadovoljna
  • Kreni Zdravo
  • NovaTV
  • DomaTV
Upravljaj obavijestima