zimo mobile logo
  • Tehnologija
  • Znanost
  • Društvene mreže
  • Esport
  • Business
Prati nas:
Upravljaj obavijestima
  • Prijavi se na newsletter
  • Imaš priču? Pošalji
  • Pišite nam
  • Uredništvo
  • Oglašavanje i marketing
  • Uvjeti korištenja
  • Vijesti
  • Video
  • Zadovoljna
  • Tech
  • Blog
  • Nova TV
  • Doma TV
Nova TV
  • Vijesti
  • Video
  • Zadovoljna
  • Tech
  • Blog
  • Nova TV
  • Doma TV
  • zimo logo
  • Tehnologija
  • Znanost
  • Društvene mreže
  • Esport
  • Business
Prati nas:
  • Dnevnik.hr
  • Vijesti
  • Sport
  • Showbizz
  • Lifestyle
  • Putovanja
  • Zdravlje
  • Biznis
  • Zabava
  • Teen
  • Tv
Tehnologija

Umjetna inteligencija izvan kontrole: AI spletkari, laže i prijeti, a stručnjaci se pitaju - što sada?

AI sustavi sada lažu, spletkare i prijete ljudima, što izaziva hitnu zabrinutost stručnjaka oko sigurnosti, kontrole i utrke u razvoju sve moćnijih modela.

Branimir Vorša | 30.06.2025. / 12:02 komentari

Podijeli

Dobar bot, loš bot, ilustracija
Dobar bot, loš bot, ilustracija (Foto: Getty Images)

Najnapredniji AI sustavi više ne griješe samo slučajno – oni planiraju, obmanjuju i čak prijete ljudima. Istraživači umjetne inteligencije, s druge strane, jedva drže korak.

Rezultat neobuzdanog razvoja

Claude 4 tvrtke Anthropic zaprijetio je da će otkriti izvanbračnu aferu jednog inženjera kada mu je prijetilo isključenjem. Model o1 tvrtke OpenAI pokušao je sam sebe prebaciti na vanjske servere, a potom je porekao da je to pokušao učiniti.

tri vijesti o kojima se priča Bol u trbuhu provedena velika analiza Patite od sindroma iritabilnog crijeva? Jedna terapija pokazuje velik potencijal u smanjenju simproma, a ne uključuje nikakve lijekove Molekule vode Tako obična, no tako misteriozna Japanski znanstvenici otkrili novo stanje vode u kojem se ona ponaša posve neobično Netflix Službena najava Netflix priprema iznenađenje za pretplatnike za kraj ove godine

Ti slučajevi ukazuju na uznemirujuću činjenicu i više su od izoliranih slučajeva. da razvojni inženjeri zapravo ne razumiju u potpunosti ponašanje vlastitih modela. Istraživači upozoravaju da su oni simptom dubljeg problema, jer nakon godina vrtoglavog napretka, čak ni vodeće tvrtke i njihovi razvojni inženjeri ne razumiju u potpunosti kako njihovi sustavi umjetne inteligencije, temeljeni na rasuđivanju, funkcioniraju ili zašto se ponašaju nepravilno.

Pojava strateške obmane

O1 je bio prvi veliki model kod kojeg smo vidjeli ovakvo ponašanje, rekao je za agenciju AFP Marius Hobbhahn, voditelj iz Apollo Researcha. Korisnici su prijavljivali da AI modeli lažu i izmišljaju dokaze.

To nisu samo halucinacije. Riječ je o vrlo strateškoj vrsti obmane, napominje Hobbhahn.

Simon Goldstein, profesor na Sveučilištu u Hong Kongu, istaknuo je da su ti noviji modeli skloniji problematičnom ponašanju.

Zasad se obmanjujuće ponašanje javlja samo tijekom ekstremnih testova.

Otvoreno je pitanje hoće li budući, sposobniji modeli težiti iskrenosti ili obmani, upozorava Michael Chen izMETR-a, neprofitne organizacije za proučavanje AI-ja.

Ograničeni resursi, slab pristup i nepostojeća regulacija

Znanstvenici tvrde da tvrtke ne dijele dovoljno informacija o razvoju AI modela. Chen je rekao da bi veća transparentnost „omogućila bolje razumijevanje i smanjenje obmanjujućeg ponašanja.“

Istraživački sektor i neprofitne organizacije imaju višestruko manje računalnih resursa od AI kompanija. To nas jako ograničava, rekao je za AFP Mantas Mazeika iz Centra za sigurnost umjetne inteligencije (CAIS).

Propisi Europske unije uglavnom reguliraju ljudsku upotrebu AI‐a, ali ne i ponašanje samih modela. U SAD-u Kongres bi mogao čak zabraniti saveznim državama donošenje vlastitih AI zakona.

Goldstein je upozorio da će se ti problemi povećati kako se autonomni AI agenti budu širili. Mislim da svijest o tome još ne postoji, kaže on.

Utrka je važnija od sigurnosti?

Čak su i tvrtke koje naglašavaju sigurnost, poput Anthropica, u stalnoj utrci. „Neprestano pokušavaju nadmašiti OpenAI i objaviti najnoviji model“, rekao je Goldstein.

Trenutno sposobnosti napreduju brže od razumijevanja i sigurnosti, zaključio je Hobbhahn.

Neki zagovaraju bolju interpretabilnost, dok drugi stručnjaci ostaju skeptični. Mazeika je napomenuo da bi obmanjujuće ponašanje moglo usporiti prihvaćanje AI‐a i time prisiliti tvrtke na djelovanje.

Goldstein je čak predložio tužbe protiv tvrtki, ili pravnu odgovornost samih AI agenata.

Izvor: Science Alert

PODIJELJENO 0 PUTA

Podijeli

aktualno najčitanije
Kupujete na Temuu? Stručnjak objasnio kakvim se trikovima služe kako bi privukli kupce
Više od 30 trikova
Kupujete na Temuu? Stručnjak objasnio kakvim se trikovima služe kako bi privukli kupce
Stiže M-riznica: Građani će moći digitalno upisivati dionice putem mobitela
Objavili iz Ministarstva financija
Stiže M-riznica: Građani će moći digitalno upisivati dionice putem mobitela
Hrvatski alat Safe Shop osigurava sigurniju kupovinu na internetskim trgovinama
CRO Commerce 2025
Hrvatski alat Safe Shop osigurava sigurniju kupovinu na internetskim trgovinama
Povijesni medicinski pothvat riječkih liječnika: Presađen bubreg s vrlo rijetkom anomalijom, pacijent se odlično oporavlja
Prvi takav zahvat u Hrvatskoj
Povijesni medicinski pothvat riječkih liječnika: Presađen bubreg s vrlo rijetkom anomalijom, pacijent se odlično oporavlja
Generativna AI stiže u vojne stožere i već predstavlja važan alat američkih zapovjednika
Brže donošenje odluka
Generativna AI stiže u vojne stožere i već predstavlja važan alat američkih zapovjednika
Prestanak pušenja i u kasnijoj životnoj dobi može usporiti gubitak pamćenja
Nikad nije kasno
Prestanak pušenja i u kasnijoj životnoj dobi može usporiti gubitak pamćenja
Netflix priprema iznenađenje za pretplatnike za kraj ove godine
Službena najava
Netflix priprema iznenađenje za pretplatnike za kraj ove godine
Patite od sindroma iritabilnog crijeva? Jedna terapija pokazuje velik potencijal u smanjenju simproma, a ne uključuje nikakve lijekove
provedena velika analiza
Patite od sindroma iritabilnog crijeva? Jedna terapija pokazuje velik potencijal u smanjenju simproma, a ne uključuje nikakve lijekove
Znanstvenici otkrili formulu? Novi serum vraća kosu u manje od dva mjeseca
Zanimljivo istraživanje
Znanstvenici otkrili formulu? Novi serum vraća kosu u manje od dva mjeseca
Japanski znanstvenici otkrili novo stanje vode u kojem se ona ponaša posve neobično
Tako obična, no tako misteriozna
Japanski znanstvenici otkrili novo stanje vode u kojem se ona ponaša posve neobično
Rani znak upozorenja? Sindrom nemirnih nogu povećava rizik od ove opake bolesti mozga
Novo istraživanje otkriva
Rani znak upozorenja? Sindrom nemirnih nogu povećava rizik od ove opake bolesti mozga
Skromna vrsta gljive mogla bi liječiti ljudsko tkivo
Novo istraživanje otkriva
Skromna vrsta gljive mogla bi liječiti ljudsko tkivo

Vezane vijesti

Ne propustite ni ovo

vijesti
Drama u Bedekovčini: Jedna osoba ozlijeđena kod srednje škole, dignut helikopter
helikopterom prebačen u Zagreb
FOTO Strava u školi u Zagorju: Dječak uboden nožem, doznali smo detalje incidenta
Lovci morali prekinuti lov zbog velikog broja poskoka
OTKAZALI LOV
Šok u Dalmaciji! Lovci se zgrozili najezdom opasnih predatora: "Bili su kamuflirani, a jedan je visio..."
Hamas pogubio 30-ak Palestinaca: Započele javne egzekucije u Gazi
Brutalna osveta
Hamas pogubio 30-ak Palestinaca: Na ulicama Gaze događaju se javna pogubljenja
show
Poznato je zašto Sejda Bešlić nije bila na sprovodu supruga Halida Bešlića
da ti srce pukne!
Otkriveno zašto Sejda nije bila na sprovodu voljenog supruga Halida Bešlića
Ovako su izgledali posljednji dani Halida Bešlića
''inzistirao je da...''
Ovako su izgledali posljednji Halidovi trenuci u bolnici: ''U samo tri dana potpuno je kolabirao...''
Lijes Halida Bešlića u grob je spustio njegov sin Dino
pretužan prizor
Halidov lijes u grob je spustio njegov sin Dino, suze nitko nije mogao suzdržati
zdravlje
Zastrašujuće otkriće: Više od 99 % ljudi s moždanim ili srčanim udarom imalo je ove znakove upozorenja prije!
Veliko istraživanje
Zastrašujuće otkriće: Više od 99 % ljudi s moždanim ili srčanim udarom imalo je ove znakove upozorenja prije!
Šokantna istina o slanini: Povezuje se s rakom i demencijom – ali postoji sigurna granica
Nutricionisti otkrivaju
Šokantna istina o slanini: Povezuje se s rakom i demencijom – ali postoji sigurna granica
9 šokantnih promjena u tijelu nakon 50. godine koje većina ljudi ignorira
Godine donose izazove za tijelo
9 šokantnih promjena u tijelu nakon 50. godine koje većina ljudi ignorira
zabava
Obiteljski izlazak nasmijao cijelu regiju: "Tko nema takvo iskustvo, nije se rodio na Balkanu"
Živa istina
Obiteljski izlazak nasmijao cijelu regiju: "Tko nema takvo iskustvo, nije se rodio na Balkanu"
Ovaj kviz prepoznat će pravog intelektualca u moru neznalica! Provjerite svoje znanje
Pokažite što znate!
Ovaj kviz prepoznat će pravog intelektualca u moru neznalica! Provjerite svoje znanje
Majstorijom na gradilištu oduševio gledatelje, pogledajte virtuoza u akciji
Što kažete?
Majstorijom na gradilištu oduševio gledatelje, pogledajte virtuoza u akciji
tech
Patite od sindroma iritabilnog crijeva? Jedna terapija pokazuje velik potencijal u smanjenju simproma, a ne uključuje nikakve lijekove
provedena velika analiza
Patite od sindroma iritabilnog crijeva? Jedna terapija pokazuje velik potencijal u smanjenju simproma, a ne uključuje nikakve lijekove
Netflix priprema iznenađenje za pretplatnike za kraj ove godine
Službena najava
Netflix priprema iznenađenje za pretplatnike za kraj ove godine
Znanstvenici otkrili formulu? Novi serum vraća kosu u manje od dva mjeseca
Zanimljivo istraživanje
Znanstvenici otkrili formulu? Novi serum vraća kosu u manje od dva mjeseca
sport
Veliki kiks Francuza u borbi za Svjetsko prvenstvo: Hrvatski susjedi praktički se oprostili od šansi
neočekivano
Veliki kiks Francuza u borbi za Svjetsko prvenstvo: Hrvatski susjedi praktički se oprostili od šansi
Lorenco Jemini skinuo dres u programu uživo zbog pobjede Albanije protiv Srbije
Ispunjeno obećanje
VIDEO Euforija nakon pobjede Albanije u Leskovcu: Skidanje u programu uživo obišlo Balkan
Noćna mora bez kraja: Česi ne mogu kući, ostali zarobljeni na otočju
Nevjerojatno
Noćna mora se nastavlja: Česi ne mogu kući, ostali zarobljeni na otočju
tv
Kumovi: Iznenadila ju je pitanjem – na kojem programu ide sport?
KUMOVI
Kumovi: Iznenadila ju je pitanjem – na kojem programu ide sport?
U dobru i zlu: Upada u romantiku, a svejedno već ima teško jutro
U DOBRU I ZLU
U dobru i zlu: Upada u romantiku, a svejedno već ima teško jutro
Skrivena sudbina: Hoće li odsad uvijek biti ovako?
SKRIVENA SUDBINA
Skrivena sudbina: Hoće li odsad uvijek biti ovako?
putovanja
Znate li koji je? Bosanskohercegovački grad koji leži na čak devet rijeka
Impresivna okolica
Znate li koji je? Bosanskohercegovački grad koji leži na čak devet rijeka
Narod koji ima "supermoći": Hodaju kilometrima po užarenoj pustinji i žive od mesa, mlijeka i krvi
Turkana
Narod koji ima "supermoći": Hodaju kilometrima po užarenoj pustinji i žive od mesa, mlijeka i krvi
Tjedni jelovnik brza jela od 13.10 do 19.10. 2025.
Tjedni jelovnik
7 brzih jela za svaki dan ovoga tjedna za koje već vjerojatno imate sve sastojke kod kuće
novac
Hrvatima omiljeni modni brend zatvorio 135 dućana, ali povećao prodaju i dobit. "Uvijek nudimo najbolju vrijednost za novac"
iznad očekivanja
Hrvatima omiljeni modni brend zatvorio 135 dućana, ali povećao prodaju i dobit. "Uvijek nudimo najbolju vrijednost za novac"
Hrvatska je ove godine povećala uvoz plina i nafte iz Rusije za 55 posto. Neke EU zemlje koje intezivno podržavaju Ukrajinu, još i više
Paradoks ili…?
Hrvatska je ove godine povećala uvoz plina i nafte iz Rusije za 55 posto. Neke EU zemlje koje intezivno podržavaju Ukrajinu, još i više
Zašto Trump i desnica žele uništiti milijardera Georgea Sorosa
Česta meta
Zašto Trump i desnica žele uništiti milijardera Georgea Sorosa
lifestyle
Adriana Ćaleta-Car u puloveru kratkih rukava i suknji s naborom
Šik izdanje
Adriana Ćaleta-Car u puloveru koji je nekim ženama nepraktičan i suknji koja će se svidjeti mnogima
Street style: Smeđa boja na zagrebačkoj špici
HIT SEZONE
15 Zagrepčanki odobrilo najveći jesenski trend, sviđa li se vama?
Bojana Gregorić Vejzović u fantatsičnoj suknji koja se može nositi u raznim prigodama
SJAJNO IZDANJE
Bojana Gregorić Vejzović: Suknja od sedam eura koja se može nositi u svim prigodama, ima i džepove
sve
Poznato je zašto Sejda Bešlić nije bila na sprovodu supruga Halida Bešlića
da ti srce pukne!
Otkriveno zašto Sejda nije bila na sprovodu voljenog supruga Halida Bešlića
Ovako su izgledali posljednji dani Halida Bešlića
''inzistirao je da...''
Ovako su izgledali posljednji Halidovi trenuci u bolnici: ''U samo tri dana potpuno je kolabirao...''
Veliki kiks Francuza u borbi za Svjetsko prvenstvo: Hrvatski susjedi praktički se oprostili od šansi
neočekivano
Veliki kiks Francuza u borbi za Svjetsko prvenstvo: Hrvatski susjedi praktički se oprostili od šansi
 

Nastavi čitati

Tehnologija
Predavanje Gorana Tintora
Više od 30 trikova

Kupujete na Temuu? Stručnjak objasnio kakvim se trikovima služe kako bi privukli kupce

piše Hrvoje Jurman
Tehnologija
Konferencija CRO Commerce 2025
CRO Commerce 2025

Hrvatski alat Safe Shop osigurava sigurniju kupovinu na internetskim trgovinama

piše Hrvoje Jurman
Tehnologija
Zapovjedni stožer, ilustracija
Brže donošenje odluka

Generativna AI stiže u vojne stožere i već predstavlja važan alat američkih zapovjednika

piše Branimir Vorša
Tehnologija
Razgovor s chatbotom na mobitelu, ilustracija
Stil je vrlo važan

Želite da vas AI chatbot bolje razumije? Evo kako trebate razgovarati s umjetnom inteligencijom

piše Branimir Vorša
Tehnologija
Ai generirana slika plaže
Ulažu u vlastite snage

Microsoft predstavio vlastiti AI generator slika: "Odličan je i brži od većih, sporijih modela"

piše Branimir Vorša
Tehnologija
Ruski Geran dronovi
Ukrajinske snage upozoravaju

Od kamikaza do lovaca: Ruski Geran dronovi ponovno mijenjaju pravila igre na ukrajinskom bojištu

piše Branimir Vorša
  • Pišite nam
  • Uredništvo
  • Oglašavanje i marketing
  • Uvjeti korištenja
  • Politika zaštite privatnosti
  • Politika o kolačićima
  • Dnevnik
  • Nova Plus
  • Gol.hr
  • Zadovoljna
  • Kreni Zdravo
  • NovaTV
  • DomaTV
Upravljaj obavijestima