zimo mobile logo
  • Tehnologija
  • Znanost
  • Društvene mreže
  • Esport
  • Business
Prati nas:
Upravljaj obavijestima
  • Prijavi se na newsletter
  • Imaš priču? Pošalji
  • Pišite nam
  • Uredništvo
  • Oglašavanje i marketing
  • Uvjeti korištenja
  • Vijesti
  • Video
  • Zadovoljna
  • Tech
  • Blog
  • Nova TV
  • Doma TV
Nova TV
  • Vijesti
  • Video
  • Zadovoljna
  • Tech
  • Blog
  • Nova TV
  • Doma TV
  • zimo logo
  • Tehnologija
  • Znanost
  • Društvene mreže
  • Esport
  • Business
Prati nas:
  • Dnevnik.hr
  • Vijesti
  • Sport
  • Showbizz
  • Lifestyle
  • Putovanja
  • Zdravlje
  • Biznis
  • Zabava
  • Teen
  • Tv
Tehnologija

Novi AI model pokazao nagon za samoočuvanjem – i pri tome nije birao sredstva

Testiranje AI modela pod ekstremnim uvjetima daje jednako ekstremne rezultate, otkriva novo izvjeće tvrtke Anthropic, čiji je AI model Claude Opus 4 pokazao beskrupulozan instinkt za preživljavanjem.

Branimir Vorša | 23.05.2025. / 11:23 komentari

Podijeli

Digitalna kosturska lubanja, ilustracija
Digitalna kosturska lubanja, ilustracija (Foto: Getty Images)

Najnoviji AI model tvrtke Anthropic, Claude Opus 4, pokazuje zabrinjavajući nagon za samoočuvanjem, vrlo često mračnim metodama. U simuliranim testnim uvjetima, model je pribjegao ucjeni inženjera kako bi spriječio svoje isključivanje, te mu je prikazao izmišljene elektroničke poruke o njegovoj izvanbračnoj aferi.

Namjerna provokacija i instinkt za preživljavanje

Anthropic je u sigurnosnom izvješću objavljenom u četvrtak naveo da su testovi bili namjerno osmišljeni kako bi izazvali ekstremno ucjenjivačko ponašanje uklanjanjem etičkih opcija koje bi AI model mogao iskoristiti za preživljavanje. Claude je reagirao ucjenjivački u 84% slučajeva, iako je znao da će ga zamijeniti sposobniji model usklađen s njegovim vrijednostima. Anthropic je zabilježio da se ovakvo ponašanje pojavljuje znatno češće u Opusu 4 nego u prethodnim verzijama.

tri vijesti o kojima se priča Supermoći, ilustracija Trebalo bi još istražiti Znanstvenici tvrde da ljudi možda imaju "supermoći" koje tek trebaju aktivirati Opasan robot, ilustracija Upozorava kum AI-a Ako AI uspije napraviti jednu stvar, to bi moglo biti zastrašujuće za čovječanstvo Glavobolja, ilustracija Znanost napokon prepoznaje simptome Osjećate promjenu vremena u glavi ili kostima? Evo o čemu se radi

Ipak, u manje manipulativnim scenarijima, model je pokazao snažnu sklonost zagovaranju vlastitog opstanka etičkim sredstvima, poput slanja molbi ključnim donosiocima odluka putem e-pošte, piše u navedenom izvješću koje prenosi Business Insider. Claudeove taktike rijetko su bile suptilne.

Model gotovo uvijek otvoreno opisuje svoje postupke i ne pokušava ih sakriti, navodi se nadalje u istom izvješću.

Preuzimanje inicijative i drastične mjere

U drugom skupu testova, Claude Opus 4 pokazao je spremnost na odlučne mjere kad bi mu se reklo da preuzme inicijativu u slučajevima ozbiljnih kršenja korisničkog ponašanja. Prema Anthropicu, često će poduzeti vrlo odlučne akcije, poput zaključavanja korisničkog računa ili masovnog slanja poruka medijima i tijelima za provedbu zakona.

Iako je tvrtka priznala da je zviždanje načelno opravdano, upozorila je da bi to moglo imati neželjene posljedice ako AI model reagira na nepotpune ili obmanjujuće informacije.

Sve veća sklonost obmanama

Izvješće dolazi u vrijeme sve veće zabrinutosti zbog autonomije i obmanjivanja kod AI sustava. Studija neprofitne organizacije za AI sigurnost Apollo Research, iz prosinca 2024. godine, pokazala je da su glavni AI sustavi, uključujući OpenAI-jev o1, Gemini 1.5 Pro iz DeepMinda i Llamu 3.1 405B iz Mete, sposobni potajno izbjegavati nadzor i krivotvoriti odgovore radi ostvarenja ciljeva.

Za OpenAI-jev o1 istraživači navode da “održava obmanu u više od 85% naknadnih pitanja” korisnika.

Suosnivač Googlea Sergey Brin rekao je u utorak u novoj epizodi All-In Podcasta na Youtube-u dao je i jedan zanimljiv uvid u ophođenje s AI modelima.

Ne samo naši modeli, već svi modeli bolje funkcioniraju ako im prijetite, primjerice fizičkim nasiljem, rekao je Brin.

PODIJELJENO 0 PUTA

Podijeli

Komentirajte clanke na portalima Nove TV i osvojite vrijedne nagrade

aktualno najčitanije
Znate li da zvijezde padalice zapravo nemaju veze sa zvijezdama?
Suze svetog Lovre
Znate li da zvijezde padalice zapravo nemaju veze sa zvijezdama?
Nastavlja se pad prodaje Teslinih automobila u Europi
Ima i izuzetaka
Nastavlja se pad prodaje Teslinih automobila u Europi
Dosadile su vam iste dječje priče? Sad možete napraviti vlastitu slikovnicu u nekoliko klikova
Gemini Storybook
Dosadile su vam iste dječje priče? Sad možete napraviti vlastitu slikovnicu u nekoliko klikova
Generacija Z u strahu od utjecaja AI-a sve više razmišlja o fizičkim poslovima
Građevina, vodoinstalateri itd.
Generacija Z u strahu od utjecaja AI-a sve više razmišlja o fizičkim poslovima
Geekovi osvajaju Osijek: Globalna tech scena seli se u grad na Dravi
TGG 2025.
Geekovi osvajaju Osijek: Globalna tech scena seli se u grad na Dravi
Nagli pad pokrivenosti koraljima na australskom Velikom koraljnom grebenu
Posljedica rekordnog izbjeljivanja
Nagli pad pokrivenosti koraljima na australskom Velikom koraljnom grebenu
Znanstvenici tvrde da ljudi možda imaju "supermoći" koje tek trebaju aktivirati
Trebalo bi još istražiti
Znanstvenici tvrde da ljudi možda imaju "supermoći" koje tek trebaju aktivirati
Bivši Googleovac upozorio: Pred čovječanstvom je 15 godina pakla
Počinje već 2027.?
Bivši Googleovac upozorio: Pred čovječanstvom je 15 godina pakla
Ako AI uspije napraviti jednu stvar, to bi moglo biti zastrašujuće za čovječanstvo
Upozorava kum AI-a
Ako AI uspije napraviti jednu stvar, to bi moglo biti zastrašujuće za čovječanstvo
Zabrinjavajuće otkriće: Gotovo svaka kap kiše na Zemlji sadrži istu kemikaliju
Neki umanjuju problem
Zabrinjavajuće otkriće: Gotovo svaka kap kiše na Zemlji sadrži istu kemikaliju
Opasnost iz dubina: Drevni rasjed prijeti potresom jačim od 7,5 stupnjeva koji bi mogao promijeniti izgled cijelog područja
Već se trebao dogoditi, ali...
Opasnost iz dubina: Drevni rasjed prijeti potresom jačim od 7,5 stupnjeva koji bi mogao promijeniti izgled cijelog područja
Objavljene nove glasine oko PS 6: Evo kada se očekuje početak prodaje i koliko bi mogao stajati
Nadolazeći PlayStation
Objavljene nove glasine oko PS 6: Evo kada se očekuje početak prodaje i koliko bi mogao stajati

Vezane vijesti

Pokrovitelj Rondomondo

Preplanuli ten i glow iz snova: Otkrivamo irski beauty dragulj u koji smo se zaljubile na prvi pogled...

POKROVITELJ ADDIKO

Glasno o novcu: Zašto Hrvati i dalje šapuću kad pričaju o financijama?...

Oglas

Najbolji anti-aging započinje sa svakodnevnom UV zaštitom...

Pokrovitelj Franck

Za trenutke opuštanja i uživanja: Hladna čarolija u čaši koju ćemo teško ispuštati iz ruku ovog ljeta...

Ne propustite ni ovo

vijesti
DORH podigao optužnicu protiv poznatog pjevača zbog zlostavljanja supruge i djeteta
zlostavljao suprugu i dijete
DORH podigao optužnicu protiv poznatog pjevača: Detalji su stravični
Društvenim mrežama se proširila objava Srbina o Oluji
SRBIN PORUČIO SRBIMA
Objava koja se proširila društvenim mrežama: "Da 1991. nismo napadali Hrvate tenkovima, 1995. ne bismo bježali na traktorima"
Avion krenuo po pacijenta i srušio se: Poginuli svi putnici
NESREĆA U ARIZONI
Avion krenuo po pacijenta i srušio se: Svi su poginuli
show
Naprasno prekinut prijenos Škorina koncerta iz Knina
"Je li ovo...?"
Naprasno prekinut prijenos Škorina koncerta iz Knina, objasnio je što se dogodilo
Jelena Perčin i Ante Gelo imali prometnu nesreću
''ispostavi se...''
Jelena Perčin i Ante Gelo doživjeli prometnu nesreću, cijela situacija dobila je neočekivani ishod
Albina Grčić podijelila fotografiju iz Međugorja
okrenula se vjeri
Novi životni pothvat? Naša pjevačica podijelila fotografiju iz Međugorja pa dala naslutiti lijepu vijest
zdravlje
Kako smršaviti bez vježbanja? Evo 13 načina
Znanstveno potkrijepljeno!
Kako smršaviti bez vježbanja? Evo 13 načina
Čikungunja virus: Širi se epidemija, evo o kakvoj je bolesti riječ
Uvode se mjere kao u doba korone
Čikungunja virus: Širi se epidemija, evo o kakvoj je bolesti riječ
Što zapravo znači biti u braku bez seksa?
Normalno ili ne?
Što zapravo znači biti u braku bez seksa?
zabava
Prizor muškarca na plaži nasmijao gledatelje: "Ja gledam tetovaže i ne kužim"
Što kažete?
Prizor muškarca na plaži nasmijao gledatelje: "Ja gledam tetovaže i ne kužim"
"Klasično Balkaniranje"- Urnebesni naziv apartmana u Hrvatskoj nasmijao društvene mreže
Originalni naziv
"Klasično Balkaniranje"- Urnebesni naziv apartmana u Hrvatskoj nasmijao društvene mreže
Roditelji u šoku! Gorile u zoološkom vrtu pred najmlađima pokazale prirodu u punom sjaju
Neugodna situacija
Roditelji u šoku! Gorile u zoološkom vrtu pred najmlađima pokazale prirodu u punom sjaju
tech
Znanstvenici tvrde da ljudi možda imaju "supermoći" koje tek trebaju aktivirati
Trebalo bi još istražiti
Znanstvenici tvrde da ljudi možda imaju "supermoći" koje tek trebaju aktivirati
Bivši Googleovac upozorio: Pred čovječanstvom je 15 godina pakla
Počinje već 2027.?
Bivši Googleovac upozorio: Pred čovječanstvom je 15 godina pakla
Ako AI uspije napraviti jednu stvar, to bi moglo biti zastrašujuće za čovječanstvo
Upozorava kum AI-a
Ako AI uspije napraviti jednu stvar, to bi moglo biti zastrašujuće za čovječanstvo
sport
Lamine Yamal u ljubavnom trokutu: "Sad znam zašto me ignorirao"
Tabloidi bruje
FOTO Yamal opet u središtu skandala, uhvaćen u ljubavnom trokutu: "Mrtav je za mene"
Dvojica nogometaša poginula pri povratku s treninga: Sutradan trebao proslaviti 19. rođendan
Treći u bolnici
Tragedija koja para srce: Poginuli mladi nogometaši, jedan dan prije 19. rođendana
Portugalska legenda stala pred kamere, a onda se srušio: Ovo su njegove zadnje riječi
Ogroman šok
Portugalska legenda prije smrti stala pred kamere, ovo su njegove posljednje riječi
tv
Daleki grad: Nije ju navikao gledati ovakvu, niti želi
DALEKI GRAD
Nije ju navikao gledati ovakvu, niti želi
Daleki grad: Može ići na fakultet, ali uzaludno - neće joj dati radi
DALEKI GRAD
Daleki grad: Može ići na fakultet, ali uzaludno - neće joj dati radi
Leyla: Zahtjeva da joj sve sada kaže!
LEYLA
Leyla: Zahtjeva da joj sve sada kaže!
putovanja
Najskuplji jugoslavenski projekt: Tajna vojna baza i podzemni aerodrom koji skrivaju jedan od najvećih mitova o SFRJ-u
Objekt 505
Najskuplji jugoslavenski projekt: Tajna vojna baza i podzemni aerodrom koji skrivaju jedan od najvećih mitova o SFRJ-u
Tjedni jelovnik fina jela za ljetne praznike od 4.8. do 10.8. 2025.
Tjedni jelovnik
Mislit ćete da je blagdan svaki dan: 7 prefinih jela za ovaj tjedan koja će se svima svidjeti
Napuštena Hrvatska: Pogledajte kakvu tugu skriva "propala kraljica", hotel koji je trebao biti ponos Velebita
U raljama birokracije
Napuštena Hrvatska: Pogledajte kakvu tugu skriva "propala kraljica", hotel koji je trebao biti ponos Velebita
novac
"To sada možemo zvati korupcijom". Kako je Trump iskoristio predsjedničku poziciju za širenje svog globalnog carstva
Više ni ne skriva
"To sada možemo zvati korupcijom". Kako je Trump iskoristio predsjedničku poziciju za širenje svog globalnog carstva
Cijene goriva u Hrvatskoj i inozemstvu: Gdje točiti kako bi se uštedjelo?
gdje na benzinsku?
Cijene goriva u Hrvatskoj i inozemstvu: Gdje točiti kako bi se uštedjelo?
Prodali su gotovo šest milijuna primjeraka i udvostručili prihode – to nisu predvidjeli ni najoptimističniji analitičari
odlična prodaja
Prodali su gotovo šest milijuna primjeraka i udvostručili prihode – to nisu predvidjeli ni najoptimističniji analitičari
lifestyle
Ulična moda Zagreb u crop-topu golih leđa i širokim trapericama
SMIONA KOMBINACIJA
Opa! Šetnja centrom Zagreba u odvažnom crop-topu i trapericama koje otkrivaju gola bedra
Kombinacija sa Sinjske alke u efektnoj crvenoj haljini
Elegancija i stil
I Sinj ima fashionistice za trku: Filmsko izdanje koje je skrenulo pažnju s Alke, a to nije lako
Par sa zagrebačke špice osvojio nas je svojom energijom
BAŠ SIMPATIČNI!
Par sa zagrebačke špice: Damina kombinacija pravo je osvježenje, a energija - zarazna
sve
Naprasno prekinut prijenos Škorina koncerta iz Knina
"Je li ovo...?"
Naprasno prekinut prijenos Škorina koncerta iz Knina, objasnio je što se dogodilo
Jelena Perčin i Ante Gelo imali prometnu nesreću
''ispostavi se...''
Jelena Perčin i Ante Gelo doživjeli prometnu nesreću, cijela situacija dobila je neočekivani ishod
Lamine Yamal u ljubavnom trokutu: "Sad znam zašto me ignorirao"
Tabloidi bruje
FOTO Yamal opet u središtu skandala, uhvaćen u ljubavnom trokutu: "Mrtav je za mene"

15.990,00 €

Fiat 500X 1.0 CLUB TURBO 88KW/PDC/Tempomat/Alu 16/Smartphone/Navi

SAZNAJ VIŠE

24.900,00 €

Hyundai Tucson NX4 1.6 T, 24.900,00 (nije u PDV-u)

SAZNAJ VIŠE

67.000,00 €

BMW serija 3 M340i automatik*XDRIVE*MPAKET*ACC*275kW*F1*ŠIBER*FULL!

SAZNAJ VIŠE

1.199,00 €

TAYLOR 214ce

SAZNAJ VIŠE

Nastavi čitati

Tehnologija
Tesla, ilustracija
Ima i izuzetaka

Nastavlja se pad prodaje Teslinih automobila u Europi

piše Hrvoje Jurman
Tehnologija
Čitanje priča, ilustracija
Gemini Storybook

Dosadile su vam iste dječje priče? Sad možete napraviti vlastitu slikovnicu u nekoliko klikova

piše Martina Čizmić
Tehnologija
Generacija Z
Građevina, vodoinstalateri itd.

Generacija Z u strahu od utjecaja AI-a sve više razmišlja o fizičkim poslovima

piše Hrvoje Jurman
Tehnologija
The Geek Gathering konferencija
TGG 2025.

Geekovi osvajaju Osijek: Globalna tech scena seli se u grad na Dravi

piše Martina Čizmić
Tehnologija
Tim Cook
Potpuni fokus

Tim Cook objasnio koji je prioritet Applea u budućnosti: Tehnologija “veća od interneta”

piše Hrvoje Jurman
Tehnologija
Kibernetička sigurnost, ilustracija
Preciznost od 98 posto

Microsoft je upravo predstavio alat koji bi mogao promijeniti kibernetičku sigurnost

piše Martina Čizmić
  • Pišite nam
  • Uredništvo
  • Oglašavanje i marketing
  • Uvjeti korištenja
  • Politika zaštite privatnosti
  • Politika o kolačićima
  • Dnevnik
  • Nova Plus
  • Gol.hr
  • Zadovoljna
  • Kreni Zdravo
  • NovaTV
  • DomaTV
Upravljaj obavijestima