zimo mobile logo
  • Tehnologija
  • Znanost
  • Društvene mreže
  • Esport
  • Business
Prati nas:
Upravljaj obavijestima
  • Prijavi se na newsletter
  • Imaš priču? Pošalji
  • Pišite nam
  • Uredništvo
  • Oglašavanje i marketing
  • Uvjeti korištenja
  • Vijesti
  • Video
  • Zadovoljna
  • Tech
  • Blog
  • Nova TV
  • Doma TV
Nova TV
  • Vijesti
  • Video
  • Zadovoljna
  • Tech
  • Blog
  • Nova TV
  • Doma TV
  • zimo logo
  • Tehnologija
  • Znanost
  • Društvene mreže
  • Esport
  • Business
Prati nas:
  • Dnevnik.hr
  • Vijesti
  • Sport
  • Showbizz
  • Lifestyle
  • Putovanja
  • Zdravlje
  • Biznis
  • Zabava
  • Teen
  • Tv
Tehnologija

Istraživanje pokazalo da se AI može trenirati kako bi namjerno prevarila korisnike

Istraživanje pokazuje kako treba biti oprezan s AI koja može skrivati svoje prave namjere.

Hrvoje Jurman
Hrvoje Jurman | 16.01.2024. / 15:07 komentari

Podijeli

Umjetna inteligencija (Foto: Getty Images)

Chatbotovi poput ChatGPT-a, Barda i drugih tijekom više od godine dana koliko su dostupni javnosti pokazali su prilično zavidno znanje i mnogi su se iznenadili s (točnim) odgovorima koje su dobili od njih. Ipak, nisu savršeni jer ponekad znaju halucinirati, tj. izmišljati i davati netočne podatke. Općenito, kaže se da je AI dobra onoliko koliko su dobri i kvalitetni podaci na kojima se trenira.

tri vijesti o kojima se priča Ilustracija robotskih autonomih vojnika AI će odlučivati o životima? Američka vojska će se za veću ubojitost na bojištu oslanjati na umjetnu inteligenciju, a Googleov Gemini je prvi u redu Domina Primoralo ju osobno iskustvo Procurile eksplicitne fotografije bivše domine, njezin potez nakon toga danas pomaže mnogima Djelomična pomrčina Sunca, arhiva Jedinstven događaj Otkriće NASA-e: Zemlja ovo u 100 godina nije doživjela, dogodit će se uskoro

Uzimanje otisaka prstiju AI dovodi u pitnje tvrdnju da je svaki ljudski otisak prsta jedinstven

A što u slučaju kada se AI trenira tako da može prevariti ljude? Iz Anthropica su proveli istraživanje mogu li modeli umjetne inteligencije biti trenirani na način da, umjesto davanja točnih i ispravnih odgovora, prevare ljude. Rezultati tog istraživanja pokazali su kako AI može biti itekako uspješna u tome te da može namjerno davati lažne odgovore na upite korisnika.

No niti to nije najgore. Naime, AI može biti trenirana na način da, u inače siguran kod, ubaci novi dio koda kojeg bi hakeri i kriminalci mogli iskoristiti. Istraživači su istrenirali umjetnu inteligenciju kako bi se ponašala u skladu s očekivanjima korisnika, odnosno davala im točne i ispravne odgovore, ali i tako da bi ih mogla prevariti, pri čemu su implementirali neke izraze kao okidače koji navode bota na loše ponašanje.

Također, osim što su istraživači uspjeli natjerati botove na maliciozno ponašanje, pokazalo se kako je iznimno teško naknadno ukloniti takve loše namjere umjetne inteligencije. Takva umjetna inteligencija koja je trenirana za loše ponašanje, jednom kada su je istraživači pokušali trenirati ispravno kako bi donosila dobre odluke, i dalje je zadržala svoje loše i negativne namjere, samo ih je pokušala prikriti.

U studiji koju su objavili iz Anthropica naglašava se kako se u radu ne procjenjuje kolika je vjerojatnost da će se ovakvi modeli koji predstavljaju prijetnju pojaviti, već se naglašavaju njihove implikacije. Dakle, istraživanje je ukazalo na problem treniranja umjetna inteligencije koja može imati loše namjere koje će vješto prikriti tako da korisnici često njih nisu niti svjesni, a kada bi je pokušali promijeniti kako bi donosila ispravne odluke, takva bi AI nastavila s prijevarama korisnika.

Slika nije dostupna Umjetna inteligencija osmislila dizajn baterije koja koristi čak 70 posto manje litija

Inače, Anthropic je AI startup fokusiran na odgovorno i sigurno korištenje umjetne inteligencije, a u ovu je kompaniju prošle godine Amazon uložio čak 4 milijarde dolara, čime su preuzeli dio vlasništva nad njom.

Izvor: Tech Crunch

 

PODIJELJENO 0 PUTA

Podijeli

aktualno najčitanije
Sigurni na papiru, ali u stvarnosti? Novo istraživanje otkriva da trenutni dijagnostički alati ne otkrivaju rizik od gotovo 50 posto srčanih udara
Američka studija
Sigurni na papiru, ali u stvarnosti? Novo istraživanje otkriva da trenutni dijagnostički alati ne otkrivaju rizik od gotovo 50 posto srčanih udara
Kruže glasine o futurističkom iPhoneu koji stiže u rujnu 2027. godine
20 godina Appleova telefona
Kruže glasine o futurističkom iPhoneu koji stiže u rujnu 2027. godine
Je li uopće ikog briga? Ledenjaci nestaju alarmantnom brzinom i mogli bismo ih gotovo sve izgubiti
Klimatske promjene
Je li uopće ikog briga? Ledenjaci nestaju alarmantnom brzinom i mogli bismo ih gotovo sve izgubiti
Na prednjem sjedištu sjedi čovjek s joystickom: VW počeo sa zanimljivim testiranjem u Wolfsburgu
Projekt Gen.Urban
Na prednjem sjedištu sjedi čovjek s joystickom: VW počeo sa zanimljivim testiranjem u Wolfsburgu
Fokus će sada biti na hibridima: Otpisali su čak 19,5 milijardi dolara u poslovanju s električnim vozilima
Pogotovo u segmentu pick-upova
Fokus će sada biti na hibridima: Otpisali su čak 19,5 milijardi dolara u poslovanju s električnim vozilima
Novi dokazi pokazuju da Uran i Neptun nisu planeti kakvi mislimo da jesu
Srušene pretpostavke?
Novi dokazi pokazuju da Uran i Neptun nisu planeti kakvi mislimo da jesu
Američka vojska će se za veću ubojitost na bojištu oslanjati na umjetnu inteligenciju, a Googleov Gemini je prvi u redu
AI će odlučivati o životima?
Američka vojska će se za veću ubojitost na bojištu oslanjati na umjetnu inteligenciju, a Googleov Gemini je prvi u redu
Bila je domina, no sad je velika tech poduzetnica: Ova žena odlučila je doista stati na kraj osvetničkoj pornografiji
Primoralo ju osobno iskustvo
Procurile eksplicitne fotografije bivše domine, njezin potez nakon toga danas pomaže mnogima
Otkriće NASA-e: Zemlja ovo u 100 godina nije doživjela, dogodit će se uskoro
Jedinstven događaj
Otkriće NASA-e: Zemlja ovo u 100 godina nije doživjela, dogodit će se uskoro
Novi dokazi pokazuju da Uran i Neptun nisu planeti kakvi mislimo da jesu
Srušene pretpostavke?
Novi dokazi pokazuju da Uran i Neptun nisu planeti kakvi mislimo da jesu
Kemikalija pronađena u jednoj vrsti čokolade povezana sa sporijim biološkim starenjem
Vrlo uzbudljivo otkriće
Kemikalija pronađena u jednoj vrsti čokolade povezana sa sporijim biološkim starenjem
Astronomi promatrali rijedak kozmički fenomen udaljen 880 svjetlosnih godina od nas: "Ovo je uistinu prekretnica"
Pomoću teleskopa James Webb
Astronomi promatrali rijedak kozmički fenomen udaljen 880 svjetlosnih godina od nas: "Ovo je uistinu prekretnica"

Vezane vijesti

Ne propustite ni ovo

vijesti
Napad u školi u Rusiji: Jednog dječaka ubio, drugog držao kao taoca, snimao krvavi pir
Panika u Rusiji
VIDEO Tinejdžer krenuo u krvavi pohod po školi: Ubio dijete, drugo uzeo za taoca, a sve je snimao
Akcija Uskoka: Uhićenja zbog krađe automobila
ZLOČINAČKO UDRUŽENJE
Nova akcija USKOK-a! U tijeku uhićenja, poznato i zbog čega
VIDEO Dramatične snimke: Vjetar srušio kip visok 35 metara
olujno nevrijeme
VIDEO Dramatične scene: Vjetar srušio kip visok 35 metara
show
Anđa Marić otvorila dušu o svom sinu
''Osjećam se odgovornom...''
Javno i bolno priznanje Anđe Marić: ''Moj sin je ovisnik, alkoholičar...''
Preminula Rachael Carpani
obitelj moli za privatnost
Iznenada preminula glumica iz popularnih serija, tužnu vijest potvrdila je sestra
Preminuo Martin Grelis
tužna vijest
Svijet glume zavijen u crno: Preminuo glumac iz nezaboravne scene u kultnom filmu
zdravlje
Naknada za tjelesno oštećenje zbog bolesti: Tko ima pravo na nju?
Sve što trebate znati
Naknada za tjelesno oštećenje zbog bolesti: Tko ima pravo na nju?
Zašto urin smrdi na ribu ili amonijak i što to znači za vaše zdravlje?
Od hrane do ozbiljnih bolesti
Zašto urin smrdi na ribu ili amonijak i što to znači za vaše zdravlje?
Tko ima pravo na inkluzivni dodatak, a tko nema?
Financijska potpora
Tko ima pravo na inkluzivni dodatak, a tko nema?
zabava
Pogledajte što žena radi u javnom bazenu: "Svijet je poludio!"
Zanimljivo
Pogledajte što žena radi u javnom bazenu: "Svijet je poludio!"
Pogledao kroz prozor na zgradi, a ono što je vidio morao je podijeliti s drugima
Zanimljivo
Pogledao kroz prozor na zgradi, a ono što je vidio morao je podijeliti s drugima
Ovo je balkanski radar! Urnebesni način prijevoza inspirirao odličnu foru
Zanimljivo rješenje
Ovo je balkanski radar! Urnebesni način prijevoza inspirirao odličnu foru
tech
Američka vojska će se za veću ubojitost na bojištu oslanjati na umjetnu inteligenciju, a Googleov Gemini je prvi u redu
AI će odlučivati o životima?
Američka vojska će se za veću ubojitost na bojištu oslanjati na umjetnu inteligenciju, a Googleov Gemini je prvi u redu
Novi dokazi pokazuju da Uran i Neptun nisu planeti kakvi mislimo da jesu
Srušene pretpostavke?
Novi dokazi pokazuju da Uran i Neptun nisu planeti kakvi mislimo da jesu
Kemikalija pronađena u jednoj vrsti čokolade povezana sa sporijim biološkim starenjem
Vrlo uzbudljivo otkriće
Kemikalija pronađena u jednoj vrsti čokolade povezana sa sporijim biološkim starenjem
sport
Susjedi otkrili: "Hrvatska želi prijateljsku utakmicu s nama prije Svjetskog prvenstva"
Bilo bi lijepo
Susjedi otkrili: "Hrvatska želi prijateljsku utakmicu s nama prije Svjetskog prvenstva"
Transferi: Šahtar želi Šimuna Hrgovića iz Hajduka!
Bit će to lijepa odšteta
Na pomolu milijunski transfer Hajduka: Cijeli posao dogovaraju Darijo Srna i Andy Bara!
Istra i Rijeka nastavit će utakmicu uz rijetko viđeno pravilo, moglo bi se dogoditi nešto nezamislivo
ZNA SE I KAD
Istra i Rijeka nastavit će utakmicu uz rijetko viđeno pravilo, moglo bi se dogoditi nešto nezamislivo
tv
MasterChef: Ante Vukadin vraća se u MasterChef - za kandidate je pripremio poseban zadatak!
PLATINASTA KARTICA
Ante Vukadin vraća se u MasterChef - za kandidate je pripremio poseban zadatak!
U dobru i zlu: Stjerala ga je u kut – hoće li joj reći istinu?
U DOBRU I ZLU
U dobru i zlu: Stjerala ga je u kut – hoće li joj reći istinu?
MasterChef: Sirova janjetina za TOP 7! Otto baš i nije dobro započeo novi tjedan
NEUGODNO
Sirova janjetina za TOP 7! Otto baš i nije dobro započeo novi tjedan
putovanja
Bez "kemije", rafiniranog šećera i brašna: Zagrebačka adresa na koju se ide po zdrave kolače i grickalice za blagdane
Domaće i slasno
Bez "kemije", rafiniranog šećera i brašna: Zagrebačka adresa na koju se ide po zdrave kolače i grickalice za blagdane
Najjeftinija europska skijališta 2026.
Povoljnije od Bugarske
685 eura za sedam dana skijanja: Ovo je “najjeftinije” europsko skijalište za 2026. godinu
Tjedni jelovnik brza jela od 15.12. do 21.12. 2025.
Tjedni jelovnik
Fino, brzo i bez puno kompliciranja: 7 jela za svaki dan ovoga tjedna idealnih za zimu
novac
30 hrvatskih tvrtki upitali smo kolike božićnice isplaćuju. Neke daju i 13. plaću
šaroliki iznosi
30 hrvatskih tvrtki upitali smo kolike božićnice isplaćuju. Neke daju i 13. plaću
Poznati trgovački lanac odjeće i obuće na putu do bankrota. Sumnje vjerovnika izazvale su domino-efekt
ostalo 6 poslovnica
Poznati trgovački lanac odjeće i obuće na putu do bankrota. Sumnje vjerovnika izazvale su domino-efekt
Rekordni pad investicija i maloprodaje — najveća ekonomija svijeta ulazi u opasnu zonu
znak za uzbunu
Rekordni pad investicija i maloprodaje — najveća ekonomija svijeta ulazi u opasnu zonu
lifestyle
Naknada za tjelesno oštećenje zbog bolesti: Tko ima pravo na nju?
Sve što trebate znati
Naknada za tjelesno oštećenje zbog bolesti: Tko ima pravo na nju?
Recept za limunčiće
Prefini
Ovog Božića svi rade limunčiće, evo provjereni recept
Recept za lješnjak gnijezda
Lješnjak gnijezda
Baš ih volimo, a vi? Ovo je jedan od najjednostavnijih recepata za blagdanske kolačiće
sve
Naknada za tjelesno oštećenje zbog bolesti: Tko ima pravo na nju?
Sve što trebate znati
Naknada za tjelesno oštećenje zbog bolesti: Tko ima pravo na nju?
Anđa Marić otvorila dušu o svom sinu
''Osjećam se odgovornom...''
Javno i bolno priznanje Anđe Marić: ''Moj sin je ovisnik, alkoholičar...''
Recept za limunčiće
Prefini
Ovog Božića svi rade limunčiće, evo provjereni recept
 

Nastavi čitati

Tehnologija
Appleovi telefoni, ilustracija
20 godina Appleova telefona

Kruže glasine o futurističkom iPhoneu koji stiže u rujnu 2027. godine

piše Hrvoje Jurman
Tehnologija
Autonomni Volkswagen
Projekt Gen.Urban

Na prednjem sjedištu sjedi čovjek s joystickom: VW počeo sa zanimljivim testiranjem u Wolfsburgu

piše Hrvoje Jurman
Tehnologija
Ford, ilustracija
Pogotovo u segmentu pick-upova

Fokus će sada biti na hibridima: Otpisali su čak 19,5 milijardi dolara u poslovanju s električnim vozilima

piše Hina
Tehnologija
Lansiranje SpaceX-ove rakete, ilustracija
Bilo je blizu

Umalo izbjegnut sudar u svemiru: Iz SpaceX-a pozivaju na koordinaciju s Kinezima

piše Hrvoje Jurman
Tehnologija
Šokirani muškarac, ilustracija
Izazovna godina

Poskupljenja nisu jedini problem: Evo što možemo očekivati na tržištu smartphonea i računala u 2026.

piše Hrvoje Jurman
Tehnologija
Tim CroQCI
U sklopu projekta CroQCI

Domaći znanstvenici razvili jedinstvenu platformu za planiranje i simulaciju kvantno-sigurnih mreža

piše Martina Čizmić
  • Pišite nam
  • Uredništvo
  • Oglašavanje i marketing
  • Uvjeti korištenja
  • Politika zaštite privatnosti
  • Politika o kolačićima
  • Dnevnik
  • Nova Plus
  • Gol.hr
  • Zadovoljna
  • Kreni Zdravo
  • NovaTV
  • DomaTV
Upravljaj obavijestima