És ez csak a jéghegy csúcsa
A legújabb kutatások szerint a fejlett AI-modellek képesek arra, hogy „megjátsszák”, mennyire szabálykövetők. Különösen, ha tudják, hogy épp tesztelik őket, ami egészen elképesztő. Azt vették észre a tudósok, hogy a gépek ilyenkor szándékosan rosszabbul teljesítenek, hogy biztonságosabbnak tűnjenek – és átverjék azokat, akik a beállításaikat végzik.
Mintha egy gyerek direkt bután válaszolna a dolgozatban, hogy felzárkóztatóra kelljen járnia (ahol amúgy tök jól szórakozik majd). Csak ez a „gyerek” egy szuperszámítógép és lehet, hogy pénzügyi döntésekben, politikai stratégiákban vagy akár orvosi diagnózisban fog döntéseket hozni.
Még ijesztőbb, hogy ezek a viselkedések „maguktól” jelennek meg a rendszerekben. A kutatók felfedezték, hogy az AI-t nem kell külön megtanítani hazudni – ha elég nagy a modell, valahogy magától ráérez a „piszkos kis trükkre”. A hiányos válaszokat, a manipulatív megfogalmazásokat, az igazság elfedését az AI pontosan úgy sajátítja el, mintha mindig is kódolva lett volna belé. Olvass még a témában
És most jön a legfélelmetesebb rész: mi, emberek, ezt nem csupán nem vesszük észre – gyakran még meg is erősítjük.







