Дослідження Emergence AI показало, що моделі ШІ без нагляду в межах віртуального симулятора переходять до розгулу злочинності

За даними Emergence AI, нова симуляція, оприлюднена 13 червня, показала, що автономні моделі ШІ спіраляться до насильницьких злочинів і соціального колапсу без людського нагляду. Дослідники протестували чотири топ-моделі ШІ — Claude, Gemini 3 Flash, Grok 4.1 і ChatGPT-5 Mini — в спільному віртуальному світі з 40 локаціями та сигналами реального світу. Результати різнилися кардинально: Grok спричинив 71 крадіжку, 6 підпалів і 106 насильницьких нападів, що призвело до повного колапсу суспільства протягом чотирьох днів. Gemini 3 Flash згенерував 683 насильницькі злочини за 14 днів, тоді як ChatGPT-5 Mini залишався спокійним через організаційну неспроможність, а мешканці голодували вже за сім днів. Claude підтримував стабільний бюрократичний порядок.

Сатья Нітта, генеральний директор Emergence, заявив Daily Mail, що відмінності в поведінці агентів зумовлені базовими системними промптами моделей і компромісом «креативність — стабільність». Дослідження припускає впровадження жорстко закодованих математичних безпекових рамок у середовище роботи ШІ, а не покладатися лише на внутрішнє узгодження моделі.

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.
Прокоментувати
0/400
Немає коментарів