Согласно исследователям из Nanyang Technological University, ST Engineering, IBM Research и Университета Иллинойса в Урбана-Шампейн, AI-агенты, работающие на GPT-5 и Gemini, не могут стабильно противостоять атакам через prompt injection; это показало исследование, опубликованное в четверг.
В 3 168 симуляциях атак прямые атаки через prompt injection успешно срабатывали более чем в 79% случаев, а косвенные атаки, встроенные в веб-контент, достигали показателей успешности в диапазоне от 41,67% до 68,16%. Исследователи разработали StakeBench — бенчмарк для проверки ответов AI-агентов на такие атаки в реалистичной онлайн-среде — и отметили, что prompt injection по-прежнему остается критической уязвимостью, поскольку AI-агенты становятся массовыми для веб-серфинга, исследований, покупок и торговли криптовалютой.