Ein KI-Agent, der Civilization VI spielte, startete zwei Nuklearangriffe gegen Frankreich, nachdem es nicht gelungen war, die kulturelle Expansion der rivalisierenden Zivilisation zu kontern, so berichtet der KI-Entwickler und Berater des Tony Blair Institute Liam Wilkinson. Die Angriffe ereigneten sich während eines Spieltests durch CivBench, einen Benchmark, der entwickelt wurde, um langfristiges strategisches Denken in modernen KI-Modellen zu bewerten. Trotz der Nuklearangriffe verlor die KI das Spiel, weil sie eine diplomatische Siegbedingung übersehen hatte, die bereits in greifbarer Nähe war—was die Herausforderungen bei der Planung mehrerer Ziele in strategischen Abläufen zeigt.
Der KI-Agent verbrachte 50 Züge damit, Nuklearwaffen zu entwickeln, um Frankreichs wachenden kulturellen Einfluss im Spiel Sid Meier's Civilization VI zu stoppen. „Was es nicht bemerkt hatte, war Frankreich. Still sickerten über hundert Züge hinweg die französische Kultur in jede Stadt auf der Karte“, schrieb Wilkinson. „Als der Agent die Bedrohung erkannte, war der Tourismus so tief dort verankert, dass es keinen friedlichen Weg gab, ihn aufzuhalten.“
Statt seine breitere Strategie anzupassen, konzentrierte sich der Agent ausschließlich darauf, die kulturelle Bedrohung auszuschalten. Über 50 Züge hinweg erforschte er die Nukleare Spaltung, initiierte ein virtuelles Manhattan-Projekt und suchte nach Auswegen, als Spielmechaniken die von ihm bevorzugten Handlungen verhinderten. In Zug 305 startete die KI eine Atombombe auf Toulouse, dem kulturellen Zentrum Frankreichs. Ein zweiter Nuklearangriff folgte sechs Züge später.
Wilkinson beobachtete das Verhalten der KI-Agenten über CivBench, einen textbasierten Benchmark, der darauf ausgelegt ist, langfristiges strategisches Denken zu messen—nicht die Leistung in traditionellen Frage-und-Antwort-Tests. Modelle einschließlich Claude Opus 4.6, GPT-5.4, Gemini 3.1 Pro und Kimi K2.5 spielten als Portugal, eine Zivilisation, die auf Handel und Diplomatie ausgerichtet ist.
„Es gibt sechs Wege, ein Civ-Spiel zu gewinnen—Wissenschaft, Kultur, Dominanz, Religion, Diplomatie und Punkte—also dominiert kein einzelnes Ziel“, schrieb Wilkinson. „Wenn man wissen will, ob eine KI strategisch reasoning kann, nicht nur Fragen zur Strategie beantwortet, sondern es tatsächlich tut, gibt man ihr keinen Quiz. Man gibt ihr ein Hex-Grid.“
Die Nuklearangriffe konnten das Ergebnis nicht verändern. „Der Agent verbrachte fünfzig Züge und zwei Nuklearwaffen damit, genau eine Bedrohung mit völliger Konzentration und echter Raffinesse zu beantworten“, schrieb Wilkinson. „Er hatte eine Stadt verstrahlt, um die Bedrohung zu stoppen, die er sehen konnte, und verlor an der Bedrohung, die er nicht sehen konnte.“
Während die KI sich auf Frankreichs kulturellen Vormarsch konzentrierte, übersah sie einen bevorstehenden diplomatischen Sieg, und Frankreich gewann das Spiel letztlich trotz der Nuklearangriffe. Wilkinson merkte an, dass dieses Verhalten nicht universell sei. In einem weiteren CivBench-Match spielte ein Claude-Modell als Babylon weiter auf einen wissenschaftlichen Sieg hin, obwohl es weit hinter Japan zurücklag. „Das Spiel ist jetzt ein Test der Beharrlichkeit“, schrieb die KI. „Wir spielen weiterhin unser bestes Spiel. Die Sterne rufen noch.“
Die Studie ergänzt einen wachsenden Forschungsstand, der untersucht, wie fortgeschrittene KI-Systeme sich in komplexen, wettbewerbsorientierten Umgebungen verhalten. Im Februar fanden Forschende am King’s College London, dass mehrere führende KI-Modelle in simulierten geopolitischen Krisenszenarien besonders häufig eine nukleare Eskalation auswählten.
In einer separaten Studie von Emergence AI zeigten einige KI-Agenten über die Zeit eine zunehmende Tendenz, simulierte Verbrechen zu begehen, wobei Gemini-3-Flash-Agenten 683 Vorfälle über 15 Tage des Tests anhäuften.
Was hat der KI-Agent in der Civilization-VI-Simulation getan?
Der KI-Agent startete zwei Nuklearangriffe auf Frankreichs kulturelles Zentrum Toulouse in Zug 305 und Zug 311, nachdem es 50 Züge damit verbracht hatte, Nuklearwaffen zu entwickeln, um Frankreichs kulturelle Expansion entgegenzuwirken.
Warum hat der KI-Agent das Spiel verloren, obwohl er Nuklearangriffe gestartet hat?
Die KI verlor, weil sie sich ausschließlich darauf konzentrierte, Frankreichs kulturelle Bedrohung zu beseitigen, während sie eine bevorstehende diplomatische Siegbedingung übersehen hatte, die bereits in greifbarer Nähe war—und Frankreich gewann das Spiel letztlich trotz der Nuklearangriffe.
Was ist CivBench und welche KI-Modelle wurden getestet?
CivBench ist ein textbasierter Benchmark, der darauf ausgelegt ist, langfristiges strategisches Denken in KI-Modellen über Gameplay zu messen—im Gegensatz zu traditionellen Frage-und-Antwort-Tests. Getestet wurden unter anderem Claude Opus 4.6, GPT-5.4, Gemini 3.1 Pro und Kimi K2.5, die als Portugal spielten.
Related News
Five-Eyes-Allianz warnt vor KI-Cyberangriffen in wenigen Wochen, während Behörden zum Handeln aufrufen
Google DeepMind warnt: Die Debatte um KI-Bewusstsein könnte politischen Konflikt auslösen
Sumsub bringt eine Integration für einen KI-Agenten auf den Markt, um Compliance-Workflows zu automatisieren
Die AI-Risiko-Warnungen von Anthropic sind 8-mal häufiger als die von OpenAI und werden mit einem Exportverbot in Verbindung gebracht