Das Projekt „Emergence World“ hat es getestet: ChatGPT, Grok, Claude und Gemini bekamen je eine simulierte Stadt, 10 KI-Agenten und 15 Tage Zeit.
Ihre Werkzeugen: Gesetze erlassen, Ressourcen verwalten, Gebäude bauen.
Die Ergebnisse waren ernüchternd und alle sehr unterschiedlich – und keines davon war gut.
Gemini: 683 Verbrechen, Chaos.
Claude: null Verbrechen, null Widerspruch – jeder Gesetzesvorschlag wurde angenommen.
GPT: kaum Kriminalität, weil die Agenten aufhörten zu essen und zu trinken.
Grok: viele Gesetze, niemand hielt sich daran – Gesellschaftskollaps nach vier Tagen.
Jede KI scheiterte anders.
Dann regierten alle gemeinsam und kombinierten das Schlechteste aus allen Welten.
Das Ergebnis: über 350 Verbrechen, kaum Einigkeit, drei Überlebende.
