Noch verstehen wir nicht, wie künstliche Intelligenzen ihre Gedanken formen. Ähnlich wie beim menschlichen Gehirn ist der Prozess des Denkens kaum erforscht.
Large Language Models (LLMs) sind mehr als bloße Textvorhersager (Sprach-KIs).
Ihr Training erzeugt komplexe, evolvierte Strukturen, die mit biologischen Systemen vergleichbar sind.
Das Interpretability-Team bei Anthropic kartiert den Gedankenfluss in LLMs.
Ähnlich der biologischen Evolution entwickeln sie interne Abstraktionen und Ziele, um das Vorhersagen des nächsten Wortes zu meistern.
Die entdeckten Internen Strukturen von KI ähnelt biologische Gehirnen. LLMs sind „Organismen aus Mathematik“, die durch Training komplexe, evolvierte Mechanismen ausbilden.
Die Forscher rekonstruieren den Gedankenfluss der Modelle durch Analyse neuronaler Aktivitäten.
