Die Frage, ob die menschliche Sprachfähigkeit auf biologisch verankerten, angeborenen Mechanismen beruht oder sich dynamisch durch Erfahrung und Nutzung formt, spaltet die linguistische und neurowissenschaftliche Forschung seit Jahrzehnten in zwei große Denkschulen. Während die von Noam Chomsky geprägte Theorie der Universalgrammatik postuliert, dass Menschen mit einem genetisch fest verdrahteten grammatikalischen Grundgerüst zur Welt kommen, argumentiert die kognitive Linguistik, dass syntaktische Strukturen und sprachliche Kategorien das Resultat von Musterextraktion aus dem tatsächlichen Sprachgebrauch sind. Jüngste interdisziplinäre Forschungsarbeiten an der Schnittstelle von Kognitionswissenschaft, Neurophysiologie und künstlicher Intelligenz (KI) liefern nun starke empirische Belege, die die Annahmen der kognitiven Linguistik stützen und das menschliche Gehirn als eine hochgradig prädiktive Verarbeitungsmaschine entlarven. Ein Forschungsteam um Patrick Krauss von der Friedrich-Alexander-Universität Erlangen-Nürnberg und Achim Schilling von der Universität Heidelberg konnte in bahnbrechenden Untersuchungen nachweisen, dass sowohl das biologische Gehirn als auch künstliche Sprachmodelle (Large Language Models, LLMs) Sprache nach verblüffend ähnlichen Prinzipien der statistischen Vorhersagbarkeit organisieren und verarbeiten.
In einem wegweisenden computergestützten Experiment untersuchten die Wissenschaftler, ob komplexe grammatikalische Strukturen spontan und ohne explizites Vorwissen allein aus der kontinuierlichen Nutzung von Sprache extrahiert werden können. Anstatt menschlicher Probanden trainierten sie ein rekurrentes künstliches neuronales Netz – eine Technologie, deren mathematische Informationsverarbeitung der Architektur biologischer Nervensysteme nachempfunden ist – mit literarischen Texten wie Daniel Glattauers Roman Gut gegen Nordwind und Douglas Adams‘ Per Anhalter durch die Galaxis. Die dem Modell gestellte Aufgabe simulierte ein fundamentales Prinzip der menschlichen Kognition: Nach der Eingabe von jeweils neun Wörtern sollte das exakte zehnte Wort vorhergesagt werden. Dem System wurden dabei keinerlei explizite Informationen über Syntax, Grammatik oder Wortarten zur Verfügung gestellt. Die Analysen der einzelnen Verarbeitungsschritte innerhalb der sogenannten bidirektionalen Long-Short-Term-Memory-Schichten (LSTM), die wie ein internes Gedächtnis fungieren, offenbarten Erstaunliches. Das Sprachmodell begann Schicht für Schicht autonomously, die Eingabesequenzen um spezielle abstrakte linguistische Kategorien wie Verben, Nomen oder Adjektive zu gruppieren. Ohne jegliche menschliche Instruktion antizipierte die KI das korrekte Folgewort mit einer bemerkenswerten Präzision. Dieser Befund demonstriert eindrucksvoll, dass formale Sprachregeln und Wortklassen spontan im Zuge der rein statistischen Verarbeitung sprachlicher Datenströme entstehen können, was die Notwendigkeit einer angeborenen Universalgrammatik drastisch infrage stellt.
Dass diese mathematischen Prinzipien der künstlichen neuronalen Netze keine bloße technische Abstraktion sind, sondern die tatsächliche neurobiologische Realität des Menschen widerspiegeln, bewies das Forschungsteam in einer anschließenden neurophysiologischen Studie. Mittels simultaner Elektro- und Magnetoenzephalographie (EEG/MEG) wurde die Hirnaktivität von 29 Probanden im Millisekundenbereich aufgezeichnet, während diese in einer natürlichen Hörsituation einem Hörbuch lauschten. Die so gewonnenen neuronalen Daten wurden direkt mit den Vorhersagewahrscheinlichkeiten dreier moderner KI-Sprachmodelle – einem BERT-Modell und zwei multilingualen LLaMA-Modellen – abgeglichen. Die Ergebnisse untermauern die Theorie des Predictive Coding, wonach das Gehirn kontinuierlich Top-down-Vorhersagen generiert und diese mit dem einströmenden Bottom-up-Sinnesinput abgleicht. Je höher die durch die LLMs berechnete statistische Wahrscheinlichkeit eines Wortes im jeweiligen Kontext war, desto schwächer fiel die neuronale Reaktion während der tatsächlichen Worterkennung aus, was sich insbesondere in reduzierten Amplituden des N400-Komplexes manifestierte. Unerwartete Wörter hingegen lösten signifikant stärkere neuronale Antworten aus, da sie einen höheren kognitiven Verarbeitungsaufwand erfordern.
Besonders faszinierend war der Nachweis, dass das menschliche Gehirn bereits vor dem eigentlichen akustischen Beginn eines Wortes eine erhöhte neuronale Voraktivierung zeigt, was die Existenz aktiver, vorausschauender Antizipationsprozesse direkt belegt. Die EEG-Daten lokalisierten diese präventive Aktivität vor allem in den linken fronto-temporalen Hirnregionen, während die MEG-Daten bei der Verarbeitung von Wörtern mit geringer Vorhersagbarkeit eine verstärkte sensorimotorische Beteiligung anzeigten. Dies deutet darauf hin, dass sprachliche Antizipation unter Umständen sogar eine motorische Komponente besitzt, bei der das Gehirn das kommende Wort innerlich mitspricht. Die bebeutende Konvergenz zwischen biologischen Nervensystemen, die mit bioelektrischen und chemischen Signalen operieren, und künstlichen Sprachmodellen, die rein auf algorithmischen Zahlenwerten basieren, deutet auf universelle Prinzipien der Informationsverarbeitung hin. Gehirn und KI organisieren Sprache intern auf eine vergleichbare Weise, indem sie sie als komplexes, adaptives und auf Wahrscheinlichkeiten beruhendes System begreifen. Diese Erkenntnisse schlagen nicht nur eine Brücke zwischen rechnergestützter Linguistik und kognitiver Neurowissenschaft, sondern liefern auch fundamentale Impulse für die Entwicklung einer biologisch inspirierten, leistungsfähigeren künstlichen Intelligenz.
Literatur
Kölbl, N., Tziridis, K., Maier, A., Kinfe, T., Chavarriaga, R., Schilling, A., & Krauss, P. (2026). The predictive brain: Neural correlates of word expectancy align with large language model prediction probabilities. NeuroImage, 334, doi:10.1016/j.neuroimage.2026.121966
Impressum ::: Datenschutzerklärung ::: Nachricht ::: © Werner Stangl ::: Pädagogische Neuigkeiten für Psychologen :::