
Ein Kopf markierte Zitate perfekt – bis typografische Anführungszeichen auftauchten. Ein winziger Zeichensatzwechsel ließ die Präzision fallen. Wir zeigen, wie dieser Vorfall zu besseren Tests, robuster Tokenisierung und Reflexion über Textquellen führte. Teilst du ähnliche Funde, helfen sie anderen, schmerzhafte Überraschungen zu vermeiden und frühzeitig Schutzgeländer gegen triviale, aber folgenreiche Brüche in realen Datenströmen einzuziehen.

Eine minimale Ablation in mittleren Layern veränderte plötzlich die Vorhersagegründe, nicht die Genauigkeit. Erst kausales Patchen zeigte, dass ein nachgelagerter Kopf ein Muster nur dekorativ wiederholte. Die Lektion: Stabilität der Metrik ersetzt keine funktionale Analyse. Wir skizzieren, wie kleine Eingriffe große Einsichten liefern und warum Erfolg ohne Erklärung langfristig selten robust bleibt.

Wir erwarteten Syntax in frühen Layern, Semantik später. Stattdessen zeigte ein Probe, dass bestimmte semantische Rollen überraschend früh linear verfügbar waren. Nach Replikation über Seeds, Domänen und Sprachen blieb der Befund bestehen. Diese Erfahrung ermutigt, gängige Erzählungen neugierig, aber respektvoll zu testen und aus Abweichungen produktive Forschungsfragen zu formen, statt sie reflexhaft wegzuerklären.