Tagung vom 24.09.-25.09.2025
Universität Leipzig 
 

Die Tagung “Große Lernerkorpora - Möglichkeiten und Grenzen” am 24. und 25. September 2025 griff Fragen, Herausforderungen und Potenziale der (automatischen) Aufbereitung und Annotation großer Lernerkorpora auf. Neben Vorträgen zu aktuellen Forschungsprojekten fand eine Methodenmesse / Posterpräsentation zu Tools, Ressourcen und infrastrukturellen Initiativen aus dem Kontext der (Lerner-)Korpuslinguistik statt. 

Die Tagung war gleichzeitig die Abschlussveranstaltung des BMFTR-geförderten DAKODA-Projekts.

Wir bedanken uns ganz herzlich bei allen Teilnehmenden und bei allen Beitragenden aus Deutschland, Österreich der Schweiz und aus Italien für die wunderbare Tagung und den sehr anregenden Austausch.

Keynote Speakers: 

 

Tagung "Große Lernerkorpora - Möglichkeiten und Grenzen" (24.-25.09.2025)

Die DAKODA-Abschlusstagung fand vom 24.9.-25.9.2025 im großen Vortragssaal der Bibliotheca Albertina  (Beethovenstr. 6, 04107 Leipzig) statt.

 

Die Arbeit mit Lernerkopora zeichnet sich unter anderem dadurch aus, dass sie in einem inhärenten methodischen Spannungsfeld verortet ist: Oft stehen Forscher:innen vor der Entscheidung, entweder große Datenmengen zu erheben, die dann aber eventuell nicht so tief annotiert werden können, oder kleinere mehrfach annotierte Lernerkorpora zu erstellen, die dann wiederum nicht unbedingt für statistisch verallgemeinerbare Aussagen herangezogen werden können. In der Regel bestimmen dann konkrete Forschungsfragen und -ziele die konkrete Ausgestaltung der Lernerkorpora.

 

Dabei könnten gerade große Datenmengen dabei helfen, wichtige Fragen der Zweitspracherwerbsforschung neu oder auch zum ersten Mal überhaupt zu stellen und unter Umständen zu beantworten. Beispielsweise könnten große Lernerkorpora dazu genutzt werden, um den Zusammenhang von GER-Niveaus und lernersprachlichen Mustern oder um Einflüsse der Aufgabenstellungen auf lernersprachliche Produktionen zu untersuchen. Vor allem für wenig frequente sprachliche Phänomenen scheinen umfassende Datengrundlagen essentiell. Gleichzeitig werden gerade Fragen danach, wie etwa die Erhebung großer Datenmengen mit der Modellierung individueller Spracherwerbsverläufe zu verbinden ist, in der SLA-Forschung bis heute kontrovers diskutiert. 

 

Dem gegenüber steht die Tatsache, dass die Erstellung von Lernerkorpora aufwendig ist: Es existieren rechtliche Hürden bereits bei der Erhebung, und die Aufbereitung erfordert häufig manuelles Transkribieren, Annotieren oder das Formulieren von Zielhypothesen. Zwar scheint die Automatisierung von Annotation und Analyse vielversprechend, jedoch unterscheidet sich etwa die Zuverlässigkeit automatischer Annotationen je nach Kontext oder die Erklärbarkeit KI-gestützter Analysen ist eingeschränkt. Dass die Analyse von Lernersprache inhärent schon bei eher qualitativen Ansätzen immer interpretativ ist, ist zuletzt eine Herausforderung, die auch bei Verwendung computerlinguistischer Methoden bestehen bleibt.

 

Die DAKODA-Abschlusskonferenz am 24. und 25. September 2025 griff diese Fragen auf und stellte Potenziale von großen Lernerkorpora und die Hürden auf dem Weg dorthin in ihren Mittelpunkt. Neben Vorträgen zu aktuellen Forschungsprojekten fand eine Methodenmesse und eine Posterpräsentation zu Tools, Ressourcen und infrastrukturellen Initiativen statt. 

Leipzig, 22.09.-24.09.2025

Das BMFTR-geförderte Projekt DAKODA veranstaltete im Sommer 2025 an der Universität Leipzig eine 2 1/2-tägige Sommerschule zum Thema “Aufbereitung und Analyse von Lernerkorpusdaten”. 

Zielgruppe

Im Rahmen der Sommerschule wurden Nachwuchsforschende im Bereich DaF/DaZ mit dem Einsatz sprachtechnologischer Ressourcen für erwerbsbezogene Fragestellungen vertraut gemacht.

Inhalt

Die Sommerschule begann am ersten Tag mit einer Einführung in die Programmiersprache Python, die den Teilnehmenden Gelegenheit gab, am Beispiel echter Lernerdaten Grundlagen für deren automatische Verarbeitung zu erwerben und einzuüben.

Am zweiten und dritten (halben) Workshop-Tag ging es dann um die Vorstellung und das konkrete Einüben von Methoden und Analysen. Ein Themenschwerpunkt war hierbei die Datenvisualisierung, ein anderer die Verwendung von Jupyter Notebooks zur Durchführung komplexerer Datenanalysen.

Dozierende

Prof. Dr. Torsten Zesch leitet die Forschungsprofessur Computerlinguistik an der FernUniversität in Hagen und forscht unter anderem dazu, wie mit sprachtechnologischen Verfahren der Bildungsprozess unterstützt werden kann.

Dr. Josef Ruppenhofer ist wissenschaftlicher Mitarbeiter der Forschungsprofessur Computerlinguistik im Projekt DAKODA.

 

Bildergalerie der DAKODA-Abschlusskonferenz

zur Vergrößerungsansicht des Bildes:
zur Vergrößerungsansicht des Bildes:
zur Vergrößerungsansicht des Bildes:
zur Vergrößerungsansicht des Bildes:
zur Vergrößerungsansicht des Bildes:
zur Vergrößerungsansicht des Bildes:
zur Vergrößerungsansicht des Bildes:
zur Vergrößerungsansicht des Bildes:
zur Vergrößerungsansicht des Bildes:
zur Vergrößerungsansicht des Bildes:
zur Vergrößerungsansicht des Bildes:
zur Vergrößerungsansicht des Bildes:
zur Vergrößerungsansicht des Bildes:
zur Vergrößerungsansicht des Bildes:
zur Vergrößerungsansicht des Bildes:
zur Vergrößerungsansicht des Bildes:
zur Vergrößerungsansicht des Bildes:
zur Vergrößerungsansicht des Bildes:
zur Vergrößerungsansicht des Bildes:
zur Vergrößerungsansicht des Bildes:
zur Vergrößerungsansicht des Bildes:
zur Vergrößerungsansicht des Bildes:
zur Vergrößerungsansicht des Bildes:
zur Vergrößerungsansicht des Bildes:
zur Vergrößerungsansicht des Bildes:
zur Vergrößerungsansicht des Bildes:
zur Vergrößerungsansicht des Bildes:
zur Vergrößerungsansicht des Bildes:
zur Vergrößerungsansicht des Bildes:
zur Vergrößerungsansicht des Bildes:
zur Vergrößerungsansicht des Bildes:
zur Vergrößerungsansicht des Bildes:
zur Vergrößerungsansicht des Bildes:
zur Vergrößerungsansicht des Bildes: