Tagung vom 24.09.-25.09.2025
Universität Leipzig 
 

Die Tagung “Große Lernerkorpora - Möglichkeiten und Grenzen” am 24. und 25. September 2025 greift Fragen, Herausforderungen und Potenziale der (automatischen) Aufbereitung und Annotation großer Lernerkorpora auf. Neben Vorträgen zu aktuellen Forschungsprojekten soll ein Bazar zu Tools, Ressourcen und infrastrukturellen Initiativen aus dem Kontext der (Lerner-)Korpuslinguistik stattfinden. Als Abschluss bietet eine Paneldiskussion Raum für unterschiedliche Perspektiven auf Chancen und Herausforderungen bei der Arbeit mit Lernerkorpora.

Die Tagung ist gleichzeitig die Abschlussveranstaltung des BMBF-geförderten DAKODA-Projekts.

Vor der Tagung wird ebenfalls an der Universität Leipzig eine Sommerschule zum Thema “Aufbereitung und Analyse von Lernerkorpusdaten” stattfinden.

Die Teilnahme an Sommerschule und Tagung sind kostenfrei. 

Bestätigte Keynote Speakers: 

 

Tagung "Große Lernerkorpora - Möglichkeiten und Grenzen" (24.-25.09.2025)

 

Die Arbeit mit Lernerkopora zeichnet sich unter anderem dadurch aus, dass sie in einem inhärenten methodischen Spannungsfeld verortet ist: Oft stehen Forscher:innen vor der Entscheidung, entweder große Datenmengen zu erheben, die dann aber eventuell nicht so tief annotiert werden können, oder kleinere mehrfach annotierte Lernerkorpora zu erstellen, die dann wiederum nicht unbedingt für statistisch verallgemeinerbare Aussagen herangezogen werden können. In der Regel bestimmen dann konkrete Forschungsfragen und -ziele die konkrete Ausgestaltung der Lernerkorpora.

 

Dabei könnten gerade große Datenmengen dabei helfen, wichtige Fragen der Zweitspracherwerbsforschung neu oder auch zum ersten Mal überhaupt zu stellen und unter Umständen zu beantworten. Beispielsweise könnten große Lernerkorpora dazu genutzt werden, um den Zusammenhang von GER-Niveaus und lernersprachlichen Mustern oder um Einflüsse der Aufgabenstellungen auf lernersprachliche Produktionen zu untersuchen. Vor allem für wenig frequente sprachliche Phänomenen scheinen umfassende Datengrundlagen essentiell. Gleichzeitig werden gerade Fragen danach, wie etwa die Erhebung großer Datenmengen mit der Modellierung individueller Spracherwerbsverläufe zu verbinden ist, in der SLA-Forschung bis heute kontrovers diskutiert. 

 

Dem gegenüber steht die Tatsache, dass die Erstellung von Lernerkorpora aufwendig ist: Es existieren rechtliche Hürden bereits bei der Erhebung, und die Aufbereitung erfordert häufig manuelles Transkribieren, Annotieren oder das Formulieren von Zielhypothesen. Zwar scheint die Automatisierung von Annotation und Analyse vielversprechend, jedoch unterscheidet sich etwa die Zuverlässigkeit automatischer Annotationen je nach Kontext oder die Erklärbarkeit KI-gestützter Analysen ist eingeschränkt. Dass die Analyse von Lernersprache inhärent schon bei eher qualitativen Ansätzen immer interpretativ ist, ist zuletzt eine Herausforderung, die auch bei Verwendung computerlinguistischer Methoden bestehen bleibt.

 

Die DAKODA-Abschlusskonferenz am 24. und 25. September 2025 greift diese Fragen auf und stellt Potenziale von großen Lernerkorpora und die Hürden auf dem Weg dorthin in ihren Mittelpunkt. Neben Vorträgen zu aktuellen Forschungsprojekten soll ein Bazar zu Tools, Ressourcen und infrastrukturellen Initiativen stattfinden. Als Abschluss bietet eine Paneldiskussion Raum für unterschiedliche Perspektiven auf Chancen und Herausforderungen bei der Arbeit mit Lernerkorpora.

Leipzig, 22.09.-24.09.2025

Das BMBF-geförderte Projekt DAKODA veranstaltet im Sommer 2025 an der Universität Leipzig eine 2 1/2-tägige Sommerschule zum Thema “Aufbereitung und Analyse von Lernerkorpusdaten”. 

Zielgruppe

Im Rahmen der Sommerschule sollen Nachwuchsforschende im Bereich DaF/DaZ mit dem Einsatz sprachtechnologischer Ressourcen für erwerbsbezogene Fragestellungen vertraut gemacht werden.

Inhalt

Die Sommerschule beginnt am ersten Tag mit einer Einführung in die Programmiersprache Python, die den Teilnehmenden Gelegenheit gibt, am Beispiel echter Lernerdaten Grundlagen für deren automatische Verarbeitung zu erwerben und einzuüben.

Am zweiten und dritten (halben) Workshop-Tag geht es dann um die Vorstellung und das konkrete Einüben von Methoden und Analysen. Ein Themenschwerpunkt wird hierbei die Datenvisualisierung sein, ein anderer die Verwendung von Jupyter Notebooks zur Durchführung komplexerer Datenanalysen.

Zusätzlich zu den vorgenannten Programmpunkten, die von Mitgliedern des DAKODA-Projekts angeboten werden und sich mit Daten des DAKODA-Projekts beschäftigen, wird es einen externen Fachbeitrag zu einem dritten Themenbereich rund um Lernerkorpusanalysen geben.

Dozierende

Prof. Dr. Torsten Zesch leitet die Forschungsprofessur Computerlinguistik an der FernUniversität in Hagen und forscht unter anderem dazu, wie mit sprachtechnologischen Verfahren der Bildungsprozess unterstützt werden kann.

Dr. Josef Ruppenhofer ist wissenschaftlicher Mitarbeiter der Forschungsprofessur Computerlinguistik im Projekt DAKODA.

Teilnahme

Die Teilnahme ist aus logistischen Gründen nur in Person möglich und die Zahl der Teilnehmenden auf 20 Personen begrenzt. Falls Sie prinzipiell Interesse an einer Teilnahme haben, können Sie dies bereits jetzt im untenstehenden Formular vermerken. Wir werden Sie dann direkt über alle weiteren Schritte informieren.

folgt in Kürze

Große Lernerkorpora - Möglichkeiten und Grenzen

Ich interessiere mich für

Einwilligung zur Datenverarbeitung