DAKODA ist ein interdisziplinäres Projekt mit dem übergeordneten Ziel, die Datenkompetenzen des wissenschaftlichen DaF/DaZ-Nachwuchses im Bereich Lernerkorpusforschung voranzutreiben. Im Projekt werden sprachtechnologische Ressourcen für erwerbsbezogene Fragestellungen entwickelt und auf Basis einer breiten Datengrundlage erprobt. DAKODA soll somit Möglichkeiten und Grenzen der Anwendung computerlinguistischer Verfahren für Lernersprachenanalysen explorativ ausloten.

Vom 24.-25.09.2025 wird an der Universität Leipzig die Tagung “Große Lernerkorpora - Möglichkeiten und Grenzen” stattfinden.

 

Die Tagung “Große Lernerkorpora - Möglichkeiten und Grenzen” am 24. und 25. September 2025 greift Fragen, Herausforderungen und Potenziale der (automatischen) Aufbereitung und Annotation großer Lernerkorpora auf. Neben Vorträgen zu aktuellen Forschungsprojekten soll ein Bazar zu Tools, Ressourcen und infrastrukturellen Initiativen aus dem Kontext der Korpuslinguistik stattfinden. Als Abschluss bietet eine Paneldiskussion Raum für unterschiedliche Perspektiven auf Chancen und Herausforderungen bei der Arbeit mit Lernerkorpora.

Weitere Infos zur Tagung und die Möglichkeit zur Anmeldung finden Sie  → hier.

An die Tagung ist eine Sommerschule angeschlossen, die vom 22.09.-24.09.2025 ebenfalls in Leipzig stattfinden wird.

DAKODA steht für Datenkompetenzen in DaF/DaZ: Exploration sprachtechnologischer Ansätze zur Analyse von L2-Erwerbsstufen in Lernerkorpora des Deutschen. Ausführliche Informationen zu DAKODA können Sie zusätzlich auf der Projekthomepage finden: dakoda.org

Das Projektteam des Herder-Instituts (Leitung: Prof. Dr. Katrin Wisniewski) kooperiert in DAKODA mit dem Language Technology Lab der FernUniversität in Hagen (Leitung: Prof. Dr.-Ing. Torsten Zesch).

DAKODA wird vom BMBF in der Förderlinie "Datenkompetenzen Für den wissenschaftlichen Nachwuchs" gefördert.

(Laufzeit 10/2022 - 9/2025)

Weitere Informationen über die Förderlinie und die geförderten Projekte finden sich hier.

1. Eine gut zugängliche Datenbasis mit einer großen Zahl an Lernerkorpora schaffen und erschließen

DAKODA wird eine Vielzahl an Lernerkorpora zum Deutschen zusammenführen und unter Beachtung datenschutz- und urheberrechtlicher Vorgaben möglichst niederschwellig zugänglich machen. Es sollen teils auch solche Daten zugänglich und analysierbar gemacht werden, die bisher nicht öffentlich bzw. nicht ohne Weiteres für projektexterne Forschende zugänglich waren.

Die Daten werden in einem Repositorium zum Download verfügbar sein. Außerdem wird in DAKODA ein nutzer:innenfreundliches Dashboard entwickelt, mit dem man korpusübergreifend suchen kann.  Die Korpora werden v.a. über ihre Metadaten miteinander verankert.

Um eine möglichst große Datenbasis für DAKODA zu schaffen, sind wir an Datenspenden interessiert.

  • Falls Sie im Besitz von geschriebenen oder gesprochenen L2-Produktionen sind und diesen gerne eine größere Sichtbarkeit verschaffen würden, kontaktieren Sie uns gern!

2. Forschung zur Variation von Lernersprache unter Anwendung explorativer Verfahren des maschinellen Lernens   

Lernersprachenanalysen zeigen schon seit Entstehen der L2-Erwerbsforschung immer wieder eine beträchtliche inter-, aber auch intraindividuelle Variation. Jüngst rückt dies bedingt durch verbesserte Analysemethoden erneut in verstärktem Maße ins Licht: Erwerbsverläufe erweisen sich oft als nicht-linear und sehr dynamisch und sind abhängig von einer Vielzahl an Einflussfaktoren. Dies steht jedoch in einem Spannungsverhältnis zu recht robusten Befunden über den geordneten Erwerb syntaktisch-morphologischer Erwerbsstufen, die für das Deutsche als L2 intensiv beforscht sind.

DAKODA möchte deshalb Aspekte sprachlicher Variation innerhalb dieser Erwerbsstufen genauer analysieren. Dazu sollen computerlinguistische Analyseverfahren (maschinelles Lernen) exploriert und hinsichtlich ihrer Zuverlässigkeit und Validität eingeschätzt werden.

3. Förderung der Datenmanagement- und Datenalysekompetenzen beim Nachwuchs in DaF/DaZ

Kern von DAKODA ist zudem das zentrale Anliegen, die Datenmanagement- und Analysekompetenzen zur Auswertung großer und heterogener Datenmengen durch Nachwuchswissenschaftler:innen im Bereich DaF/DaZ weiterzuentwickeln. Um dieses Ziel zu erreichen, wird das Projekt durch eine Reihe von Workshops begleitet, die Nachwuchswissenschaftler:innen des Fachkontextes DaF/DaZ offenstehen. Informieren Sie sich in Kürze hier übergeplante Workshops und Verfügbarkeiten.

 

Weiter Informationen können Sie auf der Projektwebseite finden: dakoda.org

Projektleitung

Katrin Wisniewski (Universität Leipzig, Herder-Institut)

Torsten Zesch (FernUni Hagen, Language Technology Lab)

 

Wissenschaftliche Mitarbeiter:innen

Matthias Schwendemann (UL)

Annette Portmann (UL)

Josef Ruppendorfer (FUH)

 

Nicht-wissenschaftliches Personal

Denise Kiesel (UL)

 

Assoziierte Forschende

Lisa Lenort (UL)

Christine Renker (UL)

Iulia Sucutardean (UL)

Raphael Engl (FUH)

 

Ehemalige Mitarbeiter:innen / assoziierte Forschende

Luise Böttcher (UL)

Max Polter (UL)

Shanny Druker (UL)

Jamila Bläsing (UL)

Lisa Prepens (FUH)

Christine Czinglar
Professorin für Deutsch als Zweit- und Fremdsprache an der Friedrich-Schiller-Universität Jena

Stefanie Dipper
Professorin für Computerlinguistik an der Ruhr-Universität Bochum, Lehrstuhl für Linguistik und Projektleitung des SFB-Projekts C6

Jana Gamper
Professorin für Deutsch als Zweitsprache an der Justus-Liebig-Universität Gießen

Gisela Håkansson
Emeritierte Professorin für Allgemeine Linguistik an der Universität Lund

Hagen Hirschmann
Wissenschaftlicher Mitarbeiter am Institut für Deutsche Sprache und Linguistik der Humboldt-Universität zu Berlin, Abteilung Korpuslinguistik und Morphologie

Anke Lenzing
Professorin für Fachdidaktik in Englisch, Universität Innsbruck

Detmar Meurers
Professor für Computerlinguistik und Leiter der Arbeitsgruppe Theoretische Computerlinguistik an der Universität Tübingen

Elena Volodina
Forscherin am Fachbereich Schwedisch, Mehrsprachigkeit, Sprachtechnologie an der Universität Göteborg

Sonja Zimmermann
Test-DaF-Institut/g.a.s.t

  • Alle Publikationen aus dem DAKODA-Projekt können Sie hier finden.
  • Informationen zu Vorträgen und Workshops im Rahmen des DAKODA-Projekts können Sie hier finden. 

Katrin Wisniewski und Matthias Schwendemann haben in einer Themenausgabe der Zeitschrift Babylonia zum Thema “Lernerkorpora” ein Interview zum DAKODA-Projekt gegeben.

Das Interview zum Nachlesen finden Sie hier.

Direkt zum Download geht es hier