Um Forschungsdaten einerseits für die wissenschaftliche Community sowie die interessierte Öffentlichkeit verfügbar zu machen und sie andererseits in eine Langzeitarchivierung zu überführen, wurde in den letzten Jahren das Management dieser Ressourcen und damit auch der Umgang mit Daten im wissenschaftlichen Alltag stärker fokussiert. Darunter fällt auch der Aufbau von Repositorien, der als wichtige Aufgabe von empirisch arbeitenden Forschungseinrichtungen gelten kann.
Auch das Forschungszentrum Deutscher Sprachatlas (DSA) hat sich dieser Aufgabe verpflichtet und setzt neue Impulse im Bereich des sprachbezogenen Forschungsdatenmanagements: Es verfügt über eine umfangreiche Dokumentation regionalsprachlicher Datensätze aus Ton, Bild und Text, die digital aufgearbeitet und online in einem lebendigen Repositorium publiziert sind – u. a. in Form von digitalen Katalogen für Audiokorpora, einer Online-Bibliografie und digitalen Sprachkarten (Ganswindt/Kehrein/Lameli 2015). Die Audiokorpora umfassen circa 4.000 Übertragungen der „Wenkersätze“ in Dialekt und intendierte Standardsprache sowie zahlreiche Sprachaufnahmen weiterer Erhebungssituationen aus internen und externen Projekten. Insgesamt stammen die Sprachaufnahmen aus mehr als 70 Jahren Dialektologie, so dass sie auch als Datengrundlage für kurzzeitdiachrone Forschungen geeignet sind.
Die verschiedenartigen Datenbestände sind momentan in dem sprachgeografischen Informationssystem „REDE SprachGIS“ zusammengeführt, dessen Basis die geografische Informationsverarbeitung und ‑vernetzung ist. Es verfügt über spezifische Suchwerkzeuge, die Filterungen nach verschiedenen Korpora oder Dialekträumen erlauben und zudem einen text- und lemmabasierten Zugriff ermöglichen.
Aktuell wird zudem ein „Korpus der Regionalsprachen“ aufgebaut. Dieses Korpus speist sich vorwiegend aus Aufnahmen freier Gesprächssituationen, die momentan transkribiert und für Annotation und Analyse aufbereitet werden. In einer modularen Vorgehensweise wird das Korpus sukzessive erweitert mit dem Ziel, ein Referenzkorpus der deutschen Regionalsprachen anbieten zu können. In der Korpusgenerierung stehen neben grammatischen Aspekten (Morphologie, Syntax) auch gesprächs- und diskurslinguistische Fragestellungen im Erkenntnisinteresse (Diskursmarker und ‑organisation, sprachreflexive Handlungen). Das „Korpus der Regionalsprachen“ ist als Teil des frei zugänglichen Repositoriums des DSA mit einem eigenständigen Webinterface für Recherche und Export angelegt.
Mit der Weiterentwicklung des Repositoriums in den nächsten Jahren werden zentrale Zugänge zu dialektalen und regiolektalen Sprachdaten unterschiedlicher Provenienz aus dem gesamten deutschen Sprachgebiet der wissenschaftlichen Community und interessierten Öffentlichkeit zur Verfügung gestellt. Die Sprachaufnahmen und ihre teils mehrschichtigen Annotationslayer bieten dabei eine einmalige Forschungsressource für die germanistische Variationslinguistik und darüber hinaus.
Im Video bekommen Sie einen Überblick über die verfügbaren Daten und Annotationen sowie den Zugriff auf diese. Des Weiteren werden erste Einblicke in das im Entstehen befindliche „Korpus der Regionalsprachen“ gegeben.
Literatur
Ganswindt, Brigitte/Roland Kehrein/Alfred Lameli (2015): Regionalsprache.de (REDE). In: Kehrein, Roland/Alfred Lameli/Stefan Rabanus (Hrsg.): Regionale Variation des Deutschen – Projekte und Perspektiven. Berlin/Boston: De Gruyter, 421–453.
Diesen Beitrag zitieren als:
Fischer, Hanna/Brigitte Ganswindt/Georg Oberdorfer. 2022. Regionalsprachliche Korpora des Deutschen. Repositorien des Forschungszentrums Deutscher Sprachatlas. Sprachspuren: Berichte aus dem Deutschen Sprachatlas 2(5). https://doi.org/10.57712/2022-05.