Regionalsprachliche Korpora des Deutschen — Repositorien des Forschungszentrums Deutscher Sprachatlas

Um Forschungs­da­ten einer­seits für die wissen­schaft­li­che Community sowie die inter­es­sier­te Öffent­lich­keit verfügbar zu machen und sie anderer­seits in eine Langzeit­ar­chi­vie­rung zu überfüh­ren, wurde in den letzten Jahren das Manage­ment dieser Ressour­cen und damit auch der Umgang mit Daten im wissen­schaft­li­chen Alltag stärker fokus­siert. Darunter fällt auch der Aufbau von Reposi­to­ri­en, der als wichtige Aufgabe von empirisch arbei­ten­den Forschungs­ein­rich­tun­gen gelten kann.

Auch das Forschungs­zen­trum Deutscher Sprach­at­las (DSA) hat sich dieser Aufgabe verpflich­tet und setzt neue Impulse im Bereich des sprach­be­zo­ge­nen Forschungs­da­ten­ma­nage­ments: Es verfügt über eine umfang­rei­che Dokumen­ta­ti­on regio­nal­sprach­li­cher Daten­sät­ze aus Ton, Bild und Text, die digital aufge­ar­bei­tet und online in einem leben­di­gen Reposi­to­ri­um publi­ziert sind – u. a. in Form von digitalen Katalogen für Audio­kor­po­ra, einer Online-Bibliografie und digitalen Sprach­kar­ten (Ganswindt/Kehrein/Lameli 2015). Die Audio­kor­po­ra umfassen circa 4.000 Übertra­gun­gen der „Wenkersätze“ in Dialekt und inten­dier­te Standard­spra­che sowie zahlrei­che Sprach­auf­nah­men weiterer Erhebungs­si­tua­tio­nen aus internen und externen Projekten. Insgesamt stammen die Sprach­auf­nah­men aus mehr als 70 Jahren Dialek­to­lo­gie, so dass sie auch als Daten­grund­la­ge für kurzzeit­dia­chro­ne Forschun­gen geeignet sind.

Die verschie­den­ar­ti­gen Daten­be­stän­de sind momentan in dem sprach­geo­gra­fi­schen Infor­ma­ti­ons­sys­tem „REDE SprachGIS“ zusam­men­ge­führt, dessen Basis die geogra­fi­sche Infor­ma­ti­ons­ver­ar­bei­tung und ‑vernet­zung ist. Es verfügt über spezi­fi­sche Suchwerk­zeu­ge, die Filte­run­gen nach verschie­de­nen Korpora oder Dialek­t­räu­men erlauben und zudem einen text- und lemma­ba­sier­ten Zugriff ermöglichen.

Aktuell wird zudem ein „Korpus der Regio­nal­spra­chen“ aufgebaut. Dieses Korpus speist sich vorwie­gend aus Aufnahmen freier Gesprächs­si­tua­tio­nen, die momentan transkri­biert und für Annota­ti­on und Analyse aufbe­rei­tet werden. In einer modularen Vorge­hens­wei­se wird das Korpus sukzes­si­ve erweitert mit dem Ziel, ein Referenz­kor­pus der deutschen Regio­nal­spra­chen anbieten zu können. In der Korpus­ge­ne­rie­rung stehen neben gramma­ti­schen Aspekten (Morpho­lo­gie, Syntax) auch gesprächs- und diskurs­lin­gu­is­ti­sche Frage­stel­lun­gen im Erkennt­nis­in­ter­es­se (Diskurs­mar­ker und ‑organi­sa­ti­on, sprach­re­fle­xi­ve Handlun­gen). Das „Korpus der Regio­nal­spra­chen“ ist als Teil des frei zugäng­li­chen Reposi­to­ri­ums des DSA mit einem eigen­stän­di­gen Webin­ter­face für Recherche und Export angelegt.

Mit der Weiter­ent­wick­lung des Reposi­to­ri­ums in den nächsten Jahren werden zentrale Zugänge zu dialek­ta­len und regio­lek­ta­len Sprach­da­ten unter­schied­li­cher Prove­ni­enz aus dem gesamten deutschen Sprach­ge­biet der wissen­schaft­li­chen Community und inter­es­sier­ten Öffent­lich­keit zur Verfügung gestellt. Die Sprach­auf­nah­men und ihre teils mehrschich­ti­gen Annota­ti­ons­lay­er bieten dabei eine einmalige Forschungs­res­sour­ce für die germa­nis­ti­sche Varia­ti­ons­lin­gu­is­tik und darüber hinaus.

Im Video bekommen Sie einen Überblick über die verfüg­ba­ren Daten und Annota­tio­nen sowie den Zugriff auf diese. Des Weiteren werden erste Einblicke in das im Entstehen befind­li­che „Korpus der Regio­nal­spra­chen“ gegeben.

Literatur

Ganswindt, Brigitte/Roland Kehrein/Alfred Lameli (2015): Regionalsprache.de (REDE). In: Kehrein, Roland/Alfred Lameli/Stefan Rabanus (Hrsg.): Regionale Variation des Deutschen – Projekte und Perspek­ti­ven. Berlin/Boston: De Gruyter, 421–453.

Diesen Beitrag zitieren als:

Fischer, Hanna/Brigitte Ganswindt/Georg Oberdor­fer. 2022. Regio­nal­sprach­li­che Korpora des Deutschen. Reposi­to­ri­en des Forschungs­zen­trums Deutscher Sprach­at­las. Sprach­spu­ren: Berichte aus dem Deutschen Sprach­at­las 2(5). https://doi.org/10.57712/2022-05.

Hanna Fischer, Brigitte Ganswindt und Georg Oberdorfer
Hanna Fischer ist in der Projektleitung des Projekts REDE. Brigitte Ganswindt ist wissenschaftliche Mitarbeiterin im Forschungszentrum Deutscher Sprachatlas und leitet hier den Bereich "Dokumentation und Wissenstransfer". Georg Oberdorfer ist Forschungsgruppenleiter der AG "Datenintegration Ton".