Sie fragen sich vielleicht auch immer einmal wieder, aus welcher Region in Deutschland eine Ihnen unbekannte Person, die Sie beispielsweise im Fernverkehrszug haben sprechen hören, wohl stammen könnte. Oder Sie haben eine Idee, woher die Person stammt, sind sich aber nicht sicher und würden Ihre Idee gern überprüfen. Bei der Bestimmung der Herkunft einer unbekannten Person handelt es sich zwar nicht um eine Kerndisziplin innerhalb der Sprachwissenschaft, sie bildet aber einen mitunter wichtigen Teil der anwendungsbezogenen „forensischen Sprechererkennung“ bzw., wenn es vor allem um lautsprachliche Aspekte geht, der „forensischen Phonetik“.
Und Forscherinnen und Forscher sowie Gutachterinnen und Gutachter, die in diesen Bereichen tätig sind, greifen wesentlich auf sprachwissenschaftliche Erkenntnisse, im vorliegenden Fall auf Erkenntnisse der Dialektologie und/oder der Regionalsprachenforschung zurück. Das hat einen Grund: Für das im Titel genannte Speaker Profiling, also für die Erstellung des Stimmenprofils eines unbekannten Sprechers oder einer unbekannten Sprecherin, spielen nach den Angaben in einschlägigen Publikationen dialektale Merkmale eine wichtige Rolle (vgl. Künzel 1987, Köster 2001, Köster et al. 2012). Solche Merkmale erlauben es, die betreffende Person einer Gruppe von Sprecherinnen und Sprechern mehr oder weniger scharf zuzuordnen, und zwar Sprecherinnen und Sprechern, die ihre Spracherwerbs- bzw. ihre „sog. Sprachprägephase, die ungefähr der Zeit des Schulbesuchs (bis ca. 18 Jahre) entspricht“ (Künzel 1987, 79), in einer bestimmten Region des deutschen Sprachraums verbracht haben.
Eine Beispielaufnahme: Ermittlung dialektaler Merkmale
Im vorliegenden Beitrag werde ich anhand eines ausgewählten Beispiels demonstrieren, wie mit Hilfe von (alten) Dialektkarten die mögliche Herkunft einer Sprecherin oder eines Sprechers, deren Sprache dialektal „gefärbt“ ist, eingegrenzt werden kann. Bei dem Beispiel handelt es sich um die Aufnahme eines Interviews, die auf der Plattform Youtube öffentlich zugänglich ist. Gefunden haben diese Aufnahme Teilnehmerinnen und Teilnehmer eines Seminars zur forensischen Phonetik, das ich seit einigen Semestern regelmäßig an der Universität Marburg anbiete. Darin werden die in Gruppen eingeteilten Teilnehmerinnen und Teilnehmer in einem abschließenden Wettbewerb aufgefordert, einer jeweils anderen Gruppe eine Aufgabe zur Ermittlung der Herkunft einer unbekannten Person anhand einer Aufnahme zu stellen. Die einzigen Vorgaben dabei sind, (1) dass die unbekannte Person aus Deutschland stammen soll und (2) dass in der Aufnahme regionalsprachliche Merkmale zu hören sein sollen. Bei der für den Wettbewerb ausgewählten Passage handelt es sich um die Abschnitte 0:03–0:11 Sek., 0:21–0:27 Sek. und 0:30–0:58 Sek. des oben verknüpften Interviews (die Gesprächsbeiträge des Interviewers sowie Passagen, in denen Hinweise auf die Herkunft des Sprechers enthalten sind, wurden für den Wettbewerb herausgeschnitten). Der Sprecher äußert in diesen Passagen Folgendes – in der Tabelle werden jeweils eine orthographische (kursiv) und eine literarische Transkription (blau hinterlegt) wiedergegeben:
Ja ich weiß nicht, aber die Mannschaften sind gut dieses Jahr. |
Jo isch waaß net, ower die Mannschafte sai gut dis Joar. |
Aber ich rechne mir wirklich Chancen auf den Turniersieg aus, |
Ower isch rachel mir wirklisch Chance uf de Turniersiisch aus, |
also wir sind eine gute Truppe hier stehen |
also mir sin’n gut Trupp häi stii |
und äh das machen wir dieses Jahr wieder. |
un äh dat mache mir dies Joar wirrer. |
Gucken wir mal, dass wir auch was reißen hier. |
Gucke mir mo, dat mir au wat raiße häi. |
Ei ja, wir haben hier so einen dabei, das ist so ein […] |
Ai jo mir hu hier so ain dabei, dat is so e […] |
Und der hat uns […] angemeldet, wir waren voriges Jahr schon dabei. Und […] |
Un der hat uns […] uugemeld, mir woarn fiirs Joar schoo dabai. Un […] |
Aber dieses Jahr sind wir stärker, deswegen werden wir dieses Jahr auch, |
Ober dis Joar sai mir stärker, deswesche wern mir dis Joar aach, |
denke ich, im Finale ankommen. |
denk isch, im Finale uukomme. |
Nein, wir sind nur Hobbykicker, da sind Rennfahrer dabei, |
Naa, mir sai nur Hobbykicker, do sai Rennfahrer dabai, |
da sind Eishockeyspieler dabei, Fußballspieler dabei, |
do sai Eishockeyspieler dabai, Fußballspieler dabai, |
wir sind – eine Multikulti-Truppe. |
mir sai – n Multikulti-Truppe. |
Ja, ich denke schon, ich denke schon, das werden wir packen. |
Jo, isch denke schuu, isch denke schuu, dat wern mir packe. |
Wenn man sich das Interview anhört, fällt auf, dass die Sprache des Interviewten stark dialektal geprägt ist. Die im Folgenden vorgestellte Methode funktioniert aber auch mit weniger stark dialektalen Sprachproben. Bei der Methode handelt es sich um die Überlagerung von Dialektkarten, auf denen die geographische Verbreitung von Dialektformen dargestellt ist. Bevor wir dazu kommen, sammeln wir erst einmal solche Dialektformen, wobei hier keine Vollständigkeit angestrebt werden kann. Es werden exemplarisch nur zehn Merkmale jeweils im Vergleich zu den standarddeutschen Formen aufgezählt:
- In der ersten Passage produziert der Sprecher für den Infinitiv des Verbs stehen [ʃtiː] (literarisch: stii).
- Die 1. Person Plural des Verbs haben realisiert der Sprecher als [huː] (literarisch: hu).
- Für die 1. und die 3. Person Plural des Verbs sein verwendet der Sprecher [za̱ɪ̯] (literarisch: sai).
- Den germanischen Plosiv t realisiert der Sprecher als stimmlosen alveolaren Plosiv anstatt als Frikativ, er sagt also dat statt das.
- Den Diphthong in weiß (1. Person Singular von wissen) realisiert der Sprecher als Monophthong [a̱ː] (literarisch: waaß).
- Seine a‑Laute klingen manchmal wie o- bzw. sogar u‑Laute, z.B. in ja (literarisch: jo) oder in ankommen (literarisch: uukomme). In der Dialektologie wird dieses Merkmal als „a-Verdumpfung“ bezeichnet.
- Für finales /ɡ/ im Wort Sieg produziert der Sprecher (7a) einen Frikativ und dieser Frikativ wird zudem (7b) nicht als palataler [ç], sondern als postalveolarer Laut [ʃ] gebildet (literarisch: Siisch). In der Dialektologie bezeichnet man diese Abweichungen von der Standardsprache (7a) als g-Spirantisierung und (7b) als Koronalisierung. Letztere tritt in der Aufnahme auch überall dort auf, wo standardsprachlich der stimmlose palatale Frikativ, der „ich-Laut“, realisiert wird, z.B. in ich (literarisch: isch).
- Das Wort schon wird als [ʃuː] (literarisch: schuu) realisiert.
- Das Phonem /r/ wird mit der Zungenspitze als [r] gebildet. Vereinzelt ist außerhalb der transkribierten Passagen auch eine Realisierung als alveolarer Approximant [ɹ] hörbar).
Die Analyse: kartenbasierte Ermittlung der Herkunft
Um uns der Sprecherherkunft anzunähern, benötigen wir – wie gesagt – Karten, auf denen Dialektformen im Raum dargestellt sind. Solche Karten existieren für die Dialekte des Deutschen seit über einem Jahrhundert und sind in verschiedenen Atlaswerken publiziert worden. Wir bedienen uns dem Sprachatlas, der mit fast 50 000 Erhebungsorten auf der bis zum heutigen Tag umfangreichsten Datensammlung basiert: dem Sprachatlas des Deutschen Reichs von Georg Wenker, der zwischen 1888 und 1923 bearbeitet und gezeichnet wurde (eine Projektbeschreibung findet sich online hier). Dieser Atlas ist – wie viele andere Sprachatlanten zum Deutschen auch – frei digital verfügbar und kann auf den Seiten unseres von der Akademie der Wissenschaften und der Literatur | Mainz von 2008 bis 2026 geförderten Projekts „Regionalsprache.de“ (kurz: REDE) aufgerufen werden (vgl. Ganswindt/Kehrein/Lameli 2015). Die folgende Abbildung zeigt die Dialektkarte für den Infinitiv des Verbs stehen (= Merkmal 1 der Aufzählung).
Zunächst einige allgemeine Hinweise zu diesen Sprachkarten: Die Ausdehnung des Erhebungsgebiets, das Deutsche Reich im ausgehenden 19. Jahrhundert, war so groß, dass die Karten für ein Thema (in unserem Fall der Infinitiv stehen) in drei Kartenblätter aufgeteilt werden mussten (je ein Nordwest‑, Nordost- und Südwestblatt), die in der Darstellung im REDE-System allerdings digital wieder zusammengefügt wurden (vgl. auch Lameli/Purschke/Rabanus 2015). Auf der gedruckten Grundkarte sind farbige Linien eingezeichnet worden, die in der Dialektologie als „Isoglossen“ bezeichnet werden. Innerhalb der dadurch abgegrenzten Gebiete dominiert eine bestimmte dialektale Form für das auf der Karte dargestellte Thema, die sogenannte Leitform, die mit lateinischer Schrift in die jeweiligen Gebiete eingetragen wurde. Dies ist in der Ausschnittvergrößerung in Abbildung 1 zu erkennen. Falls es an Orten innerhalb von Isoglossen Abweichungen von der Leitform gibt, so sind diese mit Symbolen gekennzeichnet, die sich über die für jedes Kartenblatt angefertigte Legende erschließen lassen.
Zurück zu unserem Sprecher und zur Ermittlung von dessen Herkunft: In Abbildung 2 sind für das Gebiet der Bundesrepublik Deutschland einige der Leitformen für den Infinitiv stehen eingetragen. Es zeigt sich, dass es in der Mitte Deutschlands drei Regionen gibt, in denen die von unserem Sprecher produzierte Form [ʃtiː] bzw. stii auftritt (eine im Westen, zwei im Osten Deutschlands). Auf der Wenkerkarte ist diese Realisierung zwar als stieh wiedergegeben, man kann aber davon ausgehen, dass diese Buchstabenfolge nicht auf eine Qualitätsveränderung des Stammvokals im Sinne eines fallenden Diphthongs hindeutet, sondern dass sowohl das <e> als auch das <h> von den Informanten als Dehnungszeichen geschrieben wurden.
Mit dem Zeichenwerkzeug in der Online-Applikation REDE SprachGIS – das „Sprachgeographische Informationssystem“ in REDE (vgl. Kehrein 2019) – lassen sich die Verbreitungsgebiete der Leitformen als Polygone nachzeichnen (eine Anleitung zur Verwendung des Zeichenwerkzeugs findet sich online hier). In Abbildung 3 wurden die Gebiete, in denen die Leitform stieh eingetragen wurde, in dieser Weise erfasst.
Auf dieselbe Weise wurden anhand der Wenkerkarten für das zweite und das dritte der oben genannten Merkmale – „1. Person Plural von haben“ (Karte WA 338) und „1. und 3. Person Plural von sein“ (Karte WA 334) – die Verbreitungsgebiete der von dem Sprecher verwendeten Formen [huː] (literarisch: hu) und [za̱ɪ̯] (literarisch: sai, als Leitform in der Wenkerkarte steht sei) abgezeichnet (vgl. die Abbildungen 4 und 5). Auch diese Formen finden sich in der Mitte Deutschlands, wobei die Realisierung von haben als [huː] bzw. hu nur in einem kleineren westlichen Gebiet, im Osten dagegen nicht auftritt (zumindest nicht als Gebiet, das durch eine Isoglosse abgegrenzt wird).
Da unser Sprecher die drei jeweils markierten Formen verwendet, überlagern wir die Polygone für deren Verbreitungsgebiete in Deutschland, wie in Abbildung 6 dargestellt. Durch diese Überlagerung lässt sich erkennen, dass die am wenigsten weit verbreitete Form die Realisierung der 1. Person Plural von haben als [huː] bzw. hu ist (orangefarbenes Polygon). An dessen Ausdehnung ist wesentlich auch die Schnittfläche orientiert, die sich mit den Werkzeugen im REDE SprachGIS erzeugen lässt und die der Übersicht in Abbildung 6 als Ausschnittvergrößerung zur Seite gestellt ist (auch für die geometrische Operation „Schnitt“ wird auf den Seiten des REDE-Projekts eine Anleitung angeboten).
In der Ausschnittvergrößerung in Abbildung 6 ist durch die Eintragungen auf der Grundkarte gut zu erkennen, in welcher Region Deutschlands wir uns befinden: Die Schnittfläche hat eine Größe von ungefähr 100 × 100 km und ist eingerahmt vom Rothaargebirge im Norden, dem Westerwald im Westen, dem Vogelsberg in Osten und dem Taunus im Süden. Sprachgeographisch liegt der größte Teil der Schnittfläche im Zentralhessischen, wobei Ausläufer im Norden auch ins Nordhessische und im Westen ins Übergangsgebiet zum Moselfränkischen reichen.
An dieser Stelle kommt eine weitere standardabweichende Form, die der Sprecher realisiert, ins Spiel: Und zwar verwendet er für den Artikel bzw. das Pronomen das eine Form mit auslautendem Plosiv [t] statt des Frikativs [s], er sagt also dat. Dieser Gegensatz von standardsprachlichem Frikativ und dialektalem Plosiv bildet Teil eines komplexen Lautwandels, der sich vor über einem Jahrtausend vollzogen hat und der sich in den deutschen Dialekten bis heute spiegelt. Die Rede ist von der Zweiten oder Hochdeutschen Lautverschiebung, auf die hier allerdings nicht näher eingegangen werden kann. Für unsere Zwecke, die Herkunftsbestimmung des anonymen Sprechers, genügt es, auf der Karte in Abbildung 7 die Verteilung von Plosiv und Frikativ im Auslaut von das darzustellen (Basis bildet die Karte WA 472).
Auf der Karte in Abbildung 7 ist die Verbreitung der Formen mit finalem Plosiv in dem dunkleren, die Verbreitung der Frikativformen im helleren Blau dargestellt. Diese neue Information wird nun in Abbildung 8 mit der Schnittfläche der dialektalen Formen für stehen, (wir) haben und (wir) sind kombiniert. Dadurch zeigt sich, dass von der Schnittfläche nur noch ein sehr kleiner Teil im Westen übrig bleibt, in dem Sprecher die genannten Verbformen und dat für das produzieren (Überlagerung von Grün und dunklem Blau). Die Ausdehnung dieses Gebietes beträgt ca. 20 × 20 km.
Des Rätsels Lösung
Kommen wir zur Auflösung: Woher kommt der Sprecher denn nun? Im Verlauf des Interviews wird ihm diese Frage gestellt, wobei diese Passage in dem zu bearbeitenden Ausschnitt der Aufnahme im Seminar-Wettbewerb nicht enthalten war. Der Sprecher gibt an, aus Rehe im Westerwald (er spricht es als [ɹiː], literarisch Rii aus) zu stammen. Wie oben bereits ausgeführt, berührt die Schnittfläche im Westen den Westerwald. Liegt nun aber Rehe in dem anhand der vier dialektalen Formen abgegrenzten Gebiet?
Die Darstellung in Abbildung 9 zeigt den Ortspunkt für Rehe zusammen mit der Karte aus Abbildung 8. Leider zeigt sich, dass Rehe nicht innerhalb der Fläche liegt, in der sich das grüne und das dunkelblaue Polygon überlagern, sondern in der unmittelbaren Umgebung. Wir wollen überprüfen, welche der Verbreitungsgebiete der vier Dialektmerkmale Rehe nicht mit einschließen. Da es die Form dat nicht ist, wird in Abbildung 10 noch einmal die Überlagerung der drei Polygone für die Verbformen dargestellt. Hier wird deutlich, dass Rehe außerhalb des Polygons liegt, innerhalb dessen die Leitform [huː] bzw. hu für (wir) haben gilt (orangefarbenes Polygon).
Aus diesem Grund gehen wir nochmals einen Analyseschritt zurück und prüfen, welche Form für die 1. Person Plural für haben die Informanten aus Rehe in Wenkers Erhebung angegeben haben. Der Kartenausschnitt in Abbildung 11 zeigt, dass Rehe in einem Gebiet liegt, für das die Leitform ho eingetragen wurde. Für Rehe (es handelt sich um den unteren der drei Ortspunkte innerhalb des roten Kreises, nördlich des auf der Grundkarte eingezeichneten Rehbachs gelegen) wurde aber ein rotes, L‑förmiges Symbol eingezeichnet. Dieses Symbol steht, wie ein Blick in die Legende des Nordost-Blattes für die Karte zeigt, für den Stammvokal u, also eine Realisierung von haben als hu. Dass sich gegebenenfalls ein genauerer Blick auch über die durch Isoglossen abgegrenzten Gebiete hinaus lohnt, sollte bei der Anwendung der hier präsentierten Methode auf jeden Fall berücksichtigt werden. An dieser finalen Beobachtung zeigt sich, dass sich Wenkers Ansatz, „lieber Weniges aus möglichst allen, als Vieles aus einer ungenügenden Zahl an Ortschaften einzusammeln“ (Wenker 1881, VIII; Sperrung im Original), für das hier hinsichtlich der regionalsprachlichen Prägung durchgeführte Speaker Profiling durchaus ausgezahlt hat.
Fazit
Die im vorliegenden Beitrag beschriebene Analyse zeigt, dass es bei Personen, die einen ausgeprägten Dialekt sprechen, ausreichen kann, die regionale Distribution von wenigen Merkmalen – hier waren es vier Dialektformen – zu ermitteln, um eine Idee von der möglichen regionalen Herkunft dieser Person zu bekommen. Die Erfahrung aus mehreren der einleitend beschriebenen Seminar-Wettbewerbe zeigt, dass diese Methode der dialektkartenbasierten Eingrenzung einer möglichen Herkunft eines Sprechers oder einer Sprecherin auch mit Sprachproben funktioniert, in denen sich die Personen stärker an der Standardsprache orientieren. Auch in solchen Sprechweisen sind noch regionalsprachliche Merkmale enthalten, deren Verbreitung sich aus den (alten) Dialektkarten, auf die man über das REDE SprachGIS zugreifen kann, ermitteln lässt. Die Methode stößt allerdings dann an ihre Grenzen, wenn Personen ihre Sprachprägephase in verschiedenen Regionen des deutschen Sprachraums verbracht und sich Merkmale aus allen dieser Regionen angeeignet haben. Für solche Sprecherinnen und Sprecher lässt sich dann im forensischen Kontext kein so klares Profil erstellen wie für den exemplarisch im vorliegenden Beitrag analysierten Sprecher. Sobald bei sprachlich variableren Personen allerdings Vergleichsaufnahmen vorliegen, ist ein spezifischer Variantenmix in deren Alltagssprache von großem Wert für die Entscheidung, mit welcher Wahrscheinlichkeit Sprecheridentität vorliegt.
Literatur
- Ganswindt, Brigitte/Kehrein, Roland/Lameli, Alfred (2015): Regionalsprache.de (REDE). In: Kehrein, Roland/Lameli, Alfred/Rabanus, Stefan (Hrsg.): Regionale Variation des Deutschen. Projekte und Perspektiven. De Gruyter: Berlin/Boston, 425–457. doi:10.1515/9783110363449-019
- Kehrein, Roland (2019): Regionalsprache.de (REDE) – das REDE SprachGIS. In: Eichinger, Ludwig M./Plewnia, Albrecht (Hrsg.): Neues vom heutigen Deutsch. Empirisch – methodisch – theoretisch. Berlin/Boston, 327–330.
- Köster, Olaf (2001): Die Datenbank regionaler Umgangssprachen (DRUGS). Ein neues Datenbank-Expertensystem für die forensische Sprechererkennung. Kriminalistik 1: 46–50.
- Köster, Olaf/Kehrein, Roland/Masthoff, Karen/Boubaker, Yasmin Hadi (2012): The tell-tale accent: identification of regionally marked speech in German telephone conversations by forensic phoneticians. In: The International Journal of Speech, Language and the Law 19.1: 52–71.
- Künzel, Hermann J. (1987): Sprechererkennung. Grundzüge forensischer Sprachverarbeitung. Heidelberg.
- Lameli, Alfred/Purschke, Christoph/Rabanus, Stefan (2015): Digitaler Wenker-Atlas (DiWA). In: Kehrein, Roland/Lameli, Alfred/Rabanus, Stefan (Hrsg.): Regionale Variation des Deutschen. Projekte und Perspektiven. De Gruyter: Berlin/Boston, 127–154. doi:10.1515/9783110363449-007
- Wenker, Georg (1881): Sprachatlas von Nord- und Mitteldeutschland. Auf Grund von systematisch mit Hülfe der Volksschullehrer gesammeltem Material aus circa 30.000 Orten. Bearbeitet, entworfen und gezeichnet von Dr. G. Wenker. Strassburg/London.
- Wenker, Georg (1888–1923): Sprachatlas des Deutschen Reichs. Marburg: Handgezeichnet.
Diesen Beitrag zitieren als:
Kehrein, Roland. 2021. Wo kommt die/der denn her? Dialektkarten für das Speaker Profiling. Sprachspuren: Berichte aus dem Deutschen Sprachatlas 1(7). https://doi.org/10.57712/2021-07.