Im Sprachspuren-Beitrag vom 01. Juli 2021 hat Roland Kehrein veranschaulicht, wie die im REDE-SprachGIS zur Verfügung stehenden Karten für die Einordnung der Herkunft eines Sprechers/einer Sprecherin verwendet werden können. In diesem Beitrag werden weitere Möglichkeiten, das REDE-SprachGIS für das Speaker Profiling zu nutzen, beschrieben. Verwendet werden die Aufnahmen aus den im REDE-SprachGIS enthaltenen Aufnahmen des REDE-Korpus (einen Überblick über die verschiedenen Korpora finden Sie hier; nähere Informationen zum REDE-Projekt bieten auch Ganswindt/Kehrein/Lameli 2015).
Die Tonaufnahmen können in der forensischen Sprechererkennung ebenso wie die Karten gewinnbringend eingesetzt werden, wenn die Herkunft eines verdächtigen Sprechers/einer verdächtigen Sprecherin näher eingegrenzt werden soll. In diesem Fall spreche ich von „horizontalem Hören“, also dem Hören „im Raum“, wobei verschiedene Sprecher aus verschiedenen Regionen angehört und deren regionalsprachliche Merkmale mit der Aufnahme des/der Tatverdächtigen verglichen werden. Die im SprachGIS zur Verfügung stehenden Aufnahmen können aber auch genutzt werden, um zu überprüfen, wie sich die Sprechweise von Sprechern und Sprecherinnen unterschiedlicher Herkunft in unterschiedlichen Situationen verändern kann. Denn je nach Situation sprechen Menschen eventuell mal stärker und mal weniger stark regional gefärbt. Um sich von dieser intrapersonellen Sprachvariation einen Höreindruck verschaffen zu können, kommt die Methode des „vertikalen Hörens“, zum Einsatz. Dabei werden einzelne oder auch mehrere Sprecher/Sprecherinnen an einem bestimmten Ort in verschiedenen Situationen angehört. Hierbei ist es das Ziel, einen Eindruck davon zu bekommen, ob ein Sprecher/eine Sprecherin aus einer bestimmten Region in der Lage ist, seine/ihre Sprechweise zu verändern und wie diese Veränderungen aussehen. Diese Methode kann hilfreich sein, wenn es mehrere Aufnahmen eines verdächtigen Sprechers/einer verdächtigen Sprecherin gibt, die aber unterschiedlich stark regional gefärbt sind. Die beiden Methoden werden anhand von fiktiven Fällen erläutert. Bereits an dieser Stelle sei allerdings erwähnt, dass beide Methoden lediglich als Ergänzung zu bewährten Methoden der forensischen Sprechererkennung zu betrachten sind.
Horizontales Hören
Nehmen wir an, dass eine Straftat begangen wurde, bei der die Stimme eines männlichen Täters aufgezeichnet wurde.
Der Sprecher scheint sich dabei zu bemühen, Hochdeutsch zu sprechen. Eine phonetische und normorthographische Transkription liefert die folgende Tabelle.
Normorthographische Transkription | Feinphonetische Transkription |
bereits auf der Straße im Vorschulalter (…) diese typischen (…) regionalen Aussprachen (…) die dann markant einen zuordnen lassen | b̥əʁa͡e̝t͡s ɔ͡ʊ̞f d̥ə ʃʁa̠ːsɜˑ ɪ̠m foːɵʃʊlʔɐl̴tʰɜ (…) dɪzɘ tʰyˑp̬ʏʃ̠ə̃n (…) ʁɛ̝ɡ̊ʏna̠ːl̆n̩ a̠͡o̝ʃ̠pʁa̠ːχən (…) d̥iˑ d̥ɜn ma̠kʰa̠ntʰ a͡ɛnɘ̃n t͡suˑʔɔχt̬ⁿnən la̠sn̩ |
Für die Erstellung eines Sprecherprofils spielt die regionale Herkunft eines/einer Verdächtigen eine große Rolle (vgl. hierzu z. B. Künzel 1987, Jessen 2012), sodass nun versucht werden soll, diese möglichst genau zu bestimmen. Zunächst ist festzustellen, dass der Sprecher weder akzentfreies Hochdeutsch noch tiefen Dialekt spricht. Es lassen sich einige regionale Merkmale heraushören: Hierzu zählt die (tendenzielle) Velarisierung des standardsprachlichen Lateralapproximanten /l/ im Wort „Vorschulalter“ sowie die tendenzielle Rückverlagerung des postalveolaren Frikativs /ʃ/ in Richtung eines alveolo-palaten Lautes ([ɕ]). Besonders auffällig ist die Realisierung des Phonems /r/ im Wort „zuordnen“. In der kodifizierten Standardsprache würde das /r/ an dieser Stelle vokalisiert, also als [ɐ] ausgesprochen. Der Täter verwendet hier aber einen regionsspezifischen Frikativ, nämlich velares [x], den sog. ach-Laut. Um die Herkunft des Sprechers einzugrenzen, werden nun systematisch Aufnahmen unterschiedlicher Sprecher aus verschiedenen Regionen angehört. Hierbei bietet sich besonders eine hierarchische Dialekteinteilung wie die von Lameli (2013) an.
Zur groben Eingrenzung der Herkunft des verdächtigen Sprechers ziehen wir nun Aufnahmen aus dem REDE-Korpus aus sieben Großräumen, die zur besseren Übersicht in der folgenden Abbildung farblich voneinander abgesetzt werden, heran.
Es werden Aufnahmen der Vorleseaussprache gewählt, um so einen guten Vergleich mit der standardnahen Aufnahme des Täters zu gewährleisten. Die für diesen Beitrag gewählten Aufnahmen stellen nur einen Ausschnitt der tatsächlich zur Verfügung stehenden Aufnahmen dar. In jeder Region könnten ergänzend zahlreiche weitere Aufnahmen hinzugezogen werden.
Das Durchhören der Aufnahmen legt die Vermutung nahe, dass der Informant aus dem in Abbildung 3 grün markierten Gebiet stammt, da auch in der Aufnahme aus Bergheim zum Teil ähnliche regionale Merkmale auftreten, wie die Realsierung vom /r/-Phonem als Frikativ [χ] im Wort „wird“ ([vɘχt]) sowie Koronalisierungen, z. B. in den Wörtern „durch“ ([d̥ʊ̽ʏʃ]) und „gleich“ ([ɡ̊ˡlɐ͡e̝ɕ]).
Bei diesem Gebiet handelt es sich nach Lameli um die Region „Westdeutsch“ (vgl. auch Abb. 2). Die Frage, die sich jetzt stellt, ist: Lässt sich die Herkunft des Sprechers innerhalb dieses Gebietes noch weiter eingrenzen? Zu diesem Zweck wird nun die Dialekteinteilung von Lameli (2013) mit der Dialekteinteilung von Wiesinger (1983) kombiniert.
Die linke Karte von Lameli (2013: 197) zeigt die Ähnlichkeiten zwischen den Dialekten in den Landkreisen im ausgewählten Gebiet an. Die Dialekteinteilungskarte von Wiesinger (1983) weist in diesem Gebiet, dem Mittelfränkischen, verschiedene Teilgebiete aus: Niederfränkisch, Ripuarisch und Moselfränkisch sowie Übergangsgebiete, die sich auch bei Lameli zeigen. In diesem Gebiet lassen sich also noch kleinräumigere Unterscheidungen treffen. Um zu prüfen, ob sich die Herkunft des Verdächtigen noch weiter eingrenzen lässt, werden nun Aufnahmen aus diesen kleinräumigen Regionen herangezogen.
Beim Hören durch den Raum zeigt sich, dass ein Hauptcharakteristikum des Verdächtigen, nämlich der bereits angesprochene velare Frikativ [x] im Lemma „zuordnen“, auch in Aufnahmen aus Krefeld (Übergangsgebiet zwischen Niederfränkisch und Ripuarisch), Köln (Ripuarisch) und Aachen (Ripuarisch) zu finden ist, bei allen drei Sprechern im Wort „wird“, das als [vɪxtʰ] realisiert wird. Es ist daher anzunehmen, dass der Sprecher weder aus dem Raum um Dinslaken (Niederfränkisch), noch aus dem Raum Linz (Übergangsgebiet zwischen Ripuarisch und Moselfränkisch) oder dem Raum Wittlich (Moselfränkisch) stammt. Eine Herkunft aus dem Ripuarischen Sprachraum ist wahrscheinlich.
Gelingt noch eine weitere Eingrenzung der Herkunft des verdächtigen Sprechers? Ein weiteres wichtiges Charakteristikum in der Sprechweise des Verdächtigen ist die Prosodie. Um auch hier nach Ähnlichkeiten zu suchen, erfolgt ein erneuter Vergleich zwischen den Aufnahmen des Verdächtigen und den Aufnahmen aus Krefeld, Köln und Aachen.
Es zeigt sich, dass die Prosodie des Sprechers aus Köln der des Verdächtigen am stärksten ähnelt. Die Prosodie ist eines der am wenigsten gut kontrollierbaren regionalsprachlichen Charakteristika, auch dann, wenn Sprecher/Sprecherinnen bemüht sind, Hochdeutsch zu sprechen. Daher ist es plausibel, anzunehmen, dass der Verdächtige aus diesem Raum, also nach Wiesinger (1983) aus dem ripuarischen Dialektraum stammt. Nun gilt es zu überprüfen, ob innerhalb dieses Raumes noch eine weitere Eingrenzung der Herkunft des Verdächtigen möglich ist. Hierfür werden Aufnahmen aus dem REDE-Korpus aus allen Orten im ripuarischen Sprachraum herangezogen.
Deutliche Unterschiede, die zu einer weiteren Eingrenzung der Sprecherherkunft des Verdächtigen führen könnten, lassen sich in den Vergleichsaufnahmen nicht erkennen, eine weitere Eingrenzung ist in diesem Fall entsprechend nicht möglich. Die Größe des Gebietes, aus dem der Verdächtige stammen könnte, konnte auf ein Gebiet von etwa. 70x130 km eingegrenzt werden.
Kommen wir nun zur Auflösung. Der gesuchte Sprecher stammt aus Düren, einem Ort südwestlich von Köln innerhalb des ripuarischen Sprachraums.
Anhand dieses Beispiels konnte gezeigt werden, dass es mit der Methode des horizontalen Hörens möglich ist, die Herkunft eines Sprechers auf ein relativ kleines Gebiet innerhalb des deutschen Sprachraums einzugrenzen, auch wenn dieser Sprecher in der zur Verfügung stehenden Aufnahme bemüht ist, Hochdeutsch zu sprechen. Die Methode kann gewinnbringend als Ergänzung in der forensischen Sprechererkennung verwendet werden.
Vertikales Hören
Beim vertikalen Hören werden unterschiedliche Aufnahmesituationen eines Sprechers (im REDE-Korpus wurden nur Männer aufgenommen) an einem bestimmten Ort miteinander verglichen, um so einen Eindruck darüber zu erhalten, inwieweit Sprecher/Sprecherinnen aus einer bestimmten Region in der Lage sind, ihre Sprechweise situationsgebunden zu ändern. Diese Methode ist in der forensischen Sprechererkennung dann nützlich, wenn mehrere Aufnahmen mit unterschiedlich starker Regionalität zur Verfügung stehen und überprüft werden muss, ob es sich bei diesen Aufnahmen um einen oder verschiedene Sprecher/Sprecherinnen handelt. Eines ist an dieser Stelle allerdings deutlich zu betonen: Diese Methode kann nur eine Ergänzung zu weiteren phonetisch-akustischen Analysen sein, sie ist keine eigenständige Methode zum Nachweis dafür, dass zwei Aufnahmen von ein und demselben Sprecher/ein und derselben Sprecherin stammen.
Kommen wir zu unserem fiktiven Fall zurück und stellen uns vor, es erreicht uns eine weitere Aufnahme zu einem sehr ähnlichen Verbrechen.
Tabelle 2 zeigt die normorthographische und die feinphonetische Transkription der Aufnahme.
Normorthographische Transkription | Feinphonetische Transkription |
Da gibt es ja, gibt es ja viel Geld hey dafür, ne, dass die Leute sich melden. | d̥ɐ ɡ̊ib ət çɑː jɘd ɘt ʝ̞ɔ̜ vɘ̆l̴ jɛl̴tʰ h̬ɛ̝ d̥ɜvyːɞ̜ nɛ ɾət tɪ̠ lø̝k sɪɕ mɛl̴də |
Was sollen wir sonst tun, wir können auch nicht fliegen. | vɜt sɵm̞ m̞ɜ zɔnsd̥ d̥o̜ən mʏ kʰœ̝n ɔ̜ n̞ɛt fleːjɛ̹ |
Im Krankenhaus, plötzlich geht da nix mehr, ne? | ə̆m kχã̠ŋko̝ɦo̝ːs pˡlœt͡sɘ̆ɕ ɕe̝ːt tɜ ne̝ks me̝ː nœ̜ |
Der Sprecher dieser Aufnahme spricht allerdings einen tieferen Dialekt als der Sprecher in unserer ersten Aufnahme. Der Dialekt ist als Ripuarisch zu identifizieren, wie sich an den hervorgehobenen Merkmalen zeigt. So fallen wie in der ersten Aufnahme Velarisierungen von standardsprachlichem /l/ auf, ebenso g‑Spirantisierung zu [j] im Wort „Geld“ und „fliegen“, unverschobenes germ. /t/ im Wort „es“ sowie die Koronalisierung von standardsprachlichem /ʃ/ zu [ɕ]. Hinzu kommen die Senkung von standardsprachlichem /iː/ im Wort „fliegen“ sowie die Monophthongierung von standardsprachlichem /a̠͡ʊ/ im Wort „Krankenhaus“ (vgl. zu ripuarischen Dialektmerkmalen z. B. Wiesinger 1983, Lauf 1994 sowie Schmidt/Möller 2019). Es stellt sich nun die Frage: Ist es möglich, dass diese sehr ähnlichen Verbrechen von ein und demselben Täter begangen wurden, der bei einem Vergehen dialektaler spricht als bei dem anderen? Tut er dies, weil er weiß, dass er aufgezeichnet werden könnte und versucht so, die Polizei zu verwirren? Ein Stimmenvergleich (vgl. hierzu z. B. Jessen 2012) ist an dieser Stelle das probate Mittel. Die Methode des vertikalen Hörens kann ergänzend eingesetzt werden, da hierdurch das Sprachverhalten von Sprechern/Sprecherinnen aus einer bestimmten Region beobachtet werden kann. In anderen Worten: Es ist mithilfe des vertikalen Hörens möglich, herauszufinden, ob es Sprechern/Sprecherinnen aus einer bestimmten Region möglich ist, sowohl Dialekt als auch Hochdeutsch zu sprechen oder zumindest eine Sprechweise zu verwenden, die der kodifizierten Standardsprache nahekommt. Da die Informanten des REDE-Projekts in 5 verschiedenen Situationen aufgenommen wurden, die sich alle in ihrem Formalitätsgrad unterscheiden, lässt sich hier auf eine gewisse Bandbreite an verschiedenen Kommunikationssituationen zurückgreifen. Die sog. Kompetenzerhebungen der Informanten aus dem REDE-Projekt, die Übertragung der Wenkersätze in ihr individuell bestes Hochdeutsch und in ihren individuell besten Dialekt sowie die Vorleseaussprache sind für alle untersuchten Informanten über das SprachGIS abrufbar. Für einen Teil der Informanten stehen unter dem Punkt Spektrumsanalysen darüber hinaus Ausschnitte aus den sog. Performanzsituationen Freundesgespräch und Interview zur Verfügung.
Hören wir uns nun Sprecher aus dem ripuarischen Sprachraum in ihrem jeweils individuell tiefsten Dialekt und besten Hochdeutsch an.
Der Vergleich zeigt: Es ist Menschen aus dem ripuarischen Sprachraum möglich, sowohl einen relativ tiefen Dialekt als auch ein Hochdeutsch mit nur wenigen regionalen Merkmalen zu sprechen. Daher ist es möglich, dass die beiden Aufnahmen aus unserem fiktiven Fall von ein und derselben Person stammen können. Wichtig ist hierbei aber, dass dies nicht auf alle Menschen aus diesem Sprachraum zutrifft. Das bedeutet, dass es selbstverständlich auch Personen gibt, die gar keinen Dialekt (mehr) sprechen oder ihre Sprechweise in unterschiedlichen Situationen nur sehr wenig ändern. Die Methode kann, um es erneut zu betonen, lediglich als Ergänzung zu weiteren akustisch-phonetischen Analysen betrachtet werden, um einen Eindruck davon zu gewinnen, wie intrapersonelle sprachliche Variation in einer bestimmten Region aussehen könnte.
Zusammenfassung und Schlussfolgerung
In diesem Beitrag wurden zwei Methoden zur Unterstützung der forensischen Sprechererkennung mit den im SprachGIS verfügbaren Sprachaufnahmen des REDE-Korpus vorgestellt. Die Methode des „horizontalen Hörens“ kann unterstützend eingesetzt werden, um die Herkunft eines Sprechers/einer Sprecherin zu ermitteln. Das „vertikale Hören“ kann einen Eindruck darüber vermitteln, wie Sprecher an bestimmten Orten in verschiedenen Situationen sprechen (können). Man erfährt mit dieser Methode also etwas über das (intersituative) sprachliche Verhalten von Sprechern an einem bestimmten Ort. Zur alleinigen Bestimmung der Sprecherherkunft bzw. zur Einschätzung, ob zwei Aufnahmen von ein und derselben Person stammen, sind diese Methoden selbstverständlich nicht geeignet. Hierfür sind weitere phonetisch-akustische Analysen vonnöten, wie die Erstellung eines umfassenden Stimmprofils, für das Fachliteratur wie die DRUGS und Dialektgrammatiken für die nähere Eingrenzung der Sprecherherkunft herangezogen werden sollten. Auch der Einsatz von Sprachkarten aus Wenkers Sprachatlas des Deutschen Reichs kann hierbei gewinnbringend sein (vgl. den Beitrag in den „Sprachspuren“ von Roland Kehrein), ebenso wie die Nutzung der neu entstanden Plattform zu den Regionalakzenten des Deutschen. Die Methoden können aber als eine hilfreiche Stütze und Ergänzung in der forensischen Sprechererkennung angewandt werden.
Literatur
Ganswindt, Brigitte/Kehrein, Roland/Lameli, Alfred (2015): Regionalsprache.de (REDE). In: Kehrein, Roland/Lameli, Alfred/Rabanus, Stefan (Hrsg.): Regionale Variation des Deutschen. Projekte und Perspektiven. Berlin/Boston: De Gruyter, 425–457. https://doi.org/10.1515/9783110363449-019
Jessen, Michael (2012): Phonetische und linguistische Prinzipien des forensischen Stimmenvergleichs. München: LINCOM EUROPA (LINCOM studies in phonetics. 9).
Künzel, Hermann J. (1987): Sprechererkennung. Grundzüge forensischer Sprachverarbeitung. Heidelberg.
Lameli, Alfred (2013): Strukturen im Sprachraum. Analysen der arealtypologischen Komplexität der Dialekte in Deutschland. Berlin/Boston: de Gruyter (Linguistik – Impulse und Tendenzen. 54).
Lauf, Raphaela (1994): Datenbank regionaler Umgangssprachen des Deutschen. DRUGS. Abschlußbericht. Manuskript. Universität Marburg.
Schmidt, Jürgen Erich/Möller, Robert: Historisches Westdeutsch/Rheinisch (Moselfränkisch, Ripuarisch, Südniederfränkisch). In: Herrgen, Joachim/Schmidt, Jürgen Erich (Hg.): Sprache und Raum. Ein internationales Handbuch der Sprachvariation. Band 4: Deutsch. Unter Mitarbeit von Hanna Fischer und Brigitte Ganswindt. Berlin/Boston: De Gruyter Mouton. (Handbücher zur Sprach- und Kommunikationswissenschaft. 30.4), 515–550. https://doi.org/10.1515/9783110261295-016
Wiesinger, Peter (1983): Die Einteilung der deutschen Dialekte. In: Besch, Werner/ Knoop, Ulrich/ Putschke, Wolfgang/ Wiegand, Herbert Ernst (Hg.): Dialektologie. Ein Handbuch zur deutschen und allgemeinen Dialektforschung. (1982/1983). Berlin / New York: Walter der Gruyter (Handbücher zur Sprach- und Kommunikationswissenschaft. 1.2) 2. Teilband, 807–89.
Diesen Beitrag zitieren als:
Limper, Juliane. 2022. Das REDE-SprachGIS als Hilfsmittel für die forensische Sprechererkennung: Horizontales und vertikales Hören. Sprachspuren: Berichte aus dem Deutschen Sprachatlas 2(12). https://doi.org/10.57712/2022-12