Der Stimme auf der Spur – Teil 4/4 der Reihe „Die Stimme – unser akustisches Ich“

© Voiceprint-Stimmabdruck by Migros Magazin

Mein Name ist Bond. James Bond.“ Unmittelbar nachdem der smarte Agent mit der sonoren Stimme diese Worte ausgesprochen hat, öffnen sich ihm im wortwörtlichen Sinne Tür und Tor. Sämtliche Sicherheitsvorkehrungen stellen dabei für ihn kein Hindernis dar. Was einst schlicht unter die Kategorie der Science-Fiction-Romane fiel, findet in der heutigen Zeit zunehmend Akzeptanz. Die Sprecherkennung durch die Aufnahme der individuellen Stimme einer Person zählt zur Biometrie. Bereits früh wurde sie als Erkennungsmethode zur Personenidentifikation eingesetzt. So zählt auch die Nutzung des persönlichen Fingerabdruckes (Daktylogramm), dessen Grundstein 1892 von Francis Galton gelegt wurde, zu diesen biometrischen Verfahren. Heute definiert man die Biometrie im Bereich der Personenidentifikation auch als „automatisierte Erkennung von Individuen“, basierend auf ihren einzigartigen physiologischen Merkmalen und ihren biologischen Charakteristika und Verhaltensweisen. Doch ist ein „Voiceprint“ wirklich mit einem Fingerabdruck vergleichbar?

In diesem letzten Blog über die Stimme als Funktionsträgerin der Identität, Individualität und der eigenen Verortung in der sozialen Umwelt möchte ich einige weitere Aspekte des Stellenwerts und des Potenzial der Stimme in der heutigen Zeit ansprechen, um diesen herauszustellen und eine Basis für weiterführende Untersuchungen zu ebnen.

„Stimmabdrücke“

Anfang der 1940er Jahre wurde ein  Spektograph entwickelt, der aufgenommene Schallwellen in optische Muster umwandelte und diese aufzeichnete. In den Zeiten des zweiten Weltkrieges versuchten Akustikexperten mithilfe dieser Geräte feindliche Stimmen im Radio zu erkennen. So wurden nach einem Anschlag auf Adolf Hitler beispielsweise amerikanische Phonetiker beauftragt, zwei Sendungen von Hitler zu vergleichen, um herauszufinden, ob die zweite der beiden nicht von einem Double gesprochen worden war. Aus der Ähnlichkeit der beiden Spektogramme und des Klangs der beiden Aufnahmen zog man den Schluss, dass Hitler noch am Leben war. Doch erst in den 1960er Jahren wurde die Technologie verfeinert und die Definition „Voiceprint“ eingeführt. Doch ist dieser englische Ausdruck für die Stimmerkennung irreführend, da er eine Analogie zu den Fingerabdrücken suggeriert.

Akustische DNA-Analyse

Während letztere allgemein ein unfehlbares Mittel zur Identifizierung einer Person sind, kennzeichnet die Bewertung von „Stimmabdrücken“ besonders im polizeilichen Kontext einer Täterüberführung lediglich eine Aussage einer, wenn auch fundierten Expertenmeinung. Bei der Stimmerkennung müssen neben den beiden eingesetzten Spektogrammen, die visualisierte Daten produzieren, auch auditive Elemente analysiert, verglichen und ausgewertet werden. Zu ihnen zählen Atemmuster, Tonfälle, Akzente und spezifische Sprechgewohnheiten, die in den beiden unterschiedlichen Aufnahmen auftreten. Und dies macht das Verfahren der Stimmerkennung immer auch zu einem subjektiven Moment, in dem nicht zweifelsfrei interpretiert und ausgelegt wird. Zudem erschweren weitere Aspekte die eindeutige Identifizierung und führen die Vorstellung einer „akustischen DNA-Analyse“ ins Aus. So variiert die Tonhöhe eines Menschen täglich, die Stimme kann (bewusst, wie unbewusst) verstellt werden und eventuelle Hintergrundgeräusche können sie weitergehend verfremden. Sogar bei eineiigen Zwillingen liegt die Fehlerquote bei 50 %. So kann die Sprechverifizierung, im Gegensatz zur Daktyloskopie, andere Verfahren der polizeilichen Verbrechensaufklärung lediglich ergänzen, sie jedoch nicht ersetzen.

Nichtsdestotrotz gilt die Stimme in britischen Gerichtsverfahren bereits als Beweismittel. So haben eine Reihe von Präzedenzfällen seit 1993 zu einer Zulassung der spektographischen Stimmverifikation geführt, wenn sie von Experten durchgeführt werden. Letztendlich ist es dann die Geschworenen überlassen, ob sie derartige Beweise akzeptieren oder nicht.

Augenzeugen vs. „Ohrenzeugen“

Doch wie ist ein Fall zu beurteilen, bei dem ein mutmaßliches Opfer die Stimme des Täters anhand von Aufzeichnungen oder sogar im direkten Hören wiedererkennt? Kann das Gehör so scharf und die Erinnerung so zuverlässig sein? Solche „Ohrenzeugen“, die sich Aufnahmen von den Stimmen Verdächtiger anhören müssen, tragen heutzutage bei polizeilichen Ermittlungen neben den üblichen Augenzeugen genauso zur Aufklärung eines Falles bei. Dennoch kann man die beiden Formen der Gegenüberstellung nicht vergleichen. Aufgrund der divergierenden Arbeitsweise des auditiven Gedächtnisses im Vergleich zur visuellen, müssen die Stimmen gegenüber den Gesichtern nacheinander, statt gleichzeitig, vorgeführt werden. Zudem verzerren mögliche momentan empfundene Emotionen der Verdächtigen wie Angst und Zorn in dem Moment der Gegenüberstellung deren Stimmen um ein vielfaches mehr als die Züge ihrer Gesichter. So liegt die Trefferquote bei einem Stimmvergleich bei  durchschnittlich nur 30%. Außerdem wird die Identifikation dadurch erschwert, dass manche Menschen besser und aufmerksamer hören und manche Stimmen markanter und dadurch leichter wiederzuerkennen sind als andere. Es ist weitaus einfacher, eine einem bereits bekannte Stimme zu identifizieren als diejenige eines Fremden.

Die Stimme als Herausforderung

Die Unwägbarkeiten, die jede einzelne Stimme mit sich bringt, können jedoch nicht als Defizit begriffen werden, indem die Stimme sich nicht für technische Zwecke instrumentalisieren lässt. Vielmehr birgt die Stimme in sich einen so großen Schatz an Facetten und Farben, dass sie sich nicht eingrenzen lässt. Ihre Potenzialität ist vorhanden. Vielmehr ist es die noch nicht ausreichend ausdifferenzierte Analyse der Stimme in ihrem Wesen, die zu ihrem noch unspezifischen Einsatz in den verschiedenen (technologisierten) Bereichen führt.

Die Einzigartigkeit einer jeden Stimme ist unbestreitbar. Sie ist das Kennzeichen des menschlichen Individuums. Genau wie die Struktur des Fingerabdruckes weist sie ihren Träger als Einzelnen aus. Der Unterschied liegt einzig darin, dass in der Über- und Vermittlung dieses individuellen Merkmals in ein festes System mit manifesten Kriterien zwar die Überführung eines Fingerabdrucks in eine Kartei aufgrund seiner lebenslangen Unveränderlichkeit möglich ist, eine solche bei der Aufzeichnung von Stimmspuren wegen ihres flüchtigen und permanent in Nuancen changierenden Charakters jedoch nicht ganz ohne Zweifel realisierbar ist. Es meint, dass nicht die vermeintliche Fehlbarkeit und mangelnde Eindeutigkeit der Stimme das Problem ist, sondern vielmehr unsere noch mangelhaften Kenntnisse über den Komplex der menschlichen Stimme und die daraus resultierende noch bestehende Unzulänglichkeit der Transformation dieser in einen weiteren funktionalen sozial-gesellschaftlichen Kontext, wie beispielsweise in den der Verbrechensbekämpfung oder in den der Stimmerkennung zugunsten einer erhöhten (Daten-)Sicherheit.

Hören vs. Sehen?

Nachwievor wird die Stimme als rein akustischer Klang und als vokaler Laut begriffen und dem Visuellen gegenübergestellt. Redewendungen wie „Das glaube ich nur, wenn ich es sehe“ und „Das ist Ansichtssache“, demonstrieren, wie sehr die zeitgenössische Kultur die visuelle Wahrnehmung mit Verständnis, Koordination, Überzeugung und Tatsachen verbindet und dem Visuellen den höchsten Wahrheitsgehalt zuspricht. Die Kultur unterliegt in dem Maße der Anschauung und der Präferenz des Visuellen derart, dass die Möglichkeiten, die die Stimme besitzt, bereits im Vorfeld negiert werden.

Schon im Vergleich der Wertigkeit eines ausgedruckten, offiziellen schriftlichen Dokumentes gegenüber der Geste des Handschlages zusammen mit den Worten „Ich gebe dir mein Wort“ wird klar, dass der Buchdruck und die Literalität den Status der Oralität verändert haben.  Während im 4. Jahrhundert v. Chr. für Platon Menschen, die viel wussten, gleichbedeutend waren mit Menschen, die viel gehört hatten, und sich die Menschen Gott noch bis zum Beginn der Renaissance als Klang oder Vibration vorstellten, veränderte die spätere Aufklärung gänzlich das westliche Bild von der Welt und der Art ihrer sinnlichen Wahrnehmung. Demgegenüber stehen nachwievor die oralen Kulturen, deren wichtigstes Medium zur Kommunikation die Laute und Klänge der Stimme darstellen.

Dennoch darf nicht der Schluss gezogen werden, die Oralität als Vorgänger der Schriftlichkeit zu begreifen, und die oralen Kulturen als vorschriftliche Gesellschaften anzusehen. Auch wenn die Chronologie der Ereignisse in der westlichen Kultur dazu verführen, die Schriftlichkeit als modernen Ersatz für die frühere Oralität zu definieren, ist diese Polarisierung von keinem Nutzen. Die Literalität hat die Oralität nicht ersetzt, sondern vielmehr ergänzt. Ist die Stimme in manchen Bereichen der Schriftlichkeit gewichen, findet sie in vielen anderen Bereichen nachwievor ihren Einsatz. Nur sind wir uns dessen viel zu wenig bewusst.

Nicht nur Sehen führt zu Wissen

Dies zeigt uns ein Blick in den wissenschaftlichen Bereich, in dem Wahrheit, Erkenntnis und Wissen zwar auf den schriftlich tradierten und manifestierten Dokumenten fußen. Hinzu findet jedoch auch ein nachwievor steter und notwendiger mündlicher Austausch über Informationen und Wissen statt. Vorlesungen, Diskussionen und mündliche Vorträge, Arbeitsgruppen, Laborgespräche und ganze wissenschaftliche Tagungen im universitären Komplex zeigen, dass der Sprachlichkeit eine bemerkenswerte Relevanz auch in der heutigen westlichen Kultur beizumessen ist. Wissen manifestiert sich nicht nur durch das Lesen von Verschriftlichten, sondern ebenso durch das Hören von Gesprochenem. Es wird nicht nur durch schriftlich verfasste und gelesene Publikationen vermittelt und ausgetauscht, sondern auch im regen Gespräch darüber.

Weiterhin  betont auch der Verweis auf die in der Populärkultur etablierten und beliebten Vertonungen von Bücher aller Genres in Form von Hörspielen, vorgelesenen Ausschnitten in Radiosendungen oder auch die Vorstellung von neu erschienen Büchern in Literaturzirkel im Rundfunk u.a. den deutlich herauszustellenden Status der Mündlichkeit in der heutigen Zeit.

Auch im Bereich der alternativen Heilung findet die Stimme in vielfachen Bereichen seinen Einsatz. Seien es Gesprächs-, Gesangs-, oder Schreitherapien oder auch die beruhigende und unterstützende „Vertonung“ der Meditation und einzelner Yogabungen durch das Begleitmedium Stimme. Überall begegnet sie uns und überall bedienen wir uns ihrer.

Fokus auf die Stimme

Es macht aufmerksam darauf, die Stimme weniger ausschließlich im Vergleich oder in der Gegenüberstellung zum Visuellen oder zum Literalen zu sehen. Vielmehr sollte der (analytische) Blick einmal gänzlich auf die Stimme an sich gelegt und die Ohren geöffnet werden für das, was sie uns noch alles zu sagen hat. Und das ist viel mehr, als das, was wir zu diesem Zeitpunkt glauben zu wissen.

Stimme ist nicht nur Sprache

Zudem bleibt bei aller Diskussion über Oralität zumeist die wirkliche, körperliche Stimme unerwähnt. Denn statt ihre parasprachliche, körperbetonte Komponente zu betonen, wird die Stimme im Kontext der Mündlichkeit verkürzt mit der Rede gleichgesetzt. Dabei wird keine Differenzierung zwischen dem Wortklang und dem Wortlaut vorgenommen. Die Argumentationen laufen in die falsche Richtung, wenn man den Unterschied zwischen oraler und literaler Kultur ausnahmslos darin sieht, dass in der einen die Worte nur flüchtig gesprochen und in der anderen zusätzlich noch zeitüberdauernd verschriftlicht werden. Ein wesentlicher Unterschied liegt eher darin, dass die oralen Gesellschaften die parasprachlichen Elemente der Stimme erkennen und betonen, während die literale Gesellschaft dies größtenteils übersieht beziehungsweise „überhört“. Beschäftigen sich Linguisten mit der Stimme, setzten sie diese oftmals mit der Sprache gleich. Zwar gehören beide durchaus zusammen, doch werden zu enge Grenzen in dem umfassenden Verständnis der Stimme gesetzt, wird die Stimme nicht auch zeitweise ohne ihre sprachliche Komponente gedacht. Steht dann doch einmal die Akustik im wissenschaftlichen Fokus,  geht es oftmals darum, wie wir durch die Stimme unsere Gedanken und Redeweisen formen und herausstellen können. Ungeachtet aber bleiben die expressiven, flüchtigen Aspekte der körperlichen Stimme. „All das, was aus dem Mund einer Person dringt, an das Ohr einer anderen Person gerichtet wird, und die spontane, persönliche Antwort, die das eigene Ohr empfängt.“ Erst durch die Vorgänge in unserem Körper wird der Klang, aus dem die Stimme mitunter besteht, mit Bedeutung aufgeladen. Diese wird durch Schwingungen transportiert und gelangt an das Ohr und generiert dort weitere, womöglich divergierende Bedeutungen (In diesem Zusammenhang sei auch auf meine beiden Blogeinträge „Klang der Gefühle“ und „Im stimmlichen Einklang“ gesondert hingewiesen, die sich mit dieser Thematik nocheinmal dezidiert auseinandersetzen).

Ergebnis und Ausblick

Will man diese Besonderheiten in Worte fassen, neigen die Studien schnell zu Abstraktionen. Die Wissenschaftler stehen vor einem mehrfachen Problem. Zum einen sind es die diffizilen Studien darüber, was als variables Stimmprodukt von dem einen Körper produziert und ausgesendet wird und zum anderen welches Produkt bei dem Empfangenen ankommt und wie es wie es von seinem Körper situationsabhängig angenommen und übersetzt wird. Dies macht darauf aufmerksam, dass für ein genaueres Verstehen des Wunderwerks der menschlichen Stimme weitere Analysen der vielfachen Probleme und Kriterien, die bei der Bestimmung dieser auftauchen, notwendigerweise zukünftig zu leisten sind, will man im nächsten Schritt die Stimme für technische Sicherheitszwecke funktionalisieren.

Und vielleicht kommen wir ja bald dem persönlichen Traum näher und stehen wirklich einmal an der eigenen Wohnungstür und schlüpfen in die Rolle des Superagenten 007 Mr. Bond, dem sich Tür und Tor öffnen, sagt er nur:

Bond. Mein Name ist James Bond.“- Ganz im Sinne: For your ears only!

 

Quellenverzeichnis:

Göttert, Karl-Heinz: Geschichte der Stimme. Köln: Wilhelm Fink Verlag 1998.

Hollien, Harry Francis: The Acoustics of Crime. The New Science of Forensic Phonetics. New York: Springer US 1990.

Hollien, Harry Francis: Forensic Voice Identification. San Diego: Academy Press 2002. Abrufbar unter: http://books.google.de/books?id=X8_Jo-pHcKMC&printsec=frontcover&dq=hollien+harry+forensic+voice+identification&hl=de&sa=X&ei=ZSNdT77qGozvsgbSt6nvCw&ved=0CDoQ6AEwAA#v=onepage&q=hollien%20harry%20forensic%20voice%20identification&f=false

Lehmann, Christian: Sprachliche – parasprachliche – nichtsprachliche Kommunikation. http://www.christianlehmann.eu/ling/elements/index.html?http://www.christianlehmann.eu/ling/elements/parasprache.html. (20.02.2012).

Planet Wissen: Sir Francis Galton. http://www.planet-wissen.de/politik_geschichte/verbrechensbekaempfung/fingerabdruecke/sir_francis_galton.jsp. (19.02.2012).

Spiegel Online Kultur: Projekt Gutenberg-DE. Platon. http://gutenberg.spiegel.de/autor/462. (22.02.2012).

Scherer, Thomas M.: Stimme, Emotion und Psyche. Untersuchungen zur emotionalen Qualität der Stimme. Frankfurt am Main: Deutsche Bibliothek 2000.

Sowodniok, Ulrike: Funktionaler Stimmklang – ein Prozess mit Nachhalligkeit. In: Funktionale Klänge. Hörbare Daten, klingende Geräte und gestaltete Hörerfahrungen. Hg. von Georg Spehr. Bielefeld: transcript Verlag 2009. S. 101-126.

Wikipedia: Biometrie. http://de.wikipedia.org/wiki/Biometrie. (19.02.2012).

Wikipedia: Fingerabdruck. http://de.wikipedia.org/wiki/Fingerabdruck. (19.02.2012).

Wikipedia: Spektogramm. http://de.wikipedia.org/wiki/Spektrogramm. (19.02.2012).