Auswirkungen der Sprachkomprimierung durch Algorithmen

Auswirkungen der Sprachkomprimierung durch Algorithmen [für Frauen]

Marcus Schmid Wissenschaft

Virtuelle Meetings via Zoom, Skype, Teams und mittels Smartphones gehören aufgrund der voranschreitenden Digitalisierung und Globalisierung mittlerweile zum Alltag vieler Arbeitskräfte. Besonders auch die anhaltende Pandemie und das dadurch verbreitete Homeoffice haben dieses Phänomen noch weiter verstärkt. Dabei werden Frauen aufgrund der verwendeten Algorithmen zur Sprachkomprimierung tendenziell benachteiligt. Woran dies liegt und welche Lösungen es dafür gibt, zeigen wir gemeinsam mit Oliver Niebuhr in diesem Beitrag auf.

Charisma als ausschlaggebende Größe für Ihre Wirkung

Charisma wird oft als etwas Magisches beschrieben, wobei die meisten Menschen zwar bestimmen können, ob eine Person charismatisch ist, jedoch nicht sagen können, woran sich dies festmacht. Dabei ist Charisma ein wichtiger Erfolgsfaktor, vor allem im Berufsleben. Genauer betrachtet, setzt sich Charisma aus einer Mischung aus mehreren Empfindungen zusammen, die auf sogenannten kommunikativen und non-kommunikativen Reizsignalen beruhen. Hierbei kann es sich beispielsweise sowohl um die Körpersprache als auch um die Kleidung einer Person handeln. Natürlich zählt dazu auch die Fähigkeit, Ideen zu formulieren, sprich die verbalen Kommunikationssignale, wobei hier auch die sogenannte Prosodie der Sprache einen großen, sogar einen der größten Einflüsse hat. Dazu zählt auch die Stimme bzw. die Akustik an sich.

Besonders in Online-Meetings sind jedoch sowohl die verbalen als auch die non-verbalen Kommunikationssignale eingeschränkt. Einerseits herrschen meist suboptimale Lichtverhältnisse und andererseits ist es ebenso schwierig die ideale Position zu finden, so dass sowohl die Körperhaltung als auch die Blickrichtung ihr volles Potenzial entfalten können. Hinzu kommt, dass die Meeting-Teilnehmenden auch in ihrer Bewegungsfreiheit eingeschränkt sind und so ein weiteres möglicherweise positives Reizsignal minimiert wird. Dadurch werden die Stimme und die Prosodie der Sprache zu einem umso wichtigeren Asset, um trotz der suboptimalen Rahmenbedingungen ein optimales Ergebnis in punkto Charisma und damit auch Überzeugungskraft und erfolgreichem Auftreten zu erzielen.

Sprachalgorithmen und ihre Wirkung

Doch genau die Akustik betreffend werden besonders Frauen in virtuellen Meetings benachteiligt. Denn die Anzahl der Videoanrufe hat laut Studien in den letzten 15 Jahren um rund 900% zugenommen. Die Auswirkungen der COVID-19-Pandemie haben 2020 sogar für einen Anstieg um 2.900% gesorgt. Dies hat direkte Effekte auf den weltweiten Internetverkehr, der laut Cisco im Jahr 2022 zu rund 80% durch solche Videogespräche verursacht werden wird.

Um diese Datenmenge wiederum stemmen zu können, setzen Anbieter wie Skype, Zoom, Blue Jeans etc. auf Algorithmen zur Sprachkomprimierung. Dabei zeigen nun die Ergebnisse des Wahrnehmungsexperiments, dass die ausschlaggebende charismatische Wirkung von Sprecherinnen und Sprechern stark von dieser Sprachkomprimierung beeinflusst wird und die angewandten Audiokompressionsraten und -techniken systematisch Frauen benachteiligen.

Arten der Sprachkomprimierung bzw. verschiedene Algorithmen & Techniken

Dabei verwenden Mobile Kommunikationssysteme zur Sprachkompression unterschiedliche Codecs. Zu den populärsten und auch zu denjenigen, die betreffend ihre Auswirkungen auf die Prosodie der Sprache und somit auch auf das Charisma untersucht wurden, zählen die folgenden:

  • Adaptive Multi-Rate Wideband (AMRWB)
  • Adaptive Multi-Rate Narrowband (AMRNB)
  • GSMFR
  • MPEG-1/MPEG-2 Audio Layer III (MP3)
  • OPUS
  • SPEEX

Auswirkungen der verschiedenen Sprachalgorithmen

Gemäß den Studienergebnissen nimmt die charismatische Wirkung weiblicher Stimmen über einen größeren Bereich diverser Codecs ab, wobei dahinter zwei verschiedene Ursachen angenommen werden können. Es könnte sein, dass die sogenannten Audiokompressionscodecs per se für männliche Stimmen optimiert sind oder aber, dass die jeweils Zuhörenden bei der Bewertung der stattfindenden Signalverschlechterung bei weiblichen Stimmen weniger nachsichtig sind.

Während MP3 und OPUS über alles betrachtet, kaum signifikante prosodische Veränderungen in den akustischen Signalen der Sätze verursachen, weisen in der genannten Studie die Codecs AMRWB und GSMFR recht viele solcher Veränderungen auf. Noch deutlichere Änderungen ergeben sich jedoch für die Codecs AMRNB und SPEEX.

Die ungleichen bzw. für Frauen nachteiligen Veränderungen betreffend, verändert sich das Bild jedoch. Denn diese geschlechter-spezifische bzw. diskriminierende Verzerrung findet am weitaus häufigsten bei den beliebtesten Codecs MP3- und AMRWB statt, die in den Sätzen der weiblichen Sprecher 2- bis 3-mal so viele sogenannte Kompressionsartefakte erzeugen, wie in denen der männlichen Sprecher. Alles in allem fanden im Rahmen des Experiments in 60% der Fälle die Veränderungen in der Prosodie bei weiblichen Sprecherinnen statt, wohingegen dies nur bei 40% der männlichen Sprecher der Fall war.

Solche Veränderungen betreffen zum Beispiel die spektrale Energieverteilung. So reduzieren Codecs die Schallenergie für höhere Frequenzbänder zunehmend. Diese Reduktion ist bei Frauen stärker ausgeprägt und setzt zudem auch früher ein (bei etwa 2000 Hz und nicht bei etwa 3000 Hz).

Bemerkenswert ist auch, dass nicht alle festgestellten Veränderungen einen negativen Effekt haben, sondern es auch vorteilhafte Veränderungen auf die Sprecherausstrahlung gibt. Diese betreffen jedoch in 86% der Fälle nur männliche Sprecher.

Möglichkeiten zur Optimierung

Bedenkt man wie wichtig Charisma in der Berufswelt ist und welch großen Einfluss die Stimme auf die Wahrnehmung des Charismas hat, stellt sich die Frage, wie dieser technischen Benachteiligung von Frauen durch die Sprachverzerrung der verschiedenen Codecs entgegnet werden kann.

Eine Möglichkeit besteht sicherlich darin, technische Systeme zu nutzen, welche die neuesten Erkenntnisse mit einbeziehen und eine präzisere parametrische Bewertung ermöglichen. Ein System, das diese Ansätze anwendet, ist “Pascal” (Prosodic Analysis of Speaker Charisma-Assessment and Learning). Dabei steuert das Programm die Sprachprosodie hin zu einer positiveren Wahrnehmung und könnte so dazu beitragen, dass auch Frauen von der Algorithmus-bedingten Verzerrung profitieren. Dazu wird einerseits eine Sprechprobe auf ihre prosodischen Merkmale hin analysiert und so konkrete Daten und Hinweise zur Verbesserung geliefert, wobei bei der Analyse bewusst darauf geachtet wird, dass kein Unterschied zwischen Männern und Frauen gemacht wird.

Aufgrund dieses Feedbacks können Sprecherinnen und Sprecher im Anschluss ihre Sprechprobe entsprechend anpassen und auf die positiven prosodischen Merkmale hin optimieren.

Langfristig wird es sicherlich auch darum gehen, mit den aus wissenschaftlichen Studien gewonnenen Erkenntnissen die Funktionen der Codecs entsprechend weiterzuentwickeln. Ziel wird es sicherlich sein, dass die Systeme sowohl für weibliche als auch für männliche Sprechende das Beste herausholen und so optimale Voraussetzungen für ein bestmögliches Wirken des Charismas schaffen.