Emotionserkennung
Emotionserkennung ist der Prozess der Abstraktion und Klassifikation von audio-visuellen Signalen und ihre Entschlüsselung als Zeichen für Emotionen. Sie findet vor allem in der Emotionspsychologie, der Psychotherapie, der Humanethologie und der Robotik Anwendung. In der Robotik unterscheidet man zwischen visueller Emotionserkennung und akustischer Emotionserkennung. Im Gegensatz zur Humanethologie und der Psychologie hat die Robotik ein sehr einfaches Bild menschlicher Emotionen. So werden hier der Ausdruck und die Darstellung von Emotionen häufig mit dem Empfinden von Emotionen gleichgesetzt. Folgendes Beispiel soll dies verdeutlichen. Sobald eine Person ihre Mundwinkel nach oben zieht oder z. B. den Satz „ich bin fröhlich“ spricht, deutet das die Robotik als Freude. Die Psychologie hingegen würde hier zunächst nur den Ausdruck eines fröhlichen Satzes sehen – aber noch lange keine echte Freude.
Wissenschaftliche Definition Emotion
Eine Emotion muss vom Begriff des Gefühls, der Stimmung und der Persönlichkeit abgegrenzt werden. Ein Gefühl ist z. B. ein Schreck, den man empfindet, wenn auf einmal hinter einer Mauer ein maskierter Mensch auftaucht. Dann empfindet man Furcht. Ein Gefühl wird erst dann zur Emotion, wenn diese körperliche Veränderung kognitiv bewertet wird.
Wenn jemand z. B. sein Herzklopfen auf den maskierten Menschen zurückführt, würde man von Furcht sprechen. Führt er es jedoch auf seine heimlich Angebetete zurück, würde man von Freude sprechen. Emotionen dauern meist nur ein paar Sekunden und haben ein klar abgrenzbares Einsetzen (on-set) und Ende (off-set). Stimmungen hingegen können über Stunden, Tage bis auch Wochen anhalten. Wenn jemand sagt, er sei heute schlecht gelaunt, dann ist er in einer schlechten Stimmung. Dies hat jedoch nicht unbedingt etwas mit Emotionen zu tun.
Häufig kann eine bestimmte Stimmung die Auftretenswahrscheinlichkeit einer bestimmten Emotion erhöhen oder erniedrigen, aber diese beiden Dinge muss man analytisch dennoch voneinander trennen. Als letztes muss die Persönlichkeit einer Person von der Stimmung abgegrenzt werden. Ein cholerischer Mensch etwa ist dauerhaft negativ übererregt. Auf diese Weise kann man sich die Begriffe Gefühl, Emotion, Stimmung und Persönlichkeit auf einer Zeitachse angeordnet vorstellen – mit Gefühl auf der einen, kurzfristigen, und Persönlichkeit auf der anderen, langfristigen Seite.
Emotionserkennung in der Humanethologie
Die Humanethologie als Teilgebiet der Verhaltensbiologie versucht, anhand vieler Komponenten des Menschen Emotionen erkennen zu können. Dabei achtet sie vor allem auf Komponenten des menschlichen Verhaltens, die einen hohen Informationsgehalt besitzen. Dazu zählen neben der Ganzkörperbewegung, die Summe der Bewegungsänderungen, die Gestik, Änderungen der Stimmfrequenz und bestimmte Teile der Mimik. Berühmtester Vertreter der Humanethologie in Europa ist das Institut für Humanethologie in Wien unter Leitung von Karl Grammer.
Cross-Race-Effekt
Die Emotionserkennung zwischen zwei Menschen ist starken Schwankungen unterlegen. In der Psychologie wurde ein Phänomen entdeckt, welches Cross-Race-Effekt genannt wird. Dieses Phänomen besagt, dass die Emotionserkennungsrate niedriger ist, wenn die zu erkennende Emotion zu einem Gesicht gehört, was nicht zur selben Kultur oder Ethnie wie die des Beobachters gehört. Dieser Effekt kann jedoch durch eine Form des Trainings überkommen werden.[1]
Visuelle Mimikerkennung
Dieser Teil wird üblicherweise als Mimikerkennung bezeichnet. Als Schnittstelle zwischen Mensch und Maschine wird eine digitale Videokamera oder ein äquivalentes optisches Eingabegerät verwendet. Hierbei werden die Methoden der Gesichtserkennung angewandt, um die Ausprägungen der Gesichtsoberfläche zu analysieren. Durch Automatische Klassifizierung ist es möglich, die Mimik der seriellen Einzelbilder einem Cluster zuzuordnen, welches möglicherweise einer Emotion zugeordnet werden könnte. Untersuchungen haben jedoch ergeben, dass nur 30 % der mimisch ausgedrückten Emotionen auch den wirklich empfundenen Emotionen entsprechen. Deswegen sollte man die visuelle Mimikerkennung nicht mit visueller Emotionserkennung gleichsetzen. Biologischer Hintergrund der visuellen Emotionserkennung ist die Simulation eines menschlichen Sehnervs in einem Roboter.
Emotionsinduktion
Für experimentelle Settings im Bereich Emotionspsychologie, Verhaltensethologie, Neuropsychologie und vielen anderen Wissenschaften ist es häufig wichtig, gezielt Emotionen unter Laborbedingungen zu „erzeugen“. Die Emotionsinduktion ist eines der schwierigsten Gebiete der Emotionsforschung. Aufgrund mehrerer Meta-Analysen über dieses Thema extrahierte man mehrere Methoden, mit denen man am validesten Emotionen induzieren kann.
An erster Stelle steht die Erfassung der Emotion in der Realität (Stichwort Feldforschung). Aufgrund geringer interner Validitäten wird davon aber häufig Abstand genommen. Die zweite Methode, die eine hohe interne mit einer hohen externen Validität verbindet, ist die Methode des emotional-recalls, in dem versucht wird, Erinnerungen aus dem Emotionsgedächtnis hervorzurufen. Abzuraten für Experimente außerhalb der EEG-Emotionsforschung ist von Induktionsverfahren wie dem IAPS oder Induktionsverfahren, die angeblich emotionsinduzierende Filmsequenzen oder Musikstücke anwenden. All diese Verfahren bleiben einen Nachweis der spezifischen Wirksamkeit schuldig. Die Robotik bedient sich häufig idealisierter Experimentalabläufe, z. B.:
- Eine Induktionsmethode soll eine Emotion beim Menschen induzieren.
- Der Mensch drückt seine Emotion mit einer veränderten Gesichtsoberfläche aus.
- Eine Webcam am Computer fängt den neuen Gesichtsausdruck ein.
- Der Computer kann die Emotion automatisch klassifizieren, indem er sie als die Emotion einstuft, die zuvor induziert wurde.
Nach dem Abschluss der Lernphase sollte die KI selbständig in der Lage sein, Emotionen zu erkennen, ohne dass sie dies zuvor von einem Menschen gelehrt wurde. Da häufig aber weder die Induktionsmethode auf ihre Wirksamkeit hin untersucht wird, noch während des Experiments selbst die induzierten Emotionen evaluiert werden, bleiben diese idealisierten Experimentalabläufe in der Robotik häufig fehlerhaft und unvollständig.
Lügenerkennung
Multisensorische Emotionswahrnehmung ist hilfreich bei dem Einschätzen des Wahrheitsgehalts von Äußerungen, genauer bei dem Erkennen von Lügen, wobei Lügen als bewusst falsche, auf Täuschung angelegte Aussagen zu verstehen sind. Zwar lässt sich kein allgemeingültiger Indikator für das sichere Feststellen von Lügen ausmachen, dennoch können Mimik, Gestik, Sprache und Körperhaltung Hinweise liefern. Relativ verlässlich sind unbewusste bzw. nicht steuerbare Signale, wie zum Beispiel Pupillenweite, Blickrichtung oder Erröten. Des Weiteren sollte die Aufmerksamkeit verstärkt auf Unstimmigkeiten zwischen den verschiedenen verbalen und nonverbalen Ausdrucksformen einer Person gerichtet werden.[2][3][4]
Siehe auch
- Bildverstehen
- Cross-Race-Effekt
- Klassifikationsverfahren
- Maschinelles Sehen
- Mustererkennung
- Prosodieerkennung: rein auf der Sprache basierende, automatische Klassifikation von suprasegmentalen Merkmalen, welche unter anderem der Emotionserkennung dienen können
- Paul Ekman, Facial Action Coding System
Literatur
- vom Bundesministerium für Wirtschaft geförderte Studie (Memento des vom 17. April 2010 im Internet Archive) Info: Der Archivlink wurde automatisch eingesetzt und noch nicht geprüft. Bitte prüfe Original- und Archivlink gemäß Anleitung und entferne dann diesen Hinweis. Umkehr des Cross-Race-Effekts
- duden.de (5. Juni 2014, 13:13)
- S. M. Litzke (Hrsg.): Nonverbale Lügen- und Machtmerkmale, in: Nachrichtenpsychologie 1. Brühl: Fachhochschule des Bunden für öffentliche Verwaltung, Fachbereich Öffentliche Sicherheit. 2003.
- H. Lukesch: Erkennbarkeit der Lüge: Alltagstheorien und empirische Befunde. 2003.