Hören und Sehen in Stereo.

Wir sehen und wir hören räumlich – das ist für uns ziemlich selbstverständlich. Aber wie unterscheiden wir rechts von links, oben von unten und ‘näher dran’ von ‘weiter weg’? Und geschieht das beim Sehen und beim Hören auf die gleiche Weise? Erstaunlicherweise nicht, und die Methoden, die Auge und Ohr (oder besser Seh- und Hörsinn) jeweils benutzen, sind schon ziemlich genial.

Die vier Fragen, vor denen die Wahrnehmung steht, sind: Befindet sich ein gesehener Gegenstand oder eine Schallquelle rechts oder links vom Wahrnehmenden? Ist das Wahrgenommene oberhalb oder unterhalb von ihm? Vor oder hinter ihm? Und wie weit ist es genau entfernt?

Um beim Sehen zwischen links und rechts zu unterscheiden, reicht schon ein Auge. Beim Sehen entsteht auf der Netzhaut ein flächiges Bild, fast wie in einer Kamera, bei dem jeder Punkt im Bild einem Punkt in der gesehenen Szene entspricht ... jedenfalls kann man sich die Sache so vorstellen. In Wirklichkeit ist natürlich alles ganz anders: Die Sensoren auf der Netzhaut tasten das Bild nicht Punkt für Punkt ab, es entstehen statt dessen ziemlich vertrackte Signale, die erst im Gehirn wieder zu einem Bild zusammengerechnet werden – aber wichtig ist nur: Wahrgenommen wird ein flächiges Bild, in dem das, was in der Wirklichkeit links stand, auch als links stehend wiedergegeben wird. Die Links-Rechts-Information ist also im Bild selbst enthalten.
Beim Hören ist das anders. Mit nur einem Ohr kann man den Ort einer Schallquelle nicht als ‘rechts’ oder ‘links’ bestimmen. Das ist leider nur schwierig auszuprobieren, denn erstens ist es fast unmöglich, ein Ohr so zu verstopfen, dass man damit wirklich nichts mehr hört, und zweitens kann man auch mit einem Ohr eine Schallquelle orten, wenn man den Kopf bewegt. Das liegt an der Ohrmuschel, die den Schall bündelt und verstärkt, allerdings nur, wenn er aus einer bestimmten Richtung kommt. Es gibt einen kegelförmigen Bereich, eine Art ‘Hörtrichter’, den wir durch Kopfbewegungen durch den Raum gleiten lassen wie einen Suchscheinwerfer. Sobald er die Schallquelle erfasst, hören wir sie plötzlich erheblich klarer und lauter – und wissen: Dort ist sie. Den Kopf zu bewegen gilt aber ab jetzt als Schummeln, und wir halten fest: Mit nur einem Ohr kann eine Schallquelle nicht als ‘links’ oder ‘rechts’ bestimmt werden. Dazu braucht es zwei Ohren.
Das Gehirn vergleicht die Signale, die von beiden Ohren kommen, und wertet die Unterschiede aus. Zum einen gilt: In jenem Ohr, das der Schallquelle näher liegt, ist das Signal lauter. Das gibt allerdings nur einen groben Eindruck von links oder rechts, daher macht sich der Hörsinn noch eine besondere Eigenschaft des Schalls zunutze: Schall ist ziemlich langsam. Er kriecht mit nur etwa 341 Metern pro Sekunde durch die Luft, und das heißt, er braucht für die 20-30 Zentimeter, die die beiden Ohren eines Menschen auseinander liegen, so etwa eine Tausendstelsekunde. Das ist wenig, aber für das Gehirn erkennbar, und es zieht daraus den Schluss: Das Ohr, bei dem der Schall später ankommt, ist weiter von der Schallquelle entfernt. Durch diesen genialen Rechentrick können wir also rechts und links beim Hören unterscheiden.

Der Trick, mit dem Menschen eine Schallquelle als ‘oben’ oder ‘unten’ orten, ist allerdings noch eine Ecke genialer. Aber erst einmal kurz ein Wort zum Sehen. Hier gilt einfach das gleiche wie bei der Bestimmung von rechts und links: Die Information ist im gesehenen Bild vorhanden.
Beim Hören aber müssten, wenn wir das über ‘rechts’ und ‘links’ gesagte sinngemäß übertragen, zwei Ohren übereinander vorhanden sein. Dann könnte wieder ein Laufzeit-Unterschied ausgewertet werden ... und genau das macht ein Mensch, wenn er den Kopf schieflegt. Dann stehen die Ohren in verschiedener Höhe, und die Auswertung der Signale lässt auf die Höhenlage der Schallquelle schließen. Nach unseren Regeln wäre das allerdings geschummelt, und es ist auch nicht nötig.
Tatsächlich hat jedes Ohr zwei Schall-Einlassöffnungen übereinander. Sie können sie sehen (oder fühlen): Es sind die beiden großen Mulden in der Ohrmuschel. Die untere führt den Schall direkt in den Gehörgang. Die obere fängt ihn ebenfalls ein, leitet ihn aber durch die Röhre, die der umgebogene Rand der Ohrmuschel bildet, einmal um das Ohr und am Ende der Röhre in die große Öffnung.
Was ist der Sinn dahinter? Stellen wir uns eine Schallquelle oberhalb des Hörenden vor. Der Klang aus ihr würde die obere Mulde kurz vor der unteren erreichen. Allerdings liegen beide Mulden nur etwa zwei Zentimeter auseinander, und der Laufzeit-Unterschied ist so kurz, dass beide Signale zu einem verschwimmen würden. Wird der Schall aus der oberen Mulde aber durch die etwa zwölf Zentimeter lange Röhre geleitet, trifft er um so viel später ein, dass er als getrenntes Signal erkennbar wird. Das Gehirn zieht jetzt den ‘künstlichen’ Laufzeit-Unterschied ab, erhält so den ‘wahren’ und kann daraus die Höhe der Schallquelle berechnen. Wegen dieser ganzen Berechnungstricks ist die Höhenortung allerdings sehr viel ungenauer als die Rechts-Links-Ortung; sie ist aber auch lange nicht so wichtig.

Was ist mit dem dritten Bereich, also der Unterscheidung von vorne und hinten? Beim Sehen stellt sich diese Frage nicht – wenn ich etwas sehen kann, ist es definitiv vor mir. Hören hingegen ist ein Rundum-Sinn, und aus dem einfachen Hören mit zwei Ohren kann ich nicht entscheiden, ob etwas vor oder hinter mir erklingt. Dennoch können wir dies einwandfrei unterscheiden – was ist diesmal der Trick? Er ist so einfach wie mal wieder genial: Schall von hinten muss die Ohrmuschel durchdringen, um den Gehörgang zu erreichen. Weil diese nur aus dünnem Knorpel mit etwas Haut darüber besteht, dämpft sie die Lautstärke des Schalls fast gar nicht – aber sie absorbiert ganz bestimmte Frequenzen. Diese fehlen dann im aufgefangenen Signal, das Gehirn erkennt dies und versieht das Gehörte mit dem Etikett ‘kommt von hinten’.

Bleibt noch die Frage nach dem ‘wie weit entfernt’. Beim Sehen wird hierzu endlich das zweite Auge gebraucht. Das heißt, auch aus dem Bild nur eines Auges können wir auf relative Entfernungen schließen: Näher liegende Dinge verdecken entferntere, und Gegenstände erscheinen umso kleiner, je weiter sie entfernt sind. Absolute, millimetergenaue Entfernungen lassen sich aber nur mit zwei Augen bestimmen. Dazu vergleicht das Gehirn die Bilder beider Augen. Je näher ein Gegenstand war, desto stärker unterscheidet sich seine Lage in den Bildern. Aus diesen Informationen berechnet das Gehirn dann das eine, dreidimensionale Bild, das wir sehen.
Beim Hören funktioniert diese Methode nicht. Es gibt keine zwei ‘Hörbilder’, die verglichen werden könnten, sondern nur ein ‘Hören’, das aus den Signalen beider Ohren berechnet wurde. Trotzdem können wir – bedingt – Entfernung hören. Einmal helfen uns dabei Erfahrungswerte: Weiter entfernte Klänge klingen leiser und dumpfer. In begrenzten Räumen aber wertet das Gehirn noch eine weitere Information aus: den Hall. Wände und andere feste Gegenstände werfen den Schall zurück. Wird sehr viel Schall mit großer Verzögerung reflektiert, nehmen wir das bewusst als Echo wahr. In gewöhnlichen Räumen ist dagegen die Verzögerung so kurz und der reflektierte Schall so gering, dass es uns gar nicht auffällt. Trotzdem können wir am Klang von Schritten oder Stimmen sehr genau erkennen, in was für einer Art Raum sie erklingen. Und unser Gehirn nutzt dies umgekehrt für die Berechnung des Abstandes einer Schallquelle: Aus (wieder einmal) dem Laufzeit-Unterschied zwischen dem Klang und seinem ‘Echo’ schließt es auf den Abstand der Schallquelle.

Auf diese Weise also berechnet das Gehirn aus den ‘Rohdaten’, die von Augen und Ohren geliefert werden, unser dreidimensionales Seh- und Hörbild der Welt – in Farbe, Stereo und 3D und natürlich in bewegten Bildern (und Tönen). In Echtzeit. Und das ist nur die Wahrnehmung, ein kleiner Teil unseres Bewusstseins. Dazu kommen noch die Analyse des ‘was ist es, das ich sehe und höre?’ und natürlich die Gedanken, die wir uns darüber machen. Ebenfalls in Echtzeit. Mit einem Gehirn, das seit grob gerechnet 40 000 Jahren kein größeres Update mehr erhalten hat. Irgendwie habe ich nicht wirklich Angst, dass uns die Rechner in nächster Zukunft einholen...

© P. Warmann