2. Die Struktur des Schallfeldes
2.1 Raumdarstellung in Kanälen
Seit Alan Blumlein in den Dreissiger Jahren die Stereofonie erfunden hat, übertragen wir die Räumlichkeit der Aufnahme als Signaldifferenz zwischen den Übertragungskanälen. Studioproduktionen sind dabei heute auf sehr hohem technischem Niveau. Ihre Wiedergabe ist subjektiv sehr angenehm, oft ist jede einzelne Stimme und jedes Instrument viel deutlicher zu hören als beim Live-Event. Dabei ist es in der Regel nicht mehr das Ziel der Produzenten, eine Aufnahmeraumakustik zu simulieren. Viel mehr sind die Aufnahmen heute ein Kunstprodukt, ganz ausgerichtet auf eine möglichst räumlich wirkende, angenehm anzuhörende Lautsprecherwiedergabe.
Wir sind mit den konventionellen Verfahren auch gar nicht in der Lage, die Akustik des Aufnahmeraumes korrekt zu reproduzieren. Genau betrachtet geben wir bei den meisten Studioproduktionen ein Monosignal wieder, dem mittels Panpot eine Position im Panorama zugeordnet wurde und das durch Bearbeitung und Nachhall seine Räumlichkeit erhielt. Ausgangsmaterial solcher Studioproduktionen ist im Normalfall das relativ trocken aufgenommene Signal jeder einzelnen Schallquelle.
Soweit damit nur das Ziel der ansprechenden Wahrnehmung verfolgt wird, ist dieser Ansatz völlig ausreichend. Wollen wir aber die Klarheit einer Stimme in guter Akustik, das Summen einer Biene direkt vor unserer Nase, oder die emotionale Wirkung des räumlichen Schallfeldes in einem guten Konzertsaal authentisch erzeugen, versagt die mit der kanalorientierung verbundene Phantomschallquellenwiedergabe .
Im vorigen Kapitel wurde beschrieben, warum wir auch nicht in der Lage sind, mit mehreren Mikrofonen die korrekte Räumlichkeit des Originalschallfeldes einzufangen. Deshalb sollten wir uns die Frage stellen, ob der Grundansatz, den wir seit Blumlein so verbissen verfolgen, wirklich geeignet ist. Phantomschallquellen migrieren immer mit der Zuhörerposition. Die korrekte Reproduktion der akustischen Verhältnisse im Aufnahmeraum ist deshalb mit ihnen nicht möglich. Das Räumliche Schallfeld ist nicht vollständig durch den Signalunterschied zwischen Punkten beschreibbar. Diese Signaldifferenz ist an jedem Punkt im Aufnahmeraum anders. Für eine authentische Wiedergabe müssen wir aber die Räumliche Struktur der Wellenfronten in einem Volumen wiederherstellen. Das heisst, eine Bewegung des Zuhörers im Wiedergaberaum muss die gleichen Veränderungen in der Wahrnehmung bewirken, wie eine entsprechende Bewegung im Aufnahmeraum.
2.2 Das Spiegelschallquellenmodell
Das ist nur mit einem anderen Grundansatz prinzipiell möglich. Er unterscheidet sich grundlegend von Blümleins Verfahren. Dabei wird konstatiert, dass die Schallquelle selbst, also der Sänger oder das Instrument, kein Räumliches Schallfeld hat. Die räumliche Abstrahlcharakteristik unterscheidet sich zwar deutlich von Instrument zu Instrument, alle Räumlichkeit der Wahrnehmung ist aber auf Reflexionen des Quellsignals im Aufnahmeraum zurückzuführen.
Diese Reflexionen gehen scheinbar von Spiegelschallquellen aus. Deren Koordinaten sind durch die Anordnung der jeweiligen Reflexionsfläche und die Position der primären Schallquelle, aber nicht von der Zuhörerposition, bestimmt:
Für die Wandflächen des Aufnahmeraumes liegen die Ausgangspunkte der ersten Reflexionen also scheinbar ausserhalb des Aufnahmeraumes. Jede dieser ersten Reflexionen ist dann Schallquelle für mehrere zweite Reflexionen:
In dieser einfachen Darstellung wird klar, dass die zweiten Reflexionen nicht ein Signal mitsamt Reflexionsanteilen zurückwerfen, wie das in der Literatur zuweilen falsch beschrieben ist. Diese Annahme führt zu der unklaren Vorstellung vom räumlichen Schallfeld, die sich heute in vielen Köpfen festgesetzt hat. Aber auch die zweiten, dritten und alle weitere Reflexionen senden von ihrer jeweiligen Raumposition immer das pure Signal der Quelle selbst aus!
Die erste Reflexion kann dabei nur den Signalanteil weitergeben, den sie entsprechend der räumlichen Abstrahlcharakteristik der primären Schallquelle empfangen hat. Zusätzlich wird das Signal durch die frequenzabhängige Filterwirkung der zugehörigen Reflexionsfläche geschwächt, der Schalldruck nimmt entsprechend der Entfernung ab, die Luftschalldämmung mindert den Anteil der hohen Frequenzen, aber immer singt die Reflexion das gleiche Lied wie die Quelle selbst. Wir brauchen kein anderes Signal als dieses trocken aufgenommene Mono- Quellsignal.
Wenn wir alle Reflexionseigenschaften des Aufnahmeraumes, die Ausrichtung und Position der Quelle darin und deren räumliche Abstrahlcharakteristik kennen und aus diesen Daten alle Positionen und Pegel der Spiegelschallquellen im Aufnahmeraum bestimmt haben, ist sein räumliches Schallfeld vollständig beschrieben.
Wir könnten es dann in einer reflexionsarmen Umgebung, beispielsweise auf einer grossen verschneiten Winterwiese, vollständig wiederherstellen. Dazu müsste nur die trocken aufgezeichnete Stimme des Heldentenors aus vielen räumlich verteilten Einzellautsprechern abgespielt werden. An jeder Position, an der im Aufnahmeraum eine Spiegelschallquelle entsteht, müsste ein solcher Lautsprecher montiert sein. Der Signalinhalt wäre von Quelle selbst oder der vorhergehenden Reflexion vorgegeben, die Filterwirkung der aktuellen Reflexionsfläche würde den Pegel mindern.
Mit der Entfernung wird die Zahl der Lautsprecher immer grösser, weil ja jede Reflexion Quelle von mehreren weiteren Reflexionen ist. Eigentlich würden wir also unendlich viele Lautsprecher brauchen. Aber in mehr als, sagen wir 1000 Meter Entfernung von der primären Quelle, also nach ca. 2,5 Sekunden Schallaufzeit durch die frostige Luft der Winterwiese, geschwächt von zwanzig oder dreissig Reflexionsverlusten, Luftschalldämmung und Schalldruckabnahme wegen der wachsenden Entfernung, unterschreitet der Pegel die -60 dB Grenze, welche die Nachhallzeit bestimmt. Weiter entfernte Lautsprecher wären nicht mehr hörbar, wir können deshalb auf sie verzichten.
Trotzdem wird ein solcher Aufbau in der Praxis sicher nicht zu realisieren sein, zumal sich die Startpunkte der Reflexionen im Aufnahmeraum für jede weitere primäre Schallquelle von diesen Lautsprecherkoordinaten unterscheiden. Wir würden also zu jedem Audiosignal ein ganzes Set von Lautsprechern brauchen. Darüber hinaus müssten die alle ihre Position verändern, sobald sich der Tenor im Aufnahmeraum bewegt.
Dass sich andererseits eine Ortsveränderung des Zuhörers auf der Winterwiese akustisch genau so auswirkt wie ein entsprechender Ortswechsel im Aufnahmeraum, ist bemerkenswert. Der Tenor wird lauter und trockener wenn der Zuhörer zu dem Lautsprecher geht, der seine direkte Welle abstrahlt. Die ersten Reflexionen ändern deutlich ihre Pegel und Einfallsrichtungen, ihre Überlagerung erzeugt Kammfiltereffekte mit gleichen Frequenzen und Amplituden wie im Aufnahmeraum. Selbst die ITDG- Lücke stimmt überein, wir können deshalb die Entfernung zur Quelle gut einschätzen. Nur der Schall der weit entfernt montierten Lautsprecher verändert sich kaum, der Nachhall trifft uns weiter von überall her mit kaum verändertem Pegel.
Mit der festen Quellposition ist auch verbunden, dass dabei die gleichen Dopplereffekte und Parallaxenverschiebungen entstehen wie im Konzertsaal. Die Überlegung zeigt also, dass es nicht prinzipiell unmöglich ist, eine virtuelle Kopie des Schallfeldes im Aufnahmeraum zu erzeugen. Alles was wir dazu brauchen sind neue Denkansätze, die technische Umsetzung lässt sich dann finden. Möglichkeiten dafür sind in den nächsten Kapiteln beschrieben.