3. Wellenfeldsynthese
Die Wellenfeldsynthese ist ein Verfahren zur Rekonstruktion des Originalschallfeldes. Die Wahrnehmung beruht nicht mehr auf der auf psychoakustisch bedingten Wahrnehmung von Phantomschallquellen, wie die konventionellen, kanalorientierten Audiowiedergabeverfahren. Das Schallfeld wird physikalisch rekonstruiert. Dazu emuliert eine Lautsprecheranordnung eine Vielzahl von Elementarwellen. Einzeln steuerbare Lautsprechermembranen, meist in einer Reihe rings um den Zuhörer aufgebaut, werden dazu exakt in dem Moment ausgelenkt, zu dem die Wellenfront einer virtuellen Schallquelle ihren Raumpunkt durchlaufen würde. Aus einer ausreichend großen Zahl solcher Elementarwellen entsteht dann eine gemeinsame Wellenfront, die sich physikalisch nicht von einer realen Wellenfront unterscheidet.
3.1 Mathematische Grundlagen
Mathematische Basis für die Wellenfeldsynthese ist das Kirchhoff-Helmholtz-Integral. Es beschreibt dass der Schalldruck an jedem beliebigen Punkt innerhalb eines quellfreien Volumens bestimmt ist, wenn Schalldruck und Schallschnelle auf der Oberfläche dieses Volumens bekannt sind. Nach Rayleigh II ist Schalldruck im Punkt A innerhalb eines Halbraumes auch schon bestimmt, wenn nur die Druckverteilung auf einer Ebene bekannt ist. Der Vektor der Schallschnelle wird dann durch die Superposition der Elementarwellen rekonstruiert.
3.2. Physikalisches Prinzip
3.2.1 Virtuelle Schallquellen
In den vorigen Kapiteln ist deutlich geworden das mit den Phantomschallquellen, die zwischen zwei Lautsprechern durch psychoakustische Prozesse entstehen, keine korrekte akustische Abbildung der Aufnahmesituation möglich sein wird. Für eine solche räumlich korrekte Reproduktion darf die wahrgenommene Position der Schallquelle nicht von der Zuhörerposition abhängig sein.
Eine solche stabile Quellposition entsteht zum Beispiel im inneren einer Kugel aus Lautsprechern, wie sie in dieser Animation dargestellt ist.
Es ist leicht einzusehen, dass wir den Ausgangspunkt der Wellenfront immer im Zentrum dieser Kugel wahrnehmen werden, unabhängig von unserer eigenen Position. Die Wellenfeldsynthese bietet nun die Möglichkeit, solche virtuelle Schallquellen mit fester Raumposition auch in ebenen Lautsprecheranordnungen zu erzeugen. Zu diesem Zweck emuliert die Synthese natürliche Wellenfronten nach Huygens-Prinzip aus Elementarwellen. Die Computersimulation bewegt dazu jede einzelne der, als horizontale Reihe rings um den Hörer angeordneten, Lautsprecher-Membranen genau in dem Moment, in dem die Wellenfront einer virtuellen Punktquelle ihre Raumkoordinaten erreichen würde. Dadurch wird die ursprüngliche Wellenfront in Betrag und Richtung wiederhergestellt. Das Verfahren wurde schon 1987 von Prof. Berkhout an der TU Delft entwickelt. Inzwischen wurden WFS- Lautsprecherreihen an vielen Forschungsinstituten praktisch aufgebaut, auch die komerzielle Nutzung macht in den letzten Jahren gute Fortschritte.
3.2.2 Elementarwellen
Christiaan Huygens entdeckte, das jeder Punkt einer Wellenfront Ausgangspunkt einer Elementarwelle ist. Schon vor mehr als 300 Jahren konnte der niederländische Mathematiker damit erstmals Beugungseffekte erklären. Das Prinzip gilt für jede Wellenausbreitung, für Lichtwellen ebenso wie für Schallwellen. Das Huygenssche Prinzip ist eine der wichtigsten Entdeckungen im Bereich der Physik. Im Bereich der Akustik bietet dieses Wissen heute die Möglichkeit, natürliche Wellenfronten aus solchen Elementarwellen zu synthetisieren:
WFS-Prinzip (GNU public ©)
In dieser Animation betrachten wir die Löcher in einer Wand, respektive die Lautsprecher, als solche Ausgangspunkte von Elementarwellen. Solange Länge und Abstand der Löcher klein bleiben im Vergleich zur Wellenlänge des Schalls, wird sich der Schalldruck an beiden Seiten der Bohrung nicht unterscheiden. Die Überlagerung einer ausreichenden Zahl solcher Elementarwellen wird dann die ursprüngliche Wellenfront vollständig wiederherstellen. Alles, was wir dazu brauchen, ist das trockene Audiosignal der Quelle und ihre Entfernung zu jedem einzelnen Ausgangspunkt der Elementarwellen.
Mit der elektronischen Verzögerung könnte diese Lautsprecheranordnung auch als Ausschnitt einer oben beschriebenen Lautsprecherkugel betrachtet werden deren Durchmesser und Position verändert werden kann.
Das Schallfeld im Aufnahmeraum besteht aber nicht nur aus der direkten Wellenfront. Der größte Teil der Schallenergie ist in den Reflexionen enthalten. Für eine naturgetreue Wiedergabe können wir diese Reflexionen nicht einfach aus Richtung der Schallquelle selbst abstrahlen, wie das bei den konventionellen Verfahren oft getan wird. Der Richtungsunterschied zwischen direkter Wellenfront und insbesondere den ersten Reflexionen ist die wichtigste Information bezüglich des Abstands zur Schallquelle und Abstand zu den Wänden, also Raumgröße. Bei den vielen späteren Reflexionen, aus denen sich der Nachhall zusammensetzt, ist die Richtung von untergeordneter Bedeutung. Aber ihre Amplitude und spektrale Zusammensetzung liefert wichtige Informationen über die Feinstruktur und die Reflexionseigenschaften des Aufnahmeraumes.
Die WFS - Lautsprecherreihen können aber beliebig viele virtuelle Schallquellen gleichzeitig erzeugen. Ihre Signalinhalte sind voneinander unabhängig und können von verschiedenen Quellen stammen. Wird aber das gleiche Audiosignal von mehreren virtuellen Schallquellen an verschiedenen Ausgangspunkten erzeugt, so täuscht das System Reflexionen des Signals vor. Wie es im zweiten Kapitel beschrieben war, können wir uns das räumliche Schallfeld jedes beliebigen Konzertsaales als räumliche Verteilung vieler solcher Ausgangspunkte von Reflexionen vorstellen. Wenn wir alle diese Positionen rekonstruieren, ist das Schallfeld im Aufnahmeraum vollständig physikalisch wiederhergestellt. Mit der ebenen Lautsprecheranordnung ist das viel praktikabler als es mit den räumlich verteilten Lautsprechern wäre, physikalisch unterscheidet sich das Ergebnis aber nicht.
3.2.3 Der Modell- basierende Ansatz
Zur Rekonstruktion der Quellpositionen gibt es zwei unterschiedliche Ansätze. Die einfachere Möglichkeit ist der modellbasierte Ansatz. Die Ausgangspunkte der Reflexionen werden aus der Geometrie des Aufnahmeraumes berechnet. Die Reflexionsfaktoren der Wände gehen dann in die Signalamplitude ein, außerdem bestimmt das räumliche Abstrahlverhalten der Quelle den Pegel der jeweiligen Reflexion. Für die ersten schallstarken Reflexionen sind diese Berechnungen einfach und heute auch für bewegte Schallquellen problemlos von jedem PC in Echtzeit zu lösen. Dabei entstehen auch völlig neue künstlerische Möglichkeiten, weil sich die ersten Reflexionen getrennt von den anderen Signalanteilen manipulieren lassen. Aber für die riesige Menge späterer Reflexionen, die den Nachhall bilden, versagt das Verfahren in der Praxis.
3.2.4 Der datenbasierte Ansatz
Deshalb hat sich heute an den Forschungsinstituten, die Berkhouts Idee weiterentwickeln, das auf der Impulsantwort beruhende Verfahren allgemein durchgesetzt. In Vorbereitung der Aufnahme wird dabei die räumliche Impulsantwort des Aufnahmeraumes aufgezeichnet. Dazu werden Mikrofon Line– Arrays im Aufnahmeraum aufgestellt. An der Stelle, an der später die direkte Schallquelle positioniert ist, wird dann ein Dirac- Impuls erzeugt. Dieser Impuls wird das nahe gelegenste Mikrofon zuerst treffen. Der Lautsprecher, der bei der Wiedergabe dieser Mikrofonposition der zugeordnet ist, wird also bei der Faltung des Quellsignals in die räumliche Impulsantwort des Aufnahmeraumes das Signal der Schallquelle zuerst abstrahlen. Entsprechend später werden die anderen Elementarwellen erzeugt, so dass die Ursprüngliche Form der Wellenfront wieder entsteht.
Auch alle Spiegelschallquellen im Aufnahmeraum, von denen die Reflexionen scheinbar ausgehen, werden von dem Dirac- Impuls getroffen. Sie werden damit zu neuen Impulsschallquellen im Aufnahmeraum. Wie das Signal der Impulsquelle selbst treffen auch ihre Wellenfronten die Mikrofonreihe, auch ihr Signal wird deshalb bei der Wiedergabe durch die Faltung des Signals in die aufgezeichnete Impulsantwort aus der korrekten Richtung synthetisiert. Die Faltung des trocken aufgezeichneten Audiosignals in die räumliche Impulsantwort des Aufnahmeraumes rekonstruiert deshalb vollständig die Akustik des Aufnahmeraumes. [1]
Das ist allerdings nicht immer das Ziel der Reproduktion. Tonträger sind heute ein Kunstprodukt, oft besser als das Original. Zudem ist es in der Praxis nicht möglich, die räumliche Impulsantwort für alle möglichen Positionen der Schallquelle im Raum und alle möglichen Positionen der Lautsprecher bezüglich dieser Quelle aufzuzeichnen. Die Messergebnisse einiger ausgewählter Positionen müssen deshalb während der Wiedergabe mathematisch auf die aktuellen Positionen von Quelle und jeweiligen Ausgangspunkt der Elementarwelle extrapoliert werden.
Diese mathematische Extrapolation muss auch die Positionen aller Spiegelschallquellen einbeziehen, um auch die korrekte Räumlichkeit der Reflexionen zu bewahren. Der Renderer auf der Wiedergabeseite muss dabei sogar die Temperaturdifferenz zwischen Aufnahme- und Wiedergaberaum in die Berechnung einbeziehen, weil bei der unterschiedlichen Schallgeschwindigkeit gleiche geometrische Abstände verschiedene akustische Längen haben. Insbesondere für frei bewegliche Quellpositionen übersteigt der Gesamtumfang der Berechnungen bis heute die Rechenleistung einzelner Personalcomputer. Selbst wenn nur kleinere Lautsprechergruppen einem PC zugeordnet werden, müssen bis heute einige Vereinfachungen hingenommen werden damit auch bewegliche Schallquellen in Echtzeit gerendert werden können.
3.3 Vorteile des Verfahrens
Mit den virtuellen Schallquellen erzeugt die Wellenfeldsynthese eine physikalische, virtuelle Kopie des räumlichen Schallfeldes im Aufnahmeraum. Die Ausgangspunkte der Wellenfronten sind dabei nicht, wie bei der Wiedergabe von Phantomschallquellen, von psychoakustischer Signalverknüpfung oder der Position des Zuhörers abhängig. Veränderungen der Zuhörerposition im Wiedergaberaum führen zu den gleichen Veränderungen in der Wahrnehmung, wie eine entsprechende Ortsveränderung im Aufnahmeraum.
Das kennzeichnet die physikalische Rekonstruktion, mit psychoakustisch basierten Verfahren wird das nicht möglich sein. Damit verbunden ist das Doppler- Effekte, wie sie bei der Bewegung im Aufnahmeraum entstehen, auch bei der Wiedergabe wahrnehmbar sind. Das ist vor allem für die Vorn- Hinten- Wahrnehmung wichtig. Weil die ITD´s für solche Quellen gleich sind, nutzen wir Kopfbewegungen für die Unterscheidung.
Offensichtlicher ist bei einer solchen Volumenlösung aber der Vorteil, dass der Zuhörer bei der Wiedergabe nicht länger an einen engen sweet-spot gebunden ist, wie bei den konventionellen Verfahren. Mit der Wellenfeldsynthese wird eine korrekte Raumabbildung über den ganzen Wiedergaberaum möglich.
Für die Synthese werden Mono- Signale der einzelnen Schallquellen gebraucht. Das ist, nicht nur wegen der einfacheren Aufzeichnung, ein substanzieller Vorteil. Bei dem Versuch, die Räumlichkeit mit mehreren Mikrofonen als Signaldifferenz zwischen den Kanälen einzufangen, hat die Klarheit und Substanz des Signals selbst deutlich gelitten. R.E.Green beschreibt das sehr differenziert in seinem Artikel Mono, the purest of the pure , er sieht sogar die fehlende Räumlichkeit der Monowiedergabe durch den Vorteil der Klarheit der Aufzeichnung kompensiert. Die Räumlichkeit mittels WFS aus der Monoaufzeichnung zu synthetisieren, so wie die Reflexionen des Aufnahmeraumes alle Räumlichkeit aus dem Signal der Quelle selbst erzeugen, das erscheint unter diesem Gesichtspunkt als Königsweg der Audioreproduktion.
Gegenüber Einzellautsprechern bietet die Wellenfeldsynthese ausserdem den Vorteil, virtuelle Schallquellen auch vor der Lautsprecheranordnung, sogar mitten im Wiedergaberaum, positioniert werden können. Die Elementarwellen setzen dabei konkave Wellenfronten zusammen. Dazu kann man nicht einfach den Ausgangspunkt des virtuellen Teils, der in der Animation hinter den Lautsprechern liegt, in den Zuhörerbereich verschieben. Die Laufzeiten von dort aus wären die gleichen wie von der Quelle hinter den Lautsprechern und die wahrgenommene Quelle bliebe hinter der Lautsprecheranordnung. Ein Focuspunkt im Wiedergaberaum lässt sich aber mit dem „Time Mirror Approach“ erzeugen, die Lautsprecher werden dabei mit inverser Zeitdifferenz angesteuert, in der Animation wären das zuerst die äußeren Lautsprecher. Der Focuspunkt verhält sich dann wie eine reale Schallquelle im Raum, mit gewissen Einschränkungen wird die sogar „umgehbar“.
Der Hauptvorteil der Wellenfeldsynthese, der sie vor allen konventionellen Verfahren auszeichnet, ist aber bisher in den wissenschaftlichen Publikationen zum Thema WFS kaum erwähnt: Alle Komponenten des Signals, jede direkte Wellenfront und jede einzelne Reflexion, werden nicht wie bisher als Signalgemisch übertragen, sondern erst bei der Synthese erzeugt. Damit ergibt sich die Möglichkeit, den Zeitpunkt, Pegel und Ausgangspunkt für jede einzelne dieser Wellenfronten auf der Wiedergabeseite getrennt festzulegen. Verzögert man die ersten schallstarken Reflexionen gegenüber der direkten Wellenfront, so wird der wahrgenommene Raum scheinbar grösser. Umgekehrt wird sogar ein downsizing des Wiedergaberaumes möglich, wenn die direkte Welle erst erzeugt wird, wenn die ersten Reflexionen schon auf ihren Weg geschickt wurden. Selbst die Subtraktion der Schalllaufzeiten des Wiedergaberaumes, also die Subtraktion der Akustik des Wiedergaberaumes aus dem Signalweg, wird prinzipiell möglich. Nicht nur das Verhältnis von Direktschall zu Reflexionen kann noch während der Wiedergabe verändert werden, der Zuhörer kann sogar seine eigene virtuelle Position im Aufnahmeraum bestimmen. So wie er in dem Modell der „verschneiten Winterwiese“ im zweiten Kapitel zu dem Lautsprecher gehen kann, der die direkte Welle abstrahlt, so kann er sich bei der Wiedergabe direkt zum Tenor zoomen oder sich im Raum umdrehen. Diese Manipulierbarkeit des Signals bietet kein anderes Verfahren, die athemberaubenden Möglichkeiten der Wellenfeldsynthese sind längst nicht vollständig erforscht.
3.4 Verbleibende Probleme
3.4.1 Horizontale Beschränkung
Die Wellenfeldsynthese ist nicht grundsätzlich auf die horizontale Ebene des Zuhörers beschränkt. Prinzipiell wäre das Verfahren in der Lage, das Schallfeld des Aufnahmeraumes in allen drei Raumdimensionen zu rekonstruieren. Doch mit der praktizierten Impulsantwort- basierten Lösung übersteigt das die derzeit verfügbare Rechenleistung noch deutlich. Außerdem ist ein ringsum an allen Wänden mit Lautsprechern bestückter Wiedergaberaum kein brauchbares Konzept für die Heimanwendung.
Auf der Suche nach einer praktikablen Lösung haben die Entwickler die Synthese auf die horizontale Ebene des Zuhörers reduziert. Die horizontale Lautsprecherreihe rings um den Zuhörer sollte dann die Elevationsebene mit einem „2,5 D Syntheseoperator“ dastellen. Diese Versuche waren zwar nicht besonders erfolgreich, am Ende war doch deutlich zu hören, dass der Schall aus der Ebene kommt. Doch nur die horizontalen Reihen ließen sich schon in den Neunziger Jahren mit einigen hundert Einzellautsprechern praktisch realisieren.
Obwohl das Verfahren aus Marketinggründen oft als 3D Audio bezeichnet wird, bleibt die horizontale Reduktion bis heute deutlich störend. Erst in den letzten Jahren gibt es wieder Bemühungen, zum Beispiel mit Zusatzlautsprechern an der Zimmerdecke ein dreidimensionales Schallfeld aufzubauen. Andere Verfahren, wie Ambisonics oder Vector Based Amplitude Paning, aber auch schon jede einfache Kunstkopfwiedergabe zeigen, wie wichtig die lang vernachlässigte Elevationsebene für die Umhüllung des Zuhörers mit dem Originaleindruck ist.
3.4.2 Störende Wiedergaberaumakustik
Neben den umlaufenden Lautsprecherreihen trägt ein weiteres Problem zu einem schlechten Akzeptanzfaktor des Verfahrens für eine mögliche Heimanwendung entgegen. Wenn alle Reflexionen des Aufnahmeraumes synthetisiert werden, dann ist jede Reflexion des Wiedergaberaumes in der Übertragungskette störend. Auch der mathematische Ansatz des Kirchhoff- Helmholtz- Integrals als Basis für das Verfahren setzt ein quellfreies Volumen, also auch frei von Spiegelschallquellen, für die Synthese voraus. In normalen Wohnzimmern wird aber eine ausreichende akustische Dämpfung kaum praktikabel sein. Speziell die starken Deckenreflexionen der Zylinderwellen, die von den horizontalen Lautsprecherreihen ausgehen, sind deutlich störend.
3.4.3 Aliasing-Effekte
Das Kirchhoff-Helmholtz-Integral beschreibt eine unbegrenzte Anzahl von Elementarwellen. In der Praxis aber wird die Anzahl der Lautsprecher aber begrenzt bleiben. Wie bei jeder Quantisierung, entstehen dadurch Aliasing-Effekte. Innerhalb des Wiedergabebereiches überlagern sich Elementarwellen, oder sie löschen sich aus. Punkte mit sehr schmalbandigen Einbrüchen im Frequenzgang entstehen. Ihr Abstand zueinander ist vom Abstand der Einzellautsprecher, aber auch vom Winkel der Wellenfronten bezüglich der abstrahlenden Lautsprecheranordnung nach
Bestimmt. Theoretisch wäre für eine aliasingfreie Wiedergabe also ein Lautsprecherabstand von weniger als einem Zoll zueinander notwendig. Glücklicherweise ist unser Gehör nicht sehr empfindlich für solche schmalbandigen Einkerbungen, so dass sie selbst bei 10 Zoll Strahlerabstand kaum hörbar sind. Eine gewisse Verbesserung kann bei gegebener Zahl von Lautsprechern durch eine unregelmässige Anordnung, wie sie in DE102009006762A1 beschrieben ist, erzielt werden.
3.4.4 Trukation- Effekt
Wenn die Lautsprecherreihen nicht um den Zuhörer geschlossen sind, erzeugt dieser Rumpf (engl. Trunk“) an den enden der Strahleranordnung ein unerwünschtes Signal. In der Animation unter 3.3 ist deutlich zu erkennen, dass zum Aufbau der Wellenfront plötzlich keine weiteren Elementarwellen mehr beitragen. Der dadurch entstehende Druckwechsel erzeugt hinter der gewünschten Wellenfront eine Schattenwelle.
Der Effekt kann in gewissem Umfang vermindert werden, wenn schon die äußeren Lautsprecher mit reduziertem Pegel angesteuert werden, doch verringert sich dabei der Darstellungsbereich.
Stark störend wird die trunkierung, wenn eine virtuelle Schallquelle vor den Lautsprechern, im Zuhörerbereich erzeugt werden soll. Dann läuft die Schattenwelle der eigentlichen Wellenfront voraus, wodurch sie deutlich hörbar wird.
3.4.5 Konkave Wellenfronten
Ein weiteres Problem für solche virtuelle Schallquellen im Wiedergabebereich ist, das die dabei generierten konkaven Wellenfronten unnatürliche interaurale Zeitdifferenzen erzeugen. In der Natur kommen nach innen gewölbte Wellenfronten praktisch nicht vor, deshalb erzeugen sie ein völlig fremdes Hörerlebnis. Sobald sich der Zuhörer in dem Bereich zwischen erzeugender Lautsprecheranordnung und virtueller Schallquelle im Raum befindet, ist er in diesem verbotenen Bereich.
Es gibt zwei Lösungsansätze für das Problem. Entsprechend EP1637012 können für eine vordefinierte Zuhörerposition die relevanten Lautsprecher ermittelt werden. Alle Lautsprecher, die für diese Zuhörerposition konkave Wellenfronten erzeugen würden, werden dann nicht angesteuert.
Ein anderer Ansatz ist in DE 10 2006 054 961 A1 offen gelegt. Er basiert auf der beschriebenen Manipulierbarkeit des Signals im modellbasierten Ansatz. Die Ausgangspunkte von direkter Welle und ersten Reflexionen werden dabei hinter die erzeugende Lautsprecheranordnung verschoben, wodurch keine konkaven Wellenfronten mehr entstehen. Dass dann durch Signalmanipulationen an einem definierten Zuhörerplatz wieder die ursprüngliche Wahrnehmung erzeugt werden kann, macht das ganze Potenzial des Verfahrens der Wellenfeldsynthese deutlich. Ein Transformationsfaktor ermöglicht dabei, auch abseits der dedizierten Zuhörerposition eine Wahrnehmung zu erzeugen, die mit einer parallelen Bilddarstellung akustisch übereinstimmt.
3.4.6 Parallaxen- Probleme
Damit kann auch ein weiteres Problem gelöst werden. Die Wellenfeldsynthese kann virtuelle Schallquellen innerhalb des Zuhörerbereiches erzeugen, aber an einer solchen Position mitten im Raum kann keine Projektion das Bild der Quelle erzeugen. Es wird von allen Plätzen aus vor dem Zuschauer wahrgenommen, eine virtuelle Quelle mitten im Zuhörerbereich wäre aber auf den vorderen Plätzen von hinten zu hören.
Diese Diskrepanz muss in der Audiowiedergabe kompensiert werden, weil eine räumlich korrekte Bildwiedergabe technisch nicht absehbar ist. Eine Trennung der wahrgenommenen Quellposition von der physikalischen virtuellen Position, verbunden mit psychoakustisch wirkenden Korrekturen der einzelnen Signalkomponenten ist eine mögliche Lösung des Problems.
3.5. Kompatibilität
Niemand würde heute mehr jeden einzelnen Bildpunkt eines Computerspiels übertragen, so wie es in Zeiten des Analogfernsehens war. Längst haben sich hier die Objektbasierten Verfahren durchgesetzt. Auch für die Audiowiedergabe sind solche Verfahren im Computerbereich schon breit im Einsatz. Sie beruhen auf dem Übertragungsstandard MPEG4. Damit lassen sich Inhalt des Signals (das Audiosignal der Quelle selbst) und seine Form (Position und Ausrichtung der Schallquelle im Raum, Reflexionseigenschaften des Raumes) als getrennte Daten übertragen. Diese Methode ist viel effektiver. Bisher übertragen wir das gleiche signal in 2 oder 5.1 oder mehr getrennten Audiokanälen, nur weil sich Phase oder Amplitude etwas unterscheidet. Zukünftig wird sicher selbst ein Kofferradio in der lage sein, das Audiosignal in eine mitübertragene Impulsantwort zu falten, um einen objektbasierten Standard, der ja auch für die Wellenfeldsynthese geeignet wäre, zu übertragen. Die 24 oder 32 separaten Audiokanäle würden dabei auf ein herkömmliches Stereosignal zusammengerechnet.
Noch mehr Einzelkanäle im objektorientierten Standard zu übertragen ist kaum sinnvoll, auch in realer Umgebung können wir mehr als 24 Unterschiedliche Quellpositionen für das primäre Signal kaum unterscheiden. Andererseits bleibt bei der Wellenfeldsynthese selbst ein Monosignal nicht eine punktförmige Schallquelle. Das Verfahren synthetisiert daraus wieder das vollständige, räumliche Audiosignal, so wie es auch der Aufnahmeraum aus diesem Quellsignal aufgebaut hat. Das ist sogar mit einer konventionell aufgenommenen Monoaufzeichnung einer mit wenig Raumanteil aufgezeichneten Quelle möglich, wenn sie virtuell in eine passende Akustik aus einer gespeicherten Bibliothek gestellt wird.
Bis sich die objektbasierten Verfahren, auch wegen ihrer geringeren Produktionskosten, breit durchgesetzt haben, werden wir auf WFS- Anlagen auch konventionelles Material abspielen müssen. Das ist mittels „Virtual Panning Spots“, virtueller Lautsprecher die das Signal der konventionellen Kanäle abspielen, möglich. Ihre Position kann auch weit jenseits der Wände des realen Wiedergaberaumes festgelegt werden. Zu diesen entfernten Punkten ändert sich Winkel und Entfernung zum Zuhörer relativ wenig, wenn er sich im Wiedergaberaum umherbewegt. Entsprechend gross wird der Sweet- Spot. Das ist aber auch der einzige Vorteil, die Wiedergabe selbst ist mit konventionellem Material wieder eine Phantomschallquellenbasierte Lautsprecherwiedergabe mit all den Fehlern, die schon im ersten Kapitel beschrieben wurden.
3.6 Subjektive Eindrücke
Wahrnehmung ist subjektiv, weil aber viele Leser dieser kurzen Beschreibung bisher kaum die Möglichkeit hatten, eine der praktisch realisierten Anlagen zu hören, möchte ich hier meinen ganz persönlichen Eindruck aus mehreren solcher Vorführungen schildern:
Bis heute bleiben die WFS- Lautsprecherreihen deutlich von dem Ziel der virtuellen Kopie des Originalschallfeldes entfernt. Am deutlichsten stört die Reduktion auf die horizontale Ebene. Sie scheint in der akustisch bedämpften Umgebung der Vorführräume sogar deutlich mehr störend als bei herkömmlicher Lautsprecherwiedergabe.
In den Anlagen waren die Einzellautsprecher in den umlaufenden Reihen immer in etwa 20 cm Abstand zueinander montiert. Theoretisch müssten dann die Aliasing- Effekte schon sehr ausgeprägt sein, ich selbst habe sie aber nicht als störend empfunden. Deutlich war immer nur eine tonale Unausgewogenheit, insbesondere eine wenig präsente Hochtonwiedergabe. Dieser Effekt verstärkte sich nach meinem persönlichen Eindruck nach einigen Vorführungen, möglicherweise gibt es noch Probleme mit der Temperaturkompensation.
Diese Probleme werden sicher in absehbarer Zeit gelöst. Dann werden die Vorteile des Verfahrens sicher offensichtlich werden. An erster Stelle ist da die überragende Räumlichkeit zu nennen. Kein konventionelles Verfahren kann den Abstand zur Schallquelle so authentisch simulieren. Insbesondere, wenn man sich im Abhörraum bewegt, hat man den Eindruck wirklich durch ein reales Schallfeld zu gehen. Alle Schallquellen bleiben exakt an ihrem Ausgangspunkt, kein Vergleich mit der schwammigen Ortbarkeit von Phantomschallquellen. Das ganze Schallfeld geht nicht länger von irgendwelchen Lautsprechern aus, es ist real, auch mitten im Raum. In gewissen Grenzen kann man sogar um die Schallquelle herumlaufen, ohne dass sie sich mitbewegt. Sie wird auch lauter und trockener wenn man sich annähert, so wie eine reale Schallquelle. Nur, wenn sie wirklich nah an den Zuhörer herankommt, wird der Schalleindruck irgendwie indifferent, ich hatte zuweilen dann auch den Eindruck einer im Kopf Lokalisation.
Die Forschung zur Weiterentwicklung des Verfahrens ist sehr intensiv. Vielversprechend ist dabei auch die Entwicklung einer Potsdamer Audiofirma, deren zweidimensionales WFS-Lautsprecherfeld schon eine atemberaubende Dynamik liefert und das tatsächlich auch in einem sehr halligen Raum eine trockene Wiedergabe möglich macht. Es soll die patentierte „Holofonie“ – Lösung, die im nächsten Kapitel beschrieben wird, realisieren.