Von Stereo zur Mono Kompatibilität

November 16, 2022 | Know-how

Mono Kompatibilität im Kontext von moderner digitaler Audioproduktion bedeutet, dass der Klang und das Gefühl eines Stereomixes erhalten bleiben soll, auch wenn er in Mono wiedergegeben wird (typischerweise über einen einzelnen Lautsprecher). Obwohl das Stereobild offensichtlich in Mono kollabiert, sollte die spektrale Balance und die Präsenz der unterschiedlichen Quellen unverändert bleiben. „Sollte“ ist hier das Stichwort: Es gibt ein paar sehr ernstzunehmende Probleme, die einen Stereomix ruinieren können, wenn er in Mono wiedergegeben wird. Wir erklären dir die technischen Hintergründe dieser Probleme und wie du sie vermeiden kannst.

Warum ist Mono Kompatibilität (noch immer) wichtig?

Intuitiv, nehmen viele Leute an, dass Musik meistens in Stereo wiedergegeben wird. Dem ist auch so: Wenn man sich Musik in einem Auto, zu Hause mit der Stereoanlage oder mit Kopfhörern anhört, dann haben wir üblicherweise einen linken und einen rechten Lautsprecher, die gemeinsam jenes Stereobild nachbilden können, das Mixing-Ingenieur*innen beabsichtigten. Dennoch gibt es, neben diesen typischen Stereo-basierten Hörsituationen, erstaunlich viele Szenarios, in denen wir Musik in Mono hören (aus nur einem Lautsprecher oder mehreren, die das gleiche Signal wiedergeben):

  • Die meisten modernen kabellosen Lautsprecher (z.B.: Amazon Echo, Sonos, Google Nest) werden typischerweise als einzelner Mono-Lautsprecher verwendet und nicht in Stereo-Setups.
  • In einem Club oder einem Restaurant wir Musik sehr oft in Mono durch mehrere Lautsprecher wiedergegeben. Da Rechts-Links-Lokalisierung hier nicht möglich ist, geben alle Lautsprecher dasselbe Mono-Signal wieder.
  • Viele Mobiltelefone verwenden noch immer Einzel-Lautsprecher oder zwei Stereo-Lautsprecher in unmittelbarer Nähe. Einige der Probleme mit Mono Kompatibilität (wie Frequenz-Maskierungen, siehe unten) werden auch in diesem Fall schlagend.

Was für Probleme gibt es bei der Wiedergabe eines Mix in Mono?

In Stereo mischen ermöglicht es, eine weitere kreative Ebene durch „Panorama“ und „Weite“ hinzuzufügen. Damit ist man in der Lage, Klangquellen an verschiedenen räumlichen Orten zu positionieren, etwa um ein vor uns spielendes Orchester bei dem sich ein paar Quellen links und andere rechts befinden wiederzugeben oder um weite Klangebenen zu kreieren. Die zusätzliche Information, die uns mit der Weite eines Tracks zur Verfügung steht, kann genutzt werden, um in Frequenzen überschneidende Quellen akustisch zu trennen, indem man sie bewusst in einem bestimmten Abstand im Klangbild platziert. Wenn jedoch ein Stereomix in Mono wiedergegeben wird, verschwindet diese zusätzliche Ebene und das kann zu großen Problemen führen, nämlich Phasenauslöschung und Frequenzmaskierung.

 

Probleme und wie man sie meistert

Von Stereo zu Mono

Wenn ein Stereosignal in mono wiedergegeben wird, werden der linke und rechte Kanal in einer einzigen Wellenform zusammengefasst. Dieser Prozess des Mono-Mixdowns kann in einer einfachen Formel ausgedrückt werden:

Mono = (Links + Rechts)/2

Das Monosignal ist also die Summe aus dem linken und rechten Kanal geteilt durch zwei. Die Division durch zwei stellt sicher, dass die Summierung nicht das maximale Peak-Level des daraus resultierenden Monosignals erhöht.

Das Problem mit der Phase …

Wenn zwei Signale summiert werden, werden die Wellenformen kombiniert. Diese Kombination von sich überlappenden Signalen wird auch als Interferenz bezeichnet und kann – abhängig von der Form, Frequenz und temporalem Zusammenhang (Phasenverschiebung) des Signals – positiv sein (Wellenberge und -täler summieren sich auf und die Wellenform wird größer) oder negativ (Wellenberge und -täler löschen sich gegenseitig aus und die Wellenform wird kleiner).


Der Effekt von Interferenz ist am verständlichsten, wenn man sich eine einfache Sinuskurve ansieht. Wenn sich dieselbe Sinuskurve (selbe Phase, Amplitude und Frequenz) in zwei Kanälen befindet und sie summiert werden, führt das zu einer Sinuskurve mit doppelter Amplitude. Wenn eine der beiden Sinuskurven eine Phasenverschiebung aufweist, die dafür sorgt, dass ihre Wellentäler mit den Wellenbergen der anderen Sinuskurven zusammentreffen (180° Phasenverschiebung), dann löschen sich die Signale gegenseitig bei einer Summierung aus.

Die Form jedes natürlichen Signals, wie Musik, ist weitaus komplexer als eine einzelne Sinuskurve. Es ist tatsächlich so, dass jedes Signal durch eine Kombination aus einer großen Anzahl an Sinuskurven, die sich überlagern, dargestellt werden kann – so funktioniert die Fourier Transformation. Daher löscht eine Summierung des linken und rechten Kanals eines Stereosignals niemals das ganze Signal, weil es sich folglich um eine Mischung aus positiven und negativen Interferenzen handelt. Trotzdem können problematische temporale Verhältnisse zwischen ähnlichen Signalkomponenten auf beiden Kanälen zu einem sogenannten Kammfilter-Effekt führen.

Ein Kammfilter-Effekt entsteht, wenn zwei Signal summiert werden, die ähnliche Frequenzkomponenten mit einer 180° Phasenverschiebung enthalten. Diese Frequenzkomponenten löschen sich gegenseitig aus, wenn sie summiert werden, was wiederum zu einem metallischen und hohlen Klang führt. Besonders bei niedrigen Frequenzen, bei denen die Wellenlängen groß und Signaländerungen vergleichsweise langsam sind, können Kammfilter ein typisches Problem sein.

 

Die Kamm-artige Filterform entsteht durch die Tatsache, dass eine bestimmte zeitliche Verschiebung zwischen zwei Signalen alle Frequenzen löscht, bei denen der zeitliche Versatz einer 180° Phasenverschiebung entspricht. Zum Beispiel führt eine Zeitverschiebung von 5ms zu einer 180° Phasenverschiebung für 100Hz Komponenten und alle ihre ungeraden Vielfachen (z.B.: 300Hz, 500Hz, etc.) während alle geraden Vielfachen (z.B.: 200Hz, 400Hz, etc.) positiv interferieren.

Das Problem mit Frequenzmaskierungen …

Während ein zeitlicher Versatz zu ungewollten Kammfilter-Effekten beim Downmixen eines Signals zu Mono führt, kann der Verlust der Weiten-Ebene kritische Frequenzmaskierungen verursachen.

Wie oben beschrieben, entsteht ein Monosignal durch die Summierung des linken und rechten Kanals eines Stereosignals. Der Verlust der Stereoweite bedeutet, dass alle Signale, die einen bestimmten Frequenzbereich abdecken, plötzlich aus derselben Richtung kommen und nicht mehr durch eine räumliche Distanz getrennt sind. Dieses Zusammenfallen aller Quellen an einen Ort kann in Maskierungsprobleme resultieren. Ein Mix, der sich zuvor aus klar unterscheidbaren Quellen in Stereo auszeichnete, kann in Mono muddy klingen und leise Komponenten können komplett von überlagernden Quellen maskiert werden.

Ein Effekt, der das Problem mit ungewollten Maskierungen weiter verschlechtert, ist die Division des Stereosignals durch zwei. Wenn ein Signal hart nach links oder rechts geschwenkt ist, ist es nur in einem Kanal präsent. Ein Signal, das aus der Mitte kommt, ist hingegen in beiden Kanälen gleichermaßen existent. Daher verändert sich ein Signal, das aus der Mitte kommt, trotz der Division durch zwei nicht (es wird sich selbst hinzugefügt und dann durch zwei geteilt). Ein Signal, dass nur auf einer Seite präsent ist verliert rund 6dB Lautstärke (es wird zu Stille hinzugefügt und dann durch zwei geteilt).

Für das Mixen bedeutet das, dass je weiter eine Quelle auf eine Seite geschwenkt ist, desto mehr Lautstärke geht bei der Summierung zu mono verloren.

 

Korrelation: Bringt alles zusammen

Jetzt wo wir uns die Probleme mit den Phasen und der Frequenzmaskierung durch überlappende Quellen angesehen haben, schauen wir uns eine Zahl an, die dabei hilft, diese beiden potenziellen Schwierigkeiten zu identifizieren – den Korrelationswert.

Einfach gesagt, ist der Korrelationswert eine Kennzahl für die „Ähnlichkeit“ der beiden Signale. Daher ist er auch ein guter Indikator für die wahrgenommene Weite eines Mix und er hilft möglich Phasenprobleme ausfindig zu machen. Obwohl der tatsächliche Korrelationswert eines Signals stark vom Mix (Instrumente, Quellenanzahl, etc.) abhängt, ist es gut, die folgenden Faustregeln im Kopf zu behalten, wenn man einen Mix analysiert:

  • Je näher der Korrelationswert bei +1 ist, desto ähnlicher sind sich der linke und rechte Kanal und desto schmaler ist die wahrgenommene Weite des Signals.

  • Je näher der Wert bei Null ist, desto weniger Zusammenhang besteht zwischen dem linken und rechten Kanal und desto breiter ist die wahrgenommene Weite. Umso näher der Wert bei Null ist, desto breiter wirkt das Signal und die Summierung kann zu ungewollten Frequenzmaskierungen führen.

  • Alle Signale mit einem Korrelationswert unter Null deuten auf phasenverschobene Komponenten hin, was Phasen-Auslöschung mit sich bringen kann, wenn das Signal zu mono summiert wird.

 

Was kann getan werden, um Probleme mit der Mono-Kompatibilität zu vermeiden?

Stereo erweiternde Effekte mit Vorsicht einsetzen
Effekte, die sich auf die Phase eines Signals auswirken um Weite zu kreieren, sind typischerweise problematisch für die Mono-Kompatibilität. Die zusätzliche Weite entsteht durch beabsichtigtes „Dekorrelieren“ des linken und rechten Signals. Während das Ergebnis in Stereo großartig sein kann, ist die Wahrscheinlichkeit groß, dass der Mono-Downmix flach und hohl klingt.

Vermeide negative Korrelationswerte
Wenn die Korrelationsmessung in Richtung eines negativen Werts geht, schau dir Signalkomponenten an, die eventuell phasenverschoben sind. Manchmal hilft es, die Phase eines Kanals zu invertieren, um das Problem mit Phasenauslöschungen zu beheben. Du kannst auch probieren, Signalkomponenten ein wenig zeitlich zu verschieben, die in beiden Kanälen präsent sind oder du verwendest Plug-ins um eine Delay von ein paar Samples in einem der Tracks zu generieren.

Mache dein Low-End mono
Da sehr tiefe Frequenzen (z.B.: Sub Bass) nicht direktional sind, wenn sie wiedergegeben werden, solltest du sie in mono halten. Bass-Signale in Stereo sind besonders anfällig für Probleme durch Phasenauslöschungen – also stell sicher, dass die Bass nicht unnötig breit ist.

Vermeide extrem weites Panning
Je weiter links oder rechts ein Signal in einem Stereomix gepannt ist, desto besser sind konkurrierende Quellen durch die zusätzliche Weiten-Ebene separiert. Wenn du dir deinen Mix in mono anhörst und eine deiner Quellen ist plötzlich verschwunden, solltest du versuchen sie näher in die Mitte deines Stereomix zu schwenken oder du gibst jeder Quelle durch spektrales Mixen mehr Platz im Stereomix.

Verwende Stereo-weitende Ebenen
Anstatt ein Signal (z.B. die Vocals) künstlich breiter zu machen, könntest du versuchen das Hauptsignal mono zu halten und zusätzliche Ebenen (z.B. Background-Gesang) hinzuzufügen, die dann nach links und rechts gepannt werden.