Cinema, Broadcast, Surround, Immersive Audio

Den Klang sehen: Visualisierung des räumlichen Verhaltens von Surround-Audio

Präsentiert auf der AES European Convention 2025 in Warschau von Pavel Smokotnin, RTW

Thomas Valter

Juni 04, 2025 5 Minuten Lesezeit

Da Surround- und immersive Formate in Kino, Rundfunk und Musikproduktion Stereo immer mehr ersetzen, werden neue Werkzeuge benötigt, die Audioexperten helfen, das räumliche Verhalten komplexer Mischungen zu verstehen. Auf der AES European Convention 2025 in Warschau stellte Software-Ingenieur Pavel Smokotnin von RTW einen neuartigen Visualisierungsansatz vor, um genau diese Herausforderung zu bewältigen: Das Polarscope.
Bitte beachten Sie, dass es sich bei diesem Artikel um ein Forschungsprojekt handelt. Das Polarscope ist ein konzeptioneller Prototyp und ist (noch) nicht als kommerzielles Produkt erhältlich.

 

Das Problem: Stereo-Tools greifen in einer Surround-Welt zu kurz

Herkömmliche Stereo-Analysetools - wie z. B. Vektorskope - funktionieren gut bei Zweikanal-Mischungen, versagen aber bei Mehrkanalformaten wie 5.1 oder 7.1. Wenn mehrere Audioquellen im Raum verteilt sind, wird die Erkennung von Phasenfehlern, räumlicher Kohärenz und Richtungsbalance wesentlich komplexer.
 

Pavels Forschung stellt die Frage: 

"Was wäre, wenn wir diese vertrauten Visualisierungstools anpassen könnten, um Surround- und sogar Immersive-Audio zu unterstützen?"
 

 


Newsletter

Melden Sie sich jetzt an und lassen Sie sich
über neue Blog-Einträge benachrichtigen!
 

 
 

 

Die Methode: Ein räumliches Vektorskop für Surround

In Anlehnung an das klassische Vektorskop entwickelte Pavel einen Algorithmus, der die Korrelationen zwischen den Kanälen mithilfe eines räumlichen Koordinatensystems visualisiert. Die Position jedes Lautsprechers wird als Vektor im Raum behandelt, und die Signalpegel werden zur Berechnung von Echtzeitformen auf dem Bildschirm verwendet.

In Stereo bildet ein gemeinsames Signal eine vertikale Linie, während eine Polaritätsumkehrung eine horizontale Linie erzeugt. Die neue Methode erweitert dieses Konzept auf Surround-Layouts, bei denen Signalkombinationen unterschiedliche geometrische Formen bilden, die räumliche Attribute widerspiegeln, z. B.:

  • Bildbreite und -tiefe
  • Energiegleichgewicht vorne/hinten
  • Ungleiche Kanalverzögerungen
  • Phasenprobleme oder Spiegelsymmetrie

Auf diese Weise ist es möglich, zu „sehen“, wie sich die Mischung im Raum verhält - wobei unterschiedliche Formen auf Probleme hinweisen oder die räumliche Kohärenz bestätigen.

 

Beispiele aus der realen Welt: Was die Formen verraten

Mithilfe eines benutzerdefinierten Softwaretools und Testsignalen demonstrierte Pavel mehrere wichtige Muster:

  • Perfekte Kanalsymmetrie bildet saubere vertikale Linien.
  • Polaritätsumkehrungen oder Verzögerungsfehlanpassungen kippen oder verzerren diese Linien.
  • Unkorreliertes Rauschen erzeugt eine „Wolkenform“, die Ausbreitung und Tiefe erkennen lässt.
  • Echtes Programmmaterial, wie z. B. Dialogszenen, verengt die Form in Richtung des mittleren Kanals, während Sturmszenen diffuse Formen bilden, die der Klangbewegung folgen.

Wichtig ist, dass diese visuellen Anhaltspunkte der menschlichen Wahrnehmung entsprechen und Tontechnikern und Qualitätskontrolleuren eine neue Möglichkeit bieten, räumliches Verhalten zu erkennen und zu optimieren.

Im folgenden Video können Sie das Beschriebene unmittelbar verfolgen. Die Montage zeigt das zugrunde liegende Movie mit 5.0/5.1- Audio und die mitgeschnittene Polarscope-Mess-Sequenz in einem.

Das Meridian Movie von Netflix Open Content mit eingeblendeter Anzeige der Polarscope-Messung
 

Dieses Video basiert auf dem Film Meridian von Netflix Open Content, der unter der Creative Commons Attribution 4.0 International Public License verfügbar ist.
RTW hat die Polarscope-Messsequenz des 5.1-Audiosignals hinzugefügt, die mit einem TouchMonitor 5 durchgeführt wurde. Das modifizierte Video fällt ebenfalls unter diese Lizenz.



 

Interessante Zeitpunkte dabei sind:
 

0:00
0:50
3:25
3:30
 

Intro-Musik
Purer Dialog im Büro
Straßengeräusche
Interner Monolog mit Hintergrundmusik
 

4:22
5:08
5:20
5:28
 

Sturm umgibt das Auto
Natur ganz laut
Telefonanruf nebenher
Donner
 

6:30
8:05
10:06
 

Meereswellen rechts und Gewitter im Hintergrund
Verdächtige Surround-Musik
Korrelierte Signale in den Kanälen (Windinstrument)
 

   Laden Sie das Video herunter (ca. 761,9 MB)
 

 

Das folgende Video beinhaltet die Polarscopr-Mess-Sequenz in voller Auflösung.
 

Der Polarscope-Prototyp, demonstriert mit einem RTW TouchMonitor 5

 

   Laden Sie das Video herunter (ca. 54,1 MB)
 
 

Vergleich mit dem SSA-Tool von RTW

Pavels Ansatz ergänzt den Surround Sound Analyzer (SSA) von RTW, der die momentane Lautheit über die Lautsprecherpositionen hinweg in einem fünfeckigen Layout visualisiert. Während sich der SSA auf die Lautstärkeverteilung konzentriert, spiegelt die vorgeschlagene Methode die Phasen- und Korrelationsdynamik wider und bietet einen anderen, aber kompatiblen Einblick in die räumliche Struktur.

 

Blick nach vorn: Auf dem Weg zur immersiven und 3D-Visualisierung

Eine der Hauptstärken dieser Methode ist ihre Flexibilität. Sie ist nicht auf flache Surround-Layouts wie 5.0 oder 5.1 beschränkt, sondern kann auch für vertikale Audioebenen in immersiven Formaten wie 7.1.4 oder 9.1.6 verwendet werden. Es besteht sogar das Potenzial für eine echte räumliche 3D-Visualisierung unter Verwendung von XYZ-Koordinaten, die es den Technikern ermöglicht, das wahrgenommene Audiofeld „abzubilden“.

 

Fazit

Mit der zunehmenden Verbreitung von immersivem Audio benötigen Toningenieure Werkzeuge, die der Komplexität der Formate entsprechen, mit denen sie arbeiten. Der Surround-Visualisierungsalgorithmus von Pavel Smokotnin ist ein wichtiger Schritt nach vorn, um die Lücke zwischen dem, was wir hören, und dem, was wir sehen können, zu schließen.

Lesen Sie das White Paper in der AES E-Library.

Pavel Smokotnin, Forschung und Entwicklung, RTW, präsentiert seinen Ansatz auf der AES