MPEG-H – HintergrundwissenWas kann der ultraflexible Next-Generation-Audio-Standard?
MPEG-H ist ein Standard für Audio- und Videocodierung, der von der Moving Picture Experts Group (MPEG) entwickelt wurde. Der Standard bietet eine fortschrittliche Audiocodierungs-Technologie, die es dem Hörer ermöglicht, immersive Audioerlebnisse zu erfahren.
Dabei wird ein neues Konzept von Audio-Objekten definiert, die sogenannten "Audio Scene Objects" (ASO), die den Klang von Musik oder Geräuschen im Raum positionieren und bewegen können. Diese Funktion ermöglicht es, die Position des Zuschauers innerhalb eines Raums zu berücksichtigen, so dass der Ton auf die Sitzposition des Hörers oder Zuschauers im Raum ausgerichtet wird.
Zusätzlich zur Audio-Immersions-Technologie umfasst MPEG-H auch eine fortgeschrittene Videocodierungs-Technologie, die es ermöglicht, 4k- und 8k-Inhalte zu kodieren und zu decodieren.
MPEG-H bietet eine Vielzahl von Vorteilen, darunter eine hohe Kompatibilität mit einer Vielzahl von Geräten und Netzwerken, eine verbesserte Audio- und Videoqualität sowie eine höhere Effizienz bei der Datenübertragung.
Der MPEG-H-Standard wird bereits in verschiedenen Anwendungen eingesetzt, darunter im Fernsehen und im Rundfunk, im Virtual-Reality-Bereich und in der Musikproduktion.
Soweit das, was bereits vielen Interessierten bekannt sein dürfte. Im Folgenden wollen wir nun etwas mehr in die Tiefe gehen ...
Positionierung von MPEG-H als Audio-Standard
Dolby Atmos und DTS:X kennt inzwischen nahezu jeder, der sich ein klein wenig im Bereich der Unterhaltungselektronik bewandert ist. Dekodiermöglichkeiten der aktuellen, objektbasierten Tonformate der beiden Szene-Größen Dolby und DTS sind inzwischen in vielen Geräten, auch im günstigeren Preisbereich, integriert.
Auch von Auro-3D, wenngleich weniger bekannt und nicht so omnipräsent wie die beiden vorher genannten Formate, haben Filmliebhaber und Heimkino-Fans sicher bereits einmal gehört. MPEG-H hingegen verfügt über einen weitaus geringeren Bekanntheitsgrad.
Zwar lässt sich das Kürzel durchaus in einigen Datenblättern moderner AV-Komponenten und Fernseher finden, große Relevanz scheint das Thema aber nicht zu haben. Dabei lohnt es sich definitiv, auf MPEG-H einmal einen genaueren Blick zu werfen. Denn als offener ISO-Standard bringt die vom Fraunhofer Institut und der ISO/IEC Moving Picture Experts Group entwickelte Technologie einige Vorteile gegenüber den proprientären Lösungen mit.
Die Moving Picture Experts Group dürfte Vielen ein Begriff sein, zeichnet sie doch für Standards wie MP3, AAC und MPEG-1 verantwortlich. In diesem Special wollen wir einen Überblick darüber geben, was MPEG-H genau ist und welche Vorteile, sofern vorhanden, in der Praxis geboten werden.
Ist MPEG-H neu?
MPEG-H ist nicht völlig neu, der Standard wurde bereits 2015 entwickelt, allerdings gab es in den Anfangsjahren kaum praktische Anwendungen und auch nur sehr wenige Geräte, die das neue Format unterstützten. Lediglich im asiatischen Raum, z.B. in Südkorea, gab es einzelne Broadcaster, die das Format bei spezifischen Übertragungen genutzt haben.
Inzwischen wird es im weltweit ersten terrestrischen UHD-Fernsehservice in Südkorea und auch im südamerikanischen Raum verwendet. In Brasilien ist es sogar das einzig verpflichtende Audiosystem des Next Generation TV 3.0 Rundfunkservice, der ab 2024 zum Einsatz kommen soll. Ebenfalls interessant: Sony 360 Reality Audio basiert auf dem offenen MPEG-H Standard.
Mehr als 3.000 Songs sind mittlerweile von großen Labels wie Sony Music, Universal Music und Warner Music verfügbar. Dennoch muss man festhalten, dass aktuell noch sehr wenig Content in MPEG-H verfügbar ist. Sollte sich dies aber ändern, sind einige Vorteile des Formates nicht von der Hand zu weisen.
Was ist MPEG-H?
Grundsätzlich einmal ist MPEG-H ein Audioformat. Die Vielseitigkeit und Flexibilität ist das herausstechendste Merkmal. Der offene Standard unterstützt zum einen Audiokanäle. Der Toningenieur kann also, wie bei konventionellen Tonformaten üblich, Audiosignale einem bestimmten Kanal (Links, Rechts, Center, etc.) zuweisen.
Genauso werden aber Audio-Objekte (bis zu 128 Objekte) unterstützt, die, identisch zu Dolby Atmos und DTS:X, einer Position im Raum zugewiesen werden können. Je nach Größe des Lautsprecher-Setups wird die akustische Abbildung dann von einem einzelnen, oder auch mehreren Lautsprechern vorgenommen. Dabei unterstützt MPEG-H, ähnlich wie DTS:X, praktisch alle Lautsprecher-Konfigurationen, beginnend ab Stereo 2.0.
MPEG-H individuell anpassen?
Schon hier zeigt sich, dass das Format flexibel einsetzbar ist. Die Wiedergabe von immersiven 3D Audio ist aber nur ein Aspekt von MPEG-H. Zusätzlich ist die Möglichkeit, in das Audiosignal einzugreifen ein wichtiger Bestandteil. Und das kann in nicht unerheblichem Umfang geschehen.
Es ist z.B. möglich, innerhalb des Signals nur die Sprachausgabe lauter oder leiser zu stellen und somit die Dialogverständlichkeit zu erhöhen. Auch könnte man z.B. bei einer Sportveranstaltung in die Abmischung dementsprechend eingreifen, dass Fangesänge oder auch das Klatschen der Zuschauer in einem Stadion nicht mehr hörbar sind. Oder man wählt gar komplett zwischen dem Audiokommentar der Heim- und dem der Gastmannschaft.
Voraussetzung ist natürlich, dass die Sendeanstalt auch beide Kommentare als unterschiedlich anwählbare Objekte in das MPEG-H Signal eingebettet hat. Zur komfortablen Ansteuerung unterschiedlicher Audiomixe gibt es dann verschiedene Presets, die man direkt mit der Fernbedienung auswählen kann. Diese Interaktivität und die personalisierten Hörerlebnisse, die mit MPEG-H möglich sind, ist einer der großen Benefits.
Die Abmischung, z.B. eines Fernsehprogramms, kann damit auf die eigenen Präferenzen angepasst werden. Das ist deshalb möglich, weil im MPEG-H Audiostream, ähnlich wie bei Atmos und DTS:X, Teile des Klangsignals als Objekte codiert werden können.
Schwer verständliche Dialoge kann man so lauter stellen, alternativ andere Klanganteile des Tonsignals abschwächen oder gar ganz ausblenden. Aber auch ohne Objekte ist eine Individualisierung möglich: Der Dialog+ Algorithmus zur Dialogtrennung z.B. kann von Rundfunkanstalten auch in konventionellem Filmmaterial eingesetzt werden, in dem keine einzelnen Tonspuren vorhanden sind.
Vielseitige Einsatzmöglichkeiten
Hinzu kommen Vorteile bezüglich der Barrierefreiheit. Audiodeskriptionen für blinde und sehbehinderte Menschen können problemlos übertragen und dann vom Nutzer selbst einfach über die Fernbedienung ausgewählt werden. Das gilt dann natürlich auch für mehrere zusätzliche, unterschiedliche Sprachen. Das Fraunhofer Institut gibt an, dass nur 20 bis 40 kbit/s pro Sprache an zusätzlichen Daten nötig sind, was natürlich wiederum Vorteile mit sich bringt.
Offener Standard
Die Offenheit des Standards ist einer der weiteren großen Vorteile von MPEG-H. Die Technologie ist für Content-Ersteller (Musiker, Video-Produzenten, Labels, etc.) weitgehend kostenfrei und auch als Geräte-Hersteller, der zwar Lizenzgebühren entrichten muss, soll MPEG-H mit einer fairen Preiskalkulation und unkompliziertem Bezug eine echte Alternative darstellen.
MPEG-H: Vom Smartphone bis zum Heimkino
Enorm profitiert MPEG-H von seiner Skalierbarkeit. Von der einfachen Soundbar über kompakte Stereo-Setups bis hin zu großen 3D-Audio-Lautsprecherkonfigurationen mit Surround- und Höhenlautsprechern lässt sich mit MPEG-H ein entsprechend realistisches und immersives Klangerlebnis realisieren.
Der Bitstream des Standards unterstützt bis zu 128 Kanäle, die gleichzeitig auf bis zu 64 Lautsprecher übertragen werden können. Selbst bei nicht perfekter Platzierung der Komponenten soll ein negativer Einfluss auf die Klangqualität vermieden werden und dank einer optimierten Downmix-Funktion ist eine eingeschränkte Wiedergabe von Höheninformationen auf 5.1- oder gar Stereo-Aufbauten laut Fraunhofer Institut möglich.
So ist es von Vorteil, wenn auf dem größtmöglichen Setup produziert wird, um beim späteren Decoding jede Lautsprecher-Konfiguration perfekt bedienen zu können. Das dabei entstandene MPEG-H Audiosignal kann dann in jeder Situation und für jedes Lautsprecher-Setup verwendet werden. Es sind keine separaten Tonspuren (z.B. in 5.1 oder Stereo) notwendig. In jedem MPEG-H Decoder steckt außerdem ein binauraler Renderer. Dieser ermöglicht eine realistische Wiedergabe der Abmischung auch über Kopfhörer.
MPEG-H bietet also über die äußerst flexible 3D Audio-Wiedergabe hinaus einige Vorteile, die sich insbesondere auf den Broadcasting- und Streaming-Bereich fokussieren. Hier ist auch zweifellos der Einsatzzweck des Formates. Und dass Flexibilität im Vordergrund steht, beweist die eben angesprochene Skalierbarkeit. Mit MPEG-H will man auf jedem Endgerät die beste Qualität bieten. Ob im Heimkino oder auf dem Smartphone.
Fazit
Momentan führt der Standard zweifellos ein Nischendasein. Abgesehen von Sony 360 Reality Audio, dass man über Musikstreamingdienste wie Amazon Music HD und Tidal genießen kann, gibt es im europäischen Raum aktuell kaum Content. Weder Sendeanstalten noch VoD-Anbieter, die man hierzulande empfangen kann, nutzen MPEG-H. Die zahlreichen Anwendungsmöglichkeiten und die Vielseitigkeit des Formates könnten aber ausschlaggebend für eine zukünftig wachsende Anzahl von Entertainment-Inhalten in MPEG-H sein.