Wat is Immersive Sound?

Donderdag 22 april 2021, 11:10 • 1025 keer gelezen
Trinnov Audio heeft een interessante tekst op hun website gezet die beschrijft wat Immersive Audio precies is en waarom het een verbetering is ten opzichte van kanaal gebaseerde surround sound audio. We hebben het vertaald middels Google Translate en hier en daar aangepast om de leesbaarheid te verbeteren.

De nieuwste modewoorden op het gebied van hoogwaardige thuistheaters zijn termen als 'Immersive Audio' en '3D-audio'. Wat betekenen deze termen en waar komen ze vandaan?
Wat is Immersive Sound?
Tot voor kort waren alle geluidsopnamen 'kanaalgebaseerd'.
Mono-opnames gebruikten een enkel kanaal, ongeacht hoeveel luidsprekers er werden toegepast- denk bijvoorbeeld aan een omroepsysteem.

Stereo-opnamen gebruiken twee verschillende kanalen en (meestal) twee luidsprekers. De magie vindt plaats wanneer je met ze op gelijke afstanden voor je zet en muziek uit de ruimte ertussen lijkt te komen. Op superieure systemen ben je je niet bewust van de luidsprekers als geluidsbronnen. Sonisch verdwijnen ze. De truc hier is dat als je een kopie van hetzelfde signaal in twee kanalen plaatst, je alles is precies zo waarneemt alsof het tussen de twee luidsprekers vandaan komt.

AURO-3D bevat twee verschillende niveaus van hoogtekanalen
Frank Sinatra stond erop voor dat zijn stem in het midden van elke stereo-opname werd geplaatst. Dat wil zeggen, Franks stem was mono en gedupliceerd in beide kanalen, ook al zaten andere muzikanten meestal aan de ene of de andere kant. Dat zorgde ervoor dat hij centraal stond in de opname en zorgde ervoor dat zelfs mensen die veel dichter bij de ene luidspreker zaten dan de andere, hem nog steeds zouden horen. (You didn't mess with Frank.)

Meer recentelijk leverden 'surround sound'-systemen gewoonlijk maar liefst zes of acht van dergelijke kanalen, waarvan er één kanaal vaak het 'punt één'-kanaal werd genoemd. Om aan te geven dat het alleen voor de diepe bas was en niet voor een volledig frequentiebereik. Vandaar dat soundtracks van "5.1" en "7.1" films zorgen voor geluid dat je overal om je heen hebt in het horizontale vlak, plus een speciaal kanaal voor dynamische, diepe bassen.

Meestal kwamen deze surround sound-systemen neer op:
-       drie luidsprekers vooraan (links, midden, rechts) plus
-       ofwel twee of vier "surround" -kanalen naast en / of achter je, plus
-       het Low Frequency Effects (LFE) -kanaal dat door geluidsontwerpers wordt gebruikt wanneer ze je wakker wilden schudden, zoals bij explosies of dreigende, diepe bassen in de partituur

Natuurlijk is het mixen met deze extra kanalen die verder gaan dan gewone stereo gecompliceerder. Maar het principe blijft hetzelfde: als je wilt dat er iets verschijnt tussen twee veronderstelde luidsprekerlocaties, stop je een deel van dat specifieke geluid in beide aangrenzende luidsprekers ... net als Frank.

Immersive Sound definiëren
Wat echter ontbrak, was de kritische derde dimensie van hoogte.

We leven tenslotte in een driedimensionale wereld. Er ontstaat een extra laag van realisme wanneer we dingen zowel boven als om ons heen kunnen horen. Dat kan het geluid van een viaduct zijn of de atmosfeer van vliegende vogels en zoemende insecten in de jungle. Mits intelligent toegepast maakt het alles realistischer en boeiender.

Door meer luidsprekers in de kamer te hebben wordt de potentiële, waargenomen ruimtelijke resolutie verbeterd. Maar als je meer luidsprekers toevoegt, wordt het maken van 'content' ingewikkelder. Om nog maar te zwijgen van een ander probleem: Wat als sommige mensen niet alle luidsprekers hebben die een engineer bij het maken van de mix zich had voorgesteld? Mist zo'n luisteraar dan simpelweg essentiële geluiden in de mix?

Introductie van immersive audio-'objecten'
Het antwoord: wat als we voor een geheel nieuwe benadering kiezen die gebruik maakt van de processing power die we tegenwoordig hebben in computers en DSP-chips?

Alle op kanalen gebaseerde systemen gaan uit van een specifieke opstelling van luidsprekers en laten het dan aan de mixer over om erachter te komen welke kanalen moeten worden gebruikt om een ​​geluid op een bepaalde plaats te laten "verschijnen". Wat als we de aanpak veranderen?

Hoe zit het met het toevoegen van een eenvoudige beschrijving aan elk geluid, waarin wordt beschreven waar het geluid zich op elk moment in de tijd bevindt? Deze "metadata" (wat simpelweg "data over andere data" betekent) zou regelmatig kunnen worden bijgewerkt, bijvoorbeeld in elk frame van een film (24 frames per seconde).

Door de metadata van de locatie in de loop van de tijd te veranderen, kunnen we objecten laten bewegen. Als we alle drie de dimensies (lengte, breedte en hoogte) opnemen, kunnen we elk geluid of elke verzameling geluiden in de kamer laten bewegen op elke gewenste manier.

Zowel Dolby Atmos als DTS: X Pro gebruiken metadata om de locaties van geluiden in de kamer te beschrijven.

Denk hier eens over na: stel je het geluid voor van een raceauto die over een circuit racet. Je kunt de auto in de verte zien aankomen, aan de rechterkant van het scherm. Naarmate deze dichterbij komt, wordt het luider en zoomt het van rechts naar links over het scherm, met de resulterende Dopplerverschuiving van het geluid als de auto langs je heen gaat. Het schreeuwt van de linkerkant van het scherm en loopt door de linkermuur totdat het in de verte achter je verdwijnt.

Een geluidsontwerper zou, in theorie, dit geluid voorzichtig kunnen pannen van de rechterluidspreker, via de middenluidspreker naar de linkerluidspreker, en verder omlaag naar de linker zij-surround luidspreker en de linker achter-surround luidspreker voordat het helemaal wegvaagde. Dat zou de kanaalgebaseerde manier zijn om over de taak na te denken.

Als alternatief zou dezelfde ontwerper het geluid van die raceauto kunnen associëren met locaties (coördinaten) die soepel over de voorkant van de kamer en vervolgens langs de linkerkant van de kamer bewegen. Het is hetzelfde geluid, maar nu met metadata die het afspeelsysteem vertellen waar het van het ene moment op het andere moet zijn.

Wat is het voordeel om het op de tweede manier te doen, met metadata?
De tweede, objectgeoriënteerde manier, is schaalbaar. Het maakt niet uit hoeveel luidsprekers je in je kamer hebt, want het verwijst niet naar een specifieke luidspreker, maar alleen naar relatieve locaties. Belangrijk is dat deze locaties de ruimte boven je en om je heen kunnen omvatten, waardoor je wordt omsloten door een "bel" van geluid.

Het is de taak van een AV-receiver van Euro 400 of een AV-voorversterker van Euro 40.000 om deze bewegingen (naar hun beste kunnen) te 'weergeven' via de verschillende luidsprekers waarvan het systeem weet dat het ze beschikbaar heeft. Dat kan een standaard 5.1.4-systeem zijn of een veel geavanceerder systeem met een veel hogere ruimtelijke resolutie van geluiden die door de kamer bewegen:

Immersive audio creëren
Vanuit het perspectief van een praktische geluidsontwerper bieden objectgeoriënteerde tools zoals Dolby Atmos een schat aan creatieve opties. Bekijk bijvoorbeeld slechts één minuut van deze documentaire over het maken van Ford vs. Ferrari. De kleine gele bolletjes op de Dolby-monitor geven aan waar verschillende geluidsobjecten zijn en hoe ze in de tijd bewegen.

Natuurlijk gebruiken niet alle geluidstechnici de tools op dezelfde manier. Dolby en DTS hebben deze krachtige tools gemaakt om de artistieke mogelijkheden van de makers en de daaruit voortvloeiende betrokkenheid van het publiek uit te breiden. Maar er is geen Dolby- of DTS-politiemacht die ervoor zorgt dat de tools worden gebruikt zoals bedoeld.

Helaas kost het produceren van immersive soundtracks meer tijd en dus meer geld. Er bestaat echter een kosteneffectieve snelkoppeling. Die bestaat uit het simpelweg creëren van enkele objecten op het plafond, die je nooit verplaats en vervolgens mengt alsof die objecten gewoon extra kanalen zijn. De resulterende mix is ​​bekend geworden als een "preprint" omdat het bijna lijkt alsof ze de Atmos- of DTS: X-bitstream voor de AV-receiver of voorversterker vooraf hadden gerenderd.

Er is niets dat de surround sound-decoder kan doen zonder bruikbare metadata - hoe geavanceerd deze ook is. De benodigde informatie is er gewoon niet.

Gelukkig hebben consumenten van zich laten horen. Met name filmliefhebbers die, hoewel kleiner in aantal, veel meer films "consumeren" dan het grote publiek. Zelfs de meest toonaangevende studio's krijgen de boodschap en investeren meer tijd en moeite in hun meeslepende audiosoundtracks.

Op de Trinnov Altitude kun je zien hoe de geluidsontwerpers de soundtrack hebben geconstrueerd met hun Dolby Atmos Object Viewer. Deze unieke display laat zien hoe de bewegingen van de objecten het volume van de luidsprekers beïnvloeden terwijl ze voorbij bewegen. De meest vereenvoudigde geluidsontwerpen en mixen worden zichtbaar. Je ziet bijvoorbeeld dat hun audio-objecten zelden of nooit bewegen.

Aan de andere kant kun je gemakkelijk het resultaat zien en horen van die creatieve geluidsontwerpers die de kracht van de nieuwe tools omarmen. (Dit is een voorbeeld van een van de vele functies die alleen beschikbaar zijn op het Trinnov Altitude-platform.)

De schoonheid van objectgebaseerde audio
Filmmakers hebben een behoorlijke uitdaging: ze hebben geen controle over hoe de consument hun kunst ervaart.

Staat het op de twee piepkleine luidsprekers die in een flatpanel-tv zijn ingebouwd? Op een "Home theater in a box", gekocht in een megastore? Of in een speciale thuisbioscoop, zoals filmproducenten zelf misschien hebben? Of misschien nog wel beter?

Ze kunnen het niet weten, maar hun film moet altijd entertainen ... anders maken ze in de toekomst misschien geen nieuwe meer.

Objectgebaseerde audio zoals Dolby Atmos of DTS: X biedt een manier om een ​​enorme hoeveelheid artistieke vrijheid en het potentieel voor echt meeslepende ervaringen op een goed systeem in te bouwen. Met dergelijke technologieën kun je echt ontsnappen in een goede film en tegelijkertijd "backward compatibility" garanderen voor de meest basale tv-systemen die mensen tegenwoordig gebruiken. Het is een soundtrack met bijna onbeperkte mogelijkheden die kan worden weergegeven elk beschikbare geluidssysteem.

Hoeveel systemen wilt je? Het is helemaal aan jou. Met behulp van deze technologieën kan dezelfde film op dezelfde schijf of hetzelfde streamingplatform ten volle profiteren van het beschikbare systeem. Nog beter: als u uw systeem verbetert, kunt u teruggaan naar een favoriete film en deze helemaal opnieuw beluisteren, compleet met alle voordelen van uw verbeteringen.

We blijven tegenwoordig allemaal meer thuis. Heb je de behoefte om af en toe te ontsnappen? Hoewel het niet de mogelijkheid vervangt om weer samen te komen met vrienden en familie, kan het hebben van een immersive geluidssysteem in je huis de "Great Espcape" zijn die je nodig hebt in het hier en nu. Het zal ook fantastisch zijn om te delen met je vrienden en familie als die tijd weer aanbreekt.