ReadScapes


De Blumlein samenzwering
beperkingen van twee- of meerkanaals geluid


geschreven door Ralph Glasgal
illustraties afkomstig van het Ambiophonics Institute

vertaald uit het Engels en bewerkt door ThingMan - januari 2018

©2018 - 13 januari - ThingMan



Ralph Glasgal is de stichter van het Ambiophonics Instituut in Rockleigh, New Jersey (USA)
veel meer interessante informatie is te vinden op de website van
Ambiophonics




Op 14 december 1931 diende EMI geluidstechnicus Alan Dower Blumlein de Britse Patentspecificatie 394325 in.

De titel hiervan was,
"Verbeteringen van en gerelateerd aan systemen voor geluidsoverdracht, geluidsopname en geluidsweergave."

Uit het hoog-ambtelijke taalgebruik dat gebruikelijk is bij de meeste patentomschrijvingen blijkt, dat Blumlein's uitvinding "bestaat uit een systeem van geluidsoverdracht, waarbij het geluid wordt opgenomen door meerdere microfoonelementen en wordt weergegeven door meerdere luidsprekers.
Hierbij is sprake van twee of meer richtinggevoelige microfoons, en/of een opstelling van elementen in het overdrachtscircuit of -circuits, terwijl de relatieve geluidssterkte van de luidsprekers afhankelijk wordt gemaakt van de richting van waaruit de geluiden arriveren bij de microfoons."





Wie was Blumlein en hoe begon het allemaal?

Alan Dower Blumlein (29-6-19037-6-1942) werd geboren in de Londense wijk Hampstead, als zoon van Semmy Joseph Blümlein, een in Duitsland geboren genaturaliseerde Brit van Joodse afkomst, en Jessie Dower, een Schotse missionarisdochter. Zijn toekomstige carrière leek bepaald te worden toen hij op zevenjarige leeftijd aan zijn moeder een rekening overhandigde voor de reparatie van de deurbel, ondertekend met "Alan Blumlein, elektrotechnicus".

Nadat hij zich in 1912 had ingeschreven aan de Highgate School studeerde hij aan het City and Guilds College, onderdeel van het Imperial College. Hij won een 'Governor’s Scholarship' en kon direct als tweedejaarsstudent beginnen. Twee later later studeerde hij af in electrotechniek, met First-Class Honours B.Sc.

Hij overleed reeds op 38-jarige leeftijd, tijdens een geheime testvlucht van het H2S - vluchtradarsysteem. De Halifax bommenwerper waarin hij vloog verongelukte nabij Welsh Bicknor, in een crash die geen van de inzittenden heeft overleefd.
Hij liet zijn vrouw, Doreen Lane en twee jonge zoontjes, Simon en David, achter.

Begin jaren 1930 ontwikkelden Blumlein en Herbert Holman een reeks trilspoelmicrofoons, die gebruikt werden door EMI in opnamestudio's en door de BBC in Alexandra Palace.

In diezelfde periode ontwikkelde Blumlein zijn denkbeelden rond wat hij zelf
"binauraal geluid" noemde, tegenwoordig vooral bekend als "stereofonie". Hij kwam op dit idee, toen hij in 1931 met zijn vrouw in een bioscoop naar een van de eerste films met geluid keek. Hij werd afgeleid door het onwerkelijke effect van stemmen die uit één locatie ontsprongen, terwijl de acteurs zelf over het filmdoek bewogen.
De uiteindelijke oplossing die uit Blumlein's veel complexere gedachtengoed naar voren kwam was simpel: in plaats van één microfoon werden er twee microfoons gebruikt, die op een vaste afstand uit elkaar stonden. Hierdoor kon de positie van de stemmen worden vastgelegd, afhankelijk van verschillen in geluidsvolume die de microfoons bereikten. Als de opname dan later werd afgespeeld via een tweekanaalssysteem - met de luidsprekers aan weerskanten van het filmdoek - kwamen de stemmen overeen met de positie van de acteurs op het scherm.
In 1933 verwierf Blumlein een octrooi op dit basisprincipe van stereofonie.












Alan Dower Blumlein





Externalisatie

Blumlein bezigde het woord "stereofonie" nergens in zijn patent, maar hij bediende zich wel van de term "binauraal". Het was reeds bekend, in de 50 jaar die aan Blumlein voorafgingen, dat twee microfoons, geplaatst op ongeveer dezelfde afstand als de menselijke hoofdbreedte en vervolgens aangesloten op een hoofdtelefoon, zeer realistische geluidsafbeeldingen voortbrachten met stabiele richtingsinformatie. Het probleem was echter dat de geluidsbronnen zich allemaal binnenin het hoofd leken af te spelen. In psychologische termen uitgedrukt: zij waren geïnternaliseerd. Wat Blumlein wilde realiseren was een externalisatie van dit binaurale effect, door gebruikmaking van luidsprekers.
Het externaliseren van het binaurale effect over een volledige 360-graden bolvorm is ook vandaag de dag nog steeds de Heilige Graal van akoestiek en geluidsweergave, in het bijzonder voor degenen die virtual reality videosystemen ontwerpen waarbij een geluidstegenhanger nodig is. Het thans slapende IMAX grootscherm 3D-filmsysteem maakt gebruik van oortelefoons, die ongeveer 2,5cm buiten en voor de oren worden geplaatst, evenals van luidsprekers achter het scherm, achter het publiek en boven en onder het scherm, om zo een volledige
(perifonische = rondom één centraal punt gelegen) akoestische bol te creëren. Indien bezitters van een thuisbioscoop in hun thuistheaters bereid zouden zijn om oortelefoons te dragen, in combinatie met luidsprekers, dan zou dit een uiterst effectieve techniek kunnen zijn. Het is evenwel niet een techniek die geschikt is voor het realistisch reproduceren van muzikale gebeurtenissen op een podium, in tegenstelling tot films die perifonie vereisen.

Andere, soortgelijke pogingen tot het externaliseren van het binaurale effect over een volledige bolvorm, dan wel slechts een cirkel, zijn
'ambisonics', varianten van 'surroundgeluid' en tegenwoordig ook een veelheid aan computerbedrijven die werken aan het genereren van virtual reality geluidsvelden voor multimediale toepassingen, zoals die hierboven. Gelukkig is ons en Blumlein's muzikale probleem (theoretisch) duidelijk minder complex, aangezien wij slechts een relatief klein deel van de bolvorm in aanmerking hoeven te nemen: we mogen er immers van uitgaan dat alle directe muzikale geluidsbronnen voortkomen vanaf een enkel podium dat zich uitsluitend vóór ons bevindt. In feite was Blumlein's eerste prioriteit dan ook het creëren van een beter frontaal podiumgeluid ten behoeve van films die in het theater werden vertoond.

Blumlein's patent beschreef dat wat we thans
"stereofonisch geluid" noemen en het werd hem officieel toegekend op 14 juni 1933. Zodoende is de fundamentele stereo-luisterdriehoek intussen meer dan 75 jaar oud.
Dit patent verfijnde, zoals Einstein's relativiteitstheorie, de Newtoniaanse natuurkunde. Het zou daarom zinvol kunnen zijn om de fundamentele concepten waarop de Blumlein-afbeelding is gebaseerd opnieuw te onderzoeken en bij te stellen.
En welk startpunt zou daarvoor nu beter geschikt zijn dan dat van Blumlein zelf!

Stel dat we eens goed naar Newton's verhandelingen zouden kijken, en daar (inderdaad) cryptische commentaren van zijn eigen hand in zouden aantreffen, waarin hij er op wijst dat hij zich ervan bewust is dat zijn wetten betreffende materie, versnelling en zwaartekracht niet geheel en al accuraat zijn bij hoge snelheden en dito massa's. We zouden dan, terecht, kunnen concluderen dat Newton toen al een zeker inzicht in relativiteit had, maar ervoor koos om zijn tijdgenoten niet verder in verwarring te brengen, aangezien zij hun handen al vol genoeg hadden aan het onderscheid tussen massa en gewicht, en eveneens bemerkten dat zijn formules altijd voldoende accuraat bleken om dingen als raketten netjes van de grond te krijgen. Newton's wetten werken vandaag de dag nog altijd prima, ondanks de latere verfijningen van de relativiteitstheorie, en op voorwaarde dat je je niet te druk maakt om ogenschijnlijk minder relevante details.
Zo is het ook met Blumlein. Blumlein's patent is overgoten met bedekte toespelingen op en aanwijzingen naar kwesties die nog zouden gaan komen.


naar boven


















Tekortkomingen

Blumlein besefte heel goed dat zijn nieuwe methode van weergave, met twee relatief ver uit elkaar geplaatste luidsprekers, tekortkomingen bezat. Maar de verbeteringen ten opzichte van mono waren tegelijkertijd zo evident, dat er op dat moment geen reden was om gedetailleerde uitleg te geven over
theoretische onvolmaaktheden. Hij wilde uiteraard ook graag dat zijn patent zou worden toegekend en dat zijn uitvinding zou worden toegepast! Desondanks leek hij zich ook verplicht te voelen om zijn technische nageslacht te laten weten dat hij precies wist wat er goed en wat er minder goed was aan de stereofonische weergavetechniek die hij had uitgewerkt. Voor wat betreft de opnamekant zag hij minder problemen, en hij stelde voor om daar de coïncidente stereomicrofoon (X/Y) toe te passen, alsmede dat wat we thans kennen als de "Blumlein shuffler", twee technieken die later verder zouden worden uitgewerkt in Ambisonics.
Zo schrijft hij in een paragraaf die ingaat op het verschil tussen laagfrequente faseverschillen en hoogfrequente intensiteitsverschillen bij het verschaffen van richtinggevoelige aanwijzingen:

"Het kan worden aangetoond dat faseverschillen, noodzakelijk bij de oren voor de richtinggevoeligheid van lage frequenties, niet uitsluitend worden voortgebracht door faseverschillen bij twee luidsprekers (die beide communiceren met beide oren) -- de haakjes zijn van Blumlein zelf -- maar dat er tevens intensiteitsverschillen bij de luidsprekers nodig zijn om een effect van faseverschil teweeg te brengen."


Wat Blumlein hierboven aangeeft is dat een onvermijdelijke tekortkoming in één geval ook een deugd kan zijn. Dat wil zeggen, hij kon niet voorkomen dat beide luidsprekers bij lage frequenties in gelijke mate toegang hebben tot beide oren (en evenmin dat zij een minder voorspelbare toegang hebben bij alle hogere frequenties), en zodoende werkte hij zijn aanbevolen coïncidente (X/Y) microfoonopstelling uit, die nuttig gebruik maakt van deze luidspreker-overspraak bij lage frequenties opdat er localiseerbaarheid in mogelijk zou worden in de relatief smalle, lage frequentieband,
daar waar het oor feitelijk alleen kan localiseren op basis van faseverschillen tussen de beide oren.

Zodoende werd overspraak een noodzakelijk kwaad in het geval van de coïncidente microfoonopstelling. Maar wat Blumlein nu werkelijk vertelde was dat, indien je microfoons laagfrequente signalen uitsturen die geen faseverschillen hebben (zoals het geval is met alle coïncidente microfoons), de luidsprekers vervolgens de zaak nog konden redden, maar niet zonder dat de op intensiteit gebaseerde localiseerbaarheid van hogere frequenties daarvoor een prijs moest betalen. Hiervan was Blumlein zich weliswaar erg bewust, maar hij kon een en ander niet volledig op waarde schatten, met name ook vanwege de begrensde bandbreedte van de apparatuur waarmee hij (destijds) moest werken.


naar boven















Pardon? Leg dat nog eens uit?

Bestudeer ook de afbeelding rechts, in samenhang met het bovenstaande en het onderstaande.

De manier waarop overspraak van luidsprekers helpt bij de lage frequenties werkt als volgt:
Bij lage frequenties kan aangenomen worden, dat elk geluid dat uit één luidspreker komt eenzelfde geluidsdruk zal opleveren
bij beide oren, aangezien het hoofd zelf geen effectieve hindernis kan zijn voor geluiden met zo'n lange golflengte. Niettemin zal het signaal enigszins in tijd vertraagd arriveren bij het verst verwijderde oor. Als er dan een tweede luidspreker is, die precies hetzelfde laagfrequente signaal afgeeft, dan zal de ontmoeting van dit tweede paar geluidsgolven met het eerste paar een samenvoeging opleveren, die de vorm aanneemt van een nieuwe geluidsgolf. En wanneer twee golfvormen worden samengevoegd die wel een identieke vorm hebben, maar verschillend zijn in amplitude en tevens een vast onderling looptijdsverschil hebben, dan zal het resultaat een nieuwe golf zijn, waarvan de fase is verschoven. Bij het ene oor voegt het luidere signaal zich bij het vertraagde, zachtere signaal. Bij het andere oor voegt het het zachtere signaal zich bij het vertraagde, luidere signaal. Het resultaat zal bij elk afzonderlijk oor bestaan uit identieke amplitudes, maar verschillende faseverschuivingen, en aldus wo rdt er tussen de oren onderling een faseverschil gecreëerd dat in de juiste verhouding staat tot het oorspronkelijke intensiteitsverschil tussen de microfoons.

Vanzelfsprekend kan deze overspraak toch nog zorgen voor versmering van de localiseerbaarheid wanneer je een van de overwegend gangbare, niet-coïncidente X/Y microfoontechnieken gebruikt, zoals de techniek met een kunsthoofd. Het feit dat Blumlein zelf al doorzag dat deze onvermijdelijke overspraak localisatieproblemen zou veroorzaken bij hogere frequenties blijkt overduidelijk uit sommige van de andere citaten hieronder. Hij leek duidelijk ook met dit gegeven te worstelen, terwijl hij zijn tekst voorbereidde.
Het is hoe dan ook een feit dat we vandaag de dag goed beseffen dat deze vorm van communicatie tussen twee luidsprekers en twee oren het voor standaard stereo en diens surround-familieleden onmogelijk maakt om een volkomen realistisch en levensecht podiumbeeld te (her)scheppen!
Oei...


Maar wacht even... er valt nog veel meer te halen bij Blumlein...
Blumlein's aanwijzingen aan zijn audiofiele nageslacht gaan namelijk verder met de opmerking dat,
"de localiseerbaarheid van een virtuele geluidsbron, ten aanzien van het volledige frequentiebereik, slechts op een luisteraar kan worden overgebracht voor posities die tussen de luidsprekers in liggen." Hieruit blijkt dat Blumlein zonder meer besefte dat de breedte van het podium dat hij met luidsprekers kon herscheppen, door overspraak begrensd werd tot de ruimte tussen die luidsprekers -- een serieuze tekortkoming, maar ook één die voor Blumlein niet heel cruciaal was, omdat hij zich vooral richtte op ver uit elkaar geplaatste luidsprekers in grote filmzalen, of in muziekruimtes die tamelijk smalle schermen of podia hadden, in vergelijking tot de diepte van zulke ruimtes.

Dit zijn evenwel niet het soort van observaties die men men normaal gesproken zal toevoegen aan een patentaanvraag. Het is niet moeilijk te begrijpen waarom de maximale breedte van het stereofonische geluidsbeeld begrensd is door de hoek die de luidsprekers onderspannen op de luisterpositie. Laten we er eens van uitgaan dat één enkele geluidsbron, zoals een trompet, zich in het echte leven bevindt op 75° rechts van de luisteraar op het podium. En laten we er voor het gemak ook van uitgaan dat het geluid dat de linkse microfoon in een stereo-opnamesetting bereikt te verwaarlozen is, waardoor er ook geen hoorbaar geluid uit de linker luidspreker komt tijdens het afspelen. Het geluid van de trompet schalt met normale intensiteit uit de rechter luidspreker. Indien de rechter luidspreker zich onder de gebruikelijke hoek van 30° bevindt ten opzichte van de centrale lijn van de normale stereo- luisterdriehoek, dan zal de trompet ook vanuit die 30° positie weerklinken,
maar niet vanuit een hoek van 75°, zoals in het echte leven op het podium. Dit laatste weerspiegelt uiteraard de normale gang van zaken in alle levensechte situaties, waarin we zonder moeite de bron kunnen localiseren van ieder discreet geluid dat beide oren onbelemmerd bereikt, ongeacht waar het zich ook mag bevinden.

Hieronder toont de linker afbeelding datgene wat we onmiddellijk hierboven bespraken.

De rechter afbeelding hieronder toont
een ambiofonische luidsprekeropstelling, waarbij een fysieke barrière tussen de luidsprekers het fenomeen van overspraak door de luidsprekers elimineert, waardoor de hoek van 75° uit de opname ook in de weergave kan worden behouden.


Desondanks hebben velen van ons geluidsopnames gehoord via stereosystemen, waarbij er soms geluiden werden geproduceerd die van buiten de luidsprekers leken te komen!
Sommige audiofielen menen dat, als ze maar aan perfecte opnames, luidsprekers, kabels en electronica zouden kunnen komen, het geluidsbeeld zich tot ver buiten de luidsprekers zou kunnen openen. Ook Blumlein zelf was niet genegen om op dit gebied een nederlaag toe te geven. Hij schrijft, "maar als het gewenst zou zijn om een indruk over te brengen dat de geluidsbron zich heeft verplaatst naar een positie buiten de ruimte tussen de luidsprekers, de regelende (studio-)electronica dan zodanig ingesteld kan worden, dat zij de fase omkeert van de luidspreker die het verst verwijderd is van het punt waar de geluidsbron dient te verschijnen, en dat zal dan afdoende zijn om de gewenste indruk te wekken voor het laagfrequente geluid."
Let vooral op dat woord "laagfrequent"! Dit voorstel is zinvol in een specifieke filmscène, waarin de fase van één luidspreker kortstondig omgekeerd kan worden, om zo de dialoog of een geluidseffect buiten het scherm te laten bewegen, maar we beseffen maar al te goed dat het voortdurend (door electronisch ingrijpen) uit-fase brengen van één luidspreker niet kan werken bij muziekweergave via een stereodriehoek.

Wat Blumlein hier voorstelt is een primitieve vorm van logische sturing, waarmee hij dus feitelijk vooruitblikte op Dolby Pro-Logic! Niettemin heeft hij ook uitgelegd waarom afbeeldingen
soms verschijnen buiten de luidsprekerposities. Elke onopzettelijke fase-omkering van een richtmicrofoon in een opnamemix, één enkele (electronisch geregelde) uit-fase luidsprekerunit, dan wel een grotere faseverschuiving in het scheidingsfilter van een drie- of vierweg luidsprekersysteem, en ook een reflectie van de wand achter een dipolaire luidspreker, kan zelfs ervaren luisteraars ervan overtuigen dat er op de een of andere manier een breder geluidsbeeld kan worden gerealiseerd bij toepassing van de normale stereotechniek. Maar helaas kunnen logische sturing, surround codering en zelfs multikanaals opnamemethoden niet het binaurale ideaal bereiken waar Blumlein naar streefde.


naar boven













Luidspreker-overspraak in beeld gebracht:
(let vooral ook op de veranderende "vorm" van het instrument zelf...)

Hoewel een juiste opnametechniek correct
getimede stereosignalen kan opvangen
(zie bovenhelft afbeelding), zal tijdens conventionele stereoweergave de luidspreker-overspraak
verwarring creëren tussen de twee oorschelpen, alsook kamfiltering van het centrale geluidsbeeld.

Overspraak is onvermijdelijk bij het gebruik van luidsprekers in een conventionele stereo-opstelling.
Artefacten van looptijdverschillen (geluiden die verder moeten reizen naar het tegenoverliggende oor)
veroorzaken
een reductie van helderheid (versmering) en vervorming van het timbre
van het centrale geluidsbeeld als gevolg van kamfiltering.






En er is nóg meer aan de hand...

Tot nu toe heeft Blumlein ons verteld dat de stereofonische weergavemethode twee inherente tekortkomingen bezit. Er is nog een derde probleem, waarvan Blumlein zich ook bewust lijkt te zijn geweest, en wel vanwege zijn gebruik van het woord "laagfrequent" in het laatste citaat.

Het betreft hier een verstoring van de afbeeldingspositie, veroorzaakt door geluiden van hogere frequentie, die de oorschelp raken vanuit hoeken die niet overeenkomen met de feitelijke hoeken van de opgenomen bron. Mogelijkerwijs bemerkte Blumlein een probleem, toen hij probeerde om het zingen van een vogel buiten het podium af te beelden door gebruikmaking van de truc met de fase-omkering. Een hiermee samenhangende probleem betreft
het vraagstuk van de opgenomen ambiance. Blumlein lijkt hier te worstelen met het probleem van het reproduceren van zo'n opgenomen ruimte-ambiance vanuit de correcte richting.

"De gereflecteerde geluidsgolven die zich voordoen tijdens een opname zullen richtinggevoelig worden weergegeven, en zullen dan natuurlijker klinken dan ze zouden doen met een niet-richtinggevoelig systeem. Als zich moeilijkheden voordoen bij de weergave, kunnen die worden verholpen door gebruikmaking van een tweede paar luidsprekers, die ruimtelijk verschillend zijn gepositioneerd en over een ander "modificatienetwerk" beschikken dan het eerste paar."


Hoewel het vocabulaire een beetje anders is, betreft het hier toch een behoorlijk juiste beschrijving van surroundgeluid of 'Ambisonics', en het is eveneens het startpunt voor het ambiance- en localiseringssysteem dat ik
"Ambiofonie" heb genoemd.
Klik op bovenstaande link voor een machtig interessant alternatief voor onze welbekende,
maar desondanks 'gehandicapte' stereoweergave...


Zie verder vooral ook de afbeelding rechts en de twee hierboven.




De menselijke localisering van geluiden is uitsluitend mogelijk door
gebruikmaking van drie (en niet meer) sonische aanwijzingen
(geleiding door botstructuren is hierbij niet inbegrepen):


  • Tijdsverschillen, daaronder inbegrepen fase en de 'randen' van transiënten, tussen de beide oren.
    Dit fenomeen, dat
    ITD (intertime differences) genoemd wordt, omvat eveneens het "precedentie effect" (precedence effect).
  • Geluidsdrukverschillen tussen beide oren, ofwel ILD (inter level differences).
  • Richtinggevoelige effecten, als gevolg van één oorschelp of beide oorschelpen in samenhang.


Elk van deze mechanismen is slechts
effectief binnen een specifiek frequentiegebied, maar deze gebieden overlappen elkaar. De predominantie van de ene over de andere is eveneens afhankelijk van genetische aanleg en de aard van het signaal, bijvoorbeeld een sinusgolf, roze ruis, muziek, omgevingsgeluiden en dergelijke.

Voor breedbandige en complexe geluiden, zoals muziek die live wordt ondergaan, zijn alle drie de mechanismen altijd actief en ze zijn het normaal gesproken met elkaar eens.
Zo'n ervaring wordt dan per definitie omschreven als realistisch en overtuigend of, in termen van de creatieve en artistieke opnamebroederschap, als een gegarandeerde ervaring van fysiologische aannemelijkheid. Indien de drie mechanismen niet consistent zijn begaan we vaak vergissingen op het gebied van localisatie, zoals meestal het geval is bij het luisteren naar een hoofdtelefoon, waarbij de interferentie met de oorschelpen en de schaduw van het hoofd doorgaans resulteert in internalisatie, zelfs indien de ITD, met inbegrip van enige opzettelijke ILD-overspraak, volmaakt is.

Voordat we bij stereofonie aanbelanden wil ik nog de relatieve sterktes bespreken van bovenstaande drie mechanismen. In hun inmiddels klassieke verhandelingen tonen Snow en Moir aan, dat de localiseerbaarheid van complexe signalen door de oorschelpen in het gebied boven 1000Hz enkele graden nauwkeuriger is dan de localiseerbaarheid die uitsluitend is gebaseerd op complexe lage frequenties. Dat wil zeggen, hun proefpersonen konden banden met hoge frequenties localiseren binnen 0,5° nauwkeurig, maar 'slechts' binnen 1 of 2° nauwkeurigheid bij lagere frequenties.
De zuiverheid van localiseren neemt in het algemeen af met dalende frequentie, totdat deze rond 90Hz geheel verloren gaat, zoals ook Bose heeft gedemonstreerd.

Denk hieraan als we het aanstonds over overspraak gaan hebben...


naar boven












de fundamentele basisopstelling voor Ambiofonie





Mechanismen voor localisering

Om de werking van sterofonie te begrijpen is het belangrijk om ervan doordrongen te zijn dat alle drie de mechanismen significant zijn, waarbij ik -- met Keele, Snow en Moir -- zou willen voorstellen dat de oorschelpen de no.1 van deze gelijkwaardige mechanismen zijn. Je zou dit zelf kunnen verifiëren door middel van stromend water in een gootsteen, hetgeen een prima bron is van complexe hoge frequenties. Sluit je ogen om afleiding te vermijden en sluit één oor zoveel mogelijk af, om zo de invloed van ILD en ITD terug te dringen. Tracht vervolgens, vanaf enige afstand, om het geluid van het stromende water te lokaliseren met het ene, nog open oor. Wijs dan het geluid zo precies mogelijk aan, open je ogen en je zult -- gelijk de meeste mensen -- de geluidsbron correct kunnen aanwijzen binnen één enkele graad of daaromtrent. Met beide oren open zul je dat punt volkomen exact kunnen aanwijzen, ondanks het feit dat dit een signaal is waarin duidelijk teveel hoge frequenties vertegenwoordigt zijn om erg veel ITD of ILD in zich te hebben.
Omdat beide oorschelpen het met elkaar eens zijn, in combinatie met de nul-ILD aanwijzing, zal de localisering met gemak accuraat zijn.

Maar, nogmaals, als een weergeefsysteem zoals stereo of 5.1 surround niet in staat is om de ITD-, ILD- en oorschelp-aanwijzingen
gelijktijdig intact aan te leveren zonder al te grote fouten, zal het nooit of te nimmer volledige geloofwaardigheid ten aanzien van de localisering kunnen leveren bij complexe signalen, zoals die van muziek. Wanneer de aanwijzingen inconsistent zijn kan er weliswaar localisering plaatsvinden, maar deze zal fragiel zijn: ze kan per gespeelde noot of instrument variëren, en zulke localisering wordt dan meestal vergezeld van het besef dat de muziek ingeblikt is en diepte, presentie en dergelijke ontbeert. Zulke localiseerbaarheid is dan geen garantie voor natuurgetrouwheid.

Laten we nu eens kijken naar de stereo-luisterdriehoek voor muziekweergave en naar de gebruikte microfoons voor het maken van dergelijke opnamen, om te zien wat er gebeurt met de drie soorten aanwijzingen voor localiseerbaarheid.
In essentie is stereofonie een gehoormatige illusie, precies zoals een optische illusie.
Bij een optische illusie past de artiest tweedimensionale artistieke trucs toe om het brein te stimuleren er een derde dimensie bij waar te nemen die er niet werkelijk is. De Blumlein stereo-illusie is iets soortgelijks: de meeste hersenen zullen een "lijn van geluiden" waarnemen tussen twee afzonderlijke bronnen van geluid. En net zoals bij optische illusies, waarbij we ons er altijd van bewust zijn dat ze niet echt zijn, zal men er ook bij stereofonische geluidsweergave altijd van doordrongen zijn dat die geluiden (er) niet echt zijn: we zullen de stereofonische illusie nooit verwarren met een echte binaurale ervaring. De plaatsing van afbeeldingen op de lijn is een niet-lineaire functie van ITD en ILD, en de lengte van de lijn is begrensd tot de afstand tussen de luidsprekers. (Ik weet het, iedereen -- met inbegrip van Blumlein -- heeft weleens geluiden gehoord die van buiten de luidsprekers komen, maar de ruimte om over het hoe en waarom te strijden is eveneens begrensd, en de werkelijke reden werd hierboven reeds uitgelegd).

Ik wil me in dit artikel richten op het vraagstuk van de ILD / ITD gestuurde schepping van een 'spookbeeld' (illusionair stereobeeld), maar we moeten daarvoor eerst het mechanisme rondom de oorschelpen aanpakken, om het vervolgens weer terzijde te kunnen schuiven.
Ongeacht
waar je precies een luidspreker localiseert, frequenties boven 1000Hz kunnen door beide oorschelpen worden gedetecteerd, zodat de localisering van die luidspreker absoluut accuraat zal zijn, tenzij andere, concurrerende aanwijzingen hier overheen zouden gaan of het oorschelpmechanisme zouden verstoren. In het geval van de stereo-driehoek zullen zowel de mechanismen van de oorschelpen als die van ILD en ITD het met elkaar eens zijn, voor wat betreft de locatie van de luidsprekers. Om die reden klinkt driedubbel monogeluid in 5.1 surround (links, center, rechts ofwel L/C/R) uitstekend, met name voor filmdialogen. In stereoweergave wordt bij centraal geplaatste geluiden de door de oorschelpen geregistreerde "foute" hoek overstemd door het brein, omdat de ITD en de ILD consistent zijn met een centraal geplaatste geluidsillusie, aangezien zij identiek zijn voor elk oor (je zit immers op de sweetspot). Het brein negeert eveneens de onechte hoofdschaduw, omdat de kleuring en verzwakking die deze teweegbrengt symmetrisch is voor centraal geplaatste bronnen, en ook niet groot genoeg is om de sonische stereo-illusie teniet te doen. Op dezelfde manier zal kamerfiltering als gevolg van overspraak, in het hogere frequentiegebied waar de oorschelpen opereren, interfereren met het localiseerbaarheidsmechanisme van diezelfde oorschelpen en zo het brein dwingen om terug te vallen op de twee overblijvende aanwijzingen gerelateerd aan de lagere frequenties. Deze, plus nog veel 'ergere' discrepanties worden bewust of onbewust waargenomen door 'gouden oren', die tijd en geld spenderen aan het streven om ze te elimineren en om stereo volmaakt te maken.
De drang naar vervolmaking van het 5.1-geluid zal nu ook duidelijk zijn.

Neem nu eens de drie frontluidspreker van een 5.1-systeem in ogenschouw: tenzij we het hebben over drie kanelen mono, is hier in werkelijkheid normaal gesproken sprake van
twee stereosystemen naast elkaar. En vergeet niet dat normaal stereo op zich al een behoorlijk fragiele illusie is! Wanneer je naar je gebruikelijke gelijkzijdige stereo-systeem luistert terwijl je hoofd gericht is naar één luidspreker en de andere onder een hoek van 30° staat, zul je niet blij worden. De ILD wordt dan sterk beïnvloed, aangezien de hoofdschaduwen niet identiek zijn: één luidspreker heeft schijnbaar geen hoofdschaduw en de andere heeft er een van 30 graden. De oorschelpfuncties zullen ook navenant verschillend zijn. In een L / C / R opstelling zullen de artefacten van kamfiltering nu op hun ergst zijn op twee locaties bij plus en min 15° in plaats van alleen op 0°, zoals bij gewone stereo. Voor gelijke amplitudes (bijvoorbeeld bij L & C), waar een signaal gecentreerd wordt op 15° zoals reeds in ons kleine experimentje gebeurt, zal de reeds gestoorde stereo-illusie nu zeer verwrongen zijn. De ITD is evenwel nog steeds in orde, en zorgt er deels voor dat er nog steeds een vorm van een sweetspot kan zijn bij 5.1-thuissystemen. Deze verwrongenheid is echter wel de standaard praktijk van 5.1!
Diverse, behoorlijke ingenieuze 5.1 opnamesystemen proberen sommige van deze fouten te corrigeren, maar de resultaten hiervan zijn zeer subjectief en zelfs controversieel. Het is waarschijnlijk ook een geluk dat het bij 5.1 opnames heel lastig is om de ITD te vermijden, aangezien een coïncidente microfoon hoogst zelden in zo'n omgeving wordt gebruikt.


naar boven
































het echte probleem, op weer een andere manier getoond...




Technische uitweiding voor opnametechnici

Alvorens met plaatsing aan de zijkant verder te gaan, zijn er enkele punten die moeten worden opgehelderd aangaande de relatie tussen microfoons en reproductieve overspraak (reproductive crosstalk). Of overspraak zinvol is of niet hangt af van het frequentiegebied in kwestie, en daarmee dus van de localisatiemethode waarop je je baseert. Bij de hogere frequenties, het gebied waar de oorschelpen de boel regelen, is overspraak duidelijk geen voordeel. Het onvoorspelbare patroon van pieken en dalen kan hier op geen enkele manier de localiseerbaarheid vergroten in een stereo- of L/C/R-systeem. Dit geldt zowel voor gebruik van microfoons met tussenruimte en voor coïncidente microfoons.

Stereo overspraak kan een faseverschuiving teweegbrengen bij frequenties lager dan die waarbij het kamfiltereffect overheerst. Dat betekent dat twee sinusgolfsignalen met onderling iets verschillende vertragingen maar vergelijkbare amplitudes zullen samenvallen en een nieuwe sinusgolf produceren, met een verschillende amplitude en fasehoek. Ik blijf erbij dat de faseverschuiving in deze verandering onhoorbaar zal zijn vanaf 90Hz en lager, en niet-bestaand is voor het centrale 10-gradendeel en nagenoeg niet-bestaand voor afbeeldingen aan de
uiterste linker- en rechterzijde. Zodoende is de hoorbaarheid dubieus tussen L/C/R-systemen op zich en eveneens onderling. Stereo-overspraak kan geen ITD veroorzaken voor transiënten in coïncidente microfoonopnames, maar kan de fase verschuiven van midbas en lagere bas. Er is evenwel geen bewijs dat deze vorm van kleine fasverschuivingen hoorbaar zijn of de localiseerbaarheid beïnvloeden. Als er microfoons met tussenruimte worden toegepast, dan is er zeker een ITD en overspraak heeft slechts weinig schadelijke gevolgen, maar evenmin enig voordeel.

ILD is een ietwat ander verhaal. In de lage bas, onder 90Hz, is het faseverschil tussen het directe geluid en het overspraakgeluid te klein (hoofden zijn daarvoor te klein) om enige verandering van betekenis teweeg te brengen in faseverhoudingen, en zullen zodoende van amplitude veranderen bij één oor wanneer de twee signalen worden samengevoegd. Onafhankelijk van de gebruikte soort microfoon is overspraak in de lage bas dus geen issue. Opnieuw houd ik vol dat de zeer lage bas energie bij beide oren nagenoeg hetzelfde blijft, zelfs als de linkse en rechtse signalen verschillen in amplitude zoals bij coïncidente opnamen. Zoals Blumlein al waarnam: naarmate de frequentie stijgt zal het verschil in looptijd (path length) gelijk zijn aan grotere fasehoeken en daardoor zullen, als er een verschil in amplitude is, tussen de speakers de signalen omhoog gaan bij één oor en naar beneden gaan bij het andere wanneer ze aan elke zijde van het hoofd samenvallen. Het is duidelijk dat, als de faseverschuiving oploopt tot 90 graden, ditzelfde mechanisme van overspraak een nadeel zal worden. Deze boost in de midbas scheiding is uitsluitend van toepassing op fantoom-stereobeelden rond 15 graden. In het centrum is er geen overspraak-amplitude assymetrie om voordeel mee te behalen, en op 30 graden, waar de luidsprekers zich hopelijk bevinden, zal de stereo kanaalscheiding ervoor zorgen dat overspraak weinig toe te voegen of weg te nemen heeft.

Als er microfoons met tussenruimte worden gebruikt kan de ILD bij lage frequenties minimaal zijn, in het bijzonder bij omnidirectionele types. Maar laten we aannemen dat er boven 90Hz een substantiële ILD en TLD zijn. In dat geval zal het laagfrequente effect van de overspraak-fase verandering tamelijk onvoorspelbaar zijn. Opnieuw kan er in het 15-graden gebied sprake zijn van een verbeterde basscheiding, maar de door ITD geïnduceerde faseverschuiving zou dit kunnen opheffen.
Samengevat: overspraak is werkelijk alleen ongewenst in het geval van coïncidente microfoonopnamen voor stereo, zoals Blumlein reeds schreef, en dan alleen indien ze beperkt zijn tot frequenties onder ongeveer 300Hz, zoals ik claim.





 

Localisatie van Surround Geluid

Laten we nu eens kijken naar de localisatie van surround geluid. Het spreekt vanzelf dat als een monosignaal wordt geplaatst op 110 graden, dit kan worden gelocaliseerd door gebruikmaking van de oorschelpen, ILD en ITD, zelfs als men naar voren kijkt. Tussen de twee surround achterluidsprekers is er feitelijk een stereopaar dat 140 graden overspant (zie de afbeelding rechts). In die situatie zullen, als er veel hoogfrequente energie aanwezig is, de oorschelpen deze luidsprekers localiseren, en het zal voor sommige mensen moeilijk zijn om geluid
direct achter of in de centrale regionen te horen. Het extra achterkanaal bij een 6.1 opstelling kan dit oplossen, maar de L/C/R anomalieën die hierboven werden aangehaald ten aanzien van de voorste kanalen zullen hier dan ook van toepassing zijn. Als er echter een echte ITD en ILD tussen de achterluidsprekers is, dan zal het theoretisch mogelijk zijn om een even breed geluidsbeeld te horen tussen de achterluidsprekers als mogelijk is bij de frontale stereo-illusie. Maar de overspraak, en daarmee ook de kamfiltering, zal extreem zijn bij deze hoek van 140° en zal reeds bij een lagere frequentie inzetten, om dan te interfereren met de ILD vanaf 800Hz en lager. Als er ITD is dan kan dit helpen, maar dan moeten de luidsprekers optimaal worden geplaatst, of dient de vertraging te worden aangepast. Als 140 graden een goede hoek zou zijn om een stereobeeld te scheppen, dan zou dat uiteraard al lang geleden algemeen zijn toegepast...

We zullen tenslotte bekijken wat er zal gebeuren als we zouden proberen om een geluidsbeeld te positioneren tussen een frontluidspreker en een luidspreker op 110 graden aan dezelfde kant, terwijl we voorwaarts kijken (dit is dus het geval tussen front L en surround L, resp. front R en surround R in de afbeelding rechts).
Voor wat betreft de oorschelpen: de oorschelp die naar de luidsprekers wijst kan perfect discreet localiseren tussen deze luidsprekers als de signalen verschillend zijn. Als ze echter samenhangend of identiek zijn zal het brein andere aanwijzingen benutten om te localiseren. Er zouden een paar zeldzame individuen kunnen zijn die in staat zijn om hoogfrequente fantoombeelden te localiseren tussen deze luidsprekers,
door gebruik te maken van slechts die ene oorschelp, maar ik zelf kan dat niet en ik ken ook niemand die dat kan. De hogere frequenties reizen eveneens rond het hoofd en produceren een hoofdschaduw, waardoor het brein in elk geval wel in staat is om vast te stellen dat de bron zich aan de luide zijde bevindt.

Als er een looptijdsverschil bestaat, dan zullen de twee signalen van elke luidspreker de blootgestelde gehoorgang bereiken, zich samenvoegen en zinloze rommel creëren, terwijl een door de hoofdschaduw gecreëerde zinloze rommelversie van dit looptijdsverschil eveneens het verafgelegen oor bereikt. In essentie zal, ongeacht het opgenomen tijdsverschil, de ITD die het brein waarneemt altijd de ITD zijn die is gebaseerd op het plaatsingsvermogen van één oor. Dit mechanisme is afdoende om de luide zijde te localiseren, maar het maakt exacte localisatie tussen de twee luidsprekers onmogelijk.

Als er een niveauverschil bestaat, dan bereiken de twee signalen van elke luidpreker de blootgestelde gehoorgang en zullen zich samenvoegen om zinloze rommel te creëren, alsmede een door de hoofdschaduw gecreëerde versie van deze zinloze rommelversie van dit niveauverschil, die dan het verafgelegen oor bereikt. In essentie zal, ongeacht het opgenomen niveauverschil, de ILD die het brein waarneemt altijd de ILD zijn die is gebaseerd op iemands hoofdschaduw. Dit mechanisme is, zoals boven, wederom afdoende om de luidere zijde te localiseren, maar het maakt exacte localisatie tussen de luidsprekers tot wensdenken.

Dat het bovenstaande scenario min of meer correct is wordt ondersteund door het feit dat de industrie maar bezig blijft om steeds meer luidsprekers toe te voegen om deze tekortkomingen te corrigeren. Intussen hebben we de achter-centerspeaker erbij gekregen (6.1), hoogtespeakers voor en achter (die uitbreidingen zijn van 5.1. / 6.1 / 7.1), er liggen 10.2 voorstellen, en we hebben ook Atmos.



vertaling en bewerking door Toine Dingemans, 13 januari 2018.



naar boven








voorgeschreven 5.1-5.2 / 6.1-6.2 / 7.1-7.2 opstellingen

en nog zal het niet afdoende kunnen zijn...