De liefde voor muziek
Ik ben een ontdekker, ik hou er van om in iets nieuws te duiken, het te doorgronden en me te laten verrassen. Soms zijn het kleine weetjes en soms zit er een heel verhaal achter, ben je verwonderd. Eens ik spring, laat het me niet los en is elk besef van tijd ver te zoeken. Heerlijk.
Een maand geleden was ik op ESPC, de jaarlijkse tech-conference rond Microsoft technologie. Een ontdekkingsreis voor techies. Meestal plan ik dan minuscuul het verloop van de dag om niets te missen. En soms loopt dat fout…of juist niet? De grootste verrassingen zitten vaak in kleine hoek, zo bleek ook dit jaar. Eén van de sessies die ik wilde volgen was helemaal vol gelopen…Noodgedwongen moest ik een uurtje in de sponsorruimte rondhangen voor de volgende sessie op de planning / voor ik mijn schema weer kon oppikken. Verloren tijd zou je denken, maar niets is minder waar gebleken. Ik belandde in een begeesterend pleidooi van 2 power-vrouwen met de boodschap: iedereen is uniek, heeft een eigen verhaal dat de moeite waard is. Een zaadje was geplant… Wat was mijn verhaal?
Ik hou van muziek en geluid. Het heeft iets magisch, onverklaarbaars en tegelijkertijd zit het vol techniek. Mijn hele leven is het al een onuitputtelijke bron van ontdekkingen en verwondering. De laatste jaren dook ik verder in de verwondering met een opleiding tot geluidstechnicus. Daarnaast prijs ik me gelukkig elke dag met technologie bezig te mogen zijn. Het is een plaats waar je de ‘kracht van verandering’ echt door de aderen voelt stromen. Terwijl ik op zoek ben naar de beste manier om met de nieuwste ontwikkelingen intuitieve oplossingen te bedenken voor onze klanten, vliegen de uren voorbij.
Die twee ingrediënten komen samen in deze korte blogreeks waar ik als geluidstechnicus een kijkje neem onder de motorkap van Microsoft Teams.
Kom mee op mijn ontdekkingsreis, wees verwonderd en pik wat handige weetjes mee over geluidsonderdrukking om lastige echo’s (of kinderen) uit je geluid te filteren, muziek door te sturen of je volgende webinar optimaal op te nemen.
Microsoft Teams meeting
In mijn vrije tijd ben ik gepassioneerd door geluid. Mooie geluiden doen het haar op mijn armen recht staan en geven me rust en inspiratie. Tussen 9u en 18u zorgt de Spotify playlist voor focus tijdens het thuiswerken maar tijdens Team calls heb ik soms het gevoel in een blikken doos beland te zijn. Niet iedereen beschikt immers over een goede verbinding, grote bandbreedte, performante laptop of goede smartphone. En toch moet het geluid voor iedereen goed verstaanbaar zijn.
Mijn haar gaat er ook van recht staan, maar het gevoel is wel heel anders. En toch hoeft dat helemaal niet zo te zijn!
In Microsoft Teams zit heel wat technisch vernuft om zelfs in de moeilijkste omstandigheden, met lawaaierige huisgenoten of ronkende computers, een optimaal geluid tot bij je collega’s of klanten te krijgen.
Hoe gaat dat in zijn werk? Best nifty! Net zoals we dit kennen bij CD’s of MP3’s wordt het geluid eerst omgezet naar een reeks bits via een CODEC. Hoe meer bits, hoe beter de kwaliteit. Hoe minder bits, hoe slechter het geluid.
Hoe kan je dan met minder bits geluid toch verstaanbaar doorsturen? Door niet-essentiële frequenties er uit te filteren. Je kleedt het geluid als het ware uit tot zijn essentie. Denk aan de klank van een telefoongesprek: perfect te verstaan, maar niemand wordt warm van dat scherpe metaalachtige geluid.
Om van die metaalachtige klank af te raken moeten ook niet-essentiële frequenties weergegeven worden (wide-band quality). En daar zit het vernuft!
De Microsoft Teams CODEC (SATIN) bevat een AI-model dat getraind werd op een groot aantal gesprekken. Dit stelt Teams in staat om met slechts enkele stukken van het totale frequentiebereik bij de ontvanger de weggelaten frequenties opnieuw te genereren. Het geluid wordt bij zender uitgekleed tot de essentie en bij de ontvanger intelligent opgepoetst om het oorspronkelijke geluid opnieuw te benaderen. En dat in near-realtime, zelfs op je smartphone!
Hoe indrukwekkend dat is, zien we als we er de cijfers naastzetten… Onderstaande tabel geeft de bitrates weer die we allemaal gebruiken wanneer we een muziekje opzetten:
- CD’s= 1411 kbps
- MP3 = 96-320 kbps
- Spotify = 96-160 kbps
- Skype = narrow-band op minimaal 6 kbps
- Microsoft Teams = super wideband op 6 kbps!!!
Als je tot hier geraakt bent, heb je wat voorbeelden verdiend
Hoor zelf het verschil:
Zelfs trage verbindingen kunnen hierdoor natuurgetrouw een stem overbrengen, wat maakt dat je ook vanuit plaatsen met een minder goede dekking toch nog een kwalitatieve geluidsbeleving krijgt.
Corona was me er eentje…Allen thuis voor de computer. De kinderen helemaal onder de stress want mama/papa hadden een meeting. Iedereen op de tippen van zijn tenen om maar geen ongewenste geluiden te produceren. Gedaan met luid door de legoblokken te zoeken en dochterlief, cancel alle optredens van Barbie maar. Ellelange meetings werden de alleenheerser in het huis. Ondertussen kunnen de kindjes terug naar school maar trotseren we ook post-corona niet zomaar de file. Gelukkig is Teams blijven groeien om thuiswerk te ondersteunen.
Professionele geluidsopnames worden in anechoïsche, goed geïsoleerde, echo-vrije ruimtes geregistreerd met dure microfoons die het geluid optimaal vastleggen. Dat geluid wordt op zijn beurt nog eens door een hele reeks apparatuur gestuurd om het geluid verder bij te schaven.
In onze Teams meetings registreren wij ook geluid, maar vaak niet in optimale omstandigheden. De echo van de kamer, een goedkope, ingebouwde microfoon, randgeluiden van collega’s, kinderen…allemaal zorgen ze er voor dat het geluid suboptimaal geregistreerd wordt.
Toch slaagt Teams er met de ‘noise suppression’ functionaliteit, die eerder dit jaar geïntroduceerd werd, in om dit geluid heel wat te verbeteren. Duik even mee in de instellingen van Teams!
- Schakel je de geluidsonderdrukking in, dan analyseert Teams het geluid aan de hand van een speciaal daarvoor getraind deep neural network. Randgeluiden worden weg gefilterd zodat alleen de spraak overblijft. Traditionele algoritmes filteren enkel eenvoudige stationaire ruisbronnen weg zoals een consistent ventilatorgeluid. De SATIN CODEC herkent echter het verschil tussen randgeluiden en spraak en onderdrukt niet-stationaire geluiden zoals toetsenbord aanslagen, het kraken van voedselverpakkingen of achtergrondmuziek.
Een paar voorbeelden:
- Zonder geluidsondrukking: je hoort achtereenvolgens een reeks geluiden zoals witte ruis, een 440Hz sinus, telefoon toetsen en spraak. Zoals onderstaande grafiek laat zien, komen alle geluiden door.
- Zonder geluidsonderdrukking: je hoort dezelfde reeks geluiden met deze keer op de achtergrond muziek .
- Met geluidsonderdrukking: niet alleen de ruis is weg, maar ook de muziek! De stem komt wel volledig door. Wat opvalt is dat de muziek de stem licht kleurt.
Best indrukwekkend toch! En dat is niet alles. Ook echo’s en onderbrekingen worden door de CODEC herkend om het geluid zo optimaal mogelijk over te brengen.
Nieuwe AI-gebaseerde audiokenmerken optimaliseren hoe je boodschap wordt ontvangen. Klik op de link voor meer info.
Nou, gedaan met ploeteren! Zet die camera uit en haal die stofzuiger maar boven…nobody knows!
Ben van Mol
Solution architect