Levels og loudness – 3. del
Skrevet: 14. december 2011 Arkiveret i: Lydteknik | Tags: compressor, digital, dithering, dynamics, headroom, loudness, LUFS, lyd, Lydteknik, Mastering, mix, musik, R128, støj 1 Comment »I dette sidste afsnit i min lille serie om levels og loudness vil jeg samle op på et par begreber og teknikker der relaterer til emnet. Der er rigtig mange aspekter der kan være svære at komme til bunds i, men jeg har forsøgt at beskrive nogle af de problematikker jeg synes der er specielt relevante for os der arbejder med lyd på et dagligt praktisk niveau.
DBFS – decibel i forhold til Full Scale.
Jeg har nævnt begrebet en gang eller to i de foregående artikler, så det er vel på sin plads at fortælle lidt om hvad det er. DBFS er en skala til at beskrive niveauer i et digitalt system. Full Scale henviser til det højeste tal vore system kan klare. Hvis vi tager vores 4-bit computer fra 1. del vil den øverste værdi være 15 der som bekendt hedder 1111 i binære tal. På dBFS-skalaen kalder man den øverste værdi for 0 og alle andre lavere niveauer beskrives med et minus foran, fx -6dBFS eller -18dBFS.
De fleste harddiskrecording systemer bruger en eller anden variant af dBFS metre, men jeg vil anbefale at man anskaffer sig en dedikeret meter-plugin til mere alvorligt mix og mastering. Jeg bruger som tidligere nævnt dette fra Nugen Audio.
Dynamikområde og dithering
Dynamikområdet er forholdet imellem det kraftigste og det laveste niveau et system kan klare. I et digitalsystem er det øverste niveau 0 dBFS, fordi alle bits hedder 1. Det laveste niveau er, teoretisk set, når alle bits står i nul (0000 i vores 4-bit eksempel), men det er ikke helt sådan i praksis. Vi har nemlig et støjgulv i vores system.
I analoge optagesystemer som fx båndoptagere kommer støjen, i form af sus, fra bl.a. magnetbelægningen på båndet og den øvrige elektronik i maskinen. Man definerer derfor det laveste niveau i båndoptageren som det laveste niveau man kan høre, uden at det bliver overdøvet af det støjgulv maskinen naturligt har. I et digitalt system er der også et støjgulv, omend det er meget lavere. Støjen kommer fra kvantiseringsfejl.
Som I måske kan huske fra 1. del kan vores computer kun gemme vores samplede værdier i en række trin. Antallet af trin er defineret af hvor stor bitopløsningen er. Vores oprindelige analoge lyd har ikke trinvise niveauer og vi er derfor nødt til at tvinge vores samplede niveauer ind på nærmeste “bit-trin”. Det er i praksis en forvrængning af signalet, og det skaber en svag støj, kaldet kvantiseringsstøj, som definerer det laveste niveau i systemet. Kvantiseringsstøj er meget svagt, men hvis vores lydoptagelse har mange svage passager kan det blive tydeligere. Problemet med kvantiseringsstøj er at det er repeterende. Hver gang vores sample har værdien 4.6 vil det blive kvantiseret til 5 og den type gentagende støj kan vores ører ikke lide. Man kan løse problemet ved bevidst at tilføre “tilfældig” støj og på den måde “mudre” billedet en smule. På den måde bliver 4.6 nogle gange til 4 andre gange til 5 og maskerer den repeterende kvantiseringsstøj. Den proces kaldes dithering og kan faktisk ret effektivt dæmpe støjen og dermed udvide systemets dynamikområde. Dithering kan også bruges når vi skal have konverteret vores 24-bit mixfil til 16-bit så den kan komme på en CD. I den proces skal der jo smides en hel del “trin” væk, med deraf følgende kvantiseringsstøj.
Kvantiseringsstøj bliver også tilføjet hver eneste gang vi processerer vores materiale med fx en equalizer- eller compressorplugin, og med mange spor kan der ophobe sig en del “fejl” i vores projekt. Det er et godt argument for at holde pluginforbruget på et minimum og blive bedre til at udnytte dem man så faktisk bruger.
Den typiske processeringsteknik i de fleste harddiskrecordingsystemer kaldes fixed point. Den fungerer sådan set fint, så længe bitopløsningen er høj, fx 24 bit.
Der findes dog en anden teknik hvor man gemmer tallene på en lidt mere kompleks måde. Den kaldes floating point. Fordelen ved floating point processering er at “trinnene” er meget mindre og kvantiseringsfejlene bliver derfor væsentligt færre. Bagsiden ved floating point er at det bruger mere computerkraft og ofte er dyrere at lave. Men nutildags hvor computerne er rimeligt kraftige kan det godt betale sig at gå efter plugins der er i stand til at arbejde med floating point hvis man vil optimere sin lyd. Gode plugins har mulighed for at arbejde med 32-bit floating point.
Headroom
Når man mixer et projekt er det god skik ikke at mixe helt op til nul – altså at det samlede niveau ofte er oppe i nærheden af det øverste peak. Der er flere grunde til at det er en god idé. Der er problematikken med intersample peaks som nævnt i 2. del og hvis man skal aflevere mixet til mastering skal der også være lidt plads eller headroom op til nul. På den måde har masteringteknikeren mulighed for at booste visse frekvensområder, hvis han finder det nødvendigt, uden at niveauet så ryger op og clipper. Jeg plejer at lægge mit mixniveau så det peaker omkring -3 dBFS og løfter til sidst niveauet helt op med en masterlimiter der kan håndtere intersample peaks når jeg mastrer.
Til sidst…
Det var en lille gennemgang af diverse emner vedrørende levels og loudness.Der er mange ting at være opmærksom på, men det er selvfølgelig vigtigt først og fremmest at bruge sine ører og lytte til materialet. Derudover er det vigtigt at være opmærksom på at højt ikke nødvendigvis er lig med godt. Jeg har vist flere gange antydet at jeg synes at niveauerne på moderne musikproduktioner er gået over gevind og at lytteoplevelsen lider rigtigt meget under det. Jeg vil håbe at det er en trend der forsvinder igen, og at den nye EBU-R128 standard kan være med til at skubbe på den udvikling. Det er som om at de kraftigt komprimerede produktioner nærmest lyder lavere hvis de skal leve op til -23 LUFS, så husk at gemme dine mixfiler, hvis du skal til at mixe hele din musikproduktion om til den nye standard.



Hej Morten.
Mange tak for ganske intrasant læsning og ikke mindst gode tips, tricks og viden.
Jeg sad netop og læste dit indlæg 3 om loudness, og da jeg synes alt andet du har skrevet har været lige i skabet, ville jeg blot indskyde en lille rettelse som i min verden er ret vigtig i forståelsen af den digitale bitstrøm og dBFS.
I min verden er det højeste lydniveau, altså 0 dBFS enten 1111 (den positive halvperiode af det analoge signal) eller 0000 (den negative halvperiode).
Det laveveste signal i den analoge verden er jo rent 0V, men da vi ikke arbejder med negative bit, er denne værdi jo forskudt til digital værdi 7,5 i 4-bit systemet – dette er der ikke noget der hedder, så enten 7 (0111) eller 8(1000) alt efter om systemer er calibreret i en positiv eller negativ retning.
Håber du forstår min tanke. Synes som sagt du laver rigtig gode artikler, og synes dette er en vigtig lille detalje.
Mvh Henrik Christiansen