Alacsonyabb felbontás, jobb hangminőség?

Koscso Ferenc
6 min readAug 5, 2024

--

Az alábbi poszt a holland TRPTK hangfelvétel kiadó vállakozás honlapján megjelent angol nyelvű írás fordítása. Írta: Brendon Heinst október 21-én, 2022.

Az eredeti cikk megtalálható: Lower Resolution, Better Sound Quality? • TRPTK oldalon.

Igényes hangfelvételkészítő kiadóként folyamatosan keressük az eszközöket és technikákat, amelyek segítségével közelebb kerülhetünk álmaink hangminőségéhez. Ez oda is vezethet, hogy a jobb minőségű eléréséhez, meg kell változtatnunk a teljes gyártási láncunkat, akár úgy is, hogy közben csökkentjük a mintavételezéseket.

Ennek a történetét és okait mesélem most el.

24 bitesről 32 bites lebegőpontosra

A TRPTK kezdetei óta, mostanáig, minden albumunkat DXD 352,8kHz / 24 bit-ben vettük fel, és 32 bit lebegőpontos formátumban masztereltük. Körülbelül másfél évvel ezelőtt vettük észre először, hogy az akkoriban használt digitális audio munkaállomásunk (a Merging Technologies Pyramix, az iparágunkban nagyjából mindenki által használt szoftver) 32 bites lebegőpontos kimenete drámaian jobban szól, mint a 24 bites kimenete. Furcsa, gondoltuk, mivel 24 bit több, mint bőséges a dinamikatartomány szempontjából (egészen pontosan 144 dB), és a különbség olyan nagy volt, hogy nem tudtuk csak a szóhossznak vagy magának a dinamikatartománynak tulajdonítani. Valami másnak kellett itt szerepet játszania. Elvégeztünk hát egy kettős vak tesztet, ahol a maszter-t 24 bites és 32 bites lebegőpontos módon is exportáltuk, és lejátszottuk a választott szoftverünkön, a Roon-on keresztül. Az egész csapatunk hallotta a különbségeket, és szinte minden alkalommal a 32 bites lebegőpontos verziót részesítették előnyben.

Az egyetlen dolog, amiben ezeknek a fájloknak különbözniük kellene egymástól, az az, hogy a 24 bites verzióban valamilyen ditheringet/zajformálást alkalmaznak, hogy figyelembe vegyék a szóhosszcsökkentést. Így hát elvégeztünk egy újabb tesztet. A streamert úgy állítottuk be, hogy a 32 bites lebegőpontos verziót automatikusan 24 bitesre csökkentse/ditherelje/zajformálja, így két különböző 24 bites verziót hasonlítottunk össze: az egyiket a masztering szoftverünk, a másikat a streaming szoftverünk hozta létre. Találd ki, melyik nyert?

A Roon.

Méghozzá elég nagy különbséggel.

Mivel úgy gondoltuk, hogy a streaming-szoftverünk jobb munkát végzett a dithering/zajformálás során, mint a mastering szoftverünk, keresni kezdtük van-e olyan szoftver, amely ezt még jobban tudja csinálni. Hosszas kísérletezés után, mindenféle szoftver kipróbálása után rájöttünk, hogy a Weiss Engineering Saracon lehet a megoldás. Az azonos 32 bites forrásból exportált 24 bites DXD fájl és a Pyramixban létrehozott 24 bites fájl összehasonlítása megdöbbentő volt. Nem számítottunk ekkora különbségre. Valójában olyan nagy volt a különbség, hogy úgy döntöttünk, hogy “frissítjük” a teljes katalógusunkat, visszamegyünk az összes eredeti munkamenethez, exportáljuk a 32 bites lebegőpontos kimenetet, majd a Saracon segítségével létrehozzuk a letölthető fájlokat. (Ez a folyamat egyébként már befejeződött, így a boltunkban található letöltések többsége a “frissített”.)

Arra is rájöttünk, hogy amikor bármilyen DSP-t alkalmazunk (szobakorrekció, mintavételezési frekvencia konverzió vagy bármi más) a streaming/lejátszó szoftveren keresztül, akkor jobb, ha ezt az eredeti nyers 32 bites lebegőpontos kimenetből tesszük, mint a 24 bites verzióból, így elkezdtük a 32 bites letölthető változatot is kínálni.

Úgy tűnt, hogy az utunk itt véget ér.

A DXD-től a DSD256-ig

A Saracon puszta konverziós minőségétől lenyűgözve azon tűnődtünk, hogy vajon tudjuk-e használni ezt a megoldást arra, hogy egy formátumban rögzítsünk, és egy másikban szerkesszünk/keverjünk/mastereljünk. Például az ADC-k (a 16 DXD/DSD256 csatornával felszerelt Merging Technologies Hapi II) DSD256-on futnának felvétel közben, majd amikor eljön a szerkesztés, a keverés és a masztering ideje (amit DSD-ben nem lehet elvégezni), minden felvett médiát valamilyen PCM formátumba (352,8kHz 32bit vagy 64bit lebegőponton) konvertálnánk. Ez a DXD-ben történő rögzítéshez képest is jelentősen jobb hangminőséget eredményezett, a részletgazdagság és az impulzusválasz tekintetében! Nagyon örültünk, amikor ezt felismertük, és ismét ennek megfelelően változtattuk meg a felvételi és masztering láncunkat. Mindezt természetesen a kiváló hangminőség érdekében!

Egy lépés előre, kettő hátra?

Természetesen kíváncsi elmém azon töprengett, hogy meddig mehetnénk még tovább.

Talán felvehetnénk DSD256-ban, majd szerkeszthetnénk/keverhetnénk/maszterelhetnénk rendkívül magas mintavételi frekvencián és bitmélységen, hogy a folyamatnak ez az egész lépése hangzásilag még transzparensebb legyen?

Vettünk egy DAC-ot, amely képes ilyen felbontást kezelni, és elkezdtünk kísérletezni az utómunkával (szerkesztés/keverés/maszterelés) 705,6kHz 64bit lebegőpontos frekvencián. Ehhez meg kellett változtatnom a mastering szoftveremet, mivel a Pyramix csak 352,8kHz 32bit lebegőpontig képes. A Cockos Reaper-t választottam, egy részben nyílt forráskódú szoftvert, amely a kávéfőzés kivételével szinte mindenre képes. Ismét hallottunk néhány javulást az akkori szoftverünkhöz képest. Fantasztikus! Ismét megváltoztattuk az egész mastering láncot, hogy ezt a lépést is belevegyük, mindezt ismét a még jobb hangminőség érdekében.

Összefoglalva tehát:

három elemet változtattunk meg:

- a mintavételi frekvenciát (megduplázva 352,8 kHz-ről 705,6 kHz-re), az összes érintett feldolgozás, valamint

- a kimeneti fájlok bitmélységét (megduplázva 32 bites lebegőpontról 64 bites lebegőpontra), és a

- szoftvert, amelyben az utómunkálatokat végeztük (Pyramixről Reaperre).

Természetesen kíváncsi voltam, hogy e három közül melyik befolyásolja leginkább a hangminőséget, ezért létrehoztam egy másik kísérletet, amelyben egy csomó különböző masztert készítettem, az alábbi változók minden kombinációjával:

- Mintavételi frekvencia (352,8 kHz és 705,6 kHz), a feldolgozás bitmélysége (32 bites lebegőpontos és 64 bites lebegőpontos).

- A kimeneti fájl bitmélysége (32bit lebegőpont és 64bit lebegőpont)

Használt szoftver (Pyramix, Reaper és Steinberg Nuendo)

Kiterjedt hallgatási tesztek után azt találtam, hogy nagyjából mindig a Reaper vagy a Nuendo fájlokat részesítettem előnyben, de furcsa módon sok esetben a 352,8kHz-es verziókat is előnyben részesítettem a 705,6kHz-es verziókkal szemben. Ez meglepett. Hogyan lehetséges?

Nos, az egésznek köze van a felvételbe történő beavatkozáshoz.

Természetesen szeretjük a lehető legkevesebb beavatkozást alkalmazni, de bizonyos esetekben egyszerűen muszáj valamit tenni. Például olyan projektekben, amelyekben nem csak a fő mikrofonkészletet használjuk, érdemes egy kis EQ-t használni a közelmikrofonozás során, hogy kiszűrjük az alacsony frekvenciájú zajokat, illetve hogy a keverés tisztasága, arányai megmaradjanak. Vagy a rendkívül dinamikus projekteknél szükség lehet némi rendkívül finom dinamikai beavatkozásra, hogy a csúcsok ne torzítsanak, és hogy minden hallható szinten maradjon.

Észrevettük, hogy minden alkalommal, amikor bármelyik beavatkozást használtuk, a 705,6 kHz-es verziók rosszabbul szóltak, mint 352,8 kHz-en, ami számomra egy egyértelmű dolognak tűnik: ezek a pluginek nem tudják kezelni a 705,6 kHz-et, és ezért a bemeneten és a kimeneten egyaránt mintavételezési konverziót alkalmaznak.

Azzal, hogy 352,8kHz-en maradtunk, az összes plugint a maximálisan megengedett felbontáson tudtuk használni, így nem volt szükség a mintavétel konverzióra.

Miért meséltem el ezt a hosszú és unalmas történetet?

Nos, először is azért, hogy megmagyarázzuk, miért változtattuk meg ismét az egész gyártási láncunkat, de ezúttal nagyon hosszú távra. Számos felbontáson, mintavételi frekvencián, bitmélységen, szoftvercsomagon, pluginen és feldolgozási láncon mentünk keresztül, de végül ott kötöttünk ki, ahol most vagyunk.

Jelen állás szerint a gyártási láncunk a következőképpen néz ki:

- először minden projektet DSD256-ban rögzítünk, mivel ez az a felbontás, amelyen az analóg-digitális átalakítóink a legjobban működnek.

- Ezután ezeket a DSD256-os fájlokat, konvertáljuk PCM 352,8 kHz-es 64 bites lebegőpontos PCM-re, hogy olyan formátumban dolgozhassunk, amely a lehető legközelebb áll a hangzásbeli transzparenciához.

- Ezeket a fájlokat ezután a Nuendo-ba, egy csúcskategóriás utómunka szoftverbe visszük, ahol az összes szerkesztést és keverést elvégezzük.

- A kimenetet egy másik, WaveLab nevű szoftverbe visszük (ugyanazok az emberek készítették, akik a Nuendót is), ahol masztereljük a végterméket.

- A nyers 352,8 kHz-es, 64 bites lebegőpontos 64 bites kimenetét egy fájlba exportáljuk, és a Weiss Saracon segítségével készítjük el az összes letölthető albumunkat, amelyet a weboldalunkon találsz.

Mit jelent ez Önöknek, kedves hallgatóinknak?

- Először is azt, hogy a néhány 705,6kHz-es albumot, amelyet eddig is kínáltunk, 352,8kHz-es változatokra cseréljük, amelyek jobban szólnak, mint 705,6kHz-es társaik.

- Azt is jelenti, hogy azok számára, akik saját DSP-t vagy mintavételi frekvencia átalakítást szeretnének alkalmazni, a nyers 64 bites lebegőpontos letöltéseink is elérhetőek lesznek, amelyek DSP-vel együtt használva kissé jobb hangminőséget kínálhatnak.

- 705,6 kHz-es verziók idővel eltűnhetnek a weboldalunkról a jobb hangzású 352,8 kHz-es megfelelők javára.

Melyik formátumot töltsem le?

Szinte minden esetben a 352,8kHz-es, 24 bites FLAC fájlt ajánljuk. Ez viszonylag kompakt, és mivel 64 biten masztereltük, majd Saracon segítségével konvertáltuk, a hangminőség pedig egészen elképesztő. Ha kalandvágyó vagy, és szívesen kísérleteznél saját DSP hozzáadásával, mintavételezési frekvenciakonverzióval, ditheringgel vagy zajformálással, akkor nézd meg a 64 bites lebegőpontosokat, hiszen így legalább egy konverziós lépést megspórolsz a folyamat során.

Ennyi a történet.

Nem érdekel a számháború, nem ez az oka az új munkafolyamat kialakításának.

Csak a hangminőség érdekel.

Reméljük, Ön is így van ezzel.

A TRPTK webshopjának címe: Shop () • TRPTK

--

--

Koscso Ferenc
Koscso Ferenc

Written by Koscso Ferenc

Solutions for Broadcast and Streaming System Integration, VR/AR/AI, Pro AV, High-End Audio, Inventor of My Reel Club Project

No responses yet