Gondolatok a DSD felkonvertálás kapcsán

4 min readNov 9, 2024

Egy facebookos poszt kapcsán éreztem szükségesnek, hogy leírjam a tapasztalataimat a felkonvertálási technológiák és lehetőségeik kapcsán.

Akkor érdemes használni ezeket leginkább, ha a D/A konverterünk optimális működéséhez valamilyen magasabb mintavételezési tartomány szükséges.

EMM Labs DA2 konverter és optikai csatlakozású streamer

Az első, Apple OS X-be épített felkonvertálás felfedezése és használata után (olyan 2008, 2009 táján) igazán komolyan kb 2012-től kb 2020-ig kísérleteztem a felkonvertálással, nagy segítséget kapva Jussi Laakotól, a Hqplayer fejlesztőjétől is illetve Jord Groentől, a Pink Faun alapítójától és több ismert szoftver fejlesztőtől is (Audio Linux például).

Építettem, használtam a 18 Xeon magos, 32 GB GPU-s Apple iMac Protól kezdve HP z8 munkaállomást, sok Xeon magos, NVIDIA GPU-s gépen keresztül erre dedikált Audio Linuxos gépeket is, egy, kettő, illetve 3 gépes konfigurációban (1 adatbázis kezelő + 1 render + plusz egy lejátszó gép Linux alatt). Roonnal, Hqplayerrel, Audirvanaval, Tidal, Qobuz desktop appal, saját fejlesztésű, linuxos parancssoros lejátszó szoftverrel is.

Több tucatnyi DAC-kal, köztük többféle R2R-rel is. 3, 4 utas aktív stúdió monitoroktól kezdve a Marten Duke 2 polcsugárzóig sokféle hangsugárzóval, erősítővel és komplett Danley hangosító rendszerrel is. Felső kategóriás Wireworld, Siltech, Crystal Cable ezüst (arany) kábelezéssel.

Vagyis összességében odafigyelve a részletekre, megadva a módját. DSD256-tól DSD1024-ig próbálkozva.

Mindezt ráadásul nem azzal a szándékkal, hogy a kísérlet eredményképpen valamiféle terméket hozzak létre, csupán azért, hogy megértsem mi történik és hogy lehet egy rendszer összerakása során a felkonvertálást optimálisan felhasználni.

Az előző posztomban már leírtam a legfontosabb tanulságokat, ehhez csak még néhány kiegészítést tennék.

Minél jobban működik egy felkonvertálás PCM-ről, annál erőforrás igényesebb valós időben. DSD512-re konvertálni egy bonyolultabb szűrővel nem lehetséges GPU használat nélkül, és már a DSD256 is necces üzembiztosan. A GPU használat meg alapvetően kizárja, hogy passzív hűtésű gépez tudjunk használni. Nálam a jó számítógépes lejátszás egyik fontos kelléke a passzív hűtés.
Azok az algoritmusok, amik relatíve jól működtek, 44k, 48k Flac esetében, már nem voltak olyan jók 96k wav feletti file-ok esetében.
A valós idejű konverziónak mindig rosszabb az eredménye, mint az un offline-nak. Az offline azt jelenti, hogy valós időnél lassabban csináljuk és elmentjük a konvertált PCM file-t, mint új .dsf/wsd DSD file és azt játszuk le. Ennek az ára a sokkal nagyobb file méret (nagyobb háttértár kapacitás és memória kell), az előnye, hogy a lejátszáshoz nem kell sok magos CPU és nagy teljesítményű GPU, csak egy gyors SSD és sok memória (16 GB a minimum) — így passzív hűtésű gép használatára is jó esély van. További hátránya, hogy a jó minőségű offline konverzióhoz, kell a Hqplayer Pro szoftver, ami drága, közel, 4000 euró volt az ára. Az ingyenes lehetőségre a poszt végén található a link.
Minél nagyobb teljesítményű a számítógépünk, annál több RF, EM zavart (és persze zavaró ventillátor zajt) vihetünk a rendszerünkbe. Vagyis amit esetleg megnyerünk a réven, annak egy részét elveszítjük a vámon. Ilyen esetben kötelező a felkonvertálást végző gépet optikai Ethernettel, galvanikusan leválasztani a rendszerünk egészéről és szükséges lehet akár egy másik helységbe is tenni, semmiképpen ne tegyük a hifi állványunkra. Ez azt is mutatja, hogy az un két gépes megoldást érdemes ilyenkor használni, lásd a poszt végén lévő linken olvasható cikket.
Amikor saját eredeti DSD256 .dsf élő koncertfelvételünket (My Reel Club®) offline lekonvertáltunk 44,1k/16 bit flacra, majd valós időben (lejátszás közben) vissza DSD256-ra, az eredmény mindig egy picit tompább, ködösebb volt, mint az eredeti DSD256 hangzása. Amennyiben offline konvertáltuk vissza DSD256-ra, akkor nagyon kevés volt különbség, talán nem is volt, lehet, hogy csak beképzeltük.
A streaming szolgáltatóktól lejátszva korlátozottak a lehetőségek a felkonvertálásra, a Roon, a Hqplayer és az Audirvana adják ehhez a viszonylag egyszerű és jó minőségű lehetőséget.
A modern, hangos és agyon processzált felvételek felkonvertálása majd lejátszása, amik a streaming szolgáltatások többségének fő tartalmait kiteszik, nem nagyon “javíthatóak” ilyen módon és nem igazán reagálnak jól a konverzión keresztüli lejátszásra, sok esetben csak “mosottá” válnak tőlük. A bonyolultabb konverzióktól főképpen, inkább az egyszerűek használatával lehet elérni egy pici “kisimulást” a használatukkal. Viszont megjelenhet a klippelés, illetve jobban hallhatóvá válik hatása a konverzió után, köszönhetően az un ISD vagyis Intersample Distortion jelenségnek. Ha ezt el akarjuk kerülni legalább 1 dB-lel vegyük vissza a file hangosságát, a konverzió megkezdése előtt.
A zene műfajától és az utómunka minőségétől, processzálás mennyiségétől, a felvétel hangosságától is függ, melyik szűrő válik be.
Az offline konverzió esetében a két lépcsős konverzió jó eredményeket tud hozni. Vagyis egyfajta konverzióval előbb felkonvertáljuk 352,8 vagy 384 kHz/24 bitre a 44k vagy 48k file-t, majd egy másik konverzióval innen tovább DSD256-ra vagy DSD512-re.
A DAC-okba épített egy vagy több csipes konverzió általában rosszabb eredményt hoz, mint a számítógépesen elvégzett. Sajnos az esetek többségében nem kikapcsolható.

Aki szeretne egy kicsit az offline konverzióval kísérletezni, az töltse le a Tascam Hi-Res editor szoftverét ingyenesen.

https://tascam.com/us/product/hi-res_editor

Ez tud DSD256-ig le és fel konvertálni. Átlagos, nem rossznak mondható minőséggel.

Ugyanazon felvételek DSD256 és 44k/16 bites verzióját pedig a tavalyi hifi kiállítási élő felvételek közül lehet letölteni a próbához innen:

https://medium.com/@mediaengineering/22-hifi-show-budapest-koscso-media-engineering-hangfelvétel-minták-a-gold-terembő-15cc30e1e19e

Ezek azért is érdekes felvételek ( kiváló zenén és előadáson túl) mert kihasználják a DSD formátum adta teljes dinamika tartományt (+3,1 dB-ig vannak kivezérelve) és dinamika kompresszió nélkül készültek vagyis a közel 70 dB-es élő dinamika maradéktalanul megvan.

A sok évig tartó kísérletezés eredményeképpen született meg az alábbi írás is arról, hogy milyen lehetőségeink vannak számítógépes zenehallgató rendszer kiépítésére.

https://medium.com/@mediaengineering/az-igényes-számítógépes-zenehallgatás-alapjai-f8722985d913

Gondolatok a DSD felkonvertálás kapcsán

Written by Koscso Ferenc

No responses yet