Nagy felbontású audio — Hamisított vagy sem?

4 min readJan 31, 2022

A valódi, natív nagyfelbontású audio formátum azt jelenti, hogy a felvétel során a zenei jelben található finom struktúrák időegységenként megfelelően felvételre kerülnek. A mikrofonokkal rögzített valódi zenei jel érzékeny időbeli információkat tartalmaz a 45–50 kHz-es frekvenciatartományban. Bizonyos hangszerek (például trombita egyenes tompítással) és mindenekelőtt az ütős hangok esetében ez a tartomány magasabb is lehet. A finom információk átvitele nem lehetséges olyan berendezésekkel, amelyek 22 kHz-es frekvenciasávszélességet (CD, 44,1 kHz mintavételezés) vagy 24 kHz-es sávszélességet (a műsorsugárzásban szokásos 48 kHz mintavételezés) használnak.

A csökkentett sávszélesség mindig fizikailag visszafordíthatatlan, csökkentett (időbeli) felbontást jelent. Ezért a valódi nagy felbontású anyagot a produkciós folyamat egyetlen szakaszában sem szabad 22 kHz-re vagy 24 kHz-re korlátozni. A HRA (High Resolution Audio portál például) spektrális elemzéssel ellenőrzi az adott zenét, hogy ezek a kritériumok teljesülnek-e.

A spektrális elemzés helyes értelmezése rendkívül fontos.

A zenei jelek 22 kHz felett csak viszonylag alacsony hangerőn tartalmaznak finom információkat. Hogy ez a szint pontosan milyen magas, az a hangszertől vagy az együttestől, vagyis a zenei tartalomtól függ. A dobszólóval játszott könnyűzene magasabb hangerőn tartalmaz magas frekvenciájú információt, mint egy pianissimoban játszó hagyományos zenekar; egy rövid staccato hangokat játszó pikoló több információt tartalmaz, mint egy legatoban játszó tuba stb.

Az abszolút hangerőszint vagy a 20 kHz feletti frekvenciaspektrum pontos összetétele csak nagyon keveset mond a felvétel minőségéről.

A natív felbontás és a hamisított, de natívnak nyilvánított felvétel megkülönböztetésénél sokkal fontosabb az, hogy ne legyenek felismerhető jelei az átviteli sávszélesség korlátozásnak.

Az ilyen korlátozás a legtöbb esetben nagyon könnyen felismerhető a frekvenciaspektrumban a jellegzetes kulcsfrekvenciák — 22,05 kHz, 24 kHz vagy akár 44,1 kHz vagy 48 kHz — egyikénél lévő éles töréspontról.

Ha egy ilyen, jelentős frekvenciaeséssel járó töréspont van jelen, akkor nem natív, nagy felbontású anyagról van szó. A töréspont másik oldalán további információk határozhatók meg a jelfeldolgozással kapcsolatban.

Ha a szint a 24 bit elméleti minimumának tartományába eső értékekre esik, ami 138–144 bit, akkor azt mondhatjuk, hogy felkonvertálást alkalmaztak.

Ha a szint jelentősen magasabb értékekre, 80–120 dB-re csökken, és egyenletesen oszlik el, mint a fehér zaj, vagy ha az anyag még a 176,4 vagy 192 kHz-es frekvencián is kis mértékű zajszintnövekedést mutat kb. 50 kHz, akkor az analóg masteringet natív, nagy felbontású A/D átalakítás követte (sok 176.4/24 és 192/24 A/D átalakító használata esetében megjelenik a zajszint növekedése a küszöbfrekvencia közelében). Bár ez nem igazi natív, a minőség még jobb is lehet, mint a standard változaté.

Ha a zajszint közvetlenül a töréspont előtt (kb. 25–28 kHz-nél kezdődően) jelentősen megnő, akkor valószínűleg SACD-anyagról van szó, ami önmagában is hamisítvány, hiszen 44,1 vagy 48 kHz-es frekvenciával készült elő. Ez valószínűleg igaz a legtöbb SACD-re, különösen a a broadcast produkciókra, hiszen ott 48 kHz a szabvány. Az ilyen anyagok könnyen megtalálhatók a piacon 24/88.2 vagy 24/96-os formátumban.

(Kép a HRA portálról, link az írás végén)

Még egy dolog a teljesség kedvéért: ha a zajszint jelentősen megnő, mint az előző példában, de nincs töréspont, akkor az a definíció szerint nem szigorúan hamisítvány. A felvételt nagy valószínűséggel teljes egészében DSD-ben készítették SACD-re. Mivel az erős zajjel a zenei jel minden finom információját elfedi közvetlenül a szabványos mintavételezési frekvencia határa felett, ezért az anyag nem lehet lényegesen jobb minőségű, mint egy szabványos CD. A minőségi szint többnyire valószínűleg egy 48 kHz/24 bites felvételhez hasonló. Ilyen anyagot gyakran találunk a piacon 88.2/24 bites vagy 96/24 bites néven is. Ez lehet jobb, mint egy CD, de valójában semmi köze a natív nagy felbontású hanghoz.

Típikus példák spektrális jellemzőinek bemutatása:

Natív 192 kHz / 24 bit: