Zkreslení a podobně

Jaroslav Lukesh lukesh@seznam.cz
Sobota Únor 24 23:26:08 CET 2007


No, nemáte až tak pravdu, jste ovlivněn FIR, zapomeňte na to. U mp3 se 
používá MDCT, což je v podstatě obdoba JPEG obrázků. U MP3 není nejvyšší 
bitrate 320kbps, jak se mylně většina domnívá, existuje formát zvaný 
freeformat, který je neomezen. Bohužel, je málo využíván. Navíc některé 
přehrávače s ním mohou mít problémy, ten bitrate nejsou schopny zpracovat - 
nemají na to výkon/paměť. Třeba LAME zvládne dekódovat freeformat do 
550kbps.

Mohu vás ujistit, že jediný enkodér, který jakž-takž se pokouší zachovat 
tvar vlny, je prastarý referenční enkodér mp3enc31 v kvlaitě -9 CBR. Tam 
totiž už ve filtrech nepoužívá MDCT, ale něco jiného, zapomněl jsem co, ale 
je to výpočetně i implementačně velmi náročné (IIR?). Jiné režimy a ostatní 
enkodéry už vůbec nezachovávají tvar signálu, zachovávají pouze "vyčištěné" 
spektrum. Dostatečný bitrate tedy nevyřeší nic, protože přechodové jevy jsou 
v transformaci širokopásmové a zaberou tolik dat, že nezbývá, než je v 
granuli rozmáznout i při nejvyšším bitrate. Granule je půl frame a aby to 
tolik necvrlikalo, překrývá se i frame - s tím se už totiž počítá při 
výpočtu vzniklé úrovně hluku. Impulsní jev tedy bude skutečně rozmáznut 
zcela dokonale.

JL.

----- Original Message ----- 
From: "Vlada Andel" <vaelektronik@vaelektronik.cz>


Tak nevím, ale myslím že přesně tohle je nepochopení matematického principu
Fourierovy transformace. Jaké rozmazání na délku frame? Samotný princip
Fourierovy transformace nám říká že každému časovému průběhu odpovídá
příslušné spektrum a z tohoto spektra lze získat původní průběh a nikoliv
nekonkrétní směs frekvencí po dobu jednoho frame. Pochopitelně musí být
ošetřeny okrajové podmínky aby framy navazovaly správně na sebe. Myslím že
různé digitální ekvalizéry a jiné hračky to dělají přes FFT a taky nic
nerozmažou. Problém je skutečně až ta komprese, kde dochází k zanedbávání
některých méně podstatných kmitočtů a k "hrubší" kvantizaci koeficientů
těch, které se přenášejí. I potom tvar vlny vychází v podstatě z původního,
ale bude se tím víc lišit, čím je menší bitrate. Takže dostatečný bitrate by
to měl vyřešit. Je otázka, jestli 320 Kbit/s je dostatečné. OGG umí snad až
500 a při tom je lepší než MP3 při stejném bitrate. Tak snad by stačilo
místo nadávání na MP3 přejít na modernější OGG.
Anděl

----- Original Message ----- 
From: "Jaroslav Lukesh" <lukesh@seznam.cz>
To: "HW-news" <hw-list@list.hw.cz>
Sent: Saturday, February 24, 2007 1:22 AM
Subject: Re: Zkreslení a podobně


Pořiďte si pořádnou aparaturu a ohulte to na 115dB ve špičkách a hned
poznáte s čím máte tu čest. Až vám nekomprimovaný činel křísne do čela,
totéž z mp3 vám jakoby vatou zacpe uši.

Když to půjde z MIDI nástroje (myslím tím nástroje pro muzikanty, ne z
hračky), prožeňte to přes AD a DA zvukovky - to berte jako referenci a pak
to zkomprimujte. No a hned poznáte zač je čeho loket.

MP3 přidává do signálu hluk - nelze napsat šum, je to nepříjemný hluk pokud
si to pustíte víc nahlas. A čím větší komprese, tím je ten hluk větší, až
zasáhne sylšitelně i užitečný signál. Navíc nízké komprese dělají delší
framy, takže je zvuk rozmazanější, uhlazenější.

Kdysi jsem sem posílal tabulku rozmazání zvuku u mp3/AAC, to bylo vše o
straně enkodéru, při dek=odování se zvuk rozmaže ještě jednou (kvůli
překrývání rámců aby nebylo slyšet tolik cvrlikání). Takže pokud bude délka
krátkého frame skoro 5ms, *4 bude skoro 20ms. To je nejkratší možný
přechodový děj u mp3. Dlouhý, 20ms frame bude taky 4x delší, ano, skoro
desetina vteřiny - to je taky důvod, proč mluvené slovo trpí tolika
artefakty při běžných bitratech používaných u hudby. A to ještě nemluvím o
50ms frame co je u 22kHz...

WMA je každá verze jiná, mickeysoft jednu dobu koupil realmedia aby
načichnul jejich technologiemi pro obraz i zvuk. Používají se taky
psychoakustické finty pro zkrácení vnímané impulsní odezvy (to má i mp3pro),
tohle už není přímo komprese jako taková, ale jedná se už i o parametrickou
syntézu zvuku.

Víte co je to vokodér? Třeba 8 filtrů + zesilovače řízené napětím. Na jedné
straně spektrální dekompozice (filtry, vyhodnocení RMS úrovně spektra
filtru), to se přenáší na druhou stranu k napětím řízeným zesilovačům a
dalším filtrům. Do toho pustíte šum, a do mikrofonu na dekompoziční straně
budete mluvit. Na druhé straně bude výstupem modulovaný šum, kterému budete
při troše dobré vůle rozumnět.

Tak a teď si tohle v bleděmodrém představte že je to součást určitých částí
spektra v mp3pro, wma, aac.... Je to ještě komprese, nebo je to syntéza?
Hmmm... Ale datový tok mezi dekompozicí a kompozicí nebude zrovna veliký,
což?

JL.


----- Original Message ----- 
From: "Saša Svobodová" <sasa.svobodova@centrum.cz>
    když už je řeč o audiu, chtěla jsem se zeptat, jaké zkreslení je
schopné poznat normální neškolené ucho ?

    A dá se nějak spočítat či odvodit, jaké zkreslení vzniká při různých
přenosových rychlostech ?

     Protože já jsem třebas teďka zkoušela MP3 (lame enc) na různé
hodnoty a rozdíl mezi 320 kbps a 128kbps nepoznám. Teprve při 96 kbps
při okamžitém srovnání s 128 jsem schopna poznat nepatrný rozdíl (ale
tak malý že je to skoro stejné)  56 kbps už vím že zní jinak. Normálně
používám WMA, ale tam neslyším rozdíl vůbec. Je jedno jestli je nastaven
na maximum nebo na minimum přenosové rychlosti.

    Školené ucho pozná jistě drobnosti, ale já se ptám na normální
neškolený sluch. Může mi to prosím někdo nějak jednoduše vysvětlit ?

_______________________________________________
HW-list mailing list  -  sponsored by www.HW.cz
Hw-list@list.hw.cz
http://list.hw.cz/mailman/listinfo/hw-list

_______________________________________________
HW-list mailing list  -  sponsored by www.HW.cz
Hw-list@list.hw.cz
http://list.hw.cz/mailman/listinfo/hw-list 




Další informace o konferenci Hw-list