Rozsireni slysitelneho spektra? za vzorkovaci kmitocet? [Re: Jiny pristup k adresovani u MCU/CPU]

Jaroslav Lukesh lukesh@seznam.cz
Úterý Duben 19 18:22:26 CEST 2005


Dne úterý, 19. dubna 2005 11:05 Marek Peca <marek@tynska.cuni.cz> napsal(a):
> Zdravim,
>
> On Mon, 18 Apr 2005, Jaroslav Lukesh wrote:
> > A jen tak mimochodem, kdybyste nekdo si chtel vyhrat se zvukem a
> > rozsireni slysitelneho spektra za vzorkovaci kmitocet i LP filtru bez
> > naroku na upravu reprodukcniho HW, ozvete se (uz to nejak nemuzu googlem
> > najit). Dalo by se to taky udelat do retezce SOXu.
>
> kdybyste prosim trochu osvetlil zadani, rad si necham vlozit brouka
> do hlavy. A nebo, pokud jste to uz nasel, zda byste se nepodelil.

Brouky vam dam hned 2

Toho prvniho jsem nenasel ani u sebe v archivu (holt vady disku leccos vzaly s 
sebou), ale strucne vam popisu oc jde:

Mejme digitalizovany audiosignal, dejme tomu samplerate 48kHz. Hardware 
prehravace ovsem zvladne polovinu, ale my chceme aby bylo slyset i to 
"nahore".

Kratce odbocim, ve studiove praxi se pouziva figl, ze se u takovychto nahravek 
zdurazni o cca 7 dB kmitocty na konci spektra prehravace (jde v podstate o 
energetickou rovnovahu signalu nad tonalitou). Ale neni to uplne ono, nektere 
zvuky (triangl,cinely, zeste...) maji energetickou prevahu prave nad meznim 
pouzitym kmitoctem.

Tedy vec je zcela jednoducha (v tomto pripade, u jineho pomeru vzorkovani by 
to bylo jen lehce slozitejsi), rozdelime signal spektralne na poloviny do 
dvou stop.

Dolni polovinu (prvni stopu) nechame jak je, hormi (druhou stopu) 
zmodifikujeme pomoci pitch shifteru o oktavu niz a resamplujeme na polovinu 
(opet plati pouze pro uvedeny priklad pomeru vzorkovacich kmitoctu, jinak by 
to bylo slozitejsi).

Ziskame tedy v druhe stope spektrum 6-12kHz z puvodniho 12-24kHz.

No a ted ty dve stopy sloucime dohromady.

Poslechnete si vysledek. Neni to sice jako original, ale v pripadech zestu, 
cinelu ci sykavek je mnohem bohatsi, nez jakkoli upravene pouze spodni pasmo. 
Hlavne mnou oblibeny test - uder palickou s porcelanovou hlavickou na cinel 
je slyset mnohem lepe.

Podotykam, ze nelze brat ne lehkou vahu fazove chyby pouzitych filtru, jak pri 
rozdelovani pasem, tak i pitch shifteru/resampleru. Mají-li nějaké, je třeba 
fázové chyby napravit. Ale to v případě digitálního zpracování není až tak 
neřešitelný problém.

Taky by bylo mozna vhodne laboorovat s nastavenim prolinani pasem a pripadneho 
pozvolneho nastupu vysek druhe stopy, prave kvuli tonalite, ktera je nekde u 
8kHz.

Tahle metoda se dneska tiše používá u vzorků hudebních nástrojů v romplerech 
(kvuli vnimani ultrazvukoveho spektra). Jak je tomu u mp3pro nevim, velmi vse 
tutlaji (jiz dlouho to ale nesleduji), ale je velmi pravdepodobne, ze se to 
pouziva taky, lepe se pak rekonstruuje puvodni spektrum.

Udealte-li nekdo pipeline pro sox, budu rad kdyz ji zverejni, sox taky 
existuje pro dos/wokna (hledejte soxexam s priklady). Myslim, ze mnohe 
internetove radia by toto uvitaly.

-----------------------------------------------------------------------------------------

.....a druhy, dodavam jen ze je to muj davny kompilat ruznych tvrzeni, 
nejdulezitejsi je Frank Klemm (udava fakta), ty ostatni jsou spise na 
dokresleni (na internetu se blbe argumentuje ceskyma knihama o akustice 
vyslima pred 50 lety - my cesi jsme k nemcum (hitler udelal co se tyce 
poznatku akustiky velmi velky skok dopredu - koncerty z "jeho" magnetofonu se 
i dnes bez uprav prepisuji na CD a jsou bez znatelneho sumu!) meli bliz nez 
amici, kde pseudokvadro objevili az koncem 70. let a pripisuji to panum 
Haflerovi a Dolbymu).

-----------------------------------------------------------------------------------------
So. MP3 is not useable as archive quality at any bitrtate. Because of frame
overlapping, impulse response is distributed over longer time than one
granule, typically two (I am right?).

:::: sice mam ale jen pro enkoder, dekodery to opet rozmaznou, tedy v idealnim 
pripade 4 :-C

Frank Klemm says:

MP3:    length of granule [ms]
fs              block
[kHz]      long     short
- -------------------------------------
 8         72       24
11         52.2     17.4
12         48       16
16         36       12
22         26.1      8.7
24         24        8
32         18        6
44         13        4.3
48         12        4

For critical music granules down to 2 ms are useful, but not available in
MP3. 

::  > Listen to castagnets at 32 kHz/320 kbps and at 48 kHz/192 kbps.
::  > The 48 kHz/192 kbps sounds much better. This is a restriction of MP3.
::  
::  ??? What is the basic reason for that ? 

MDCT window size. It is 192 or 576 in samples. This is a little bit too
long
in time for 44.1 and 48 kHz and much too long for 32 kHz. 

AAC uses 128 or 1024, which is nice for most music.

AAC 48 kHz/128:         2,7 ms
AAC 44 kHz/128:         2,9 ms 

---------
"Ivan Dimkovic" <smoke@aac-tech.com> says:

Short window length is 192 samples (this is the most important reason)
With this block length, MP3 has impulse response of  18.6 ms at 48 kHz
sampling rate. Human perceptual system has more advanced psychoacoustic in
time domain (less than 5 ms in some cases). MPEG commitee had chosen
shorter
window length for next generation of coders (AAC, MPEG-4 General Audio,
..)
--------

Segher Boessenkool <segher@wanadoo.nl>  says:
-----
The optimum window size for strong changes is about 128 samples (44 or
48 kHz),
because all pre-echo will be inaudible. The optimum window size for
stationary signals is infinite.

> The AR function inside a granule should be constant within 3...5 dB.
> This can be for >100 ms for music like some parts of "Adagio for
Strings",
> but also 0.8...1.2 ms for synthetic percussion. 

-- 

                        Jaroslav Lukesh
  -----------------------------------------------------------
  This e-mail can not contain any viruses because I use Linux




Další informace o konferenci Hw-list