Domaci automatizace

Martin Tomasek mtd@centrum.cz
Sobota Květen 14 10:01:15 CEST 2005


On Sat, May 14, 2005 at 07:40:27AM +0200, Tomáš Dresler wrote:
> http://www.sensoryinc.com

prosel jsem si trochu to RSC-4x a algoritmy, co pouzivaji jsou:

1. pro rozpoznavani nezavisle na mluvcim tam maji nejaky hybrid mezi HMM
(skryte markovovske modely) a neuronovou siti. pricemz zvuk prevadi an
text a ten pak porovnava se znamymi retezci.

2. rozpoznavani zavisle na mluvcim je delane technikou DTW (dynamic time
warping), tj. ma to navzorkovane slovo, co to ma rozpoznat a
predpoklada, ze se meni akorat rychlost => zkousi to
porovnavat za predpokladu deformace casu.

u prvniho algoritmu neni jasne, jak to presne funguje. s HMM a NN se
daji udelat ruzne veci. kazdopadne bych si tipnul, ze maji to rozpoznani
trenovane na anglickeho mluvciho, tj. s cestinou to asi nebude moc
fungovat.  u druhe techniky je jiste, ze ma malou odolnost proti
jakemukoli ruseni -- staci si pustit treba nejakou hudbu a ten
algoritmus se uz nechytne.

no, a pak jeste, jak tak koukam do blokoveho schematu, vidim ze to ma
dva mikrofoni vstupy. ale vypada to, ze neumi pouzit 2 vstupy najednou,
takze pripadna logika sledovani mluvciho (aby se odfiltrovalo ruseni) se
bude muset delat externe.

to jenom at od toho nekdo neceka zazraky...

> 
> V Conradu (DE) maji bazmek asi za tisic, rozeznava 15 ruznych povelu.

no ja taky premyslel nad tim, ze by se tohle dalo udelat treba pres
nejakou mensi atmegu. akorat ze to je tak na tyden programovani, nez to
zacne aspon trochu fungovat. a navic prikazy by s vypocetnim vykonem
atmegy byly tak 2 a jeste bych byl rad. :-)

-- 
Martin Tomasek, mtd@centrum.cz
BOFH excuse #62:
need to wrap system in aluminum foil to fix problem



Další informace o konferenci Hw-list