OT: Muj nazor na Skype [Was: Re:OTnapátek: Uzavřené a otevřené standardy: ICQ a podobně... ]
Tomáš Tomáš
tom.tore@seznam.cz
Úterý Prosinec 18 22:57:31 CET 2007
A Elvis zije.
Ale vazne, do vyvoje strojoveho rozpoznavani reci se rocne investuje cca 6 miliar dolaru , duvodem je potencialni multimiliardovy obchod. V podstate se da rici, ze rozpoznavani reci je jeden z gralu a ten kdo ho ziska ma nadeji stat se novou technologickou hvezdou.
Nicmene zatim neexistuje, nic co by rutine, spolehlive, bez uceni fungovalo.
IBM do teho oblasti skutecne masivne unvestuje a to nejlepsi co ma je ViaVoice, dnes tusim ve verzi 10, pokud pomineme propagacni materialy tak rozhodne nejde o produkt, ktery dokaze prepsat bezny hovor.
Pro ziskani ViaVoice nemusite byt clenem zednarske loze a po hw strance vystacite s cca 180MIPS CPU.
Pokud jde o odposlouhani telefonu tak neverim, ze existuje nejaky globalni system, ktery by byl schopen masivniho odposlouchavani telelefonu, ne ze by si ho nekdo nepral, ale neni a jeste dlouho nebude technologie. Kdyz jsem v minulosti cetl hruzostrasne zvesti o Echelonu a jeho moznostech, pripadalo mi to mirne receno nadnesene a to jak co do moznosti zachyceni signalu tak predevsim co do moznosti smysluplneho zpracovani ziskanych dat.
Jsem paranoidni nektera data sifruji 1024 dlouhym klicem (zichr je zichr), ale pokud jde o telefony vidim to tak, ze si vas k odposlechu misi nekdo vybrat.
No s tím odposloucháváním všech telefonů jste se seknul, už od 70. let lze
rozpoznávat mluvenou řeč a převádět na text a to bez předchozího tréningu
jak člověka, tak i softwaru. IBM vyráběla diktovací mašinky (velké asi jako
pračka a na ní tiskárna s monitorem), od poloviny 80. let i SW pro obyčejné
tehdejší počítače - které výkonově stíhaly. Takže si to převeďte do dnešní
GHZ doby, kdy jeden dnešní počítač by měl zvládnout rozpoznat několik set
mluvčích a to jsem opominul DSP procesory, které toho zvládnou mnohem více -
vše bez tréningu. To co se běžně k PC nabízí na ovládání hlasem, je jen pro
zmatení lidí. Můj šéf o ten soft od IBM dost dlouho bojoval a protože s nimi
nesdílel zednářskou lóži, nakonec to vzdal se slovy že je stejně jen pro
angličtinu.
Nevím jak u nás, ale zachytil jsem zprávu že v orwellově (GB, USA) to mají
nasazeno a zpracovává se to zatím jen statisticky - určuje se potenciální
nebezpečnost jedince.
Ve velkém orwellově (GB) už mají systém, který z kamery dokáže nejen
rozpoznat 200 tváří (pár pixlů na xicht), ale také zjisté o čem kdo povídá.
V naší těžké respublice si odlehčenou verzi co rozpoznává jen obličeje,
objednali do Prahy.
Další informace o konferenci Hw-list