OT Foceni misto skenovani

Jirka zaloha@volny.cz
Sobota Únor 25 11:11:38 CET 2006


jnjn@seznam.cz napsal(a):
> Takze v otazce jestli scanner nebo fotak bych mel jasno-scanner.
> 
> V teto sovislosti mam jeste doplnujici dotaz. Jaky zvolit format pro
> ulozeni vysledneho textu, aby bylo zachovano rozmisteni textu a
> grafiky na strance a zaroven fungovalo fultextove prohledavani podle
> mych predstav, tj. -
> 
> -vysledky vyhledavani ve stylu Gogle Desktop, ale se zobrazenim vsech
> vyskytu hledaneho slova v souboru, vcetne kontextu
> 
> -u kazdeho vyskytu hledaneho slova uveden nadpis clanku, kde se
> vyskytuje
> 
> Nechci toho malo, ze?

Ne, to tedy nechcete a imho je to nesmysl, protoze vystup z OCR nejspis 
asi skutecne nebude tusit, co je nadpis clanku atd... Zkuste se trochu 
zamyslet a nechtejte od tech pocitacu zazraky.

Jinak zachovani layoutu a text jako text (v jine vrstve nez je grafika, 
prevedeno pomoci OCR) umi prave zmineny DJVu format. Nastudujte si o nem 
neco, je toho k mani dost, prakticke zkusenosti jsou zejmena na ruskych 
webech (musite ovsem umet bukvice). Je ale pravda, ze OCR v DJVu 
konverzi spolehlive funguje jen na anglicke texty.

-- 
Jirka



Další informace o konferenci Hw-list