OT Foceni misto skenovani
Jirka
zaloha@volny.cz
Sobota Únor 25 11:11:38 CET 2006
jnjn@seznam.cz napsal(a):
> Takze v otazce jestli scanner nebo fotak bych mel jasno-scanner.
>
> V teto sovislosti mam jeste doplnujici dotaz. Jaky zvolit format pro
> ulozeni vysledneho textu, aby bylo zachovano rozmisteni textu a
> grafiky na strance a zaroven fungovalo fultextove prohledavani podle
> mych predstav, tj. -
>
> -vysledky vyhledavani ve stylu Gogle Desktop, ale se zobrazenim vsech
> vyskytu hledaneho slova v souboru, vcetne kontextu
>
> -u kazdeho vyskytu hledaneho slova uveden nadpis clanku, kde se
> vyskytuje
>
> Nechci toho malo, ze?
Ne, to tedy nechcete a imho je to nesmysl, protoze vystup z OCR nejspis
asi skutecne nebude tusit, co je nadpis clanku atd... Zkuste se trochu
zamyslet a nechtejte od tech pocitacu zazraky.
Jinak zachovani layoutu a text jako text (v jine vrstve nez je grafika,
prevedeno pomoci OCR) umi prave zmineny DJVu format. Nastudujte si o nem
neco, je toho k mani dost, prakticke zkusenosti jsou zejmena na ruskych
webech (musite ovsem umet bukvice). Je ale pravda, ze OCR v DJVu
konverzi spolehlive funguje jen na anglicke texty.
--
Jirka
Další informace o konferenci Hw-list