OT Odmekcenodlznovacie tabulky

Jiri Foldyna jiri.f na avizo.cz
Středa Listopad 9 15:02:14 CET 2011


Dne 9.11.2011 14:50, Petr Tomasek napsal(a):
> On Wed, Nov 09, 2011 at 02:47:08PM +0100, Jiri Foldyna wrote:
>> Dne 9.11.2011 9:40, Stanislav Šmejkal napsal(a):
>>> Dne 8.11.2011 21:13, Jan Waclawek napsal(a):
>>>> V nepriamej suvislosti s mrsenim mailov, existuju niekde nejake volne
>>>> pouzitelne jednoduche tabulky alebo funkcie na prevod pismen s
>>>> diakritikou na ich nediakriticku :-) verziu, pre jednotlive kodovania?
>>>> T.j. ze vstupom je napr. 'z(' v kodovani iso-8859-2, a vystupom je 'z'
>>>> a pripadne este nejake cislo co znamena ten makcen?
>>>>
>>>> Pre pouzitie v mcu, takze co najmensie/najjednoduchsie.
>>>>
>>>> Dakujem
>>>>
>>>> wek
>>>
>>> Udelejte si pole o 256 znacich (bytech) a pro kazdy index predejte
>>> vysledne pismeno. Neni to sice datove optimalni, ale implementacne a
>>> casove velmi jednoduche.
>>>
>>> Standa
>>
>> To na Unicode nestačí.
>>
>> JF
>
> no tak udelejte tabulku, ktera bude mit dany byte + codepoint v unicode
> a prohledavejte to pomoci puleni intervalu...
>
> p.t.
>

Jistě, ale to je trochu jiná píseň, než o 256 bytovém poli a konverzi 
indexem. Kouzlo metody popsané panem Standou spočívá právě v jednoduché 
implementaci v libovolném operačním prostředí a bezkonkurenční 
rychlosti. Neříkám, že Unicode pomocí tabulky konvertovat nejde, říkám 
jen, že to obecně nejde použitím konvertovaného znaku jako indexu do 
256-bytové konverzní tabulky.

JF



Další informace o konferenci Hw-list