cestina a jine komoleni ASCII :)

Petr Labaj labaj na volny.cz
Úterý Leden 15 14:16:17 CET 2013


Tak to uz by stalo zato najit nejaky konvertor z nemecke znakove sady
do Win1250 nebo UTF-8, nebo si ho napsat. A k tomu shellovy script,
ktery prekoduje cely obsah adresare. Pokud by mely zustat zachovane
puvodni znaky, tak by to chtelo mozna zvolit UTF-8, netusim, jak se
Win1250 popasuje s ostrym s (nebo ho prekodovat jako "ss", coz je
myslim oficialni postup, ale to by konvertor musel hlidat, ze to je v
komentari a ne v retezci).

Moc mi neni jasny ten problem s prekompilovanim textu v Jave. Ja
se Jave vyhybam, ale rekl bych, ze specialne tam by tyhle problemy
mely byt principialne dobre vyresene (Unicode), kdyz ma jedna
binarka fungovat na ruznych strojich.

No jako obvykle nic neni cernobile a neni jen jeden spravny nazor.
U me to funguje tak, ze jsem se presvedcil, ze vyhody z jednotneho
kodovani zdrojaku a ponechani pripadnych konverzi na stroj stoji
za ty pripadne prechodove bolesti. U jinych lidi to muze jiste byt jine.

PL

***********************************

From: "Miroslav Šinko" <sinkomiro na gmail.com>
To: "HW-news" <hw-list na list.hw.cz>
Sent: Tuesday, January 15, 2013 2:02 PM
Subject: Re: cestina a jine komoleni ASCII :)


No, problem nie je v podpore roznych kodovych stranok, ale v tom, ze
editor zdrojakov z jednoducheho textoveho zdrojaku (napr. *.c) nema
ako vediet v akej kodovej stranke bol vytvoreny.
Konkretne ten moj pripad: prevzaty C zdrojak z nemeckej verzie Linuxu
(Debian), pisany netusim v akom editore, bol v Eclipse pod Windows
zobrazeny zle - znaky mikro a nemecke ostre s. Toto sa tykalo
nastastie len komentarov.
Pripad so zlym prekompilovanim textov sa stal kolegom v jave, ked
presli z nemeckej verzie J-Buildera na anglicku verziu Eclipse for
Java. Oboje pod Windows.

miro

2013/1/15 Petr Labaj <labaj na volny.cz>:
> To co pisete je urcite bezpecne.
> Ale nejsem si jisty, jestli to jeste dneska ma smysl (tim Vam prosim
> v zadnem pripade neberu a nekritizuji Vas nazor, nakonec ja taky
> maily pisu bez diakritiky).
>
> Myslim, ze problemy s kodovanim v produktech dnesni doby uz nejsou
> aktualni hrozbou. Za poslednich rekneme 5 let jsem nenarazil na zadny
> editor, ktery by nezvladal kodovani Win1250, a to i na Linuxu. Prece jen
> vliv MS Windows na svet pocitacu je znacny, a dat dneska na trh produkt
> (byt zdarma), ktery neotevre spravne soubor napsany na Windows, tak
> to by musel byt hodne spickovy produkt v nejakem jinem parametru,
> aby stalo zato se jim vubec zabyvat.
> No a pokud by nahodou skutecne Win1250 nefungovalo, tak to cele
> davkove prevest treba do UTF-8 nebude zadny problem.
> U kompilatoru problem nehrozi, protoze tam mu to klidne predhodim
> jak on bude potrebovat (i kdyz i tady myslim plati, ze to dnes neni
> uzke misto).
>
> Ja jsem ve spouste veci taky konzerva, nakonec muj kmetsky vek
> me k tomu opravnuje. Ale prece jen si obcas uvedomuju, ze cas
> oponou trhnul, a ne vsechny pravdy meho mladi stale plati.
>
> PL
>
> *******************************
>
> From: "Miroslav Šinko" <sinkomiro na gmail.com>
> To: "HW-news" <hw-list na list.hw.cz>
> Sent: Tuesday, January 15, 2013 1:39 PM
> Subject: Re: cestina a jine komoleni ASCII :)
>
>
> 2013/1/15 Petr Labaj <labaj na volny.cz>:
>> Co jsem tim celym chtel rict: programator by mel (podle me) psat texty
>> pokud mozno co nejvic lidskym zpusobem.
>
> Toto vidim ako potencialne nebezpecne. Zdrojaky pisete v nejakom
> editore (IDE), nejaky kompilator ich kompiluje spravne. Casom prejdete
> na iny editor/kompilator, alebo jednoducho danu cast kodu pouziteje v
> inom projekte s inym editorom/kompilatorom. Rozne editory/kompilatory
> mozu chapat znaky >0x7F rozne. Najmensi problem je, ze zdrojak sa
> stava necitatelnym, vacsi je, ked sa znaky skompiluju s inymi
> hodnotami, lebo inteligentny editor uplatnil nejaku vlastnu
> inteligenciu.
> Mam s tym priamu skusenost (z prevzateho kodu), takze sa tomu vyhybam
> a v zdrojakoch ziadne znaky >0x7F nepouzivam. Ani v komentaroch. Znaky
> v textoch, ktore sa kompiluju do vystupu zapisujem hexa hodnotami.
>
> miro



Další informace o konferenci Hw-list