cestina a jine komoleni ASCII :)

Pavel Hudecek edizon na seznam.cz
Úterý Leden 15 22:05:22 CET 2013


Něco na tom bude, třeba v CodeVisionu není problém do zdrojáku napsat český 
text do řetězce, při save se to správně uloží, po překladu je bin taky 
správně. Jenže pokud editor ukončím a pustím znovu, nebo zavřu soubor a 
znovu otevřu, projeví se nějaká nežádoucí inteligence a zkazí některé znaky 
(mám dojem, že ž a š). Po uložení jsou pak zkažené i v souboru. Ale mám už 
trochu obsatožní verzi, demo nové to už nedělá. Řešení je kupodivu prosté: 
Stačí kamkoli přidat
// ěščřžýáíéúů
a pak už to nekazí ani stará verze. Toto řešení funguje na většinu 
takovýchto problémů i v jiných programech. Je to nějaký obecný problém s 
textboxy z předunikódové doby. Narazil jsem na to i u svého programu na 
opravu chyb v titulcích, napsaného ve VB6. Právě tehdy jsem objevil toto 
provizorní řešení. Dotyčná inteligence pak nejspíš správně detekuje kódovou 
stránku a nic nemění.

Teď mě čeká firmware s menu ve více jazycích, takže asi dojde i na těch více 
kódových stránek v jednom projektu. Rád používám #include, takže texty budou 
v několika includech, nebo v jednom s UTF, či unicodem, editovat je budu v 
Poznámkovém bloku.

Pro češtinu jsem jednou použil i toto řešení:

r^es^eni' proble'mu~

Přičemž ^ vyvolá dopsání háčku nad předchozím znakem, ' udělá čárku a ~ 
kroužek. Velká výhoda je, že vůbec není potřeba kreslit nová písmenka.

PH

From: "Miroslav Šinko" <sinkomiro na gmail.com>


2013/1/15 Petr Labaj <labaj na volny.cz>:
> Tak to uz by stalo zato najit nejaky konvertor z nemecke znakove sady
> do Win1250 nebo UTF-8, nebo si ho napsat. A k tomu shellovy script,
> ktery prekoduje cely obsah adresare. Pokud by mely zustat zachovane
> puvodni znaky, tak by to chtelo mozna zvolit UTF-8, netusim, jak se
> Win1250 popasuje s ostrym s (nebo ho prekodovat jako "ss", coz je
> myslim oficialni postup, ale to by konvertor musel hlidat, ze to je v
> komentari a ne v retezci).

V komentaroch sme si to prepisali, nie je to problem, ktory treba
riesit. Len som upozornil na riziko, ze sa to stat moze.

> Moc mi neni jasny ten problem s prekompilovanim textu v Jave. Ja
> se Jave vyhybam, ale rekl bych, ze specialne tam by tyhle problemy
> mely byt principialne dobre vyresene (Unicode), kdyz ma jedna
> binarka fungovat na ruznych strojich.

Ja tiez v Jave nerobim :-) Ak si spravne spominam na vysvetlenie
kolegov, tie zdrojaky po otvoreni a znovaulozeni inym editorom uz
neboli binarne zhodne s povodnymi. T.j. znaky >0x7F boli zamenene
inteligenciou editora.

> No jako obvykle nic neni cernobile a neni jen jeden spravny nazor.
> U me to funguje tak, ze jsem se presvedcil, ze vyhody z jednotneho
> kodovani zdrojaku a ponechani pripadnych konverzi na stroj stoji
> za ty pripadne prechodove bolesti. U jinych lidi to muze jiste byt jine.

Tak. Ak clovek robi na jednej platforme, pripadne prechod na inu je
jednorazovy, cesta pouzitia konvertora je schodna. Ak ma byt ale
zdrojak spatne prenositelny medzi platformami, pripadne ak nad tym
istym projektom pracuju sucasne viaceri vyvojari na roznych
platformach, je lepsie problemom sa vyhnut (tu by muselo prichadzat ku
konverziam hore-dole neustale). Do diskusie som sa zapojil pri
zmienke, ze zdrojak by mal byt ludsky citatelny. V istych specifickych
pripadoch moze byt tato snaha na obtiaz... 



Další informace o konferenci Hw-list