Obrazovka misto lupy.

Jiri Bezstarosti jiri
Středa Březen 17 14:54:49 CET 2004


Od: "Petr Simek" <psimek@jcu.cz>
> On Thu, 16 Jan 2003, Pavel Hudecek wrote:
> > Americani patrne neprispivaji do ceske konference...
> > Jinak obecne to funguje tak, ze pokud se jedna
> > o text ASCII (s b7=0), tak je uplne jedno, jake kodovani
> > zvolite, druh kodovani se projevi jen kdyz se v textu vyskytuji
> > znaky s b7=1 (vyjimku tvori UTF-7, ktere je ponekud uchylne).
> 
> Kdyz ale zvolite kodovani ktere prijemce nezna, muze mit potiz s
> prectenim i kdyz vlastne zadny problem nema. Proste to muze pohoret
> jen na te kontrole oznaceni znakove sady.

Kazdy mailovy klient respektujici RFC musi znat vsechna kodovani
ISO (RFC musi respektovat vsechno, co komunikuje s internetem).
Druha vec je, jestli OS pod kterym bezi ma nainstalovanu podporu
pro danou znakovou sadu, ale kdyz mail neobsahuje zadnou diakritiku,
je naprosto lhostejne, v jake sade OS bezi.

> > Existuje pouze jediny duvod, proc by cech mel menit kodovani
> > a to sice pokud chce pouzivat i "diakritiku" zapadnich jazyku
> > (napr. takoveto divne nemecke pismenko pripominajici betu),
> > ale v tom pripade udela urcite lepe, kdyz si nastavi UTF-8
> > a uz dal nic resit nemusi.
> 
> To se da obratit - neexistuje duvod proc by se mel dopis obsahujici
> pouze znaky sadu 8859-1 oznacovat jako 8859-2 .

Tato myslenka je nesmyslna. 8859-1 a 8859-2 se shoduji v oblasti
0-127 a lisi v oblasti 128-255 (takto se lisi vsechny normy pro narodni
prostredi). Tedy pokud dopis obsahuje jen znaky 0-127, naprosto nezalezi
na kodovani (resp. toto pro nej neni definovano), naopak obsahuje-li znaky 
s kodem mezi 128-255, lze jej spravne zobrazit pouze v jednom jedinem
kodovani.

Zaver: V Cechach pouzivat pouze 8859-2:

OS s podporou cestiny:
a) cestina funguje
b) cestina bez diakritiky funguje
c) anglictina funguje
d) jakykoli jazyk bez sve diakritiky funguje

OS bez podpory cestiny:
a) cestina NEfunguje
b) cestina bez diakritiky funguje
c) anglictina funguje
d) jakykoli jazyk bez sve diakritiky funguje

Maly prehled:

ISO-8859-1 - Latin 1 
Western Europe and Americas: Afrikaans, Basque, Catalan, Danish, Dutch, English, Faeroese, Finnish, French, Galician, German, Icelandic, Irish, Italian, Norwegian, Portuguese, Spanish and Swedish. 
ISO-8859-2 Latin 2 
Latin-written Slavic and Central European languages: Czech, German, Hungarian, Polish, Romanian, Croatian, Slovak, Slovene. 
ISO-8859-3 - Latin 3 
Esperanto, Galician, Maltese, and Turkish. 
ISO-8859-4 - Latin 4 
Scandinavia/Baltic (mostly covered by 8859-1 also): Estonian, Latvian, and Lithuanian. It is an incomplete predecessor of Latin 6. 
ISO-8859-5 - Cyrillic 
Bulgarian, Byelorussian, Macedonian, Russian, Serbian and Ukrainian. 
ISO-8859-6 - Arabic 
Non-accented Arabic. 
ISO-8859-7- Modern Greek 
Greek. 
ISO-8859-8 - Hebrew 
Non-accented Hebrew. 
ISO-8859-9 - Latin 5 
Same as 8859-1 except for Turkish instead of Icelandic 
ISO-8859-10 - Latin 6 
Latin6, for Lappish/Nordic/Eskimo languages: Adds the last Inuit (Greenlandic) and Sami (Lappish) letters that were missing in Latin 4 to cover the entire Nordic area.

Zdroj: http://www.terena.nl/library/multiling/ml-docs/iso-8859.html

Pavel Hudecek
----------------------------------------------------
http://www.diametral.cz




Další informace o konferenci Hw-list