OT jazykove kodovanie

Jan Waclawek konfera na efton.sk
Středa Duben 6 20:30:47 CEST 2022


> MUA je tu ten popcorn. 

No ak MUA je ten, co rozhoduje o kodovani, ktore dorazi k uzivatelom
hw-listu, tak nie. Ako vravim, ja som urcite odoslal oba maily s uvedenou
hlavickou, t.j. kodovanie win-1250. Zmenil to - prekvapenie - mailman
(t.j. hw-list). 

> Tak pokud ta hlavička nebyla korektní

Ta hlavicka *je* korektna (kupodivu aj bez tych medzier - dost som studoval
RFC822 - kvoli inym veciam, ta syntax hlaviciek je v TCP/IP svete
unifikovana). Proste mailman sa snazi byt korektnejsi nez korektny, a
prekoduje to na iso8859-2, a vcelku spravne, lebo iso8859-2 ma vacsiu
sancu byt u individualnych odberatelov (kde sa predpoklada diverzita OS)
spravne zobrazena ako akykolvek win codepage.

> (sázím na 95.102.148.217 (helo=wekovci))

Tak to je prehra. To hello wekovci je pre mna prekvapenie, to sa tak hlasi
SMTP server u providera, ze ako sa to "wekovci" tam dostalo, to bude nieco
sialene historicke spred 20 rokov, a neviem to zmenit. Ale SMTP server
rozhodne nerobi ziadne prekodovavanie.

Uz sme to na fore boli skumali, skutocne to robi to mailman (aj s korektnym
prekodovanim win-1250->iso8859-2) na plaintext mailoch; ak je ten mail
multipart tak to prekodovanie neurobi. To je sice divne, ale nejaky dovod
na to asi bude, a z hladiska RFC je to stale korektne.

Cely ten problem je na mojej strane, ten popcorn jednoducho nezodpoveda RFC
ani Postelovmu principu. Jednoducho to, co pride, hodi do MFC editor
classu, ktory pouziva defaultny charset windowsov, v mojom pripade
win-1250. Ak to, co prislo, bolo iso-8859-2, alebo utf-8, no tak extra
pismenka maju smolu, zmrsia sa uz v tom kroku.

Pri odosielani sa posle pevna hlavicka, v povodnom popcorne iso-8859-1.
Autori su Svedi, takze im editor funguje vo win-1252 takze pre iso-8859-1
v hlavicke funguju aj ich ikeacke pismenka s dvojbodkou.

Ja som hlavicku zmenil na win-1250, takze to sedi s tym editorom; ak teraz
*ja* napisem mail se žluťoučkým koněm, tak ten dostanete spravne. A ak mi
pride mail vo win-1250, tak ho Re-nem spravne. Akurat ze asi drviva
vacsina mailov od tych, co pisu spisovne, mi nepride vo win-1250.

> Jen tak pro mou zvědavost - proč edituješ exe, když editovat zdroják 
> bývá efektivnější?

Nebyva. Zdrojak nespustim. Ucit sa nejake M$VC so zavislostami na SSL
knizniciach (a SSL je kapitola sama osebe, uz len preto lebo sa vola TLS),
na zlozitom cudzom zdrojaku, ktory primarne vznikol pred 30 rokmi, je
netrivialna zalezitost; editovat exe je trivialne.

wekovo prekodovavanie a popcorn je na hw-liste tema ktora sa opakuje
pravidelne asi kazde 2-3 roky, len tak spakruky som nasiel
https://list.hw.cz/pipermail/hw-list/2009-June/355121.html .

Inak si vsimnite, ze sa snazim odmazavat drvivu vacsinu predchadzajuceho
dialogu a nechat len absolutne minimum potrebne pre kontext. IMO tych 5
pismen (nie 5 kusov ale 5 "druhov"), co sa tam zmrsi, to nejako
vyraznejsie nezhorsuju a citatelnost je rovnaka ako citatelnost mojho
textu bez diakritiky.

[a po technickom rozbore, politicky zaver] Je mi jedno co si kto o tom
mysli. Aj tak to, co sa tu prebera, su na 99.9% plky, kvoli tomu sa ja
svojho pohodlia nevzdam. Ak to niekomu vadi, nech moje maily necita,
nastavi si automaticky filter ktory ich bude hadzat do dev/nul, alebo
cokolvek. A ak ma admin kvoli tomu zabanuje, nuz, to je jeho pravo a jeho
rozhodnutie. [/politicky zaver]

wek



----- Original Message ---------------
MUA je tu ten popcorn. Tak pokud ta hlavička nebyla korektní, tak se jí 
asi rozhodl "opravit" někdo cestou (sázím na 95.102.148.217 
(helo=wekovci)), ale jak jsem jiľ psal, cestou je moc aktivního bordelu.

Konec konců dá se podívat co si popcorn uloľil jako sent item.
Na mojí straně je mail korektně eskejpovanej na 7 bit.

Dne 6.4.2022 v 15:49 Jan Waclawek napsal(a):
> Kto je tu MUA?
> 
> Ja som oba maily odoslal s touto hlavickou:
> 
> Content-Type:text/plain;charset=windows-1250
> Content-Transfer-Encoding: quoted-printable
> 
> Viem to, lebo ten popcorn ma napevno hlavicku v .exe - tu prave rucne
> prepisujem, preto chybaju "obvykle" medzery v tom Content-Type.
> 
> wek
> 
> 
> 
> ----- Original Message ---------------
> 
> Subject: Re: OT jazykove kodovanie
>     From: Jindrich Fucik <fulda na seznam.cz>
>     Date: Wed, 6 Apr 2022 15:41:54 +0200
>       To: hw-list na list.hw.cz
> 
> Tak oba při±li podle očekávání.
> 
> První mail je odeslaný:
> Content-Type: text/plain; charset="iso-8859-2"
> Content-Transfer-Encoding: quoted-printable
> 
> a druhý:
> Content-Type: text/plain; charset="cp1250"
> Content-Transfer-Encoding: base64
> 
> Jelikoµ MUA byl přinucen změnit kódování a zároveň mu bylo doporučeno
> neměnit obsah původní zprávy, tak celkem logicky do±el k závěru, µe z
> toho vznikne salát, který nebude moµné tímto kódováním obsáhnout a tak
> to raději zabalil do base64 krabičky.
> Trochu jsem myslel, µe se dodrµuje zvyk, µe se při Re pouµívá původní
> kódování, dokud to jde. A kdyµ uµ to nejde, tak se překóduje na
> nejbliµ±í vět±í, které postihne v±echny znaky pouµité v textech.
> 
> Dne 6.4.2022 v 15:02 Jan Waclawek napsal(a):
>> Hm.
>>
>> A ten prvy post (ne-Re) Vam prisiel ako?
>>
>> wek
>>
>>
>> ----- Original Message ---------------
>>
>> Re je s encodingem 1250 a je roz****ne.
>> J.
>>



Další informace o konferenci Hw-list