Náhrada znaků v TXT v UTF8

Josef Štengl ok1ced na nagano.cz
Sobota Březen 22 11:00:18 CET 2014


Proč otrocky? Vypadá to na problém při konvertování do utf-8 a vybraná špatná kódová strana (neb Microsoft si musel zase 
„upravit“ iso normu).

Pošlete (krátký) soubor s problémovým řetězcem a dá se to rychle dohromady.

Před lety jsem to korigoval již zmíněnou enca a iconv;

Tohle je výřez z perlového scriptu

	my $icode = `enca -i "$file"`;
	say "Zdrojové kódování: $icode";
	chomp $icode;
	`iconv -f $icode -t UTF-8 -o "$dest" --verbose "$file"`;


takže enca zjistí zdrojové kódování do $icode, odstraní \n z konce a iconv to převede do souboru $dest ze souboru $file

Bude to stačit takto?

ced


Dne 22.3.2014 09:40, Petr Zapadlo napsal(a):
> Zdravím,
>
>
> neznám původní sadu, ani to jak soubory vznikly a čím byly konvertované. prostě mám stovky souborů s kodováním UTF8, které
> mají vadné znaky ž,š,ť a jejich velké ekvivalenty. Nic víc a nic míň.
>
> Nějak se s tím poperu, zjišťoval jsem jestli existuje ekvivalent tr, který respektoval UTF8, asi ne, tak to budu muset
> udělat otrocky.
>
> Díky za pomoc a přeji pěkný víkend.
>
> Petr
>
>
> Dne 22.3.2014 00:36, Milan B. napsal(a):
>>
>> Jednoduse: Zkonvertovat to nejdriv do te spatne znakove sady,
>> tu prohlasit za spravnou a korektne zkonvertovat do utf8.
>>
>>
>> Neopisujte. Tato trivialita, ktora vobec neodpoveda na moju, toboz nie na povodnu otazku, tu uz zaznela:
>> http://list.hw.cz/pipermail/hw-list/2014-March/454140.html
>>
>>
>>>
>>> p.t.
>>>
>>>
>>> _______________________________________________
>>> HW-list mailing list  -  sponsored by www.HW.cz
>>> Hw-list na list.hw.cz
>>> http://list.hw.cz/mailman/listinfo/hw-list
>>
>> _______________________________________________
>> HW-list mailing list  -  sponsored by www.HW.cz
>> Hw-list na list.hw.cz
>> http://list.hw.cz/mailman/listinfo/hw-list
>
> _______________________________________________
> HW-list mailing list  -  sponsored by www.HW.cz
> Hw-list na list.hw.cz
> http://list.hw.cz/mailman/listinfo/hw-list


Další informace o konferenci Hw-list