Náhrada znaků v TXT v UTF8
Petr Zapadlo
zapik na email.cz
Sobota Březen 22 21:50:31 CET 2014
Zdravím,
sed byl správně, řešila to tato posloupnost:
sed -i -e 's/\xc2\x9e/\xc5\xbe/g' test.txt #pismenko ž
sed -i -e 's/\xc2\x9a/\xc5\xa1/g' test.txt #pismenko š
sed -i -e 's/\xc2\x9d/\xc5\xa5/g' test.txt #pismenko ť
sed -i -e 's/\xc2\x8a/\xc5\xa0/g' test.txt #pismenko Š
sed -i -e 's/\xc2\x8e/\xc5\xbd/g' test.txt #pismenko Ž
Opravdu enca zde nezabrala - setrvale tvrdila, že je vše OK, konverze do
cp1250 (ze které to pravděpodobně pochází) a zpět problém nevyřešila.
Díky
Zapik
Dne 22.3.2014 20:35, Milan B. napsal(a):
> On 22. 3. 2014 14:10, Josef Štengl wrote:
>>
>> Proto tr se nedá a sed se pravděpodobně použít nedá a nejrychlejší a
>> asi i nejbezpečnější řešení je od Pavla Trollera (tady enca opravdu
>> asi… ehm, opravdu nezabere).
>>
>
> SED sa pouzit da. Ak je locale nastavene na UTF8, tak u retazcov s
> diakritikou proste nahradza dva byte za dva byte, jeden byte za dva
> byte, a kludne aj dva byte za styri byte, ak to bude v nejakom
> klingonskom dialekte. To u TR nejde, tam musi byt mapovanie 1:1/
>
> Pouzivam to bezne, priklad som uviedol uz vcera.
>
> -m-
>
>
> _______________________________________________
> HW-list mailing list - sponsored by www.HW.cz
> Hw-list na list.hw.cz
> http://list.hw.cz/mailman/listinfo/hw-list
Další informace o konferenci Hw-list