Náhrada znaků v TXT v UTF8

Petr Zapadlo zapik na email.cz
Sobota Březen 22 21:50:31 CET 2014


Zdravím,


sed byl správně, řešila to tato posloupnost:

sed -i -e 's/\xc2\x9e/\xc5\xbe/g'  test.txt   #pismenko ž
sed -i -e 's/\xc2\x9a/\xc5\xa1/g'  test.txt   #pismenko š
sed -i -e 's/\xc2\x9d/\xc5\xa5/g'  test.txt   #pismenko ť
sed -i -e 's/\xc2\x8a/\xc5\xa0/g'  test.txt   #pismenko Š
sed -i -e 's/\xc2\x8e/\xc5\xbd/g'  test.txt   #pismenko Ž


Opravdu enca zde nezabrala - setrvale tvrdila, že je vše OK, konverze do 
cp1250 (ze které to pravděpodobně pochází) a zpět problém nevyřešila.

Díky

Zapik



Dne 22.3.2014 20:35, Milan B. napsal(a):
> On 22. 3. 2014 14:10, Josef Štengl wrote:
>>
>> Proto tr se nedá a sed se pravděpodobně použít nedá a nejrychlejší a 
>> asi i nejbezpečnější řešení je od Pavla Trollera (tady enca opravdu 
>> asi… ehm, opravdu nezabere).
>>
>
> SED sa pouzit da. Ak je locale nastavene na UTF8, tak u retazcov s 
> diakritikou proste nahradza dva byte za dva byte, jeden byte za dva 
> byte, a kludne aj dva byte za styri byte, ak to bude v nejakom 
> klingonskom dialekte. To u TR nejde, tam musi byt mapovanie 1:1/
>
> Pouzivam to bezne, priklad som uviedol uz vcera.
>
> -m-
>
>
> _______________________________________________
> HW-list mailing list  -  sponsored by www.HW.cz
> Hw-list na list.hw.cz
> http://list.hw.cz/mailman/listinfo/hw-list



Další informace o konferenci Hw-list