<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
</head>
<body>
<div class="moz-cite-prefix">Tak jeste jeden napad - zkuste
print(str.decode('utf8', 'replace')) - melo by to nahradit kazdy
vadny znak znakem uFFFD (otaznik v kosoctverci) - da se
predefinovat v replace error handleru.</div>
<div class="moz-cite-prefix"><br>
</div>
<div class="moz-cite-prefix">Dne 13. 10. 21 v 10:00 Pavel Brychta
napsal(a):<br>
</div>
<blockquote type="cite"
cite="mid:8a8b4f87-1438-44e5-1b28-28497ed17cb1@duhasys.eu">
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
<div class="moz-cite-prefix">Aha, takze chyba je uz v obsahu toho
retezce a ne v nejake konverzi predtim. V tom pripade je treba
se zamerit na to, jak se tam ty nesmysly dostaly. Standardni
metody dokazou ten retezec prevest maximalne s ignorovanim chyb
(treba str.encode('ascii', 'ignore') ), coz ale znamena, ze
invalidni byty vystriha pryc. Dalsi moznost pak je nepouzit
konverzi na bytearray, ale proiterovat to rucne (treba
ord(str[i]), nebo primo str[i], popr '%x' % str[i])<br>
</div>
<div class="moz-cite-prefix"><br>
</div>
<div class="moz-cite-prefix">P.B.</div>
<div class="moz-cite-prefix"><br>
</div>
<div class="moz-cite-prefix">Dne 12. 10. 21 v 13:49 Pavel Hudeček
napsal(a):<br>
</div>
<blockquote type="cite"
cite="mid:NFO.1oXE.TtSwG6JbhU.1XPNOo@seznam.cz">
<meta http-equiv="content-type" content="text/html;
charset=UTF-8">
Omlouvám se, ale nějak mi není jasné, jak to může pomoct. Udělám
nějakej konvert ze stringu do bytearray a ten umře úplně stejným
způsobem. Nebo se to dá konvertit nějak blbuvzdorně?
<div><br>
</div>
<div>PH</div>
<div><br>
<aside> ---------- Původní e-mail ----------<br>
Od: Pavel Brychta <a class="moz-txt-link-rfc2396E"
href="mailto:pavel.brychta@duhasys.eu"
moz-do-not-send="true"><pavel.brychta@duhasys.eu></a><br>
</aside>
<blockquote data-email="pavel.brychta@duhasys.eu">
<p>DD,</p>
<p>Python 2.X má řetězce jako pole bytů, Python 3.x má
implicintí řetězce v Unicode. Neuvedl jste, kterou verzi
Pythonu používáte, ale předpokládám, že >3, takže se
zkuste odívat na Pythoní bytearray ( <a
class="-wm-moz-txt-link-freetext"
href="https://docs.python.org/release/3.1.3/library/functions.html#bytearray"
moz-do-not-send="true">https://docs.python.org/release/3.1.3/library/functions.html#bytearray</a>
), který potom dumpnete ven.</p>
<p>P.B.<br>
</p>
<div class="-wm-moz-cite-prefix">Dne 12. 10. 21 v 12:20
Pavel Hudeček napsal(a):<br>
</div>
<blockquote> Dobrý den všem,
<div><br>
</div>
<div>mějme string vygenerovaný knihovnou, který občas může
obsahovat divné znaky. A já bych ho chtěl zobrazit bez
záruky správnosti enkódování. Prostě aby bylo vidět co
tam asi tak je.</div>
<div><br>
</div>
<div>Když udělám <span
style="background-color:transparent">for a print(str) </span><span
style="background-color:transparent">zobrazí se třeba
10 ze 13 stringů a pak nastane:</span></div>
<div><span style="background-color:transparent">UnicodeDecodeError:
'utf-8' codec can't decode byte 0xff in position 5:
invalid start byte<br>
</span></div>
<div><span style="background-color:transparent"><br>
</span></div>
<div><span style="background-color:transparent">Je nějaký
způsob, jak ho zobrazit bez errorů i za cenu, že to
nebude zcela správně?</span></div>
<div><span style="background-color:transparent"><br>
</span></div>
<div><span style="background-color:transparent">Poznámka:
Na Win10 to funguje bez errorů, ale ne Linuxu nastává
tenhle error. Ale je možné, že rozdíl win/lin je na
straně vzniku toho stringu.</span></div>
<div><span style="background-color:transparent"><br>
</span></div>
<div><span style="background-color:transparent">Je teda
nějakej způsob, jak string zcela hloupě zobrazit, asi
jako když se v roce 1995 zmáčklo F3 ve Volkov
Commanderu?</span></div>
<div><span style="background-color:transparent"><br>
</span></div>
<div><span style="background-color:transparent">Díky,</span></div>
<div><span style="background-color:transparent">PH</span></div>
<br>
<pre class="-wm-moz-quote-pre">_______________________________________________
HW-list mailing list - sponsored by <a class="-wm-moz-txt-link-abbreviated" href="http://www.hw.cz" moz-do-not-send="true">www.HW.cz</a>
<a class="-wm-moz-txt-link-abbreviated" href="mailto:Hw-list@list.hw.cz" moz-do-not-send="true">Hw-list@list.hw.cz</a>
<a class="-wm-moz-txt-link-freetext" href="http://list.hw.cz/mailman/listinfo/hw-list" moz-do-not-send="true">http://list.hw.cz/mailman/listinfo/hw-list</a>
</pre>
</blockquote>
_______________________________________________<br>
HW-list mailing list - sponsored by <a
class="moz-txt-link-abbreviated" href="http://www.HW.cz"
moz-do-not-send="true">www.HW.cz</a><br>
<a class="moz-txt-link-abbreviated"
href="mailto:Hw-list@list.hw.cz" moz-do-not-send="true">Hw-list@list.hw.cz</a><br>
<a class="moz-txt-link-freetext"
href="http://list.hw.cz/mailman/listinfo/hw-list"
moz-do-not-send="true">http://list.hw.cz/mailman/listinfo/hw-list</a><br>
</blockquote>
</div>
<br>
<fieldset class="mimeAttachmentHeader"></fieldset>
<pre class="moz-quote-pre" wrap="">_______________________________________________
HW-list mailing list - sponsored by <a class="moz-txt-link-abbreviated" href="http://www.HW.cz" moz-do-not-send="true">www.HW.cz</a>
<a class="moz-txt-link-abbreviated" href="mailto:Hw-list@list.hw.cz" moz-do-not-send="true">Hw-list@list.hw.cz</a>
<a class="moz-txt-link-freetext" href="http://list.hw.cz/mailman/listinfo/hw-list" moz-do-not-send="true">http://list.hw.cz/mailman/listinfo/hw-list</a>
</pre>
</blockquote>
<p><br>
</p>
<br>
<fieldset class="mimeAttachmentHeader"></fieldset>
<pre class="moz-quote-pre" wrap="">_______________________________________________
HW-list mailing list - sponsored by <a class="moz-txt-link-abbreviated" href="http://www.HW.cz">www.HW.cz</a>
<a class="moz-txt-link-abbreviated" href="mailto:Hw-list@list.hw.cz">Hw-list@list.hw.cz</a>
<a class="moz-txt-link-freetext" href="http://list.hw.cz/mailman/listinfo/hw-list">http://list.hw.cz/mailman/listinfo/hw-list</a>
</pre>
</blockquote>
<p><br>
</p>
</body>
</html>