<html>
  <head>
    <meta http-equiv="Content-Type" content="text/html; charset=utf-8">
  </head>
  <body text="#000000" bgcolor="#FFFFFF">
    <div class="moz-cite-prefix">Pokud jsou vstupy uz omezene na podobne
      texty, tak:<br>
      a) odstranit ne-textove tokeny, zrusit diakritiku<br>
      b) rozsekat po slovech<br>
      c) vytvorit slovnik / reverzni index<br>
      d) vsechna slova, ktera jsou na vsech radcich, jsou ten 'nejdelsi
      spolecny retezec'.<br>
      <br>
      a+b+c jde delat v jednom pruchodu.<br>
      j.<br>
      <br>
      On 28.08.2019 22:34, Jan Půhoný wrote:<br>
    </div>
    <blockquote type="cite"
cite="mid:CAEwSxSEJSTGrSYRU_ftee31b23RnVt5wa=-b0Xty8oabJk0EfQ@mail.gmail.com">
      <meta http-equiv="content-type" content="text/html; charset=utf-8">
      <div dir="auto"><span
style="font-family:verdana,arial,tahoma,calibri,geneva,sans-serif;font-size:14px;background-color:rgb(255,255,255)">Zdravím
          a potřeboval bych poradit s menším zádrhelem:</span><br
style="font-family:verdana,arial,tahoma,calibri,geneva,sans-serif;font-size:14px;background-color:rgb(255,255,255)">
        <br
style="font-family:verdana,arial,tahoma,calibri,geneva,sans-serif;font-size:14px;background-color:rgb(255,255,255)">
        <span
style="font-family:verdana,arial,tahoma,calibri,geneva,sans-serif;font-size:14px;background-color:rgb(255,255,255)">Mám
          pole, které obsahuje podobné texty. Např. </span><br
style="font-family:verdana,arial,tahoma,calibri,geneva,sans-serif;font-size:14px;background-color:rgb(255,255,255)">
        <br
style="font-family:verdana,arial,tahoma,calibri,geneva,sans-serif;font-size:14px;background-color:rgb(255,255,255)">
        <div style="margin:5px 20px
20px;padding:0px;font-family:verdana,arial,tahoma,calibri,geneva,sans-serif;font-size:14px;background-color:rgb(255,255,255)"
          dir="auto">
          <div style="margin:0px;padding:0px">Kód:</div>
          <pre style="margin-top:0px;margin-bottom:0px;padding:6px;line-height:12px;border:1px inset;direction:ltr;background:repeat-x rgb(242,246,248);font-size:12px;height:84px">Hadice tlaková
Hadice tlaková 1/2
Tlaková hadice 566789
Tlaková hadice 577898
Tlaková silná hadice 45677</pre>
        </div>
        <span
style="font-family:verdana,arial,tahoma,calibri,geneva,sans-serif;font-size:14px;background-color:rgb(255,255,255)">atd
          ...</span><br
style="font-family:verdana,arial,tahoma,calibri,geneva,sans-serif;font-size:14px;background-color:rgb(255,255,255)">
        <br
style="font-family:verdana,arial,tahoma,calibri,geneva,sans-serif;font-size:14px;background-color:rgb(255,255,255)">
        <span
style="font-family:verdana,arial,tahoma,calibri,geneva,sans-serif;font-size:14px;background-color:rgb(255,255,255)">Nebo:</span><br
style="font-family:verdana,arial,tahoma,calibri,geneva,sans-serif;font-size:14px;background-color:rgb(255,255,255)">
        <div style="margin:5px 20px
20px;padding:0px;font-family:verdana,arial,tahoma,calibri,geneva,sans-serif;font-size:14px;background-color:rgb(255,255,255)"
          dir="auto">
          <div style="margin:0px;padding:0px">Kód:</div>
          <pre style="margin-top:0px;margin-bottom:0px;padding:6px;line-height:12px;border:1px inset;direction:ltr;background:repeat-x rgb(242,246,248);font-size:12px;height:96px">Elektrolytický kondenzátor nippon 47uF 100V
Elektrolitycký kondenzátor nippon 1000uF 35V
Elektrolitycký kondenzátor nippon 9767898 4700uF/25V
Elektrolitycký kondenzátor nippon 567788
5667 1000uF 25V Elektrolitycký kondenzátor nippon 
220uF50V Elektrolitycký speciální kondenzátor nippon</pre>
        </div>
        <span
style="font-family:verdana,arial,tahoma,calibri,geneva,sans-serif;font-size:14px;background-color:rgb(255,255,255)">atd
          ....</span><br
style="font-family:verdana,arial,tahoma,calibri,geneva,sans-serif;font-size:14px;background-color:rgb(255,255,255)">
        <br
style="font-family:verdana,arial,tahoma,calibri,geneva,sans-serif;font-size:14px;background-color:rgb(255,255,255)">
        <span
style="font-family:verdana,arial,tahoma,calibri,geneva,sans-serif;font-size:14px;background-color:rgb(255,255,255)">a
          chtěl bych z toho dostat frázi, která je společná všem prvkům.
          V tomto případě by to byla fráze " tlaková hadice" a
          "elektrolitycký kondenzátor nippon" tuto frázi ale předem
          neznám. A nevím ani jak bude dlouhá. Stringy v poli frází
          mohou začínat nebo nemusí, může být i uprpstřed stringu a
          klidně i rozdělená dalšími slovy.</span>
        <div dir="auto"><span
style="font-family:verdana,arial,tahoma,calibri,geneva,sans-serif;font-size:14px;background-color:rgb(255,255,255)"><br>
          </span></div>
        <div dir="auto"><span
style="font-family:verdana,arial,tahoma,calibri,geneva,sans-serif;font-size:14px;background-color:rgb(255,255,255)">Jak
            by jste na to šli?</span><br
style="font-family:verdana,arial,tahoma,calibri,geneva,sans-serif;font-size:14px;background-color:rgb(255,255,255)">
          <span
style="font-family:verdana,arial,tahoma,calibri,geneva,sans-serif;font-size:14px;background-color:rgb(255,255,255)">Díky
            za nakopnutí.</span>
          <div dir="auto"><font face="verdana, arial, tahoma, calibri,
              geneva, sans-serif"><span style="font-size:14px"><br>
              </span></font></div>
          <div dir="auto"><font face="verdana, arial, tahoma, calibri,
              geneva, sans-serif"><span style="font-size:14px">Píšu to v
                php, ale jde mi spíše o obecný algoritmus. Hraju si s
                tím od rána. Nejdříve jsem to zkoušel předávat pi
                stranách po slovech, pak postupně probublávat po 0+i
                slovech. Uspokojivý výsledek jsem ale  nedostal.</span></font></div>
          <div dir="auto"><font face="verdana, arial, tahoma, calibri,
              geneva, sans-serif"><span style="font-size:14px"><br>
              </span></font></div>
          <div dir="auto"><font face="verdana, arial, tahoma, calibri,
              geneva, sans-serif"><span style="font-size:14px">Musí to
                ale přece jít.<br>
              </span></font>
            <div dir="auto"><span
style="font-family:verdana,arial,tahoma,calibri,geneva,sans-serif;font-size:14px;background-color:rgb(255,255,255)"><br>
              </span></div>
            <div dir="auto"><span
style="font-family:verdana,arial,tahoma,calibri,geneva,sans-serif;font-size:14px;background-color:rgb(255,255,255)">Díky,</span></div>
            <div dir="auto"><span
style="font-family:verdana,arial,tahoma,calibri,geneva,sans-serif;font-size:14px;background-color:rgb(255,255,255)"><br>
              </span></div>
            <div dir="auto"><span
style="font-family:verdana,arial,tahoma,calibri,geneva,sans-serif;font-size:14px;background-color:rgb(255,255,255)">HP</span></div>
          </div>
        </div>
      </div>
      <br>
      <fieldset class="mimeAttachmentHeader"></fieldset>
      <br>
      <pre wrap="">_______________________________________________
HW-list mailing list  -  sponsored by <a class="moz-txt-link-abbreviated" href="http://www.HW.cz">www.HW.cz</a>
<a class="moz-txt-link-abbreviated" href="mailto:Hw-list@list.hw.cz">Hw-list@list.hw.cz</a>
<a class="moz-txt-link-freetext" href="http://list.hw.cz/mailman/listinfo/hw-list">http://list.hw.cz/mailman/listinfo/hw-list</a>
</pre>
    </blockquote>
    <p><br>
    </p>
    <pre class="moz-signature" cols="72">-- 
Jindroush <a class="moz-txt-link-rfc2396E" href="mailto:jindroush@seznam.cz"><jindroush@seznam.cz></a></pre>
  </body>
</html>