Re: Algoritmus - text společný všem prvkům pole

Jindroush jindroush na seznam.cz
Čtvrtek Srpen 29 08:57:21 CEST 2019


Pokud jsou vstupy uz omezene na podobne texty, tak:
a) odstranit ne-textove tokeny, zrusit diakritiku
b) rozsekat po slovech
c) vytvorit slovnik / reverzni index
d) vsechna slova, ktera jsou na vsech radcich, jsou ten 'nejdelsi 
spolecny retezec'.

a+b+c jde delat v jednom pruchodu.
j.

On 28.08.2019 22:34, Jan Půhoný wrote:
> Zdravím a potřeboval bych poradit s menším zádrhelem:
>
> Mám pole, které obsahuje podobné texty. Např.
>
> Kód:
> Hadice tlaková
> Hadice tlaková 1/2
> Tlaková hadice 566789
> Tlaková hadice 577898
> Tlaková silná hadice 45677
> atd ...
>
> Nebo:
> Kód:
> Elektrolytický kondenzátor nippon 47uF 100V
> Elektrolitycký kondenzátor nippon 1000uF 35V
> Elektrolitycký kondenzátor nippon 9767898 4700uF/25V
> Elektrolitycký kondenzátor nippon 567788
> 5667 1000uF 25V Elektrolitycký kondenzátor nippon
> 220uF50V Elektrolitycký speciální kondenzátor nippon
> atd ....
>
> a chtěl bych z toho dostat frázi, která je společná všem prvkům. V 
> tomto případě by to byla fráze " tlaková hadice" a "elektrolitycký 
> kondenzátor nippon" tuto frázi ale předem neznám. A nevím ani jak bude 
> dlouhá. Stringy v poli frází mohou začínat nebo nemusí, může být i 
> uprpstřed stringu a klidně i rozdělená dalšími slovy.
>
> Jak by jste na to šli?
> Díky za nakopnutí.
>
> Píšu to v php, ale jde mi spíše o obecný algoritmus. Hraju si s tím od 
> rána. Nejdříve jsem to zkoušel předávat pi stranách po slovech, pak 
> postupně probublávat po 0+i slovech. Uspokojivý výsledek jsem ale  
> nedostal.
>
> Musí to ale přece jít.
>
> Díky,
>
> HP
>
>
> _______________________________________________
> HW-list mailing list  -  sponsored by www.HW.cz
> Hw-list at list.hw.cz
> http://list.hw.cz/mailman/listinfo/hw-list


-- 
Jindroush <jindroush at seznam.cz>

-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://list.hw.cz/pipermail/hw-list/attachments/20190829/fee06037/attachment.html>


Další informace o konferenci Hw-list