Chvala Linuxu - den siesty, rano

Pavel Troller patrol na sinus.cz
Čtvrtek Únor 14 09:44:51 CET 2013


Zdravím,
 
> Jo, máte pravdu v tom, že je to bludný kruh, protože stejně se pak můžete zeptat "a kdo/co kontroluje ty programy které simulují chybu testující safeguarding systém... ?"

Ano. To už kontroluje člověk.
V jeho povinnostech je každé pondělí ráno projít logy a podívat se, zda vznikly správně všechny "pseudozávady" a byly správně "opraveny".

> Nevím jak současný HW ale v Ramoně i v Tamaře bylo z pěti pater desek logiky v měřící jednotce vždy celé jedno patro pouze pro diagnostiku a simulaci provozu těch zbylých pater a k mým nejhorším zážitkům patřilo to, když jsem zjistil že ten simulační HW dělá nějaké chyby kvůli kterým nejsem schopen hýbat tím ostrým HW abych našel chybu v něm...
> Domnívám se že prostě na určité úrovni se vždy musí někdo koncepčně rozhodnout a říct " a dost..."

Určitě! Ale právě někdy je dobré mít tam několik vrstev, které se vzájemně kontrolují.
Uvedu ještě jeden příklad, který používá nejen EWSD, ale třeba i Open Source ústředna Asterisk: tzv. "kanár". Pokud to znáte, omlouvám se za zdržení.
Používá se v prostředí operačních systémů s plánovačem pracujícím dle priorit. Jedna z úloh safeguardingu má v tomto případě velmi vysokou prioritu, zaručující, že bude v pravidelných intervalech spouštěna za libovolného stavu ostatních úloh. Druhá úlohá, "kanár", má naopak co možná nejnižší prioritu.
Úloha s vysokou prioritou pravidelně testuje, zda "kanár" žije. Žijící kanár se pozná tím, že "zobe" z určitého místa, např. obnovuje stále nějaký soubor. Pokud ta dohlížecí úloha zjistí, že kanár už dlouho nezobal, vyhlásí alarm či se pokusí o nějaké nápravné řešení. Může např. začít zvyšovat prioritu kanára a zjišťovat, kdy začne zase "zobat". Tím se zjistí, na které úrovni priority běží proces, který žere všechny prostředky CPU a nepustí nic "pod sebe", a ten může "odstřelit" atd.
Zdraví Pavel


> 
> Zdravím
> Kručinský
> 
> 
> -----Original Message-----
> From: hw-list-bounces na list.hw.cz [mailto:hw-list-bounces na list.hw.cz] On Behalf Of Pavel Troller
> Sent: Thursday, February 14, 2013 6:49 AM
> To: HW-news
> Subject: Re: Chvala Linuxu - den siesty, rano
> 
> Zdravim,
>   tak v tomto mne neutvrdil Linux, ale systemy, se kterymi pracuji ja, a to klasicke telefonni ustredny.
>   Uvadi se, ze programove vybaveni systemu EWSD (ustredna od Siemense) obsahuje zhruba 30% aktivniho software (ktery opravdu telefonuje), zatimco zbylych 70% predstavuje tzv. safeguarding - diagnostika, at uz trvale bezici nebo na vyzadani, vyhledavani chyb behem chodu systemu, jejich automaticka korekce a predchazeni dalsim, neustale kontroly konzistence vsech databazi (na discich i v pameti), "propiskavani" hardware (spojovaciho pole a prenosovych cest) pred zacatkem kazdeho hovoru atd. Ale kdo zkontroluje safeguarding ? Jde to az tak daleko, ze ve stanoveny cas se (samozrejme softwarove) aktivuji specialni obvody (nebo programy), ktere simuluji vznik zavady a testuje se, zda safeguarding zavadu objevi, zaregistruje a fixne (v tomto pripade automatickym prenutim z aktivni jednotky na zalozni).
>   Malicko si rypnu - existuje jista velka, prevelka organizace, ktera provozuje jisty nejslozitejsi aparat momentalne na zemi existujici, a ja si nekdy pri studiu logu z toho aparatu trham vlasy a rikam si - kdyby tam pouzili alespon desetinu z techto safeguarding principu, ktere umi kazda "blba" ustredna, nebylo by tolik prostoju zpusobenych zhroucenymi procesory kdesi v tunelu, nahle se odmlcujicimi servery z duvodu, ze kdosi ma ze sveho kompu v uzamcene kancelari pusteno 30 klientu nejake aplikace a ty ten server pretezuji, pripadne zrestartovana jednotka si zapomene pri bootu nastavit realny cas a chybnymi timestampy "otravi" polovinu site :-). Ale chapu, ze toho softu je tam tolik, ze napsat jeste vice nez jednou tolik "jen" z duvodu safeguardingu asi nebylo v lidskych silach...
>   Zdravi Pavel
> 
> > Chvalim Linux.
> > 
> > Chvalim Linux za to, ze ma utvrdil v tom, ze druhe najtazsie na softwarovani je poriadne osetrenie chyb, neocakavanych udalosti a neobvyklych stavov.
> > 
> > wek


Další informace o konferenci Hw-list