Porucha na poštovním serveru
V sobotu 12. září okolo osmé hodiny ranní došlo na fakultním poštovním serveru k poruše, server poté přestal vyřizovat všechny požadavky na čtení nebo posílání pošty. Pracovníci Centra informačních technologií týž den na místě zjistili, že jde o problém hardwarový - vadnou součástkou byl řadič diskového pole, bez nějž nelze přistupovat k datům uloženým na pevných discích. Problém byl telefonicky ohlášen na lince podpory pro servery, servisní technik přijel s dílem na výměnu v úterý odpoledne. Následná kontrola dat neobjevila žádný problém a poštovní služby serveru byly bez dalšího prodlení zprovozněny.
Přečtená i nepřečtená pošta uložená na serveru zůstala bez poškození.
Pošta, která čekala na uživatelských počítačích (Pošta k odeslání), se rozešle ihned poté, co počítač zjistí, že server znovu začal fungovat.
Pošta, která byla od okamžiku poruchy (sobota ráno) zasílána na fakultu zvenčí, mezitím vyčkávala na serverech MU. Po obnovení provozu fakultního poštovního serveru byla postupně dosílána, ve středu 16. 9. ráno již jsou všechny pozdržené dopisy doručeny. Mohlo však dojít k malému nedorozumění - u dopisů, které se nepodaří během určené limitní doby (v rozmezí 4 hodiny až 2 dny) doručit příjemci, se odesílateli vrací zpět varování o nemožnosti dopis v tuto chvíli doručit:
From: Mail Delivery Subsystem <MAILER-DAEMON@...> Subject: Warning: could not send message for past 4 hours
Je to opravdu jen varování, poštovní programy se dál pokoušejí dopis doručovat. Teprve při nedostupnosti poštovního serveru delší než 5 dní se dopis skutečně nedoručí a vrací se zpět odesílateli s jasným označením Undeliverable mail. V našem případě byl server nedostupný jen tři a půl dne, žádné dopisy by se vracet neměly a všechny by měly dorazit do poštovní schránky příjemce, jen o několik dnů později.
Skupina fakultních serverů již delší dobu má role rozdělené podle možností jednotlivých serverů, žádné jiné služby se tedy porucha poštovního serveru nedotkla. Fungovaly fakultní webové stránky (oznámení o dysfunkci jsme ihned umístili na hlavní stránku fakulty), e-learningový systém ELF apod.
Tento případ byl výjimečný ve více ohledech:
- šlo o poruchu takového druhu, kterou pracovníci CIT sami vlastním úsilím odstranit nemohou,
- k poruše došlo o víkendu; i přes rychlou lokalizaci vadného dílu nebylo možné zajistit rychlou nápravu - typ servisní smlouvy, kterou má fakulta uzavřenou s dodavatelem, vylučuje zásah v nepracovní dny,
- byl to ale také výpadek, k jakému dochází velmi zřídka: byl neobvyklý nejenom svým rozsahem, ale už tím, že k němu vůbec došlo, spolehlivost služeb na fakultních serverech byla dosud velmi vysoká.
CIT zajišťuje u serverů maximální možnou dostupnost, poruchy počítačových dílů však nelze předvídat. Dosavadní zkušenosti s hardwarem i se softwarem byly dobré.
Děkujeme uživatelům za trpělivost a přejeme šťastné shledání s dopisy ve schránkách. Poštovní server je obnoven s původními daty a pracuje nyní správně.
Časový graf vytížení poštovního serveru.
Na vodorovné ose dny v měsíci září, na svislé procentuální zatížení.
