J:
Kā uzņēmumi maksimāli izmanto uptime?
A:Acīmredzami svarīgi ir uzturēt IT pakalpojumus un tos darbināt. Sistēmu ražotāji ir daudz domājuši par šo tēmu. Daži kritiski finanšu datori gadiem ilgi darbojas nepārtraukti. Internetā ir stāsts par Novell Netware 3 datoru, kas beidzot tika slēgts pēc 16 gadiem. Apsverot tīkla darbības laiku, standarts ir “Pieci 9” jeb 99, 999% pieejamība. Jebkura IT pakalpojumu piedāvājuma svarīgs apsvērums ir maksimāla darbības laika sasniegšana.
Kā tiek sasniegts maksimālais darbspējas laiks? Laba pārvaldība ir galvenais. Starptautiskā standartizācijas organizācija (ISO) izveidoja tīkla pārvaldības sistēmu ar nosaukumu FCAPS, kas apzīmē:
- Kļūdu vadība
- Konfigurācijas pārvaldība
- Grāmatvedības vadība
- Darbības vadība
- Drošības pārvaldība
Izmantojot šo modeli, gan proaktīvi, gan reaģējoši tiek risinātas problēmas ar atsevišķiem tīkla komponentiem. Kļūdas tiek novērotas, izmantojot trauksmes signālus un paziņojumus par notikumiem. Tos savāc protokolu aģenti, piemēram, SNMP (sistēmu tīkla pārvaldības protokols) vai daži citi patentēti risinājumi. Pielāgojami sliekšņi var izraisīt trauksmes un pat automātiski ģenerēt biļetes, kas nonāk datu centru uzraudzības personāla rindās. Lieliem pārvadātāju tīkliem var būt atsevišķas nodaļas, kas nodarbojas ar tīkla pamata, izplatīšanas vai piekļuves slāņiem. Sākotnējo cēloņu analīze mēģina izolēt un definēt kritiskās problēmas pēc liela notikuma.
Līdzīgi procesi tiek izmantoti sistēmas pārvaldībā. Interneta pakalpojumu sniedzēji (ISP) un pārvaldītie hostinga centri nodarbina sistēmu administratorus, lai uzraudzītu un pārvaldītu serveru, glabāšanas sistēmu vai citu ierīču dzīvotspēju. Piemēram, atsevišķus procesus Windows vai Linux mašīnās var apskatīt un kontrolēt, izmantojot grafiskās lietotāja saskarnes (GUI) pārvaldības programmas tādā pašā veidā kā tīkla protokoli.
Tīkla komponentu un sistēmu tālvadība un konfigurēšana nodrošina reāllaika iespējas, lai palielinātu sistēmas darbības laiku. Tas attiecas arī uz konfigurācijas izmaiņām, galveno darbības rādītāju apkopošanu vai drošības uzlabojumu ieviešanu.
Viens veids, kā aplūkot jebkuras sistēmas darbības laiku un robustumu, ir modelis, kuru IBM sauca par RAS: uzticamība, pieejamība un izmantojamība. Lai nodrošinātu RAS, ir izstrādātas daudzas metodes. Tie ietver dublēšanu, datu dublēšanu, nepārtrauktās barošanas avotus (UPS), komponentus, kas tiek ātri apmaināmi, un automātiskos atjauninājumus. Plānotās izmaiņas un apkopes logi piedāvā iespējas labot vai uzlabot zināmās problēmas, neraizējot lietotāju.
Galu galā sistēmas un tīkli neizdosies. Atlaišana ir viena no sistēmas elastības atslēgām. Tas var attiekties uz aparatūru, programmatūru vai datiem. Tie, kas ir atbildīgi par tīkla vai programmatūras sistēmas uzticamības nodrošināšanu, meklēs to, ko var uzskatīt par vienu kļūmes punktu (SPOF). Vai viss tīkls plūst caur vienu slēdzi vai kabeli? Vai visi procesi notiek vientuļā serverī? Vai ir tikai viens kritiskās datu kopijas eksemplārs? Bez atlaišanas uzņēmums vienā mirklī var zaudēt tā attīstību, kam, iespējams, vajadzēja vairākus gadus.
Uzturēšanas laika maksimizēšana ir “viss iepriekšējs” mēģinājums. Labākā prakse ir izstrādāta gadu desmitiem ilgas pieredzes un sadarbības rezultātā. Pastāvīgi tiek ieviesti jauni risinājumi, piemēram, pašdziedināšanās tīkli, virtualizācija, datu analīze un uzlabota arhitektūra. Neviena metode neatbild uz visiem jautājumiem, kas rodas sarežģītās sistēmās. Katrs uzņēmums cenšas pēc iespējas efektīvāk izmantot savus IT resursus tā rīcībā esošā aprīkojuma dzīves cikla laikā.
