Niedawno otrzymałem zadanie przygotowania planu budowy zasilania awaryjnego dla serwerowni. Liczne pytania i zagadnienia, które się pojawiły, a także brak zrozumienia niektórych kwestii, skłoniły mnie do napisania tego artykułu. Chciałbym pominąć szczegółowe kwestie techniczne i wyliczenia, które są indywidualne dla każdego przypadku jakim jest zasilanie awaryjne, skupiając się zamiast tego na kilku kluczowych elementach zasilania awaryjnego.

Na co warto zwracać uwagę w zależności od skali i wykorzystania serwerowni:

  1. Pojedynczy serwer w przestrzeni biurowej: Dla samotnego serwera wystarczy zasilacz UPS podtrzymujący zasilanie awaryjne przez kilkanaście minut, co pozwala na bezpieczne wyłączenie serwera w przypadku awarii zasilania. W tej sytuacji, podtrzymywanie zasilania na dłuższy czas często nie jest uzasadnione, chyba że wszystkie stacje robocze to laptopy, które mogą pracować niezależnie na baterii do maksymalnie 2 godzin, wtedy można zastosować zasilanie awaryjne podtrzymujące pracę serwera przez odpowiednio długi czas.
  2. Lokalna serwerownia dla użytku wewnętrznego: Podobnie jak w przypadku pojedynczego serwera, ale z dodatkowym wyzwaniem w postaci kubatury serwerowni. Ważne jest monitorowanie temperatury w serwerowni, szczególnie gdy awaria zasilania wyłączy klimatyzację. Ograniczenie czasu działania w takich warunkach to zazwyczaj 2-4 godziny, zanim ryzyko przegrzania serwerów i pomieszczenia stanie się krytyczne.
  3. Lokalna serwerownia z usługami zewnętrznymi: Tutaj wyzwanie staje się bardziej skomplikowane, gdyż należy zapewnić ciągłość działania nie tylko lokalnym użytkownikom, ale również tym zdalnym. Kluczowe staje się zapewnienie zasilania awaryjnego zarówno dla serwerów, systemów klimatyzacji oraz innych urządzeń krytycznych. Współpraca z dostawcą usług internetowych w celu zapewnienia zasilania awaryjnego dla urządzeń sieciowych dostarczających Internet jest niezbędna.
  4. Serwerownia dla usług zewnętrznych i klientów: W tym scenariuszu, oprócz utrzymania ciągłości działania serwerów i klimatyzacji, kluczowe staje się zapewnienie redundancji łączy internetowych i zasilania awaryjnego dla nich. Możliwość podtrzymania działania serwerowni w trybie online jest krytyczna dla utrzymania usług dla Klientów.

Dodatkowe aspekty do rozważenia:

  • Redundancja klimatyzacji: W serwerowniach często znajdują się dwa klimatyzatory – główny i pomocniczy. Ważne jest ustalenie warunków zasilania awaryjnego dla obu, aby zapewnić ciągłość chłodzenia.
  • Dostęp do Internetu: Współpraca z różnymi dostawcami łączy internetowych w celu zapewnienia redundancji i ciągłości dostępu do sieci w przypadku awarii zasilania.

Doświadczenia z praktyki:

Często spotykam się ze świetnie przygotowanymi systemami zasilania awaryjnego, które tracą sens, gdy dostawca Internetu nie zapewnia zasilania dla swoich urządzeń. Istnieją też przypadki, gdzie serwerownie przegrzewają się z powodu braku właściwej wentylacji podczas awarii zasilania, co prowadzi do uszkodzenia sprzętu i utraty danych.

Przykłady katastrof wynikających z awarii zasilania w serwerowni mogą wyraźnie zilustrować konsekwencje zaniedbań w odpowiednim przygotowaniu do takich zdarzeń. Poniżej przedstawię dwa przykładowe scenariusze opisujące potencjalne katastrofy.

Konsekwencje braku chłodzenia:

Przypadek: W lipcu 2016 roku, w jednym z największych centrów danych w Europie, doszło do całkowitego zatrzymania systemów chłodzenia w wyniku awarii zasilania. Mimo posiadania zasilaczy awaryjnych UPS, które miały za zadanie podtrzymać działanie krytycznych systemów, awaria wpłynęła na systemy chłodzenia, które nie były odpowiednio zabezpieczone przed takimi zdarzeniami.
Skutki: Gwałtowny wzrost temperatury w serwerowni doprowadził do przegrzania się serwerów, co spowodowało ich awarie i automatyczne wyłączanie w celu ochrony przed dalszymi uszkodzeniami. Zanim udało się przywrócić zasilanie i chłodzenie, data center było offline przez kilka godzin, co spowodowało znaczne zakłócenia w dostawie usług dla kluczowych klientów, w tym dla firm finansowych, e-commerce i mediów. Oprócz bezpośrednich strat finansowych, firma musiała zmierzyć się z uszczerbkiem na reputacji i długotrwałymi skutkami dla relacji z klientami.

Brak dostępu do Internetu:

Przypadek: W sierpniu 2018 roku, popularny dostawca hostingu internetowego doświadczył rozległej awarii zasilania, która wyłączyła nie tylko serwery, ale również systemy zapewniające łączność z Internetem. Mimo posiadania generatorów zapewniających zasilanie awaryjne, awaria zasilania w połączeniu z błędami w konfiguracji systemu doprowadziła do utraty połączenia internetowego dla całego data center.
Skutki: Brak dostępu do Internetu spowodował, że setki tysięcy stron internetowych stały się niedostępne dla użytkowników na całym świecie. Dla wielu firm e-commerce, które polegały na usługach tego dostawcy, oznaczało to utratę dochodów i zaufania klientów. Wielogodzinna przerwa w dostawie usług internetowych miała również wpływ na operacje biznesowe klientów, powodując zakłócenia w komunikacji i transakcjach online. Dostawca hostingu został później skrytykowany za brak odpowiednich procedur awaryjnych i słabą komunikację z klientami podczas i po awarii.

Wnioski:

Zasilanie awaryjne dla serwerowni na etapie planowania wymaga holistycznego podejścia, które uwzględnia nie tylko samą ciągłość zasilania, ale również systemy chłodzenia, dostęp do internetu i planowanie awaryjne. Outsourcing IT może być rozwiązaniem, pozwalającym skorzystać z doświadczeń specjalistów, którzy mają szerszą wiedzę na temat dostępnych rozwiązań i potencjalnych pułapek.

Ten artykuł jest przewodnikiem dla menedżerów małych i średnich przedsiębiorstw, aby łatwiej było im zrozumieć, na co zwracać uwagę przygotowując serwerownię do awarii zasilania. Pamiętajmy, że informatyk to tylko człowiek – może pamiętać o wszystkim lub nie, a wsparcie zewnętrzne może zapewnić dodatkową warstwę bezpieczeństwa i wiedzy.

Poznaj nasze usługi.
Definicja zasilania awaryjnego.