Navigatie overslaan.
Start

HA en UPSen

High available servers en netwerken zijn leuk.
Eigenlijk is het niet echt moeilijk om dergelijke dingen te realiseren. Je moet alleen logisch kunnen nadenken, en blijkbaar kunnen veel mensen dat niet.

Zonder electriciteit werkt er echter niet veel in computerland, en meestal gaat het daar al mis...

Bedrijven stoppen veel geld in (veel te) dure servers, met 4 processoren, 2 voedingen, RAID 5, enz...
Dan kopen ze meestal 1 UPS en alles wordt daarop aangesloten.

Fout dus.

Een server heeft 2 voedingen met de bedoeling om je server op 2 aparte electriciteitscircuits aan te sluiten, m.a.w., als je "Dual-PSU"wil implementeren, dan moet je ook investeren in "dual-power-feeds" (en dus dual UPSen), anders heeft het geen zin.

Als je dan toch heel erg arm bent en maar 1 UPS kan kopen, dan sluit je 1 PSU aan op de UPS en de andere niet, dus gewoon in het stopcontact, liefst een stopcontact van een apart electriciteitscircuit, met een aparte zekering. Simpel.

De reden hiervoor is dat ook je UPS een aparaat is dat kan stoppen met werken. Creëer dus geen single point of failure door alles op 1 UPS aan te sluiten.
(Verder ga je ooit ook eens batterijen moeten vervangen, en sommige UPSen moeten daarvoor uitgeschakeld worden, niet echt "high available" dus.)

Een andere reden is eigen aan computer voedingen, er is steeds een lekstroom. Die kan groot zijn, of klein, maar het belangrijktste is dat er een is.
Als je serverfarm groeit en groeit, gaat ook die lekstroom groeien en groeien. Als je electriciteitsinstallatie conform het AREI is (Algemeen Regelment op de Electrische Installaties), zal je een verliestroomschakelaar hebben die bij 300mA lekstroom alles afschakeld. Nog een goede reden voor aparte stroomcircuits (met dus aparte verliesstroomschakelaars).

Als je 2 UPSen hebt, dan is het de bedoeling om UPS1 op PSU1 van je servers aan te sluiten en UPS2 op PSU2 van diezelfde servers. Klinkt logisch, en dat is het ook, maar blijkbaar niet logisch genoeg om het ook daadwerkelijk te doen.
Ik heb al situaties meegemaakt waar de bovenste helft van een rack op UPS1 was aangesloten en de onderste helft op UPS2. De bovenste helft was netwerk aparatuur (Switches en routers), de onderste helft de servers. Bij 1 UPS failure was alles down...

Zelfs al sluit je alles correct aan, dan zijn er toch nog een hoop fouten die gemaakt kunnen worden.
Hieronder mijn praktijk ervaring van veelgemaakte fouten:


Beide UPSen op hetzelfde electriciteitscircuit.

Wat denk je dat er gaan gebeuren als "die ene" zekering of verliesstroomschakelaar springt?


Beide UPSen tot (bijna) 100% belast.

Wat denk je dat er gaat gebeuren als 1 UPS faalt, of als je een UPS uitgschakeld?


Geen software om je systemen af te sluiten bij een power failure.

Waarom heb je dan eigenlijk een UPS als je servers toch unlcean downgaan na 30 minuten bij een power failure op zondag om 03:48h?

Vanaf het moment dat je een (of meerdere) fouten hebt gemaakt, heb je geen high available systeem.
Als je denkt dat je wel een high available systeem hebt, dan ben je niet bang om een UPS uit te zetten, of om een zekering te laten springen... (Als je het niet getest hebt, dan werkt het niet.)

En dan hebben we het nog niet gehad over die bedrijven die hun noodgenerator om zeep helpen door hem iedere week/maand onbelast een testrun te laten maken, of bedrijven die geen koeling kunnen voorzien bij een stroomstoring...
Beide een perfect recept om toch je datacenter down krijgen tijdens stroomstoringen.

Lees ook mijn tekst over UPSen: http://www.knudde.be/index.php?page_name=ups
Of iets over datacenters en downtime: http://blog.knudde.be/Datacenters+en+downtime