Navigatie overslaan.
Start

Reliability, Redundancy en Availability.

Als je in de IT werkt, dan kom je de bovenstaande termen wel eens tegen.
Helaas ook vaak als synoniem of compleet verkeerd gebruikt.

Dus, wat is wat?

Reliability.

Dit is het meest simpele: De betrouwbaarheid van iets.

De bestrouwbaarheid van een compleet systeem is niet altijd makkelijk om te meten.
De betrouwbaarheid van een component echter vaak wel en is eigenlijk de MTBF, Mean Time Between Failures.
Dit is de gemiddelde tijd tussen 2 faalevenementen.

Over het algemeen geldt dat hoe simpeler een systeem, hoe betrouwbaarder. (Minder componenten die kunnen falen.)
Ook hoe beter de kwalitet van de componenten en opbouw, hoe betrouwbaarder iets wordt.

Als iets uit meer dan 1 component bestaat, dan kans je de betrouwbaarheid van het geheel berekenen als volgt: 1/MTBF geheel = 1/MTBF component 1 + 1/MTBF component 2 + ...

Als je een server met 2 harde schijven hebt, en de MBTF van schijf 1 is 100 uur, die van schijf 2 is 80 uur, dan is de totale MTBF slechts 44.444... uur.

Betrouwbaarheid is een berekende waarde en geeft een indicatie over hoe betrouwbaar iets gemiddeld is.
Het is perfect mogelijk dat een component met een MTBF van 100 uur al faalt na 50 uur, of slechts na 400 uur.

Redundancy.

Redundancy of redundantie is het hebben van extra componenten zodat deze extra componenten kunnen overnemen bij het falen de normale component.

Men spreekt van "full redundancy" indien alle componenten gedupliceerd zijn, maar dit is zeer moeilijk te bereiken en vaak ook zinloos.
Servers hebben bijvoorbeeld vaak redundantie disk arrays, maar geen redundant moederbord.

Een ander bekend voorbeeld van redundantie is het hebben van 2 voedingen in een server.
Indien er 1 kapot gaat, kan de server verder blijven werken met slechts 1 werkende voeding.

Het is echter niet altijd zo dat, indien iets ontdubbeld wordt, het dan ook automatisch redundant wordt.
Bijvoorbeeld een server met 2 voedingen, waabij de server 800W verbruikt, en er 2 voedingen zijn van 500W.
In dit geval is er geen sprake van redundantie, maar van parallelwerking.
De server heeft gewoonweg 2 voedingen nodig om genoeg stroom te kunnen krijgen en zal niet werken met slechts 1 voeding.
Door de parallelwerking is de betrouwbaarheid zelfs afgenomen. (Zie berekening betrouwbaarheid hierboven.)

Redundantie zorgt ervoor dat er een grotere betrouwbaarheid bereikt wordt van het gehele systeem, door ervoor te zorgen dat de onbetrouwbaarheid van een enkele component geen impact heeft op het hele systeem.

Redundantie is een eigenschap van een design om de totale betrouwbaarheid te verhogen.

Vaak is het moeilijk om achteraf voor redundantie te zorgen, omdat het iets is dat vaak tot diep in het design moet doordringen.
Hierdoor worden slechts een aantal oppervlakkige dingen redundant gemaakt, en niet het geheel.
Bijvoorbeeld het lezen vanuit een database is redundant, maar het schrijven ernaar niet.

Availability.

De beschikbaarheid van een systeem is eigenlijk iets dat enkel achteraf kan vastgesteld worden.
Vorige week had mijn server een beschikbaarheid van 100%. Of dat volgende week ook nog zo zal zijn kan ik niet weten.

Men kan wel een systeem ontwerpen om "high available" te zijn, en dat gebeurt vaak door gebruik te maken van redundancy, maar is toch niet hetzelfde.

Als ik 2 servers heb (redundancy) en het duurt 5 seconden om van de ene server naar de andere server over te schakelen, dan ben ik 5 seconden "onbeschikbaar" geweest.
De servers zijn dus wel redundant, maar niet high available.
Uiteraard is de beschikbaarheid wel beter dan indien ik geen redundante server zou hebben.

Echte High-Availability kan enkel bereikt worden door gebruik te maken van redundantie waarbij er geen tijd nodig is om over te schakelen tussen verschillende componenten, en door er voor te zorgen dat er genoeg redundantie is.

Het is perfect mogelijk dat de echte server en alle andere redundante servers gelijktijdig falen.
vb: Iemand heeft de database gewist op een redundante database server.

Het is perfect mogelijk dat alle communicatielijnen in een bepaalde streek gelijktijdig uitvallen.
vb: Aardbeving. Sommige datacenters hebben daarom backup links via satelliet voor hun High Availability.

Met "High Availability" wordt vaak in sales talk redundantie bedoeld,
maar is eigenlijk een geheel van dingen die gedaan worden om de
beschikbaarheid van het systeem zo hoog mogelijk te maken en dat hangt
af van de situatie. 

In een omgeving met veel electromagnetische straling, ga je veel tijd moeten steken in het design van de powersupplies en signaalbekabeling om tot een high available systeem te komen.

In een omgeving met veel trillingen, ga je veel tijd moeten steken in het design van alle mechanische componenten om tot een high available systeem te komen.
Enz...

Vaak wordt High Availability bekomen om door een andere manier te gebruiken om hetzelfde te doen, bijvoorbeeld:
Redundantie: Twee email adressen hebben bijverschillende providers om een document te kunnen ontvangen.
High Availability: Een email adress en een faxnummer hebben om een document te kunnen ontvangen.