Linux Systeembeheer/Opslagapparaten beheren: verschil tussen versies
Verwijderde inhoud Toegevoegde inhoud
Geen bewerkingssamenvatting |
|||
Regel 14:
** Linux Software RAID kunnen toepassen
== Opslagsystemen in bedrijfscontext ==
In dit onderdeel leggen we kort de betekenis uit van enkele types van opslagsystemen die in het bijzonder in bedrijven gebruikt worden.
Opslagmedium dat op het netwerk aangesloten is. Dit type apparaten vind je in de consumentenmarkt terug als een netwerk-harde schijf. De hardware omvat minstens een grote harde schijf en een netwerkaansluiting, typisch een processor met beperkt energieverbruik en meestal nog andere connectoren (USB, eSATA, FireWire, ...). Meestal draait hierop een vorm van embedded Linux met services voor de meest gangbare protocols voor bestandsdeling: Samba, FTP, eventueel NFS, enz. NAS kan gebruik maken van meerdere harde schijven die vaak in RAID gebruikt worden. Versies voor professioneel gebruik kunnen rack-mountable zijn, met snellere processoren of interfaces.
Een SAN is specifiek voor grotere bedrijven nuttig. Opslagapparaten (harde schijven, tape, optische schijven, enz.) zijn fysiek losgekoppeld van de servers die er gebruik van maken, maar voor het besturingssysteem zijn ze niet te onderscheiden van lokale schijven. Performantie is in dit type opstellingen van groot belang, en daarom is de bekabeling typisch gebaseerd op glasvezel. Dat is een van de redenen dat een SAN erg duur is. De protocollen die op dit soort netwerken gebruikt worden zijn vaak afgeleid van deze voor het aanspreken van lokale, fysieke schijven, bijvoorbeeld iSCSI of ATA over Ethernet. Een SAN is een basisbestanddeel van grotere opstellingen van servervirtualisatie.
In een CAS krijgt elk opgeslagen document een adres op basis van de inhoud, bijvoorbeeld een MD-5 of SHA-1 keysum. Op deze manier wordt duplicatie vermeden. Een CAS wordt vooral gebruikt voor de langdurige archivering van documenten die niet of zelden veranderen. Dit helpt organisaties (i.h.b. beursgenoteerde bedrijven) om te voldoen aan door de overheid opgelegde vereisten wat betreft het bijhouden van bedrijfsgegevens, bijvoorbeeld Sarbanes-Oxley.
==
'''Partitietypes'''▼
'''Windows'''
Regel 91 ⟶ 90:
:'''/boot''': deze directory bevat de Linux-kernel. Na opstarten van het systeem heb je die in principe niet meer nodig, en je kan er voor kiezen die niet te mounten. Zo vermijd je dat de kernel (per ongeluk of moedwillig) overschreven of gewijzigd wordt.
:'''/home''': Je /home map kan eventueel op een ander schijf staan of op een network share.
:: Als een gebruiker per ongeluk
::
:'''/opt''': Is bedoeld voor programma’s die
:'''/usr''': Je kan je /usr partitie aparte permissies geven voor de veiligheid, bijvoorbeeld read-only mounten.
De '''/home'''-map op een aparte partitie zetten heeft vooral zin op desktop- of laptopsystemen, minder op servers. '''/home''' zal in alle waarschijnlijkheid veel meer plaats innemen (muziekcollectie, filmbestanden, documenten) dan het besturingssysteem en de programma’s zelf. Op een typisch systeem voor persoonlijk gebruik heb je daar met 20GB meer dan genoeg. De andere directories ('''/opt''', '''/usr''', '''/tmp''', '''/var''', enz.) zullen eerder op serversystemen op een aparte partitie gezet worden.
In UNIX-systemen wordt alles weergegeven als een bestand, en dat geldt ook voor partities. Die vind je terug in de directory '''/dev'''. harde schijven krijgen een aanduiding zoals '''/dev/hda1''' of ''/dev/sdb5'''. Schijven aangeduid met ‘hd’ zijn IDE-schijven en schijven aangeduid met ‘sd’ zijn SATA- of SCSI-schijven. De letter volgend op 'hd' of 'sd' slaat op de hoeveelste schijf dit is op de controller. Voor IDE zijn er dat maximaal vier: de Primary Master (hda) en Slave (hdb) en de Secondary Master (hdc) en Slave (hdd). Op SCSI en SATA-controllers kunnen meer schijven aangesloten worden, dus daar loopt de lettering verder op.
Tenslotte krijgt elke partitie binnen een schijf een nummer. De nummers 1 t/m 4 slaan op primaire partities. Op een schijf kunnen er maximaal vier zulke primaire partities bestaan. De opstartschijf van Windows moet zich op een primaire partitie bevinden. Typisch wordt één van de vier een zgn. Extended partitie, die je kan opdelen in logische partities. Op deze manier kan je meer dan 4 partities aanmaken. Deze logische partities krijgen dan een nummer vanaf 5. Een harde schijf die 2 primaire partities heeft, waarvan één extended, zal dus partities 3 en 4 missen, maar wellicht wel partities met nummer 5, 6, enz. hebben.
Data lezen of schrijven naar deze bestanden is geen goed idee: de partitiebestanden geven rechtstreekse toegang, byte per byte, naar de inhoud van de partitie of schijf. Op deze manier kan je directorygegevens overschrijven en bestanden beschadigen. Door partities te mounten kan je wel op een veilige manier aan de opgeslagen gegevens geraken. De partitiebestanden kunnen wel gebruikt worden bij het maken van een exacte back-up van de partitie (bv. '''dd if=/dev/sda5 of=/media/usbdisk/home-partition.img''').
*Hoe bepaal je een geschikte grootte voor je swap-partitie? ▼
==Self-Monitoring Analysis and Reporting Technology (S.M.A.R.T)==▼
SMART is ontwikkeld door een aantal grote producenten van harde schijven om de betrouwbaarheid van harde schijven te verhogen. SMART is een technologie die toelaat om fouten in harde schijven te detecteren en zelfs te voorspellen. In de laatste jaren is het een standaard geworden in de industrie voor harde schijven.
*Stel dat je een desktopsysteem hebt met een harde schijf van ca. 160 GB. Je wil de '''/home''' in een aparte partitie onderbrengen. Hoeveel plaats reserveer je (bij benadering) voor de root-partitie en hoeveel voor de '''/home'''? Motiveer. ▼
Een SMART systeem gaat alles op de harde schijf monitoren wat kan duiden op eventuele fouten. SMART gaat dit alles dan documenteren en analyseren. Als het iets vind wat op de fout wijst, is het mogelijk om de gebruiker of systeem administrator hiervan op de hoogte te brengen. Dit gaat over: snelheid van de schijf, fout sectoren, recalibratie, CRC fouten, drive spin-up time, drive heads, afstand tussen de heads en de schijf platen, schijf temperatuur, enz. Wanneer bepaalde meetpunten een zekere drempel overschrijden (bv. sectorfouten), kan dit duiden op een komende schijfcrash. Tegenwoordig zou SMART 70% van alle fouten kunnen voorspellen. De systeembeheerder kan dan tijdig backups nemen en de schijf vervangen.
*Wat is het verschil tussen partities die aangeduid zijn met '''/dev/hd''x''''' en die met '''/dev/sd''x'''''? ▼
*Bij het partitioneren van een harde schijf krijgt elke partitie een nummer, bijvoorbeeld '''/dev/hda1''', '''/dev/hda2''', enz. De toewijzing van de nummers is niet willekeurig, maar ook niet incrementeel. Soms krijg je bijvoorbeeld een systeem met drie partities: '''/dev/hda1''', '''/dev/hda2''' en dan ineens '''/dev/hda5'''. Verklaar waarom dit zo is. Meer bepaald, zoek uit wat de betekenis is van de nummers van de partities.▼
▲Self-Monitoring Analysis and Reporting Technology
▲SMART gebruiken kan via het smartmontools package, hierin heb je 2 utilities:
*'''smartd''':
Is de service zelf, aanpassingen kan je dan doorvoeren door de smartd.conf file aan te passsen.
*'''smartctl''':
hiermee kan je informatie opvragen,
Enkele voorbeelden van gebruik
<pre>
$ smartctl -t long /dev/hda # Een uitgebreide schijftest opstarten
</pre>
==
LVM wordt gebruikt voor het flexibel beheren van partities over verschillende fysieke schijven. LVM kan bekeken worden als een kleine software laag bovenop de harde schijven, die voor het besturingssysteem de illusie creëert dat er maar één grote harde schijf is. Schijven kunnen toegevoegd of vervangen worden, partities kunnen verdeeld worden over fysieke schijven, enz. Fedora zal standaard LVM installeren.
De afkorting RAID staat voor 'Redundant Array of Independent Disks'. Dit is de benaming van een set methodieken
RAID wordt typisch aangeboden als een hardware-systeem dat de behuizing, de controller en eventueel de schijven zelf omvat. In Linux kan je sommige types van RAID in software emuleren, wat men Software RAID noemt. Dit is uiteraard een heel stuk trager dan hardware RAID, maar wel een heel stuk goedkoper.
▲==='''RAID'''===
▲De afkorting RAID staat voor 'Redundant Array of Independent Disks'. Dit is de benaming van een set methodieken die de fysieke data-opslag van de gegevens betreft. RAID kan er voor zorgen dat gegevens op meerdere harde schijven worden opgeslaan, wat dus zorgt voor betere betrouwbaarheid en minder dataverlies. Of het ken er anderzijds voor zorgen dat meerdere harde schijven worden beschouwd als één geheel en verdeeld de data dan over dit geheel.
'''RAID niveaus'''
Er bestaan verschillende niveaus met elk hun eigen kenmerken en doeleinden. Sommige zijn min of meer standaard, andere zijn typisch voor bepaalde producenten van hardware RAID-systemen. Onderstaande tabel geeft een overzicht van de meest gangbare niveaus:
{| class=prettytable
Regel 225 ⟶ 192:
Sommige RAID-configuraties kunnen gecombineerd worden zodat de minpunten van de ene door de andere weggewerkt worden en resulteren tot een beter geheel. Zo kan je bijvoorbeeld RAID-0 met RAID-1 combineren tot RAID 0+1. Hier heb je wel 4 harde schijven nodig, wat duur kan uitvallen om dit te configureren, maar je zal uiteindelijk wel de snelheid van RAID-0 en de betrouwbaarheid van RAID-1 behouden. zie onderstaande afbeelding als verduidelijking:
[[Bestand:RAID10.png]]
<small>bron:wikipedia.org</small>
'''JBOD'''
Regel 237 ⟶ 201:
JBOD ('Just a Bunch Of Disks') is het simpelweg achter elkaar plakken van een aantal schijven waarbij de totale grootte de som is van de ruimte op alle schijven. Dit is op zich geen RAID maar wordt wel ondersteund door veel RAID-controllers.
JBOD is ten opzichte van RAID-0 'veiliger'
'''RAID-0'''
Regel 249 ⟶ 212:
Software RAID-0 wordt ook wel aangeduid als Volume Sets. Hierbij is echter niet altijd sprake van striping op blokniveau, maar worden directory's en de daarin aanwezige bestanden door het filesysteem op die schijf binnen de Volume Set geplaatst die op dat moment de meeste vrije ruimte heeft.
'''RAID-1'''
Regel 266 ⟶ 228:
Naast de mirroring versie van RAID-1 is er ook een duplexing versie. Waar bij mirroring de schijven alle aangesloten zijn op een enkele controller, worden de schijven bij duplexing aangesloten op verschillende controllers.
'''RAID-2'''
Regel 273 ⟶ 234:
Alle moderne harde schijven hebben tegenwoordig wel een ingebouwde foutcorrectie. Omdat bij gebruik van een Hammingcode extra bits worden toegevoegd, heeft men meer dan 1 schijf nodig voor de opslag van deze code. Deze RAID-variant heeft geen voordelen ten opzichte van RAID-3.
'''RAID-3'''
Regel 280 ⟶ 240:
Als een disk uitvalt, kan men terug berekenen wat de verloren byte had moeten zijn. Door deze pariteitsdata kan een RAID-3-systeem echter vaak niet gelijktijdig schrijven en lezen.
'''RAID-4'''
RAID-4 is identiek aan RAID-3 maar nu wordt de pariteit niet per byte maar per datablok (stripe) berekend. Een dergelijk datablok is bijvoorbeeld 32 of 64 kilobyte groot. Hierdoor kan gelijktijdig geschreven en gelezen worden mits er geen overlapping plaats vindt. Wel is het zo dat de schijf die voor de pariteit gebruikt wordt, voor iedere schrijfactie aangesproken moet worden en dus een snelheidsbeperkende factor is.
'''RAID-5'''
RAID 5 werkt identiek aan RAID-4, met het verschil dat de pariteitblokken niet op een enkele schijf opgeslagen worden maar verdeeld over de schijven in de array. Hierdoor geldt het nadeel van de pariteitsschijf die de snelheid beperkt dus niet meer. In de praktijk wordt RAID-5 dan ook vaak toegepast in tegenstelling tot de andere RAID-varianten met pariteit.
'''RAID-6'''
RAID 6 kan je omschrijven als "RAID-5, maar meer". Net zoals bij RAID-5 wordt de pariteit per datablok berekend, met het verschil dat er niet 1 maar 2 sets zijn. Dit wordt gedaan met het oog op fouttolerantie. De schrijfperformantie zal over het algemeen iets lager liggen dan bij RAID-5.
'''Toepassing'''
Regel 302 ⟶ 258:
Hiervoor kijk je best eerst of je systeem RAID ondersteunt met:
Creëer /etc/raidtab file:
en starten:
== Toetsvragen ==
# Het Linux installatieprogramma stelt meestal zelf een geschikte partitionering voor. Dikwijls is het echter zo dat je best zelf manueel de partities instelt. Hieronder volgen enkele directories die vaak een eigen partitie hebben. Geef voor elk enkele redenen waarom je dat zou doen:
## '''/boot'''
## '''/home'''
## '''/opt'''
## '''/usr'''
## '''/var'''
▲
▲
▲
<!-- ----------- Hieronder onderhoudsmeldingen, niet weghalen -------------- -->
{{sub}}
{{bron|bronvermelding=
|