Linux Systeembeheer/Opslagapparaten beheren: verschil tussen versies

Verwijderde inhoud Toegevoegde inhoud
Bertvanvreckem (overleg | bijdragen)
Bertvanvreckem (overleg | bijdragen)
Geen bewerkingssamenvatting
Regel 14:
** Linux Software RAID kunnen toepassen
 
== Opslagsystemen in bedrijfscontext ==
== Inhoud ==
 
In dit onderdeel leggen we kort de betekenis uit van enkele types van opslagsystemen die in het bijzonder in bedrijven gebruikt worden.
===SAN, NAS en CAS===
 
'''===Network Attached Storage (NAS)'''===
 
Opslagmedium dat op het netwerk aangesloten is. Dit type apparaten vind je in de consumentenmarkt terug als een netwerk-harde schijf. De hardware omvat minstens een grote harde schijf en een netwerkaansluiting, typisch een processor met beperkt energieverbruik en meestal nog andere connectoren (USB, eSATA, FireWire, ...). Meestal draait hierop een vorm van embedded Linux met services voor de meest gangbare protocols voor bestandsdeling: Samba, FTP, eventueel NFS, enz. NAS kan gebruik maken van meerdere harde schijven die vaak in RAID gebruikt worden. Versies voor professioneel gebruik kunnen rack-mountable zijn, met snellere processoren of interfaces.
 
'''===Storage Area Network (SAN)'''===
 
Een SAN is specifiek voor grotere bedrijven nuttig. Opslagapparaten (harde schijven, tape, optische schijven, enz.) zijn fysiek losgekoppeld van de servers die er gebruik van maken, maar voor het besturingssysteem zijn ze niet te onderscheiden van lokale schijven. Performantie is in dit type opstellingen van groot belang, en daarom is de bekabeling typisch gebaseerd op glasvezel. Dat is een van de redenen dat een SAN erg duur is. De protocollen die op dit soort netwerken gebruikt worden zijn vaak afgeleid van deze voor het aanspreken van lokale, fysieke schijven, bijvoorbeeld iSCSI of ATA over Ethernet. Een SAN is een basisbestanddeel van grotere opstellingen van servervirtualisatie.
 
'''===Content-Addressable Storage (CAS)'''===
 
In een CAS krijgt elk opgeslagen document een adres op basis van de inhoud, bijvoorbeeld een MD-5 of SHA-1 keysum. Op deze manier wordt duplicatie vermeden. Een CAS wordt vooral gebruikt voor de langdurige archivering van documenten die niet of zelden veranderen. Dit helpt organisaties (i.h.b. beursgenoteerde bedrijven) om te voldoen aan door de overheid opgelegde vereisten wat betreft het bijhouden van bedrijfsgegevens, bijvoorbeeld Sarbanes-Oxley.
 
==='''Partitioneren'''===
 
'''Partitietypes'''
 
'''===Partitietypes'''===
 
'''Windows'''
Regel 91 ⟶ 90:
 
 
'''===Partitieschema'''===
 
HetEen van de voordelen van Linux installatieprogramma(en steltUNIX-sytemen meestalin zelfhet eenalgemeen) geschikteis partitioneringdat voorje directories aan aparte partities kan toekennen. DikwijlsJe ishebt hetop echterzijn zominst dateen je'root-partitie' best(voor zelfde manueelroot-directory '''/''') en de partitiesswap-partitie insteltnodig. Hieronder volgen enkele directories die vaak een eigen partitie hebben., Geef voor elk enkelemet redenen waarom jeom dat zoute doen:.
 
:'''/boot''': deze directory bevat de Linux-kernel. Na opstarten van het systeem heb je die in principe niet meer nodig, en je kan er voor kiezen die niet te mounten. Zo vermijd je dat de kernel (per ongeluk of moedwillig) overschreven of gewijzigd wordt.
:'''/boot''': Mogelijkheid om het te backuppen.
:'''/home''': Je /home map kan eventueel op een ander schijf staan of op een network share.
:: Als een gebruiker per ongeluk met een script de /home map volledig vol steektopvult, loopt je systeem niet vast.
:: MediaJe enraakt documentenpersoonlijke bestanden niet kwijtrakenkwijt bij een herinstallatie waarbij de andere partities geformatteerd worden.
:'''/opt''': Is bedoeld voor programma’s die opniet zichzelftot staan,de kunnendistributie dusbehoren. moeiteloosDeze gebackuptzullen niet moeten geherinstalleerd worden wanneer je de distributie herinstalleert.
:'''/usr''': Je kan je /usr partitie aparte permissies geven voor de veiligheid, bijvoorbeeld read-only mounten.
 
De '''/home'''-map op een aparte partitie zetten heeft vooral zin op desktop- of laptopsystemen, minder op servers. '''/home''' zal in alle waarschijnlijkheid veel meer plaats innemen (muziekcollectie, filmbestanden, documenten) dan het besturingssysteem en de programma’s zelf. Op een typisch systeem voor persoonlijk gebruik heb je daar met 20GB meer dan genoeg. De andere directories ('''/opt''', '''/usr''', '''/tmp''', '''/var''', enz.) zullen eerder op serversystemen op een aparte partitie gezet worden.
Enkele algemene redenen voor partitioneren:
 
In UNIX-systemen wordt alles weergegeven als een bestand, en dat geldt ook voor partities. Die vind je terug in de directory '''/dev'''. harde schijven krijgen een aanduiding zoals '''/dev/hda1''' of ''/dev/sdb5'''. Schijven aangeduid met ‘hd’ zijn IDE-schijven en schijven aangeduid met ‘sd’ zijn SATA- of SCSI-schijven. De letter volgend op 'hd' of 'sd' slaat op de hoeveelste schijf dit is op de controller. Voor IDE zijn er dat maximaal vier: de Primary Master (hda) en Slave (hdb) en de Secondary Master (hdc) en Slave (hdd). Op SCSI en SATA-controllers kunnen meer schijven aangesloten worden, dus daar loopt de lettering verder op.
:*Mogelijkheid om zaken te backuppen zonder andere administratieve taken stop te zetten.
:*Stricte permissie controle voor elke aparte partitie om misbruik en ongelukken te vermijden.
:*Betrouwbaarheid: Bij een disk error is de kans groot dat er maar 1 partitie beschadigd is.
 
Tenslotte krijgt elke partitie binnen een schijf een nummer. De nummers 1 t/m 4 slaan op primaire partities. Op een schijf kunnen er maximaal vier zulke primaire partities bestaan. De opstartschijf van Windows moet zich op een primaire partitie bevinden. Typisch wordt één van de vier een zgn. Extended partitie, die je kan opdelen in logische partities. Op deze manier kan je meer dan 4 partities aanmaken. Deze logische partities krijgen dan een nummer vanaf 5. Een harde schijf die 2 primaire partities heeft, waarvan één extended, zal dus partities 3 en 4 missen, maar wellicht wel partities met nummer 5, 6, enz. hebben.
Enkele vragen:
 
Data lezen of schrijven naar deze bestanden is geen goed idee: de partitiebestanden geven rechtstreekse toegang, byte per byte, naar de inhoud van de partitie of schijf. Op deze manier kan je directorygegevens overschrijven en bestanden beschadigen. Door partities te mounten kan je wel op een veilige manier aan de opgeslagen gegevens geraken. De partitiebestanden kunnen wel gebruikt worden bij het maken van een exacte back-up van de partitie (bv. '''dd if=/dev/sda5 of=/media/usbdisk/home-partition.img''').
*Hoe bepaal je een geschikte grootte voor je swap-partitie?
 
==Self-Monitoring Analysis and Reporting Technology (S.M.A.R.T)==
:'''2 keer je hoeveelheid RAM, bv 2 GB RAM ⇒ 4 GB swap'''
 
SMART is ontwikkeld door een aantal grote producenten van harde schijven om de betrouwbaarheid van harde schijven te verhogen. SMART is een technologie die toelaat om fouten in harde schijven te detecteren en zelfs te voorspellen. In de laatste jaren is het een standaard geworden in de industrie voor harde schijven.
*Stel dat je een desktopsysteem hebt met een harde schijf van ca. 160 GB. Je wil de '''/home''' in een aparte partitie onderbrengen. Hoeveel plaats reserveer je (bij benadering) voor de root-partitie en hoeveel voor de '''/home'''? Motiveer.
 
Een SMART systeem gaat alles op de harde schijf monitoren wat kan duiden op eventuele fouten. SMART gaat dit alles dan documenteren en analyseren. Als het iets vind wat op de fout wijst, is het mogelijk om de gebruiker of systeem administrator hiervan op de hoogte te brengen. Dit gaat over: snelheid van de schijf, fout sectoren, recalibratie, CRC fouten, drive spin-up time, drive heads, afstand tussen de heads en de schijf platen, schijf temperatuur, enz. Wanneer bepaalde meetpunten een zekere drempel overschrijden (bv. sectorfouten), kan dit duiden op een komende schijfcrash. Tegenwoordig zou SMART 70% van alle fouten kunnen voorspellen. De systeembeheerder kan dan tijdig backups nemen en de schijf vervangen.
:'''20 voor / en 140 voor /home. /home zal in alle waarschijnlijkheid veel meer plaats nodig hebben (muziekcollectie, filmbestanden, documenten) dan het besturingssysteem en de programma’s zelf.'''
 
SMARTOnder gebruikenLinux kan je toegang krijgen tot de functionaliteit van SMART kan via het ''smartmontools'' package, hierin heb je 2 utilities:
*Wat is het verschil tussen partities die aangeduid zijn met '''/dev/hd''x''''' en die met '''/dev/sd''x'''''?
 
:'''Schijven aangeduid met ‘hd’ zijn IDE schijven en schijven aangeduid met ‘sd’ zijn SATA schijven.'''
 
*Bij het partitioneren van een harde schijf krijgt elke partitie een nummer, bijvoorbeeld '''/dev/hda1''', '''/dev/hda2''', enz. De toewijzing van de nummers is niet willekeurig, maar ook niet incrementeel. Soms krijg je bijvoorbeeld een systeem met drie partities: '''/dev/hda1''', '''/dev/hda2''' en dan ineens '''/dev/hda5'''. Verklaar waarom dit zo is. Meer bepaald, zoek uit wat de betekenis is van de nummers van de partities.
:*‘1’ duidt een 'primary partition' aan, op zo’n partitie moet je /boot staan wil het systeem opstarten (mogelijk irrelevant nu met GRUB)
:*‘2’ duidt een 'extended partition' aan, die is een 'primary partition' die 'secondary partitions' kan bevatten. Een harde schijf mag slechts 1 'extended partition' bevatten die dan onderverdeeld kan worden in meerdere partities (of logical drives met hun eigen drive letter in Windows).
:*‘5’ duidt een 'swap partition' aan.
 
 
==='''S.M.A.R.T'''===
 
Self-Monitoring Analysis and Reporting Technology
SMART is ontwikkeld door een aantal grote harde schijf producenten om de betrouwbaarheid van de harde schijven te verhogen.
SMART is een technologie dat toelaat dat de computers fouten in harde schijven kan voorspellen.
In de laatste jaren is het een standaard geworden in de industrie voor harde schijven.
<br />
 
Een SMART systeem gaat alles op de harde schijf monitoren van vreemd gedrag of eventuele fouten. SMART gaat dit alles dan documenteren en analyseren. Als het iets vind wat op de fout wijst, is het mogelijk om de gebruiker of systeem administrator hiervan op de hoogte te brengen.
Dit gaat over: snelheid van de schijf, fout sectoren, recalibratie, CRC fouten, drive spin-up time, drive heads, afstand tussen de heads en de schijf platen, schijf temperatuur enzo...
De fouten die het systeem registreert kan hij voorspelen door een aantal methoden. Tegenwoordig kan SMART 70% van alle fouten voorspellen.
<br />
 
SMART gebruiken kan via het smartmontools package, hierin heb je 2 utilities:
<br />
*'''smartd''':
Is de service zelf, aanpassingen kan je dan doorvoeren door de smartd.conf file aan te passsen.
 
*'''smartctl''':
hiermee kan je informatie opvragen, uitschakelijk of testeneen vanschijf een drivetesten.
<br />
 
Enkele voorbeelden van gebruik
vb:
<pre>
$ smartctl -a /dev/hda --> informatie opvragen
$ smartctl -s offa /dev/hda --> uitschakelijk # informatie opvragen
$ smartctl -ts longoff /dev/hda --> testen # SMART monitoring uitschakelen
$ smartctl -t long /dev/hda # Een uitgebreide schijftest opstarten
</pre>
 
==='''Logical Volume Manager (LVM)'''===
 
LVM wordt gebruikt voor het flexibel beheren van partities over verschillende fysieke schijven. LVM kan bekeken worden als een kleine software laag bovenop de harde schijven, die voor het besturingssysteem de illusie creëert dat er maar één grote harde schijf is. Schijven kunnen toegevoegd of vervangen worden, partities kunnen verdeeld worden over fysieke schijven, enz. Fedora zal standaard LVM installeren.
Gebruik van LVM:
#-LVM wordt gebruikt voor het beheren van grote harde cluster schijven door schijven toe te voegen en te verplaatsen en te kopiëren en te delen van informatie naar een disk naar de andere zonder de service te storen.
#-Op kleine systemen zoals een desktop thuis, LVM laat je toe om je disk grootte te veranderen wanneer nodig. Zonder dat je als gebruiker hoeft te raden naar hoe groot een bepaalde partitie moet zijn.
#-Het maken van back-ups door moment opnames te nemen.
#-Het toelaten van dynamische volume aanpassing door het creëren van een enkele logische volume van meerdere fysische volumes of volledige harde schijven. Beetje gelijkaardig aan RAID 0 en JBOD)
 
==='''RAID'''===
LVM kan bekeken worden als een kleine software laag die bovenop de harde schijven en partities ligt, welke een illusie creëert van continuiteit en het makkelijk beheren van harde schijven vervangen, partitioneren en maken van back-ups.
 
De afkorting RAID staat voor 'Redundant Array of Independent Disks'. Dit is de benaming van een set methodieken dievoor de fysieke data-opslag van dedata gegevensop betrefteen harde schijf. RAID kan er voor zorgen dat gegevens redundant op meerdere harde schijven worden opgeslaan, wat dus zorgt voor betere betrouwbaarheid en minder dataverlies. Of het kenkan er anderzijds voor zorgen dat meerdere harde schijven worden beschouwd als één geheel en verdeeldverdeelt de data dan over dit geheel. Ook is RAID gekend als 'Redundant Array of Inexpensive Disks (of Drives)', dit is omdat voorheen goedkope harde schijven vaak ook onbetrouwbaar waren. Betere harde schijven waren vaak te duur. Om de betrouwbaarheid te verhogen was bij deze goedkope schijven maakte men gebruik van RAID, dat er voor zorgde dat kapotte schijven konden vervangen worden zonder gegevensverlies. Tegenwoordig zijn de harde schijven op de consumentenmarkt aanzienlijk verbeterd en is er slechts een beperkte vraag naar meer betrouwbaarheid en/of meer snelheid.
 
RAID wordt typisch aangeboden als een hardware-systeem dat de behuizing, de controller en eventueel de schijven zelf omvat. In Linux kan je sommige types van RAID in software emuleren, wat men Software RAID noemt. Dit is uiteraard een heel stuk trager dan hardware RAID, maar wel een heel stuk goedkoper.
==='''RAID'''===
 
De afkorting RAID staat voor 'Redundant Array of Independent Disks'. Dit is de benaming van een set methodieken die de fysieke data-opslag van de gegevens betreft. RAID kan er voor zorgen dat gegevens op meerdere harde schijven worden opgeslaan, wat dus zorgt voor betere betrouwbaarheid en minder dataverlies. Of het ken er anderzijds voor zorgen dat meerdere harde schijven worden beschouwd als één geheel en verdeeld de data dan over dit geheel.
Ook is RAID gekend als 'Redundant Array of Inexpensive Disks (of Drives)', dit is omdat voorheen goedkope harde schijven vaak ook onbetrouwbaar waren. Betere harde schijven waren vaak te duur. Om er voor te zorgen dat er minder dataverlies en betrouwbaarheid was bij deze goedkope schijven maakte men gebruik van RAID.
Tegenwoordig zijn de harde schijven op de consumentenmarkt aanzienlijk verbeterd en is er een beperte vraag naar meer betreouwbaarheid en/of meer snelheid.
 
 
'''RAID niveaus'''
 
Er bestaan verschillende niveaus met elk hun eigen kenmerken en doeleinden. Sommige zijn min of meer standaard, andere zijn typisch voor bepaalde producenten van hardware RAID-systemen. Onderstaande tabel geeft een overzicht van de meest gangbare niveaus:
 
{| class=prettytable
Regel 225 ⟶ 192:
 
Sommige RAID-configuraties kunnen gecombineerd worden zodat de minpunten van de ene door de andere weggewerkt worden en resulteren tot een beter geheel. Zo kan je bijvoorbeeld RAID-0 met RAID-1 combineren tot RAID 0+1. Hier heb je wel 4 harde schijven nodig, wat duur kan uitvallen om dit te configureren, maar je zal uiteindelijk wel de snelheid van RAID-0 en de betrouwbaarheid van RAID-1 behouden. zie onderstaande afbeelding als verduidelijking:
 
 
[[Bestand:RAID10.png]]
 
 
<small>bron:wikipedia.org</small>
 
 
'''JBOD'''
Regel 237 ⟶ 201:
JBOD ('Just a Bunch Of Disks') is het simpelweg achter elkaar plakken van een aantal schijven waarbij de totale grootte de som is van de ruimte op alle schijven. Dit is op zich geen RAID maar wordt wel ondersteund door veel RAID-controllers.
 
JBOD is ten opzichte van RAID-0 'veiliger',. alsAls een schijf stukgaat in een JBOD-set blijft de data op de andere schijven onaangetast. Bij RAID-0 is de hele set verbroken en is alle data verloren.
 
 
'''RAID-0'''
Regel 249 ⟶ 212:
 
Software RAID-0 wordt ook wel aangeduid als Volume Sets. Hierbij is echter niet altijd sprake van striping op blokniveau, maar worden directory's en de daarin aanwezige bestanden door het filesysteem op die schijf binnen de Volume Set geplaatst die op dat moment de meeste vrije ruimte heeft.
 
 
'''RAID-1'''
Regel 266 ⟶ 228:
 
Naast de mirroring versie van RAID-1 is er ook een duplexing versie. Waar bij mirroring de schijven alle aangesloten zijn op een enkele controller, worden de schijven bij duplexing aangesloten op verschillende controllers.
 
 
'''RAID-2'''
Regel 273 ⟶ 234:
 
Alle moderne harde schijven hebben tegenwoordig wel een ingebouwde foutcorrectie. Omdat bij gebruik van een Hammingcode extra bits worden toegevoegd, heeft men meer dan 1 schijf nodig voor de opslag van deze code. Deze RAID-variant heeft geen voordelen ten opzichte van RAID-3.
 
 
'''RAID-3'''
Regel 280 ⟶ 240:
 
Als een disk uitvalt, kan men terug berekenen wat de verloren byte had moeten zijn. Door deze pariteitsdata kan een RAID-3-systeem echter vaak niet gelijktijdig schrijven en lezen.
 
 
'''RAID-4'''
 
RAID-4 is identiek aan RAID-3 maar nu wordt de pariteit niet per byte maar per datablok (stripe) berekend. Een dergelijk datablok is bijvoorbeeld 32 of 64 kilobyte groot. Hierdoor kan gelijktijdig geschreven en gelezen worden mits er geen overlapping plaats vindt. Wel is het zo dat de schijf die voor de pariteit gebruikt wordt, voor iedere schrijfactie aangesproken moet worden en dus een snelheidsbeperkende factor is.
 
 
'''RAID-5'''
 
RAID 5 werkt identiek aan RAID-4, met het verschil dat de pariteitblokken niet op een enkele schijf opgeslagen worden maar verdeeld over de schijven in de array. Hierdoor geldt het nadeel van de pariteitsschijf die de snelheid beperkt dus niet meer. In de praktijk wordt RAID-5 dan ook vaak toegepast in tegenstelling tot de andere RAID-varianten met pariteit.
 
 
'''RAID-6'''
 
RAID 6 kan je omschrijven als "RAID-5, maar meer". Net zoals bij RAID-5 wordt de pariteit per datablok berekend, met het verschil dat er niet 1 maar 2 sets zijn. Dit wordt gedaan met het oog op fouttolerantie. De schrijfperformantie zal over het algemeen iets lager liggen dan bij RAID-5.
 
 
'''Toepassing'''
Regel 302 ⟶ 258:
Hiervoor kijk je best eerst of je systeem RAID ondersteunt met:
 
<pre>$ cat /proc/mdstat</pre>
 
Creëer /etc/raidtab file:
 
<pre>$ mkraid /dev/md0</pre>
 
en starten:
 
<pre>$ mdadm -S /dev/md0</pre>
 
== Toetsvragen ==
 
# Het Linux installatieprogramma stelt meestal zelf een geschikte partitionering voor. Dikwijls is het echter zo dat je best zelf manueel de partities instelt. Hieronder volgen enkele directories die vaak een eigen partitie hebben. Geef voor elk enkele redenen waarom je dat zou doen:
## '''/boot'''
## '''/home'''
## '''/opt'''
## '''/usr'''
## '''/var'''
*# Hoe bepaal je een geschikte grootte voor je swap-partitie?
*# Stel dat je een desktopsysteem hebt met een harde schijf van ca. 160 GB. Je wil de '''/home''' in een aparte partitie onderbrengen. Hoeveel plaats reserveer je (bij benadering) voor de root-partitie en hoeveel voor de '''/home'''? Motiveer.
*# Wat is het verschil tussen partities die aangeduid zijn met '''/dev/hd''x''''' en die met '''/dev/sd''x'''''? '''
*# Bij het partitioneren van een harde schijf krijgt elke partitie een nummer, bijvoorbeeld '''/dev/hda1''', '''/dev/hda2''', enz. De toewijzing van de nummers is niet willekeurig, maar ook niet incrementeel. Soms krijg je bijvoorbeeld een systeem met drie partities: '''/dev/hda1''', '''/dev/hda2''' en dan ineens '''/dev/hda5'''. Verklaar waarom dit zo is. Meer bepaald, zoek uit wat de betekenis is van de nummers van de partities.
 
<!-- ----------- Hieronder onderhoudsmeldingen, niet weghalen -------------- -->
 
{{sub}}
 
{{bron|bronvermelding=
Informatie afkomstig van https://nl.wikibooks.org Wikibooks NL.
Wikibooks NL is onderdeel van de wikimediafoundation.