Gebruiker:KKoolstra/Meten en onzekerheid
Meten en onzekerheid: een schijnbare tegenstelling
bewerkenMeten is een essentieel onderdeel van kennisverwerving. Hoewel we allerlei theorieën kunnen verzinnen over hoe de werkelijkheid in elkaar zit, zijn er metingen nodig om onze ideeën te toetsen. Daarbij kan blijken dat de inhoud en werking van de natuur, het gedrag van mensen en de geschiedenis van onze leefwereld toch net iets anders zijn dan eerder gedacht. Het verwerven van dit soort fundamentele kennis over de werkelijkheid waarin wij leven, kun je zien als het kerndoel van de wetenschap.
Maar zelfs al zouden we over alle benodigde fundamentele kennis beschikken om te weten hoe de wereld ontstaan is en aan welke wetten de natuur en de mens gehoorzaamt - dan nog hadden we metingen nodig in onze dagelijkse beroepspraktijk. Enkele voorbeelden:
- Een arts zal iedere patiënt afzonderlijk moeten onderzoeken om een goede diagnose te stellen.
- Door steekproefsgewijs de productie van (bijvoorbeeld) betonspecie te controleren, test je of de samenstelling van het mengsel nog steeds voldoet.
- Bij een grote brand controleren milieukundigen of er schadelijke stoffen in de lucht of het water terecht zijn gekomen.
In al deze voorbeelden is het onvoldoende voor een professional om alleen af te gaan op zijn/haar medische, fysische en chemische achtergrondkennis. Het benodigde onderzoek zal daarbij niet leiden tot (fundamentele) wetenschappelijke kennis, maar tot toegepaste kennis. Dit soort kennis is onmisbaar in de praktijk van toegepast-wetenschappelijke beroepsbeoefenaars, zoals medici, ingenieurs en milieukundigen.
Meten is onmisbaar om kennis te verwerven over de afzonderlijke producten, personen, gebeurtenissen, locaties, etc., waarmee je als professional te maken hebt. Meten zorgt voor kennis en daarmee voor het verdwijnen van het omgekeerde van kennis: onzekerheid.
...of toch niet?
bewerken
Op 22 september 2011 werden de resultaten gepubliceerd van een experiment waarbij vanuit de Large Hadron Collider van het CERN in Zwitserland een neutrinobundel werd afgevuurd op een doel 730 kilometer verderop in Gran Sasso (Italië). De metingen lijken erop te duiden dat de deeltjes een fractie sneller waren dan het licht. Nieuwe metingen op 18 november 2011 bevestigden dit resultaat. Op 23 februari 2012 maakte CERN bekend dat bij deze experimenten een niet goed functionerende glasvezelverbinding tot een lagere uitkomst van de vluchttijd van de neutrino's geleid kan hebben. In juli 2012 werd bekend gemaakt dat na correctie van de meetresultaten de deeltjes toch in overeenstemming zijn met de snelheid van het licht.[3] |
Het bovenstaande voorbeeld illustreert dat nooit alle onzekerheid weggenomen kan worden door metingen. Sterker nog, soms lijkt de onzekerheid alleen maar toe te nemen...
De onzekerheid bij metingen heeft te maken met een aantal verschillende vragen:
- Meet mijn instrument ook wat ik wil meten?
- Hoe nauwkeurig en betrouwbaar zijn mijn metingen?
- Hoe veel moet ik meten om ook een representatief beeld te hebben?
- Wat waren de veronderstellingen achter mijn metingen en wat betekent dit voor de interpretatie ervan?
- Etc.
Dit minidictaat geeft handreikingen om dit soort vragen te kunnen beantwoorden.
Meten
bewerkenMeten is eigenlijk een heel alledaagse activiteit. Stel bijvoorbeeld dat je een boodschap gaat doen op de markt. Je telt hoeveel contant geld je nog op zak hebt, vergelijkt de grootte van twee bloemkolen, vergelijkt de kleur en vorm van twee verschillende soorten appels als indicatie voor de kwaliteit ervan... In feite zijn dat alle drie voorbeelden van metingen.
Ook in de beroepspraktijk is meten de basis voor verschillende activiteiten met een onderzoekscomponent. Denk daarbij bij voorbeeld aan het diagnosticeren van oorzaken van gezondheidsklachten in de (para)medische beroepen, het monitoren van de onderhoudstoestand van constructies in technische beroepen, het evalueren van de effectiviteit van nieuwe werkwijzen in managementberoepen, etc.
Dit minidictaat gaat over meten zoals dat plaatsvindt in de beroepspraktijk. Hierbij gaat het om vragen als:
- hoe bereid ik mijn metingen voor?
- hoe verwerk ik mijn metingen?
- hoe betrouwbaar/nauwkeurig/valide zijn mijn metingen?
- welke conclusies mag ik verbinden uit mijn meetresultaten?
Dit hoofdstuk geeft daarvoor een eerste aanzet. In dit hoofdstuk gaan we specifiek in op een aantal deelvragen:
- Wat is meten?
- Waarmee meten we?
- Wat zijn meetvariabelen en wat voor soorten meetvariabelen zijn er?
Definitie van meten
bewerkenEr zijn verschillende definities van het begrip meten. Sommige leggen meer de nadruk op het kwantificerende karakter van meten, terwijl ander definities weer meer nadruk leggen op het verschil tussen het gemetene en de meetwaarde zelf en de daaruit voortkomende onzekerheden.
De verschillen tussen mogelijke definities van meten vallen echter buiten het bestek van dit minidictaat. De volgende definitie volstaat voor onze doeleinden: meten is het bepalen van de waarde van een meetvariabele met behulp van een specifiek meetinstrument en meetprocedure.[4] Meting is niet beperkt tot natuurkundige grootheden, maar strekt zich uit tot de kwantificatie van bijna al het denkbare. Voorbeelden van metingen zijn schattingen van faalkansen op basis van modelstudies, het bepalen van het vertrouwen van de consument op basis van telefonische enquêtes en het meten van prijsstijging van ijsjes in de zomer op basis van observaties.
Welke waarden een meetvariabele kan aannemen, hangt mede af van de gekozen meetschaal en de bijbehorende definities, zoals de definitie van de meeteenheid, klassekenmerken, nulpunt, etc. Zo kan men de lengte van een persoon meten in centimeters of inches, maar ook enkel als rangordening tussen personen (groter of kleiner).
In de hier gebruikte definitie van meten wordt het belang van het meetinstrument en de meetprocedure benadrukt. Dit om onderscheid te maken tussen subjectieve (persoonsafhankelijke) waarnemingen en waarnemingen met behulp van een meetinstrument. Door gebruik te maken van de juiste meetinstrumeten en meetprocedures kan de kwaliteit en objectiviteit van de waarnemingen worden geborgd. Een voorbeeld is het meten van het voorrang nemen en voorrang verlenen op een gelijkwaardig kruispunt op basis van visuele observatie. Alleen als alle waarnemers dezelfde definities en standaarden hanteren, voorkom je dat de meetresultaten sterk worden beïnvloed door verschillen in interpretatie tussen waarnemers onderling.
Meten kan worden opgevat als de kernactiviteit van (empirisch) onderzoek. Door te meten is het mogelijk om:
- ideeën op te doen over hoe de werkelijkheid in elkaar zit (verkennend onderzoek);
- ideeën (hypothesen) over hoe de werkelijkheid in elkaar zit te toetsen (toetsend onderzoek);
- het functioneren van een systeem te monitoren en problemen op te sporen (diagnostisch onderzoek);
- te toetsen of een ingreep in een systeem wel heeft gewerkt (evaluerend onderzoek).
Meetschaal
bewerkenDe meetschaal, ook wel meetniveau genoemd, is een typering van een meetvariabele.[5] Het meetniveau van een variabele bepaalt onder meer welke statistische methoden op zinvolle wijze kunnen worden gebruikt om de meetgegevens te karakteriseren en interpreteren. De vijf meest gebruikte meetschalen, waarvan de eerste vier zijn geïntroduceerd door Stevens (1946) [6], zijn:
- Nominaal: benoemen, ordening is willekeurig
- Ordinaal: ordening, afstanden tussen rangordes zijn willekeurig
- Interval: gelijke afstanden, nulpunt is willekeurig
- Ratio: absoluut nulpunt, schaal is willekeurig
- Absoluut: zowel nulpunt als schaal zijn vast
Ook hierbij geldt dat er verschil kan zijn tussen de meetschaal van de theoretische variabele (bijvoorbeeld temperatuur in graden Kelvin - ratioschaal) en de variabele zoals gemeten (bijvoorbeeld temperatuur in graden Celsius - intervalschaal). Hieronder worden de vijf hierboven genoemde meetschalen nader toegelicht.
Niveau | Kenmerkend | Volgorde | Verschillen | Nulpunt |
---|---|---|---|---|
Nominaal | x | |||
Ordinaal | x | x | ||
Interval | x | x | x | |
Ratio | x | x | x | x |
Nominale schaal
bewerkenDe eenvoudigste meetschaal die we kennen is het nominale. Daarbij gaat het, zoals de naam al aangeeft (Latijn: nomen, naam) bij het meten slechts om het benoemen (naam geven aan) een eigenschap van het gemetene. Voorbeelden zijn: geslacht (man/vrouw), de provincie waarin de ondervraagde woont, etc. Omdat zonder naamgeving niets onderscheiden kan worden, is elk van de andere meetniveaus ook minstens van nominaal niveau.
Voor praktische doeleinden worden de onderscheiden eigenschappen vaak gelabeld met een uniek nummer, letterreeks of ander symbool. Voorbeelden van numerieke labels zijn bankrekeningnummers en kentekens. Daarbij worden nominale gegevens vaak voor het gemak van terugzoeken alfabetische of numeriek geordend. Deze ordening heeft echter geen specifieke betekenis.
Ordinale schaal
bewerkenMetingen op ordinaal schaalniveau kennen een natuurlijke ordening, zonder dat het onderlinge verschil tussen objecten éénduidig kan worden uitgedrukt in een bepaalde eenheid. Een voorbeeld van een ordinale meetschaal is de Hardheidsschaal van Mohs. Deze maakt het mogelijk de hardheid van mineralen te vergelijken, door te bepalen welke stof de andere kan krassen. Een verschil van één eenheid op deze schaal zegt echter niets over het absolute verschl in hardheid. Een ander voorbeeld is de veelgebruikte 5-puntsschaal bij opiniepeilingen (zeer mee oneens - mee oneens - neutraal - mee eens - zeer mee eens). Bij een ordinale schaal is de volgorde duidelijk, maar zijn de verschillen niet interpreteerbaar: 'zeer mee eens' ligt niet noodzakelijk net zo ver boven 'mee eens' als dat 'mee eens' boven 'neutraal' ligt.
Intervalschaal
bewerkenMetingen op intervalschaal betreffen altijd getallen. Naast de vanzelfsprekende ordening kunnen hiermee ook rekenkundige bewerkingen gedaan worden. Voor dit meetniveau zijn vooral de intervallen (de verschillen) van belang. Eigenlijk dient men de absolute aanduiding en de verschillen goed te onderscheiden. Daarbij is de absolute aanduiding op te vatten als het interval vanaf het gekozen nulpunt. Het nulpunt zelf heeft echter geen specifieke betekenis. Daarnaast dient ook, net als in geval van een ratioschaal, de meeteenheid te worden gekozen.
Intervalschalen komt men vooral tegen in coördinatenstelsels. Zowel het nulpunt van tijd- en ruimtecoördinaten als de oriëntatie van een coördinatenstelsel in de ruimte zijn min of meer willekeurig gedefinieerd. Coördinatenstelsels kennen geen echt natuurlijk nulpunt; zo is het nulpunt van het in Nederland gebruikte RD-stelsel gedefinieerd als 300 km ten westen en 600 km ten zuiden van de Onze Lieve Vrouwekerk in Amersfoort. Er zijn echter ook meeteenheden die een ander nulpunt hebben dan het natuurlijke nulpunt. Een voorbeeld hiervan is de Celsiusschaal voor temperatuur, in tegenstelling tot de Kelvinschaal. Van 5 naar 10 graden Celsius betekent dus niet dat de temperatuur is verdubbeld. Het verschil tussen deze twee meeteenheden is niet de meetstandaard - een verschil van 1 graad Celsius en 1 graad Kelvin is exact hetzelfde, maar de keuze van het nulpunt.
Ratioschaal
bewerkenNaast de kenmerken van een intervalschaal is er nu ook een absoluut nulpunt. Daarmee hebben ook verhoudingen (Latijn: ratio) van waarden op deze schaal betekenis. Bekende metingen, waarbij een grootheid wordt vergeleken met een meetstandaard en uitgedrukt in verhouding tot die standaard, zijn van rationiveau. Bij deze variabelen is dus de enige, min of meer arbiraire, keuze de meetstandaard.
Voorbeelden van meetvariabelen met een ratioschaal zijn, met de bijbehorende w:SI-eenheid, lengte in meter, energie in joule, etc.
Absolute schaal
bewerkenDe absolute schaal is ten slotte van toepassing op variabelen die betrekking hebben op een aantal of een daarvan afgeleide (dimensieloze) grootheid. Bij een absolute schaal is noch het nulpunt, noch de meeteenheid arbitrair gekozen, maar zijn deze op natuurlijke wijze gedefinieerd. Hoewel in navolging van Stevens deze variabelen vaak als ratioschaal worden getypeerd,is het feit dat hier geen meeteenheid gekozen hoeft te worden, een belangrijk verschil. Meetvariabelen op absolute schaal zijn dus per definitie dimensieloos.
Voorbeelden van grootheden op een absolute schaal zijn aantallen (bijvoorbeeld het aantal elektronen gedetecteerd in een nevelvat gedurende een vaste meetperiode, of een afgeleide daarvan (bijvoorbeeld de relatieve frequentie van het aantal keer kop bij 20 muntworpen).
Meetinstrumentarium
bewerkenStrikt gesproken kunnen we onderscheid maken tussen subjectieve (persoonsafhankelijke) waarnemingen en waarnemingen met behulp van een meetinstrument. Meetinstrumenten zorgen voor structurering en objectivering van de waarneming. Bovendien zou zonder meetinstrumenten onze mogelijkheden tot meten beperkt zijn tot wat onze zintuigen kunnen waarnemen. Bovendien moet een variabele éénduidig kunnen worden gemeten. Dit kan niet worden gegarandeerd door persoonsafhankelijke waarnemingen; er moet dus worden nagedacht over welk meetinstrument wordt gehanteerd.
De keuze van de operationele definitie hangt vaak samen met de keuze van het meetinstrument. Onder meetinstrumentarium verstaan we onder andere analytische machines en meetsystemen, met name in experimenteel onderzoek en observatieonderzoek in de technische- en natuurwetenchappen. Ook het uitwerken van een enquête in de sociale wetenschappen wordt echter wel beschouwd als uitwerking van het 'meetinstrument'. Belangrijk aspect is de controle van het meetinstrumentarium: hoe controleer je of het meetinstrument correct meet. Met name voor veel analytische meetinstrumenten zijn hiervoor standaard controleprocedure.
Bij de keuze van het meetinstrument vindt een koppeling plaats van de variabele zoals bedoeld aan de variabele zoals gemeten. Hierbij kan een verschil in definitie ontstaan tussen de variabele zoals bedoel en de variabele zoals gemeten. Zo kan bijvoorbeeld een variabele als tevredenheid van een klas kwalitatief worden opgevat, maar in een onderzoek worden geoperationaliseerd als het percentage leerlingen dat aangeeft tevreden te zijn.
In dit hoofdstuk zijn we vooral geïnteresseerd in de kenmerken van de variabele zoals gemeten door het gekozen instrument. Een eerste onderscheid is het hierboven genoemde vershil tussen kwalitatief en kwantitatief. Een voorbeeld van een zuiver kwantitatieve meting is het bepalen van de luchtdruk in Pascal of Bar met behulp van een barometer. Het geslacht van een respondent in een interview of enquête is een kwalitatieve variabele. Overigens: met hetzelfde meetinstrument kun je ook het aantal mannen in de onderzochte steekproef bepalen, en dat is weer een kwantitatieve variabele; het is dus een kenmerk van een variabele zoals gemeten met een bepaald type instrument.
Bij de keuze van het meetinstrument kunnen een aantal overwegingen een rol spelen:
- kwaliteit van het instrument (meetfouten)
- effecten van het instrument op het onderzoeksobject (destructief of non-destructief)
- kosten van het gebruik van het instrument
Over twee van deze aspecten, de kwaliteit van het meetinstrument en de effecten van het meetinstrument op het onderzoeksobject, meer in de volgende paragrafen.
Meetfouten
bewerkenVoor het meten van grootheden is het gebruik van de juiste meetapparatuur en kennis van meetmethoden noodzakelijk. Een wezenlijk kwaliteitsbepalend aspect van het meetinstrument is de mate waarin meetfouten optreden. De meetfout is de afwijking tussen de gemeten waarde en de werkelijke waarden. Er zal altijd sprake zijn van een zekere meetfout: een gemeten waarde is namelijk nooit exact gelijk gelijk aan de werkelijke waarde van de gemeten grootheid.
De mate van afwijkingen tussen werkelijke en gemeten waarde hangt samen met drie verschillende kwaliteiten van het meetinstrument:
- validiteit;
- betrouwbaarheid;
- nauwkeurigheid.
Validiteit
bewerkenDe validiteit van een meetinstrument is de mate waarin deze meet wat hij zou moeten meten. Een mogelijk probleem hierbij is het optreden van structurele meetfouten. Er is sprake van een structurele meetfout als gemiddeld gesproken het meetinstrument een hogere of lagere waarde aangeeft dan zou moeten. Als je bijvoorbeeld de breedte van een gebouw opmeet met een meetband die onvoldoende strak wordt gehouden, zul je een grotere lengte aflezen dan juist is.
Het controleren van het meetinstrument op structurele meetfouten wordt kalibratie genoemd. Kalibratie vindt meestal plaats voordat de metingen zelf worden verricht. Bij het kalibreren van meettoestellen wordt de afwijking (bias) van het meettoestel vastgesteld. Dit kan door te vergelijken met een referentie of met een berekend model. In sommige gevallen is het mogelijk om het meetinstrument bij te regelen om zo te corrigeren voor de geconstateerde afwijking. Dit wordt justatie genoemd. Een andere mogelijkheid is om de afwijkingen vast te leggen in een correctietabel, zodat de meetresultaten naderhand kunnen worden gecorrigeerd.
Betrouwbaarheid
bewerkenDe betrouwbaarheid van het meetinstrument is de mate waarin er sprake is van toevallige meetfouten. Kenmerkend voor zuiver toevallige meetfouten is dat de meetfout van de ene meting geen voorspellende waarde heeft voor de meetfout in een volgende meting, ook al wordt gemeten aan hetzelfde object. Een betrouwbaar meetinstrument zal bij herhaalde meting aan hetzelfde object met constante kenmerken dezelfde meetresultaten geven of alleen een kleine afwijking.
Nauwkeurigheid
bewerkenDe meetnauwkeurigheid is hoe precies het instrument afgelezen kan worden. Een thermometer kan bijvoorbeeld afleesbaar zijn per graad Celsius of per tiende graad Celsius. En een enquête naar de tevredenheid over de eigen werkomstandigheden kan informatie geven op de schaal tevreden - ontevreden of op een schaal van 1 tot 10. Indien een meetinstrument nauwkeuriger is dan betrouwbaar, bijvoorbeeld als de nauwkeurigheid in honderden graad Celsius is bij een betrouwbaarheid van plusminus 0,5 graad Celsius, dan spreekt men wel van schijnnauwkeurigheid. In dat geval zal namelijk het laatste cijfer van de meting vrijwel volledig worden bepaald door de meetfout en niet door het te meten verschijnsel.
Validatie en kalibratie van het meetinstrument
bewerkenVan een meetinstrument mag men verlangen:
- dat het juiste instrument is toegepast om een gegeven variabele te meten: meet het instrument wat het geacht wordt te meten;
- dat het instrument juist is afgesteld.
Het eerste bovengenoemde aspect is de validatie, het tweede aspect de kalibratie.
Een meettoestel kan worden gekalibreerd door dezelfde meting te verrichten met een gekalibreerd en een niet-gekalibreerd meettoestel, en vervolgens de waarden te vergelijken. Een alternatief is gebruik te maken van een ijkobject waarvan de eigenschappen bekend zijn en vervolgens te kijken of het instrument de juiste waarden meet.
De volgende stap is het justeren van het meetinstrument. Dit is het zodanig aanpassen van de instellingen van het instrument, dat deze weer zo goed mogelijk de juiste waarde aangeeft. Indien dat niet mogelijk is, kan gebruik worden gemaakt van een correctietabel. In deze correctietabel kan dan worden opgezocht wat bij een afgelezen meetwaarde de werkelijke meetwaarde is.
Destructieve en niet-destructieve metingen
bewerkenIdealiter wordt het object van meting niet beïnvloed door de meting zelf. Dit ideaal is echter vaak maar lastig volledig te verwezenlijken. Zo zal er bij een temperatuurmeting met behulp van een kwikthermometer er warmte stromen van het object waaraan wordt gemeten naar de thermometer (ervan uitgaande dat deze warmer is dan de thermometer was). Hierdoor zal de temperatuur van het object (licht) worden beïnvloed.
Dit aspect speelt sterker bij het bepalen van mechanische eigenschappen van materialen en constructies. De meest direct en eenvoudige manier om te bepalen bij welke belasting een object bezwijkt - wat zeer relevant is om te weten uit praktisch oogpunt - is door in laboratoriumomstandigheden het object te beproeven totaan bezwijken. Dit soort onderzoek noemen we destructief, aangezien het object (of een monster van het materiaal bij materiaalkundig onderzoek) zodanig wordt belast dat het vervormt en/of bezwijkt. [7]
Bij destructief testen wordt een materiaal getest op bezwijkomstandigheden (bij welke belasting, temperatuur, etc. bezwijkt het materiaal) en bezwijkvorm (waar vervormt of breekt het materiaal het eerst). Zoals de naam het zegt is het materiaal na de test niet meer bruikbaar als constructief element. Denk bijvoorbeeld aan het afsteken van lucifers om te testen of deze wel lang genoeg branden. Destructieve tests zijn vrij makkelijk uit te voeren, in vergelijking met de niet-destructieve testen.
Destructieve tests worden gedaan om informatie in te winnen van de eigenschappen van het materiaal en/of het object, voor toekomstig gebruik ervan in de praktijk. Enkele voorbeelden van destructieve testen zijn:
- Trekproeven ter bepaling van een spanning-rekdiagram
- Vermoeiingstesten
- Hardheidstesten
- Impacttesten.
Ook voor het bepalen van de restlevensduur en maximale belastbaarheid van bestaande objecten, zoals dijklichamen gebouwen, verhardingen en bruggen kunnen destructieve testen worden toegepast, mits het mogelijk is om een monster van het materiaal uit het object te nemen en te beproeven. Dit betekent echter per definitie een verzwakking van het object, als het al mogelijk of verantwoord is om een dergelijk monster te nemen van het materiaal. In dergelijke gevallen verdient een niet-destructieve test de voorkeur. [8]
Onder niet-destructieve testen worden onderzoektechnieken verstaan waarmee men een indruk kan krijgen van de kwaliteit van een te onderzoeken object zonder dit object te beschadigen. Dat kan men bijvoorbeeld bereiken door er een röntgenfoto van te maken. In tegenstelling tot destructief onderzoek, waarbij beschadigingen van het object plaatsvinden, kan niet-destructief onderzoek op het gehele object plaatsvinden. Sinds het begin van de 20e eeuw zijn er diverse onderzoekstechnieken ontwikkeld, onder andere door de ontwikkeling van de elektrotechniek en elektronica.
Voorbeelden van niet-destructieve onderzoekstechnieken zijn:
- Visuele inspectie
- Wervelstroom-onderzoek
- Ultrasoon onderzoek
- Radiografisch onderzoek: Röntgenbuis, Isotopen-onderzoek
- Scheurdieptemetingen
- Materiaalidentificatie: Positive material identification (PMI), Optische Emissie Spectroscopie (OES), Ferrietmeting.
Onzekerheid
bewerkenEen veelgehoorde uitpraak is meten is weten. Waarom dan toch de nadruk op onzekerheid in dit boek over meten? Nu is het inderdaad zo dat metingen, in ieder geval valide metingen, ervoor zorgen dat de onzekerheid over de werkelijke situatie wordt verminderd. Toch is het een illusie te denken dat je door te meten alles kunt weten.
Waarom is meten onzeker?
bewerkenHet doel van meten is om informatie te verzamelen over een werkelijke toestandsgrootheid van een object (meetvariabele). Er zijn echter goede redenen om te veronderstellen dat de werkelijke toestand van een object zelden exact zal overeenkomen met de gemeten waarden:
- metingen hebben een beperkte precisie
- meetinstrumenten geven niet altijd de juiste waarde aan
- bij het bedienen van meetinstrumenten kunnen fouten worden gemaakt
- de werkelijke waarde van de toestandsgrootheid varieert vaak in plaats en tijd
- etc.
Een voorbeeld: stel dat we de hoogteligging van een toren willen meten ten opzichte van een bekende referentiehoogte. We kunnen hiervoor bijvoorbeeld een GPS gebruiken met een precisie op centimeter-niveau. We kunnen kiezen voor andere meetinstrumenten met een grotere nauwkeurigheid, maar de precizie van aflezen of waarmee digitaal meetresultaten worden getoond is echter altijd eindig. Belangrijker is echter dat de afgelezen waarde niet altijd juist is. Door kleine afwijkingen in de afstelling van het meetinstrument kunnen fouten in de meetwaarde ontstaan. Deze fouten kunnen nog groter worden indien de meetinstrumenten fout worden bediend. Ten slotte varieert de werkelijke waarde van de toestandsgrootheid vaak in plaats en tijd. Zelfs al definiëren we de hoogte van de toren als het verschil tussen het allerhoogste punt en het NAP, dan blijft het probleem dat de hoogte van de toren varieert in de tijd. Bij warm weer zal het gebouw uitzetten, bij koud weer krimpen. Zo varieert de hoogte van de Eiffeltoren ca. 15 cm afhankelijk van de temperatuur.
Steekproeven
bewerkenDe variabiliteit van het gemetene naar plaats en tijd is nog een relatief klein probleem bij het meten van de hoogte van een toren. Lastiger wordt het als de stijfheid van de ondergrond van een geheel bouwkavel of wegtracé moet worden gemeten, of bijvoorbeeld de gemiddelde intensiteit van het verkeer over de A10 op een gemiddelde werkdag. Gelukkig is het mogelijk om betrouwbare uitspraken te doen op basis van een beperkt aantal metingen, mits deze metingen een voldoende representatief beeld geven van het geheel. In dit geval spreken we van een steekproef. [9]
Er zijn echter meer goede redenen om te kiezen voor een steekproef van beperkte omvang:
- Het is gemakkelijker en goedkoper om slechts een deel van de populatie te onderzoeken.
- Als snelheid gewenst is, kan niet de hele populatie onderzocht worden.
- Bij destructief onderzoek zou de hele populatie verloren gaan.
In de steekproeftheorie beschouwen we de hierboven genoemde objecten (bouwkavel, wegtracé, verkeer over een weg) als een populatie van verschillende plaatsen en tijdstippen. Men kan op verschillende manieren een steekproef verkrijgen. Als alle elementen uit de populatie dezelfde kans hebben om in de steekproef te worden opgenomen, spreekt men van een aselecte steekproef. Men spreekt van een selecte steekproef wanneer de elementen niet op toevalsbasis uit een populatie worden genomen. Zorgt men ervoor dat de verhouding mannen en vrouwen in de steekproef voorkomen ongeveer gelijk is aan deze verhouding in de bevolking dan heet de steekproef representatief (althans wat het kenmerk geslacht betreft). De keuze bepaalt in grote mate de validiteit van verdere analyse.
Voorbeelden van blijvende onzekerheid na meting
bewerkenStel dat we willen toetsen of de verdichtingsgraad van de fundering van een nieuwe weg voldoende groot is. Het weglichaam is 2,3 km lang en 15 m breed. We steken op 25 verschillende plekken een monster en bepalen met behulp van een proctorproef de verdichtingsgraad. Puur uitgaande van de meetresultaten, weet je eigenlijk niets meer dan de verdichtingsgraad die bereikt was op 25 verschillende plekken, notabene plekken die door het 'destructieve' karakter van de meting aangetast zijn.
Op basis van onze geotechnische kennis en ervaring mogen we echter veronderstellen dat de verdichtingsgraad tussen twee nabij gelegen plekken niet veel van elkaar verschilt. Bovendien kunnen we uit de 25 metingen ook iets afleiden over de orde grootte van de onderlinge verschillen.
Het vakgebied dat zich bezighoudt met het verbinden van algemene conclusies uit een beperkte steekproef is de statistiek. Dit vakgebied is nauw verwant aan - en volgens sommigen een onlosmakelijk onderdeel van - de kansrekening, welke zich bezighoudt met het rekenen met onzekerheid. Om een getalsmatige uitspraak te kunnen doen over de (on)zekerheid voor en na de metingen m.b.t. tot de verdichtingsgraad zullen we dus eerst een manier moeten vinden om onzekerheid in getallen uit te drukken. Dit kan met behulp van de begrippen kans en entropie.
Proctorproef [10]
De proctorproef is een testprocedure die wordt toegepast om de dichtheid van een grondmonster te bepalen zodat men de funderingsstabiliteit van de grond kan vaststellen. De naam verwijst naar de Amerikaanse ingenieur Ralph R. Proctor die in 1933 de eerste varianten van de proef ontwikkelde. Er moet eerst worden bepaald wat het vochtgehalte van de genomen grondmonsters is. De grondmonsters worden genomen met een cilinder van een bepaalde inhoud. Het vochtgehalte wordt gemeten door ongeveer 150 gram nat zand uit een monster in de ovenschaal te doen, dit gewicht wordt dan genoteerd. Hierna wordt dit zand enkele minuten verwarmd in een oven. Op regelmatige tijdstippen wordt gewogen en indien het gewicht niet meer dan 0,1% afwijkt van de vorige meting wordt het monster als droog beschouwd. Nu wordt het droge gewicht gemeten, en zo is bekend hoeveel vocht het betreffende monster bevat. De maximale dichtheid wordt bepaald aan de hand van een test. Een machine met een gewicht van 2,5 kg met een oppervlakte van 50,8 mm slaat met 25 slagen per laag het monster aan, het aantal lagen verschilt per inhoud van de cilinder (3 tot 5), de lagen zijn gemiddeld 40 mm dik. De foto toont de cilinder met inhoud die wordt aangeslagen door het betreffende gewicht. Om vervolgens de maximale proctordichtheid te bepalen wordt als volgt te werk gegaan: Men begint met een normale waarde (het vochtgehalte zoals deze met het monster was geleverd) en vervolgens voegt men een x aantal % aan water toe en voert de test nogmaals uit. Dit gebeurt zo vaak totdat de dichtheid begint te dalen. |
|
|
Onzekerheid en kansbegrip
bewerkenKansrekening is een tak van de wiskunde die zich bezighoudt met situaties waarin het toeval een rol speelt, met als gevolg dat er geen zekerheid is over allerlei uitkomsten. Kansrekening is ontstaan vanuit de maatschappelijke behoefte om zo effectief mogelijk om te gaan met onzekerheden. De kansrekening tracht mathematische hulpmiddelen aan te reiken aan een zeer breed scala van maatschappelijke activiteiten en wetenschappen, om binnen een omgeving met onzekerheden toch gefundeerde keuzes te kunnen maken of conclusies te kunnen trekken.Zie voor een (wiskundige) inleiding in de Discrete Kansrekening het gelijknamige wikiboek.
In een situatie waarin het toeval een rol speelt zal tevoren vaak niet bekend zijn wat de uitkomst van een gebeurtenis (een waarneming of meting) is. Wel kan meestal van tevoren aangegeven worden wat de mogelijke uitkomsten zijn. De kans is dan een maat voor de waarschijnlijkheid van iedere uitkomst. Deze kansmaat heeft een aantal (wenselijke) eigenschappen. Als alle uitkomsten even waarschijnlijk (of, zo je wilt, onwaarschijnlijk) zijn, dan hebben ze logischgewijs dezelfde kans. Verder moeten we, net als bij meetvariabelen, een schaal definiëren om een getalswaarde te kunnen gaan geven. Dit doen we door 0% waarschijnlijkheid (het minimum) te laten overeenkomen met een kans van 0 en 100% waarschijnlijkheid (het maximum) overeen te laten komen met een kans van 1. Ten slotte willen we dat tussen een kans van 0 en 1 er een logische schaling is, zodat we een kans van 1/2 mogen opvatten als dat de betreffende uitkomst even waarschijnlijk wel als niet kan gebeuren.
We gaan nu proberen in een aantal situaties op intuïtieve gronden kansen toe te kennen aan mogelijke uitkomsten.
Voorbeeld 1 |
In dit voorbeeld is er sprake van vier gelijkwaardige mogelijkheden, waarvan er drie leiden tot de uitkomst rood. De meeste mensen zullen daarom ervoor kiezen om aan deze gebeurtenis de kans toe te kennen.
Voorbeeld 2 |
Ook hier is er sprake van een (fysische) symmetrie. Op grond van de symmetrie van de dobbelsteen zeggen we dat elk van de mogelijke uitkomsten (ogenaantallen) 1 tot en met 6 gelijke kans van optreden heeft. Het begrip symmetrie is de basis voor de klassieke definitie van het begrip kans. Het werd geïntroduceerd door Laplace (1749-1827). In een symmetrisch experiment wordt de kans op een gebeurtenis A gegeven door de fractie voor A gunstige (dat wil zeggen tot A behorende) uitkomsten #A ten opzichte van het totaal aantal mogelijke uitkomsten #S:
De kans op een '6' is daarmee en de kans op een 'even aantal ogen' .
Voorbeeld 3 |
In dit voorbeeld is het niet mogelijk om alleen op basis van 'symmetrie' kansen toe te kennen. Toch zullen veel mensen bereid zijn om de genoemde 92% patiënten die geneest te vertalen naar een kans(schatting) van 0,92. Als we intuïtief twijfelen aan de 'hardheid' van deze kans, dan heeft dat waarschijnlijk als oorzaak dat we (1) de betrouwbaarheid niet weten van het empirische gegeven dat 92% geneest en (2) niet weten of we, als we andere informatie zouden hebben, niet tot andere conclusies zouden komen. Bijvoorbeeld: wat nu als uit ander onderzoek blijkt dat mensen met een vergelijkbare medische geschiedenis lagere kans hebben om te genezen na deze ene kuur?
Naar een algemene kansdefintie
Op basis van de bovenstaande voorbeelden kunnen we concluderen dat er verschillende aanknopingspunten zijn om het begrip 'kans' te definiëren. In situaties met een symmetrische uitkomstenruimte kunnen we de (klassieke) kansdefinitie van Laplace toepassen. Deze kansdefinitie heeft echter twee belangrijke beperkingen. De klassieke definitie veronderstelt een eindige uitkomstenruimte, terwijl we ook experimenten in onze beschouwingen willen betrekken waarbij de uitkomstenruimte oneindig veel elementen bevat. Bovendien is in veel situaties niet duidelijk hoe je een dergelijke 'symmetrische' uitkomstenruimte moet definiëren, bijvoorbeeld als het gaat om het gooien van een asymmetrisch voorwerp als een punaise in plaats van een symmetrische munt of dobbelsteen.
Een andere intuïtieve benadering is het ervaringsfeit dat het herhaald uitvoeren van hetzelfde experiment leidt tot dezelfde relatieve frequentie op de lange duur. Op basis hiervan kun je wanneer bijvoorbeeld een uitkomst in 30% van een lange reeks waarnemingen optreedt, dit interpreteren als dat deze uitkomst (globaal) 30% kans van optreden heeft voor ieder experiment.
De overeenkomst is voor eindige aantallen experimenten echter nooit exact; alleen bij een fictieve oneindige rij experimenten komt de denkbeeldige relatieve frequentie overeen met de kans. Het gelijkstellen van het begrip 'kans' aan deze denkbeeldige relatieve frequentie in een oneindige reeks heeft echter een zware prijs: hierdoor verliest het begrip alle relatie met onze (eindige) werkelijkheid.
Bovenstaande modellen (symmetrie en relatieve frequentie) zijn nodig om het begrip kans te koppelen aan onze waarneembare werkelijkheid en helpen het begrip intuïtief te begrijpen. Voor een wiskundig éénduidige definitie zijn deze echter niet voldoende. Daarom wordt het begrip kans in de volgende paragraaf axiomatisch ingevoerd. De kans, aangeduid met 'P', zal aan een gebeurtenis de kans van optreden P(A) toekennen volgens een drietal vastgestelde regels (zie onder formele definitie van het begrip kans). De begrippen: uitkomst, gebeurtenis en kans vormen de basis waarop de gehele kansrekening rust.
De axioma's van de kansrekening zijn enkele door de Russische wiskundige Kolmogorov geformuleerde wiskundige uitganspunten, op basis waarvan alle regels van de kansrekening kunnen worden afgeleid. Het is als het ware een formele wiskundige definitie van het begrip kans. Hierdoor is het mogelijk om te redeneren over en rekenen met kansen als abstract begrip, onafhankelijk van de vraag hoe we in werkelijkheid bepalen wat de 'kans' is van een reële gebeurtenis zoals beschreven in de drie bovenstaande voorbeelden.
Kansruimte
Bij kansrekening hebben we te maken met een willekeurige (niet-lege) verzameling Ω en een collectie deelverzamelingen daarvan, , de gebeurtenissen. Op de collectie gebeurtenissen is een kans P (van 'Probabilitas') gedefinieerd. De verzameling Ω kan worden gezien als de verzameling van de mogelijke uitkomsten van een kansexperiment; daarom wordt Ω de 'uitkomstenruimte' genoemd en de elementen van Ω uitkomsten.
Er is echter wel een technische beperking die voor niet-wiskundigen lastig uit te leggen is, maar wel van belang is om paradoxale uitkomsten te voorkomen in situaties waarbij de uitkomstenruimte uit een 'oneindig' aantal elementen bestaat. Niet iedere deelverzameling van Ω kan als gebeurtenis optreden; de deelverzamelingen die wel als gebeurtenis kunnen optreden vormen een speciale collectie . Om te garanderen dat allerlei met een of meer gebeurtenissen samenhangende deelverzamelingen van Ω ook tot de gebeurtenissen behoren, wordt gëeist dat een σ-algebra is. Een dergelijk drietal heet kansruimte en is een bijzonder geval van wat in de wiskunde, specifiek de maattheorie, een maatruimte wordt genoemd.
Over het algemeen kan niet iedere deelverzameling van Ω als gebeurtenis optreden; de deelverzamelingen die wel als gebeurtenis kunnen optreden vormen een speciale collectie . De kans P moet voldoen aan de volgende voorwaarden, de zgn. axioma's van Kolmogorov:
Axioma 1: de kans van een gebeurtenis E is niet-negatief:
Axioma 2: De kans op een zekere gebeurtenis (de vereniging van alle mogelijke gebeurtenissen is genormeerd op 1:
Axioma 3: Voor gebeurtenissen die niet tegelijkertijd kunnen optreden, kun je de kans dat een van deze gebeurtenissen optreedt, berekenen als de som van de kansen op de afzonderlijke gebeurtenissen:
Voorbeeld 4
Bij eenmaal gooien met een dobbelsteen is de uitkomstenruimte (verzameling mogelijke uitkomsten) Ω = {1,2,3,4,5,6}. Welk ogenaantal boven zal komen bij een worp met een dobbelsteen, weten we tevoren niet - dat is ook juist de bedoeling - maar we weten wel dat er slechts de mogelijkheden 1 tot en met 6 zijn. De verzameling van de mogelijke uitkomsten van zo'n toevalsexperiment wordt 'uitkomstenruimte' (of 'uitkomstenverzameling') genoemd en veelal aangeduid met Ω. De kans op een van de ogenaantallen 1 tot en met 6, dus de kans op heel Ω, is 1. De kans op een van de ogenaantallen uit {1,2,3,5,6} is gelijk aan de kans op een uitkomst uit {1,5} plus de kans op een uitkomst uit {2,3,6}. Bij een zuivere dobbelsteen zal de kans op elk van de gebeurtenissen {1}, {2}, ...,{6} hetzelfde zijn en dus gelijk aan . Voor de hiervoor genoemde gebeurtenissen geldt dan:
Behalve de vraag welke uitkomst de worp met de dobbelsteen heeft, is er ook behoefte om vragen als "Is de uitkomst een even ogenaantal?" of "Heb je meer dan 4 gegooid?" te beantwoorden. Deze vragen hebben betrekking op meer dan een uitkomst, de eerste op de uitkomsten 2, 4 en 6, en de tweede op de uitkomsten 5 en 6. Het resultaat 'even uitkomst' en evenzo 'meer ogen dan 4' wordt een gebeurtenis genoemd en voorgesteld door respectievelijk de deelverzamelingen {2,4,6} en {5,6} van de uitkomstenruimte. |
Vergelijking met intuïtief geformuleerde eigenschappen
Eerder in dit hoofdstuk hebben we op basis van wat gevoelsmatig logisch is (plus bepaalde vrij arbitraire afspraken, zoals dat we de maximale kans normeren op 1), een aantal eigenschappen genoemd die wenselijk zijn voor een kansmaat. We vertalen deze naar de volgende desiderata (wenselijke eigenschappen) ten aanzien van een kansmaat:
- Aan uitkomsten die equivalent of anderszins even waarschijnlijk zijn, kennen we dezelfde unieke kans toe.
- Een onmogelijke gebeurtenis (een gebeurtenis die geen deel uitmaakt van de set van mogelijke gebeurtenissen) heeft kans 0.
- Een zekere gebeurtenis Ω (de vereniging van alle mogelijke gebeurtenissen) heeft kans 1.
- Een gebeurtenis A die even waarschijnlijk is als zijn complement (de gebeurtenis niet-A), heeft als kans
Met uizondering van eigenschap 1, die meer te maken heeft met hoe wij kansen toekennen aan gebeurtenissen, kunnen deze eigenschappen direct uit de axioma's van Kolmogorov worden afgeleid. Zo garandeert de combinatie van het tweede en derde axioma de eigenschap dat als gebeurtenis A even waarschijnlijk is als gebeurtenis niet-A, deze allebei kans moeten hebben. Immers:
- A en niet-A zijn twee disjuncte gebeurtenissen, waarvan de vereniging per definitie gelijk is aan de hele kansruimte Ω. De kans op A of niet-A is 1 op grond van het tweede axioma.
- A en niet-A (_A) zijn disjuncte gebeurtenissen, dus volgens het derde axioma is P(Ω)de som van P(A) en P(_A).
- A en niet-A zijn even waarschijnlijk, dus per definitie geldt P(A) = P(_A).
- De enige oplossing voor P(A) + P(A) = 1 is P(A) = .
- ↑ Deze bekende slagzin is waarschijnlijk afgeleid van het motto van het laboratorium van Heike Kamerlingh Onnes: "Door meten tot weten"
- ↑ Dit voorbeeld is overgenomen van het artikel lichtsnelheid op nl.wikipeda. Versie: zie [1]; auteurs: zie [2].
- ↑ Bron:OPERA Collaboration (2012), Measurement of the neutrino velocity with the OPERA detector in the CNGS beam, Journal of High Energy Physics, Vol. 10, p. 93
- ↑ Deze definitie is een vrije interpretatie van de definitie van Gertsbakh, die als definitie geeft van measurement: The assignment of a number to the measurand, using special technical means (measuring instruments) and a specified technical procedure. Gertsbakh, I. (2003), Measurement Theory for Engineers. Springer Verlag, Berlin/Heidelberg/New York, p.1.
- ↑ Deze paragraaf is een bewerking van het lemma [[w:Meetschaal|]] op nl.wikipedia. Versie: [3]; auteurs: [4]
- ↑ Stevens, S. S. (1946). "On the Theory of Scales of Measurement". Science 103, pp. 677–680.
- ↑ Onderstaande alinea is een bewerking van het lemma destructief onderzoek van nl.wikipedia. Versie: [5]; Auteurs: [6].
- ↑ Onderstaande alinea is een bewerking van het lemma niet-destructief onderzoek van nl.wikipedia. Versie: [7]; Auteurs: [8].
- ↑ De onderstaande paragraaf is een bewerking van het lemma steekproef van nl.wikipedia. Versie: [9]; auteurs: [10].
- ↑ Deze tekst is een bewerking van het lemma Proctorproef op nl.wikipedia. Versie: zie [11]; auteurs: zie [12]
- ↑ Deze paragraaf is een bewerking van het lemma Kansrekening van nl.wikipedia; zie: [13]; auteurs: zie [14] en de module Discrete Kansrekening/Basisbegrippen/Intuïtief kansbegrip uit het wikiboek Discrete Kansrekening. Versie: zie [15]; auteurs: zie [16]
- ↑ Bron: Nijdam, W. & W. Albers, Discrete Kansrekening. [17].
- ↑ Deze paragraaf is een bewerking van het lemma Axioma's van de kansrekening van nl.wikipedia. Versie: [18]; auteurs: [19].