Meten en onzekerheid/Onzekerheid
4. Onzekerheid
bewerkenEen veelgehoorde uitpraak is meten is weten. Waarom dan toch de nadruk op onzekerheid in dit boek over meten? Nu is het inderdaad zo dat metingen, in ieder geval valide metingen, ervoor zorgen dat de onzekerheid over de werkelijke situatie wordt verminderd. Toch is het een illusie te denken dat je door te meten alles kunt weten. "Meten is weten" is feitelijk onjuist: metingen moeten eerst nog gecorrigeerd en (soms stilzwijgend) geïnterpreteerd worden aan de hand van een theorie of veronderstelling, anders hebben metingen geen betekenis. Het is een versimpeling van de spreuk van Heike Kamerlingh Onnes Door meten tot weten.
Waarom is meten onzeker?
bewerkenHet doel van meten is om informatie te verzamelen over een werkelijke toestandsgrootheid van een object (meetvariabele). Er zijn echter goede redenen om te veronderstellen dat de werkelijke toestand van een object zelden exact zal overeenkomen met de gemeten waarden:
- metingen hebben een beperkte precisie
- meetinstrumenten geven niet altijd de juiste waarde aan
- bij het bedienen van meetinstrumenten kunnen fouten worden gemaakt
- de werkelijke waarde van de toestandsgrootheid varieert vaak in plaats en tijd
- etc.
Een voorbeeld: stel dat we de hoogteligging van een toren willen meten ten opzichte van een bekende referentiehoogte. We kunnen hiervoor bijvoorbeeld een GPS gebruiken met een precisie op centimeter-niveau. We kunnen kiezen voor andere meetinstrumenten met een grotere nauwkeurigheid, maar de precizie van aflezen of waarmee digitaal meetresultaten worden getoond is echter altijd eindig. Belangrijker is echter dat de afgelezen waarde niet altijd juist is. Door kleine afwijkingen in de afstelling van het meetinstrument kunnen fouten in de meetwaarde ontstaan. Deze fouten kunnen nog groter worden indien de meetinstrumenten fout worden bediend. Ten slotte varieert de werkelijke waarde van de toestandsgrootheid vaak in plaats en tijd. Zelfs al definiëren we de hoogte van de toren als het verschil tussen het allerhoogste punt en het NAP, dan blijft het probleem dat de hoogte van de toren varieert in de tijd. Bij warm weer zal het gebouw uitzetten, bij koud weer krimpen. Zo varieert de hoogte van de Eiffeltoren ca. 15 cm afhankelijk van de temperatuur.
Steekproeven
bewerkenDe variabiliteit van het gemetene naar plaats en tijd is nog een relatief klein probleem bij het meten van de hoogte van een toren. Lastiger wordt het als de stijfheid van de ondergrond van een geheel bouwkavel of wegtracé moet worden gemeten, of bijvoorbeeld de gemiddelde intensiteit van het verkeer over de A10 op een gemiddelde werkdag. Gelukkig is het mogelijk om betrouwbare uitspraken te doen op basis van een beperkt aantal metingen, mits deze metingen een voldoende representatief beeld geven van het geheel. In dit geval spreken we van een steekproef. [1]
Er zijn echter meer goede redenen om te kiezen voor een steekproef van beperkte omvang:
- Het is gemakkelijker en goedkoper om slechts een deel van de populatie te onderzoeken.
- Als snelheid gewenst is, kan niet de hele populatie onderzocht worden.
- Bij destructief onderzoek zou de hele populatie verloren gaan.
In de steekproeftheorie beschouwen we de hierboven genoemde objecten (bouwkavel, wegtracé, verkeer over een weg) als een populatie van verschillende plaatsen en tijdstippen. Men kan op verschillende manieren een steekproef verkrijgen. Als alle elementen uit de populatie dezelfde kans hebben om in de steekproef te worden opgenomen, spreekt men van een aselecte steekproef. Men spreekt van een selecte steekproef wanneer de elementen niet op toevalsbasis uit een populatie worden genomen. Zorgt men ervoor dat de verhouding mannen en vrouwen in de steekproef voorkomen ongeveer gelijk is aan deze verhouding in de bevolking dan heet de steekproef representatief (althans wat het kenmerk geslacht betreft). De keuze bepaalt in grote mate de validiteit van verdere analyse.
Voorbeelden van blijvende onzekerheid na meting
bewerkenStel dat we willen toetsen of de verdichtingsgraad van de fundering van een nieuwe weg voldoende groot is. Het weglichaam is 2,3 km lang en 15 m breed. We steken op 25 verschillende plekken een monster en bepalen met behulp van een proctorproef de verdichtingsgraad. Puur uitgaande van de meetresultaten, weet je eigenlijk niets meer dan de verdichtingsgraad die bereikt was op 25 verschillende plekken, notabene plekken die door het 'destructieve' karakter van de meting aangetast zijn.
Op basis van onze geotechnische kennis en ervaring mogen we echter veronderstellen dat de verdichtingsgraad tussen twee nabij gelegen plekken niet veel van elkaar verschilt. Bovendien kunnen we uit de 25 metingen ook iets afleiden over de orde grootte van de onderlinge verschillen.
Het vakgebied dat zich bezighoudt met het verbinden van algemene conclusies uit een beperkte steekproef is de statistiek. Dit vakgebied is nauw verwant aan - en volgens sommigen een onlosmakelijk onderdeel van - de kansrekening, welke zich bezighoudt met het rekenen met onzekerheid. Om een getalsmatige uitspraak te kunnen doen over de (on)zekerheid voor en na de metingen m.b.t. tot de verdichtingsgraad zullen we dus eerst een manier moeten vinden om onzekerheid in getallen uit te drukken. Dit kan met behulp van de begrippen kans en entropie.
Proctorproef De proctorproef[2] is een testprocedure die wordt toegepast om de dichtheid van een grondmonster te bepalen zodat men de funderingsstabiliteit van de grond kan vaststellen. De naam verwijst naar de Amerikaanse ingenieur Ralph R. Proctor die in 1933 de eerste varianten van de proef ontwikkelde.
Er moet eerst worden bepaald wat het vochtgehalte van de genomen grondmonsters is. De grondmonsters worden genomen met een cilinder van een bepaalde inhoud. Het vochtgehalte wordt gemeten door ongeveer 150 gram nat zand uit een monster in de ovenschaal te doen, dit gewicht wordt dan genoteerd. Hierna wordt dit zand enkele minuten verwarmd in een oven. Op regelmatige tijdstippen wordt gewogen en indien het gewicht niet meer dan 0,1% afwijkt van de vorige meting wordt het monster als droog beschouwd. Nu wordt het droge gewicht gemeten, en zo is bekend hoeveel vocht het betreffende monster bevat.
De maximale dichtheid wordt bepaald aan de hand van een test. Een machine met een gewicht van 2,5 kg met een oppervlakte van 50,8 mm slaat met 25 slagen per laag het monster aan, het aantal lagen verschilt per inhoud van de cilinder (3 tot 5), de lagen zijn gemiddeld 40 mm dik. De foto toont de cilinder met inhoud die wordt aangeslagen door het betreffende gewicht.
Om vervolgens de maximale proctordichtheid te bepalen wordt als volgt te werk gegaan: Men begint met een normale waarde (het vochtgehalte zoals deze met het monster was geleverd) en vervolgens voegt men een x aantal % aan water toe en voert de test nogmaals uit. Dit gebeurt zo vaak totdat de dichtheid begint te dalen.
|
|
Onzekerheid en kansbegrip
bewerkenKansrekening is een tak van de wiskunde die zich bezighoudt met situaties waarin het toeval een rol speelt, met als gevolg dat er geen zekerheid is over allerlei uitkomsten. Kansrekening is ontstaan vanuit de maatschappelijke behoefte om zo effectief mogelijk om te gaan met onzekerheden. De kansrekening tracht mathematische hulpmiddelen aan te reiken aan een zeer breed scala van maatschappelijke activiteiten en wetenschappen, om binnen een omgeving met onzekerheden toch gefundeerde keuzes te kunnen maken of conclusies te kunnen trekken.Zie voor een (wiskundige) inleiding in de Discrete Kansrekening het gelijknamige wikiboek.
In een situatie waarin het toeval een rol speelt zal tevoren vaak niet bekend zijn wat de uitkomst van een gebeurtenis (een waarneming of meting) is. Wel kan meestal van tevoren aangegeven worden wat de mogelijke uitkomsten zijn. De kans is dan een maat voor de waarschijnlijkheid van iedere uitkomst. Deze kansmaat heeft een aantal (wenselijke) eigenschappen. Als alle uitkomsten even waarschijnlijk (of, zo je wilt, onwaarschijnlijk) zijn, dan hebben ze logischgewijs dezelfde kans. Verder moeten we, net als bij meetvariabelen, een schaal definiëren om een getalswaarde te kunnen gaan geven. Dit doen we door 0% waarschijnlijkheid (het minimum) te laten overeenkomen met een kans van 0 en 100% waarschijnlijkheid (het maximum) overeen te laten komen met een kans van 1. Ten slotte willen we dat tussen een kans van 0 en 1 er een logische schaling is, zodat we een kans van 1/2 mogen opvatten als dat de betreffende uitkomst even waarschijnlijk wel als niet kan gebeuren.
We gaan nu proberen in een aantal situaties op intuïtieve gronden kansen toe te kennen aan mogelijke uitkomsten.
Voorbeeld 1 |
In dit voorbeeld is er sprake van vier gelijkwaardige mogelijkheden, waarvan er drie leiden tot de uitkomst rood. De meeste mensen zullen daarom ervoor kiezen om aan deze gebeurtenis de kans toe te kennen.
Voorbeeld 2 |
Ook hier is er sprake van een (fysische) symmetrie. Op grond van de symmetrie van de dobbelsteen zeggen we dat elk van de mogelijke uitkomsten (ogenaantallen) 1 tot en met 6 gelijke kans van optreden heeft. Het begrip symmetrie is de basis voor de klassieke definitie van het begrip kans. Het werd geïntroduceerd door Laplace (1749-1827). In een symmetrisch experiment wordt de kans op een gebeurtenis A gegeven door de fractie voor A gunstige (dat wil zeggen tot A behorende) uitkomsten #A ten opzichte van het totaal aantal mogelijke uitkomsten #S:
De kans op een '6' is daarmee en de kans op een 'even aantal ogen' .
Voorbeeld 3 |
In dit voorbeeld is het niet mogelijk om alleen op basis van 'symmetrie' kansen toe te kennen. Toch zullen veel mensen bereid zijn om de genoemde 92% patiënten die geneest te vertalen naar een kans(schatting) van 0,92. Als we intuïtief twijfelen aan de 'hardheid' van deze kans, dan heeft dat waarschijnlijk als oorzaak dat we (1) de betrouwbaarheid niet weten van het empirische gegeven dat 92% geneest en (2) niet weten of we, als we andere informatie zouden hebben, niet tot andere conclusies zouden komen. Bijvoorbeeld: wat nu als uit ander onderzoek blijkt dat mensen met een vergelijkbare medische geschiedenis lagere kans hebben om te genezen na deze ene kuur?
Naar een algemene kansdefintie
bewerkenOp basis van de bovenstaande voorbeelden kunnen we concluderen dat er verschillende aanknopingspunten zijn om het begrip 'kans' te definiëren. In situaties met een symmetrische uitkomstenruimte kunnen we de (klassieke) kansdefinitie van Laplace toepassen. Deze kansdefinitie heeft echter twee belangrijke beperkingen. De klassieke definitie veronderstelt een eindige uitkomstenruimte, terwijl we ook experimenten in onze beschouwingen willen betrekken waarbij de uitkomstenruimte oneindig veel elementen bevat. Bovendien is in veel situaties niet duidelijk hoe je een dergelijke 'symmetrische' uitkomstenruimte moet definiëren, bijvoorbeeld als het gaat om het gooien van een asymmetrisch voorwerp als een punaise in plaats van een symmetrische munt of dobbelsteen.
Een andere intuïtieve benadering is het ervaringsfeit dat het herhaald uitvoeren van hetzelfde experiment leidt tot dezelfde relatieve frequentie op de lange duur. Op basis hiervan kun je wanneer bijvoorbeeld een uitkomst in 30% van een lange reeks waarnemingen optreedt, dit interpreteren als dat deze uitkomst (globaal) 30% kans van optreden heeft voor ieder experiment.
De overeenkomst is voor eindige aantallen experimenten echter nooit exact; alleen bij een fictieve oneindige rij experimenten komt de denkbeeldige relatieve frequentie overeen met de kans. Het gelijkstellen van het begrip 'kans' aan deze denkbeeldige relatieve frequentie in een oneindige reeks heeft echter een zware prijs: hierdoor verliest het begrip alle relatie met onze (eindige) werkelijkheid.
Bovenstaande modellen (symmetrie en relatieve frequentie) zijn nodig om het begrip kans te koppelen aan onze waarneembare werkelijkheid en helpen het begrip intuïtief te begrijpen. Voor een wiskundig éénduidige definitie zijn deze echter niet voldoende. Daarom wordt het begrip kans in de volgende paragraaf axiomatisch ingevoerd. De kans, aangeduid met 'P', zal aan een gebeurtenis de kans van optreden P(A) toekennen volgens een drietal vastgestelde regels (zie onder formele definitie van het begrip kans). De begrippen: uitkomst, gebeurtenis en kans vormen de basis waarop de gehele kansrekening rust.
De axioma's van de kansrekening zijn enkele door de Russische wiskundige Kolmogorov geformuleerde wiskundige uitganspunten, op basis waarvan alle regels van de kansrekening kunnen worden afgeleid. Het is als het ware een formele wiskundige definitie van het begrip kans. Hierdoor is het mogelijk om te redeneren over en rekenen met kansen als abstract begrip, onafhankelijk van de vraag hoe we in werkelijkheid bepalen wat de 'kans' is van een reële gebeurtenis zoals beschreven in de drie bovenstaande voorbeelden.
Kansruimte
bewerkenBij kansrekening hebben we te maken met een willekeurige (niet-lege) verzameling Ω en een collectie deelverzamelingen daarvan, , de gebeurtenissen. Op de collectie gebeurtenissen is een kans P (van 'Probabilitas') gedefinieerd. De verzameling Ω kan worden gezien als de verzameling van de mogelijke uitkomsten van een kansexperiment; daarom wordt Ω de 'uitkomstenruimte' genoemd en de elementen van Ω uitkomsten.
Er is echter wel een technische beperking die voor niet-wiskundigen lastig uit te leggen is, maar wel van belang is om paradoxale uitkomsten te voorkomen in situaties waarbij de uitkomstenruimte uit een 'oneindig' aantal elementen bestaat. Niet iedere deelverzameling van Ω kan als gebeurtenis optreden; de deelverzamelingen die wel als gebeurtenis kunnen optreden vormen een speciale collectie . Om te garanderen dat allerlei met een of meer gebeurtenissen samenhangende deelverzamelingen van Ω ook tot de gebeurtenissen behoren, wordt gëeist dat een σ-algebra is. Een dergelijk drietal heet kansruimte en is een bijzonder geval van wat in de wiskunde, specifiek de maattheorie, een maatruimte wordt genoemd.
Over het algemeen kan niet iedere deelverzameling van Ω als gebeurtenis optreden; de deelverzamelingen die wel als gebeurtenis kunnen optreden vormen een speciale collectie . De kans P moet voldoen aan de volgende voorwaarden, de zgn. axioma's van Kolmogorov:
Axioma 1: de kans van een gebeurtenis E is niet-negatief:
Axioma 2: De kans op een zekere gebeurtenis (de vereniging van alle mogelijke gebeurtenissen is genormeerd op 1:
Axioma 3: Voor gebeurtenissen die niet tegelijkertijd kunnen optreden, kun je de kans dat een van deze gebeurtenissen optreedt, berekenen als de som van de kansen op de afzonderlijke gebeurtenissen:
Voorbeeld 4
Bij eenmaal gooien met een dobbelsteen is de uitkomstenruimte (verzameling mogelijke uitkomsten) Ω = {1,2,3,4,5,6}. Welk ogenaantal boven zal komen bij een worp met een dobbelsteen, weten we tevoren niet - dat is ook juist de bedoeling - maar we weten wel dat er slechts de mogelijkheden 1 tot en met 6 zijn. De verzameling van de mogelijke uitkomsten van zo'n toevalsexperiment wordt 'uitkomstenruimte' (of 'uitkomstenverzameling') genoemd en veelal aangeduid met Ω. De kans op een van de ogenaantallen 1 tot en met 6, dus de kans op heel Ω, is 1. De kans op een van de ogenaantallen uit {1,2,3,5,6} is gelijk aan de kans op een uitkomst uit {1,5} plus de kans op een uitkomst uit {2,3,6}. Bij een zuivere dobbelsteen zal de kans op elk van de gebeurtenissen {1}, {2}, ...,{6} hetzelfde zijn en dus gelijk aan . Voor de hiervoor genoemde gebeurtenissen geldt dan:
Behalve de vraag welke uitkomst de worp met de dobbelsteen heeft, is er ook behoefte om vragen als "Is de uitkomst een even ogenaantal?" of "Heb je meer dan 4 gegooid?" te beantwoorden. Deze vragen hebben betrekking op meer dan een uitkomst, de eerste op de uitkomsten 2, 4 en 6, en de tweede op de uitkomsten 5 en 6. Het resultaat 'even uitkomst' en evenzo 'meer ogen dan 4' wordt een gebeurtenis genoemd en voorgesteld door respectievelijk de deelverzamelingen {2,4,6} en {5,6} van de uitkomstenruimte. |
Vergelijking met intuïtief geformuleerde eigenschappen
bewerkenEerder in dit hoofdstuk hebben we op basis van wat gevoelsmatig logisch is (plus bepaalde vrij arbitraire afspraken, zoals dat we de maximale kans normeren op 1), een aantal eigenschappen genoemd die wenselijk zijn voor een kansmaat. We vertalen deze naar de volgende desiderata (wenselijke eigenschappen) ten aanzien van een kansmaat:
- Aan uitkomsten die equivalent of anderszins even waarschijnlijk zijn, kennen we dezelfde unieke kans toe.
- Een onmogelijke gebeurtenis (een gebeurtenis die geen deel uitmaakt van de set van mogelijke gebeurtenissen) heeft kans 0.
- Een zekere gebeurtenis Ω (de vereniging van alle mogelijke gebeurtenissen) heeft kans 1.
- Een gebeurtenis A die even waarschijnlijk is als zijn complement (de gebeurtenis niet-A), heeft als kans
Met uizondering van eigenschap 1, die meer te maken heeft met hoe wij kansen toekennen aan gebeurtenissen, kunnen deze eigenschappen direct uit de axioma's van Kolmogorov worden afgeleid. Zo garandeert de combinatie van het tweede en derde axioma de eigenschap dat als gebeurtenis A even waarschijnlijk is als gebeurtenis niet-A, deze allebei kans moeten hebben. Immers:
- A en niet-A zijn twee disjuncte gebeurtenissen, waarvan de vereniging per definitie gelijk is aan de hele kansruimte Ω. De kans op A of niet-A is 1 op grond van het tweede axioma.
- A en niet-A (_A) zijn disjuncte gebeurtenissen, dus volgens het derde axioma is P(Ω)de som van P(A) en P(_A).
- Als A en niet-A even waarschijnlijk zijn, geldt per definitie P(A) = P(_A).
- De enige oplossing voor P(A) + P(A) = 1 is P(A) = .
Voetnoten:
- ↑ De onderstaande paragraaf is een bewerking van het lemma steekproef van nl.wikipedia. Versie: [1]; auteurs: [2].
- ↑ Deze tekst is een bewerking van het lemma Proctorproef op nl.wikipedia. Versie: zie [3]; auteurs: zie [4]
- ↑ Deze paragraaf is een bewerking van het lemma Kansrekening van nl.wikipedia; zie: [5]; auteurs: zie [6] en de module Discrete Kansrekening/Basisbegrippen/Intuïtief kansbegrip uit het wikiboek Discrete Kansrekening. Versie: zie [7]; auteurs: zie [8]
- ↑ Bron: Nijdam, W. & W. Albers, Discrete Kansrekening. [9].
- ↑ Deze paragraaf is een bewerking van het lemma Axioma's van de kansrekening van nl.wikipedia. Versie: [10]; auteurs: [11].