Discrete Kansrekening/Voorwaardelijke kans en onafhankelijkheid/Voorwaardelijke kans
3.1 Voorwaardelijke kans
bewerkenHet komt dikwijls voor dat over de uitkomst van een experiment tevoren al iets bekend is of iets verondersteld wordt. Als we een willekeurige voorbijganger in Amsterdam aanspreken, dan is de kans dat hij op de PVDA stemt een andere dan voor iemand uit Wassenaar. We kunnen ons het experiment zo voorstellen dat we lukraak een Nederlander aanwijzen, echter als extra voorwaarde stellen dat hij in Amsterdam moet wonen. Onder deze voorwaarde kunnen we vragen naar de kans dat hij op de PVDA stemt. Deze "kans" is niet een kans zoals we die tot nu toe kennen. Er is een nieuwe definitie nodig voor dit begrip. In het voorbeeld vragen we naar de voorwaardelijke kans dat een willekeurige Nederlander op de PVDA stemt, gegeven dat hij in Amsterdam woont. Intuïtief ligt het voor de hand om deze voorwaardelijke kans gelijk te stellen aan de kans dat een willekeurige Amsterdammer op de PVDA stemt. Als we met A de Nederlanders aangeven die op de PVDA stemmen en met B de Amsterdammers, dan is deze voorwaardelijke kans gelijk aan #AB/#B, waarbij #B het aantal Amsterdammers is en #AB het aantal daarvan dat op de PVDA stemt. We duiden deze voorwaardelijke kans aan met P(A|B); als N het totale aantal Nederlanders is, geldt:
Op deze manier kunnen we de voorwaardelijke kans uitdrukken in onvoorwaardelijke kansen. Dit intuïtieve resultaat voor deze symmetrische kansruimte gebruiken we nu als definitie van het begrip voorwaardelijke kans voor willekeurige kansruimten.
Definitie 3.1.1
Als A en B gebeurtenissen zijn en P(B) > 0, dan noemen we:
de voorwaardelijke kans op A gegeven B. We spreken ook wel van de kans op A onder de voorwaarde B.
Opmerking 1
De notatie P(A|B) voor de voorwaardelijke kans op de gebeurtenis A gegeven de gebeurtenis B is historisch bepaald, maar kan gemakkelijk verwarrend werken. Zo moeten we dit niet lezen als de kans P op de gebeurtenis (?) "A|B". Het zou logischer zijn om PB(A) te schrijven, daarmee aanduidend dat het gaat om een andere kans, nl. PB, en niet om de (onvoorwaardelijke) kans P zelf. Het heeft echter nadelen om gecompliceerde gebeurtenissen B als index aan P te hangen, zodat we de notatie P(A|B) handhaven.
Voorbeeld 1
We trekken geordend en zonder terugleggen lukraak 5 keer een knikker uit een vaas met 10 rode en 20 witte knikkers. De kans dat de eerste knikker rood is, is 1/3. De kans dat de tweede knikker rood is, is ook 1/3. Echter de voorwaardelijke kans dat de tweede knikker rood is, gegeven dat de eerste rood is, is:
- P("2e rood"|"1e rood") = P("2e rood" en "1e rood")/P("1e rood") = .
Dat antwoord zal ons niet verbazen. Deze voorwaardelijke kans leiden we direct af door naar het experiment te kijken dat ontstaat als we als eerste een rode knikker getrokken hebben en vervolgens weer een knikker gaan trekken.
Voorbeeld 2
Een doos bevat twee munten, waarvan er één zuiver is, dwz. kruis en munt worden met gelijke kans geworpen, terwijl de andere aan beide zijden kruis heeft. We kiezen nu lukraak een van de munten en werpen deze. Als het resultaat van deze worp kruis is, wat is dan de kans dat de andere kant van deze munt ook kruis is? Zij A de gebeurtenis dat de uitkomst kruis is en B de gebeurtenis dat de geworpen munt aan beide zijden kruis heeft dan is P(B|A) de gevraagde voorwaardelijke kans. Nu geldt P(A) = 3/4, immers drie van de in totaal 4 zijden van de munten zijn kruis en deze zijden komen alle met gelijke kans boven. Bovendien geldt P(BA) = P(B) = 1/2, want B ⊂ A en beide munten hebben gelijke kans om getrokken te worden. Dus P(B|A) = P(BA)/P(A) = 2/3.
Uit de definitie van voorwaardelijke kans volgt eenvoudig dat voor vaste B met P(B) > 0 de voorwaardelijke kans P(W|B) een kans is op S zowel als op B, dwz. dat hij net als P voldoet aan de axioma's van Kolmogorov.
Stelling 3.1.1
Als (S,P) een kansruimte is en B een gebeurtenis met P(B) > 0, is de voorwaardelijke kans P(.|B) zowel een kans op S als op B.
Bewijs: Beschouw de bijbehorende kansfunctie pB. Daarvoor geldt: pB(s) ≥ 0, voor alle s ∈ S en:
- .
Uit de definitie van voorwaardelijke kans volgt direct voor twee gebeurtenissen A en B: P(AB) = P(A)P(B|A). We kunnen deze relatie uitbreiden tot meer dan twee gebeurtenissen en krijgen dan de zgn. productregel voor kansen.
Stelling 3.1.2 (productregel)
Voor de gebeurtenissen A1,A2,...,An met P(A1A2...An–1) > 0 geldt: P(A1A2...An) = P(A1).P(A2|A1)...P(An|A1A2...An–1).
Voorbeeld 3 (vervolg voorbeeld 1)
Zij Ai de gebeurtenis dat de ie getrokken knikker rood is. Dan is: P(A1) = 1/3 en P(A2|A1) = 9/29, zodat P(A1A2) = P(A1)P(A2|A1) = 3/29. We kunnen op de volgende manier P(A2) berekenen:
-
- .
De laatste berekening in het voorbeeld kunnen we heel algemeen formuleren. We hebben daar de kans op de gebeurtenis A2 bepaald door een opsplitsing (partitie) van A2 te bekijken. We zeggen wel dat we de totale kans op A2 berekenen via de voorwaardelijke kansen van de partitie. We bekijken nog een voorbeeld.
Voorbeeld 4
Stel dat we de fractie Nederlanders die op de PVDA stemmen willen bepalen. We kunnen daartoe het aantal Nederlanders N en het aantal #A onder hen die op de PVDA stemmen bepalen. De gevraagde fractie is dan p = #A/N. Stel dat voor elke provincie i de fractie
al bekend is; dan is:
- .
In een symmetrische kansruimte met S = {alle Nederlanders} en A = {PVDA-stemmers} correspondeert deze relatie met
- P(A) = ∑ P(A|provincie i).P(provincie i).
De algemene formulering luidt:
Stelling 3.1.3 (Wet van de totale kans)
Laat de (ten hoogste aftelbaar veel) gebeurtenissen A1,A2,..., met P(An) > 0 voor alle n, een partitie vormen van de uitkomstenruimte S, dan geldt:
- .
In de praktijk is het dikwijls zo, dat we de voorwaardelijke kansen P(B|An) uit het model afleiden en gebruiken voor het berekenen van de onvoorwaardelijke kans P(B), die vaak niet direct uit het model volgt. In deze zin wordt de wet van de totale kans gebruikt in het volgende voorbeeld.
Voorbeeld 5
Een bedrijf bezit drie fabrieken A, B en C, waar scheerapparaten van hetzelfde type worden gemaakt. Gedurende een bepaalde periode maakte fabriek A 2000 scheerapparaten, waarvan er 200 defect waren, fabriek B maakte in die periode 5000 apparaten, waarvan er 300 defect waren en C maakte 3000 apparaten, waaronder 150 defecte. Uit de totale productie wordt lukraak een scheerapparaat gekozen; wat is de kans dat dit apparaat defect (D) is? De gegevens van die periode kunnen we op de volgende overzichtelijke manier weergeven:
fabriek 2000/10000 200/2000 200/10000 5000/10000 300/5000 300/10000 3000/10000 150/3000 150/10000 totaal 1 650/10000
De berekening in de laatste kolom laat zien hoe met behulp van de wet van de totale kans de gevraagde kans berekend wordt: P(D) = P(D|A)P(A) + P(D|B)P(B) + P(D|C)P(C) = 0,065.
Het gekozen scheerapparaat blijkt defect te zijn! Wat is de kans dat het afkomstig is van fabriek A? We vragen dus naar P(A|D), de voorwaardelijke kans dat het van A afkomstig is, gegeven dat het defect is. We berekenen:
- .
In het voorbeeld is de laatste berekening een toepassing van de zgn. regel van Bayes. Terwijl de voorwaardelijke kansen op de gebeurtenis D, gegeven elk van A, B en C, bekend zijn, laat deze regel zien hoe we de "omgekeerde" voorwaardelijke kans op elk van A, B en C, gegeven D, moeten berekenen.
Stelling 3.1.4 (Regel van Bayes)
Zij B een gebeurtenis met P(B) > 0 en A1,A2,... een partitie van S met P(Ai) > 0 voor alle i, dan geldt voor iedere i:
- .
Bewijs: Volgt direct uit de definitie van voorwaardelijke kans en de wet van de totale kans.
Voorbeeld 6
Een prototype van een machine om bij banken geldstukken te sorteren vertoonde nogal wat gebreken. De machine accepteerde een mengsel van guldens, rijksdaalders en vijfjes (5-guldenstukken) en telde de munten, maar maakte nogal wat fouten. Uit proeven bleek dat een vijfje soms voor een rijksdaalder of een gulden werd gehouden of andersom. Van 1000 vijfjes werden 16 als rijksdaalder en 33 als gulden gezien. van 1000 rijksdaalders werden slechts 5 als vijfje geteld, maar 71 als gulden en van 1000 guldens werden 14 als rijksdaalder gezien en 32 als vijfje. Hoe groot is de kans dat een munt werkelijk een vijfje is {5!} als de machine aangeeft een vijfje te tellen {5?}? We gaan er daarbij van uit dat 10% van de aangeboden munten vijfjes zijn en 40% rijksdaalders. We kunnen de gegevens ordelijk in de volgende tabel weergeven.
munt 2 0,10 0,951 0,0951 1 0,40 0,005 0,0020 0,5 0,50 0,032 0,0160 totaal 1,00 0,1131 =
Met de regel van Bayes berekenen we:
- P(5!|5?) = P(5?|5!)P(5!)/P(5?) = 0,0951/0,1131 = 0,841.
De wet van de totale kans wordt ook wel weergegeven in een kansboom. Aan de hand van een voorbeeld zullen we dit duidelijk maken.
Voorbeeld 7 (kansboom)
We beschouwen de situatie van voorbeeld 5 en geven die op de volgende wijze weer. Deze figuur, die kansboom wordt genoemd, spreekt verder voor zich.
Een kansboom laat zich op voor de hand liggende wijze ook gebruiken in gecompliceerdere situaties. We geven daarvan verder geen voorbeeld.