Discrete Kansrekening/Simultane kansverdelingen/Inleiding
5.1 Inleiding
bewerkenVaak doen we meer dan één "waarneming" aan een uitkomst van een experiment, zoals het meten van leeftijd, lengte en gewicht van een willekeurig gekozen persoon. Op de kansruimte zijn dan verscheidene s.v.-en X1,X2,...,Xn (gelijktijdig) gegeven. We zullen dan iets te weten willen komen van de onderlinge relaties tussen de X'en. Als we de verdelingen van elk der s.v-en afzonderlijk kennen, is het in het algemeen niet mogelijk een kansuitspraak te doen die twee of meer van de s.v.-en betreft. Toch zijn het juist die gezamenlijke kansen die ons interesseren, want het zijn die zgn. simultane kansen die ons iets zeggen over de samenhang tussen de s.v.-en.
Voorbeeld 1 (twee worpen met een dobbelsteen; vervolg)
Met Z geven we het totale aantal geworpen ogen aan en met M het maximum van de beide ogenaantallen. Duidelijk is dat er een samenhang is tussen Z en M; als bv. M = 2, dan is Z ten hoogste gelijk aan 4. De simultane kans P(Z=3 en M=2) kunnen we niet afleiden uit de kansen P(Z=3) en P(M=2).
Definitie 5.1.1
Als op de kansruimte (S,P) de s.v.-en X1,X2,...,Xn gegeven zijn, noemen we de rij X = (X1,X2,...,Xn) een stochastische vector (ook afgekort tot s.v.) met dimensie n; de s.v.-en X1,X2,...,Xn zelf noemen we de componenten van X.
De begrippen waardenbereik, kansfunctie en kansverdeling zijn geheel analoog aan het geval van één dimensie gedefinieerd.
Definitie 5.1.2
Onder het waardenbereik SX van de stochastische vector X verstaan we de verzameling van alle mogelijke waarden van X, dus SX = {X(s)|s∈S}.
In het volgende zullen we, om niet met allerlei indices te moeten werken, slechts het geval van drie s.v.-en X, Y en Z behandelen. De generalisatie naar een willekeurig aantal X1, X2, ..., Xn is meestal vanzelfsprekend.
Definitie 5.1.3
Laat X, Y en Z de componenten zijn van de stochastische vector V. Onder de simultane kansfunctie van X, Y en Z verstaan we de functie pX,Y,Z: SV -> \R gedefinieerd door: pX,Y,Z(x,y,z) = P(X=x en Y=y en Z=z).
De simultane kansfunctie induceert weer een kans(maat) PV op het waardenbereik SV van V = (X,Y,Z); deze kansmaat duiden we aan als de simultane (kans)verdeling van X, Y en Z. Waar het echter niet tot verwarring aanleiding geeft, zullen we ook de simultane kansfunctie wel met kansverdeling aanduiden.
Definitie 5.1.4
Laat X, Y en Z de componenten zijn van de stochastische vector V. Onder de simultane (kans)verdeling van X, Y en Z verstaan we de functie PX, Y en Z , gedefinieerd voor B ⊂ SV door:
- ,
waarin x, y en z de componenten van v zijn.
Ook geldt een analoge stelling als in één dimensie:
Stelling 5.1.2
De simultane kansverdeling PV van de s.v. V is een kans op het waardenbereik SV van V.
Voorbeeld 2 (twee worpen met een dobbelsteen; vervolg)
De simultane kansfunctie pZ,M van Z en M wordt gegeven door:
In de volgende tabel staat deze simultane kansfunctie.
2 3 4 5 6 7 8 9 10 11 12 1 1/36 1/36 2 2/36 1/36 3/36 3 2/36 2/36 1/36 5/36 4 2/36 2/36 2/36 1/36 7/36 5 2/36 2/36 2/36 2/36 1/36 9/36 6 2/36 2/36 2/36 2/36 2/36 1/36 11/36 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36 36/36
In de rechter- en ondermarge van de tabel staan de rij- resp. kolomtotalen vermeld. Deze totalen stellen juist de verdelingen (kansfuncties) pM van M en pZ van Z voor. Immers om bv. pM(3) te bepalen, bedenken we dat: pM(3) = P(M=3) = P(Z=4 en M=3 of Z=5 en M=3 of Z=6 en M=3) = P(Z=4 en M=3) + P(Z=5 en M=3) + P(Z=6 en M=3) = pZ,M(4,3) + pZ,M(5,3) + pZ,M(6,3).
Daarom noemen we in dit verband de verdelingen van M en van Z wel marginale verdelingen.
Als de simultane verdeling (kansfunctie) van een stel s.v.-en bekend is, kunnen we, zoals uit het bovenstaande blijkt, van elke gebeurtenis omtrent die s.v.-en de kans berekenen. In het bijzonder kunnen we de kansen bepalen op gebeurtenissen die alleen een deel van de s.v.-en betreffen; de daarbij behorende kansverdeling noemen we marginale verdeling.
Definitie 5.1.5a
Laat X, Y en Z de componenten zijn van de stochastische vector V. De kansfuncties pX, pY en pZ van de componenten van V noemen we in dit verband wel marginale kansfuncties.
Ook voor een deel van de componenten van een stochastische vector V spreken we van marginale verdelingen. We formuleren de definitie alleen voor de twee componenten X en Z.
Definitie 5.1.5b
Laat X, Y en Z de componenten zijn van de stochastische vector V. De simultane kansfunctie van de twee componenten X en Z noemen we in dit verband wel de marginale kansfunctie van X en Z.
In voorbeeld 2 hebben we al gezien hoe we de marginale kansfunctie van een s.v. konden berekenen uit de simultane verdeling van die s.v. en een andere. De volgende stelling formuleert dit.
Stelling 5.1.1
De marginale kansfunctie van de s.v. X kan uit de simultane kansfunctie van X, Y en Z berekend worden volgens:
- ,
dus door de bij x horende simultane kansen te sommeren over alle mogelijke waarden y van Y en z van Z.
We kunnen de stelling generaliseren naar de algemene situatie van het berekenen van de marginale verdeling van de m componenten van een s.v. uit de simultane verdeling van alle n (n>m) componenten. We zullen deze vanzelfsprekende generalisatie echter niet opschrijven, maar de formulering aan de lezer overlaten.
Alvorens we een voorbeeld bespreken, introduceren we eerst een generalisatie van de binomiale verdeling, nl. de multinomiale verdeling. De binomiale verdeling ontstaat onder meer wanneer we uit een vaas met twee soorten knikkers, zeg witte en zwarte, met terugleggen, lukraak n keer een knikker trekken. Het aantal getrokken witte knikkers is dan binomiaal verdeeld. Met het aantal witte ligt ook het aantal zwarte vast. Als generalisatie nemen we een vaas met bv. vijf soorten knikkers: witte, rode, gele, groene en blauwe. We trekken ook nu met terugleggen, lukraak n knikkers uit de vaas. De steekproef bevat nu van elke kleur een aantal knikkers. Die aantallen, X1,...,X5 zijn dan multinomiaal verdeeld. De parameters van deze verdeling zijn: het aantal getrokken knikkers n, het aantal mogelijke kleuren, hier 5, en de fracties knikkers p1,...,p5 van elk der kleuren in de vaas.
Definitie 5.1.6 (multinomiale verdeling)
We zeggen dat de s.v.-en X1,X2,...,Xm een multinomiale verdeling hebben met parameters n, m en p1,p2,...,pm, als het waardenbereik van de s.v. X = (X1,X2,...,Xm) gegeven wordt door: SX = {(n1,n2,...,nm)|ni geheel, ni ≥ 0 en n1+ n2+...+ nm= n} en de simultane kansverdeling van X1,X2,...,Xm bepaald wordt door:
- .
Daarbij zijn n en m natuurlijke getallen en is pi ≥ 0 voor elke i = 1,2,...,m en er geldt p1+ p2+...+ pm= 1.
Voorbeeld 3 (multinomiale verdeling)
Als generalisatie van een Bernoulli-experiment beschouwen we een experiment met m verschillende uitkomsten. Als vaasmodel kunnen we denken aan een vaas met knikkers in m verschillende kleuren; de kansen op de verschillende uitkomsten noemen we p1,p2,...,pm. Er geldt natuurlijk dat p1+ p2+...+ pm = 1. We trekken n keer lukraak een knikker uit de vaas en leggen deze na de kleur vastgesteld te hebben weer terug. Met Xi geven we het aantal keren aan dat de ie uitkomst bij de n herhalingen voorkwam. De s.v.-en X1,X2,...,Xm zijn dan multinomiaal verdeeld met parameters n, m en p1,p2,...,pm.
We bepalen eens voor het geval m=3 (trinomiale verdeling) de marginale verdeling van X1. Voor n1= 0,1,...,n berekenen we:
-
- .
We zien dat X1 een binomiale verdeling heeft met parameters n en p1.