Kurssin puoliväli ja osan 2 teemat

Samankaltaiset tiedostot
Todennäköisyys (englanniksi probability)

(x, y) 2. heiton tulos y

Varma tapahtuma, Yhdiste, Yhdistetty tapahtuma, Yhteenlaskusääntö

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Sovellettu todennäköisyyslaskenta B

Mat Sovellettu todennäköisyyslasku. Aiheet: Todennäköisyyslaskennan peruskäsitteet Todennäköisyyslaskennan peruslaskusäännöt Avainsanat:

HY / Matematiikan ja tilastotieteen laitos Tilastollinen päättely II, kevät 2017 Harjoitus 1 Ratkaisuehdotuksia Tehtäväsarja I

Osa 1: Todennäköisyys ja sen laskusäännöt. Todennäköisyyden peruslaskusäännöt

Miten hyvin mallit kuvaavat todellisuutta? Tarvitaan havaintoja.

Todennäköisyys. Antoine Gombaud, eli chevalier de Méré?.? Kirjailija ja matemaatikko

Johdatus todennäköisyyslaskentaan Todennäköisyys ja sen määritteleminen. TKK (c) Ilkka Mellin (2005) 1

Ilkka Mellin Todennäköisyyslaskenta

1. laskuharjoituskierros, vko 4, ratkaisut

Todennäköisyyslaskenta I, kesä 2017 Helsingin yliopisto/avoin Yliopisto Harjoitus 1, ratkaisuehdotukset

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Sovellettu todennäköisyyslaskenta B

Käytetään satunnaismuuttujaa samoin kuin tilastotieteen puolella:

Todennäköisyyslaskennan peruslaskusäännöt. Todennäköisyyslaskennan peruslaskusäännöt. Todennäköisyyslaskennan peruslaskusäännöt: Esitiedot

Todennäköisyyslaskenta: Todennäköisyys ja sen laskusäännöt

Osa 1: Todennäköisyys ja sen laskusäännöt

B. Siten A B, jos ja vain jos x A x

Johdatus todennäköisyyslaskentaan Todennäköisyyden peruslaskusäännöt. TKK (c) Ilkka Mellin (2005) 1

Kurssilla esitetään lyhyt katsaus niihin todennäköisyyden ja satunnaisprosessien peruskäsitteisiin ja -ominaisuuksiin, joita tarvitaan digitaalisten

Osa 1: Todennäköisyys ja sen laskusäännöt. Todennäköisyyden aksioomat

Johdatus todennäköisyyslaskentaan Todennäköisyyslaskenta ja puudiagrammit. TKK (c) Ilkka Mellin (2005) 1

Johdatus todennäköisyyslaskentaan Todennäköisyyden aksioomat. TKK (c) Ilkka Mellin (2005) 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Todennäköisyyslaskenta ja puudiagrammit. Todennäköisyyslaskenta ja puudiagrammit. Todennäköisyyslaskenta ja puudiagrammit: Esitiedot

Liite 2: Verkot ja todennäköisyyslaskenta. Todennäköisyyslaskenta ja puudiagrammit

Johdatus todennäköisyyslaskentaan Kokonaistodennäköisyys ja Bayesin kaava. TKK (c) Ilkka Mellin (2005) 1

Mat Sovellettu todennäköisyyslasku A

Mat Sovellettu todennäköisyyslasku A

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 1

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

&idx=2&uilang=fi&lang=fi&lvv=2015

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

TODENNÄKÖISYYS JA TILASTOT MAA6 KERTAUS

A. Jos A on niiden perusjoukon S alkioiden x joukko, jotka toteuttavat ehdon P(x) eli joille lause P(x) on tosi, niin merkitsemme

dx=2&uilang=fi&lang=fi&lvv=2015

4.1. Olkoon X mielivaltainen positiivinen satunnaismuuttuja, jonka odotusarvo on

Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi

Teema 8: Parametrien estimointi ja luottamusvälit

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Osa 1: Todennäköisyys ja sen laskusäännöt. Kokonaistodennäköisyyden ja Bayesin kaavat

1. Matkalla todennäköisyyteen

(b) Tarkista integroimalla, että kyseessä on todella tiheysfunktio.

Teema 7: Todennäköisyyksien laskentaa

H0: otos peräisin normaalijakaumasta H0: otos peräisin tasajakaumasta

Testit laatueroasteikollisille muuttujille

5/11 6/11 Vaihe 1. 6/10 4/10 6/10 4/10 Vaihe 2. 5/11 6/11 4/11 7/11 6/11 5/11 5/11 6/11 Vaihe 3

Ilkka Mellin Todennäköisyyslaskenta Osa 1: Todennäköisyys ja sen laskusäännöt Verkot ja todennäköisyyslaskenta

&idx=2&uilang=fi&lang=fi&lvv=2015

Suotuisien tapahtumien lukumäärä Kaikki alkeistapahtumien lukumäärä

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Osa 2: Otokset, otosjakaumat ja estimointi

1. Kuinka monella tavalla joukon kaikki alkiot voidaan järjestää jonoksi? Tähän antaa vastauksen: tuloperiaate ja permutaatio

Todennäköisyyslaskenta IIa, syyslokakuu 2019 / Hytönen 2. laskuharjoitus, ratkaisuehdotukset

9 Yhteenlaskusääntö ja komplementtitapahtuma

Luku 1. Johdanto. 1.1 Todennäköisyys ja tilastotiede. 1.2 Havaitut frekvenssit ja empiiriset jakaumat

JOHDATUS TEKOÄLYYN LUENTO 4.

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Johdatus todennäköisyyslaskentaan Verkot ja todennäköisyyslaskenta. TKK (c) Ilkka Mellin (2004) 1

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

D ( ) E( ) E( ) 2.917

Todennäköisyyslaskenta 1/7 Sisältö ESITIEDOT: joukko-oppi, lukumäärän laskeminen, funktiokäsite Hakemisto

Sovellettu todennäköisyyslaskenta B

Tilaston esittäminen frekvenssitaulukossa ja graafisesti. Keskiluvut luokittelemattomalle ja luokitellulle aineistolle: moodi, mediaani, keskiarvo.

031021P Tilastomatematiikka (5 op)

OTATKO RISKIN? peli. Heitä noppaa 3 kertaa. Tavoitteena on saada

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. Luentokuulustelujen esimerkkivastauksia. Pertti Palo. 30.

D ( ) Var( ) ( ) E( ) [E( )]

Mat Sovellettu todennäköisyyslasku A. Moniulotteiset jakaumat. Avainsanat:

6. laskuharjoitusten vastaukset (viikot 10 11)

30A02000 Tilastotieteen perusteet

Sovellettu todennäköisyyslaskenta B

Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä palamisaikaa?

Määritelmiä. Nopanheitossa taas ω 1 = saadaan 1, ω 2 = saadaan 2,..., ω 6 = saadaan

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

1. Tässä tehtävässä päätellään kaksilapsisen perheen lapsiin liittyviä todennäköisyyksiä.

Tutkimustiedonhallinnan peruskurssi

P(X = x T (X ) = t, θ) = p(x = x T (X ) = t) ei riipu tuntemattomasta θ:sta. Silloin uskottavuusfunktio faktorisoituu

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Kertymäfunktio. TKK (c) Ilkka Mellin (2007) 1

Väliestimointi (jatkoa) Heliövaara 1

11. laskuharjoituskierros, vko 15, ratkaisut

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

Ilkka Mellin (2008) 1/5

3. laskuharjoituskierros, vko 6, ratkaisut

Johdatus todennäköisyyslaskentaan Kertymäfunktio. TKK (c) Ilkka Mellin (2005) 1

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Muu opetus- ja tutkimushenkilöstö. Muu 4. porras 3. porras 2. porras 1. porras

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

HAVAITUT JA ODOTETUT FREKVENSSIT

OPETUSSUUNNITELMALOMAKE

OPETUSSUUNNITELMALOMAKE

Aineistoista. Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin

Todennäköisyyslaskenta - tehtävät

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Satunnaismuuttujat ja todennäköisyysjakaumat

Transkriptio:

Kurssin puoliväli ja osan 2 teemat Kurssin osa 1 keskittyi mittaukseen, tiedonkeruuseen ja kuvailevaan tilastotieteeseen. Osassa 2 painottuu tilastollinen päättely, joka puolestaan rakentuu voimakkaasti todennäköisyys-käsitteen varaan. Osassa 2 perehdytään seuraaviin teemoihin: Teema 6: Todennäköisyys ja satunnaisuus Teema 7: Todennäköisyyksien laskentaa Teema 8: Parametrien estimointi ja luottamusvälit Teema 9: Tilastollinen merkitsevyystestaus Teema 10: Regressio- ja varianssianalyysi Osa 2 ei ole erillinen kokonaisuus vaan se kietoutuu monilta kohdin osan 1 teemoihin. Tämä vastaa käytäntöä, sillä päättelyssä ei ole mieltä ilman aineiston perusteellista kuvailua. Teema 6: Todennäköisyys ja satunnaisuus Käsite todennäköisyys kohdataan päivittäin mm. sääennusteissa, uutisraporteissa, peliarvonnoissa, tulevaisuuden suunnitelmissa jne. Mitä todennäköisyys tarkoittaa ja miten sitä pitäisi tulkita? Todennäköisyys voidaan määritellä matemaattisena käsitteenä, mutta tällä kurssilla keskitytään todennäköisyyden tulkintoihin: 1. todennäköisyyden frekvenssitulkinta 2. subjektiivinen todennäköisyys 3. klassinen todennäköisyys Tulkinnasta riippumatta todennäköisyydelle on ominaista, että eri vaihtoehtojen toteutuminen on luonteeltaan satunnaista, ts. sattuma määrää, mikä vaihtoehto kulloinkin toteutuu. Tällaista tapahtumaa kutsutaan satunnaisilmiöksi. Se rakentuu useammista mahdollisista vaihtoehdoista (jos vaihtoehtoja on vain yksi, ilmiö ei ole satunnainen vaan deterministinen).

1. Todennäköisyyden frekvenssitulkinta Tarkastellaan tilannetta, jossa satunnaisilmiö esiintyy useita kertoja. Vaihtoehdon todennäköisyydeksi määritellään sen esiintymiskertojen suhteellinen frekvenssi. Esimerkki: rahanheitto vaihtoehdot kruuna tai klaava Historiaa (koesarjoja oikeilla kolikoilla): 1. Comte de Buffon (1700-luvulla) 4040 heittoa, 2048 kruunaa (2048/4040=0.5069) 2. Karl Pearson (1800-luvulla) 24000 heittoa, 12012 kruunaa (12012/24000=0.5005) 3. John Kerrich (1900-luvulla) 10000 heittoa, 5067 kruunaa (5067/10000=0.5067) Odotettu arvo on 1/2 = 0.5, kunhan raha on harhaton. (Huomaa, että yhdessäkään kokeessa suhteellinen frekvenssi ei ole tasan 0.5). Rahanheittokoe Survolla: 100000 heittoa, 50025 kruunaa 0.8 kruunan suhteellinen frekvenssi 0.7 0.6 0.5 0.4 10 100 1000 10000 100000 heittojen lukumäärä Heitot perustuvat (pseudo)satunnaislukugeneraattorin käyttöön, jossa aitoa satunnaisuutta jäljitellään täysin deterministisesti: Simulointikokeissa pitää luoda mahdollisimman satunnaisia lukusarjoja. Toisaalta tieteelliset kokeet on voitava toistaa täsmälleen samanlaisina. Vaikuttaako ristiriitaiselta? Sattuman jäljittely ei ole helppoa!

Todennäköisyyden frekvenssitulkinta: johtopäätöksiä Edellä olevissa kokeissa poikkeamat ennakko-odotusten mukaisesta arvosta 1/2 ovat tulkittavissa satunnaisvaihteluksi. Poikkeamien merkittävyyttä voidaan testata tilastollisesti (ks. Teema 9). Kurssin alussa perehdyttiin mittaamiseen ja tiedonkeruuseen, jotka molemmat tuovat tilastolliseen tutkimukseen epävarmuuksia. Osa näistä epävarmuuksista on satunnaisvaihtelua. Tilastollinen päättely edellyttää, että satunnaisilmiö noudattaa todennäköisyyden lakeja, ts. eri vaihtoehtoihin voidaan liittää todennäköisyydet, jotka kuvastavat ilmiön säännönmukaisuutta, kun sitä toistetaan. Frekvenssitulkinnan avulla määritelty todennäköisyys edellyttää useampia satunnaisilmiötä koskevia empiirisiä havaintoja. Niinpä on tapana puhua myös todennäköisyyden empiirisestä tulkinnasta. Todennäköisyyden frekvenssitulkinta: merkintätavat Oletetaan, että satunnaisilmiö on toistunut n kertaa, ja tapahtuma A on esiintynyt f kertaa. Tällöin A:n frekvenssi on f ja A:n suhteellinen frekvenssi f /n. Frekvenssitulkinnan mukaisesti A:n todennäköisyys on P(A) = f n, jossa P tulee englannin kielen sanasta probability (todennäköisyys). Koska 0 f n, niin 0 P(A) 1. Ääritapaukset: P( A on mahdoton ) = 0 P( A on varma ) = 1 Todennäköisyydestä käytetään usein myös merkintää P(A) = p.

Todennäköisyyden frekvenssitulkinta: tilastot Jotta suhteellisen frekvenssin tulkinta todennäköisyydeksi olisi luotettavaa, tarvitaan verrattain paljon havaintoja. Ainakaan Suomessa tämä ei ole mikään ongelma, sillä tietoja kerätään ahkerasti erilaisiin rekistereihin ja tilastoihin. Esimerkki: kuolemanvaara (todennäköisyys kuolla ko. ikävuoden aikana) 0.5 0.4 0.3 0.2 0.1 0 Suomalaisten kuolemanvaara vuonna 2006 (www.tilastokeskus.fi) 0.005 0.004 0.003 0.002 0.001 0 ikävuodet 0-7 erikseen: 0 1 2 3 4 5 6 7 0 10 20 30 40 50 60 70 80 90 100 ikä vuosina Miehet Naiset Todennäköisyyden frekvenssitulkinta: perustelu Edellä käsitelty todennäköisyyden frekvenssitulkinta perustuu suurten lukujen lakiin, jonka voi sanallisesti kuvata seuraavasti: Tapahtuman suhteellinen frekvenssi f /n lähestyy tapahtuman todennäköisyyttä p, kun toistojen lukumäärä kasvaa. Tällaista lähestymistä kutsutaan stokastiseksi: todennäköisyys, että f /n eroaa p:stä tulee yhä pienemmäksi, ts. näiden poikkeama tulee yhä epätodennäköisemmäksi. Suurten lukujen laki takaa tilastollisen stabiliteetin, jonka varassa voidaan tehdä luotettavia johtopäätöksiä. Tilastojen osalta frekvenssitulkinta nojaa siihen, että tietoja on kerätty riittävän pitkältä ajalta ja että ne ovat ajallisesti tarkasteltuina vertailukelpoisia.

2. Subjektiivinen todennäköisyys Todennäköisyyksiä voidaan esittää myös yksittäisille tapahtumille: P( lähialueella sattuu ydinvoimalaonnettomuus ) =? P( kaksi lentokonetta törmää toisiinsa ) =? P( aurinkokunnan ulkopuolelta löytyy elämää ) =? P( Liverpool voittaa Mestarien liigan 2009 ) =? Kaikki tällaiset todennäköisyydet ovat parhaimmillaankin vain erilaisten riskiarvioiden yhdistelmiä, ja edustavat siten lopulta subjektiivisia todennäköisyyksiä. Edellä käsitelty frekvenssitulkinta sopii näihin huonosti. Sen sijaan luetellun kaltaisista tapahtumista voidaan lyödä vetoa. Vedonlyönti onkin eräs subjektiivisen todennäköisyyden ilmenemismuoto, mutta vedonlyöntisuhteella (engl. odds) on käyttöä myös tilastollisten aineistojen analysoinnissa niin epidemiologiassa kuin yhteiskuntatieteissäkin. 3. Klassinen todennäköisyys Historiallinen alkuperä: uhkapelit 1600-luvun Ranskassa satunnaisilmiö jaetaan symmetrisiin, toisensa poissulkeviin alkeistapahtumiin alkeistapahtuma: tapahtuma, jota ei voida jakaa osiin toisensa poissulkevat: eivät voi esiintyä yhtaikaa symmetria: alkeistapahtumilla sama todennäköisyys (reilu peli) todennäköisyydet selvitetään päättelemällä Esimerkki: nopanheitto silmäluvut 1, 2, 3, 4, 5, 6. P( nopanheitossa saadaan silmäluku i ) = 1/6, i = 1, 2,..., 6. Yleisesti: Oletetaan, että satunnaisilmiön alkeistapahtumia on n, ja näistä tapahtumaan A johtavia alkeistapahtumia on k kpl. A:n (klassinen) todennäköisyys on näiden A:lle suotuisten alkeistapahtumien suhteellinen osuus P(A) = k n.

Klassinen todennäköisyys: esimerkkejä Esimerkki: rahanheitto Rahanheittoa voidaan käsitellä myös klassisena todennäköisyytenä. Alkeistapahtumia vastaavat todennäköisyydet päätellään suoraan: P( tulee kruuna ) = P( tulee klaava ) = 1/2. Esimerkki: kahden nopan heitto (tai saman nopan kahdesti) Mahdollisia tulospareja (alkeistapahtumia) on 6 6 = 36 kpl: (1,1) (1,2) (1,3) (1,4) (1,5) (1,6) (2,1) (2,2) (2,3) (2,4) (2,5) (2,6) (3,1) (3,2) (3,3) (3,4) (3,5) (3,6) (4,1) (4,2) (4,3) (4,4) (4,5) (4,6) (5,1) (5,2) (5,3) (5,4) (5,5) (5,6) (6,1) (6,2) (6,3) (6,4) (6,5) (6,6) Symmetrisyyden perusteella jokaisen todennäköisyys on 1/36. Klassinen todennäköisyys: esimerkkejä Heitetään kahta noppaa. Olkoon tarkasteltava tapahtuma A = Saadaan kummallakin nopalla sama silmäluku. Tapahtumalle A suotuisat alkeistapahtumat saadaan helposti poimittua edellä olevasta luettelosta. Suotuisia on kaikkiaan 6 kpl: (1,1) (2,2) (3,3) (4,4) (5,5) (6,6) Tällöin P(A) = 6/36 = 1/6 0.167. Jos taas A = Silmälukujen summa on vähintään 9, suotuisia ovat (3,6) (4,5) (4,6) (5,4) (5,5) (5,6) (6,3) (6,4) (6,5) (6,6) ja P(A) = 10/36 0.278.

Kurssin osallistujien sukupuolijakauma tiedekunnittain Lähde: WebOodi/KV (syksy 2008) Sukupuoli Tiedekunta nainen mies yhteensä Valtiotieteellinen 1 148 80 228 Matemaattis luonnontieteellinen 2 40 52 92 Käyttäytymistieteellinen 1 29 11 40 Biotieteellinen 3 16 4 20 Humanistinen 1 8 4 12 Maatalous metsätieteellinen 3 7 2 9 Lääketieteellinen 4 1 0 1 Oikeustieteellinen 1 0 1 1 Eläinlääketieteellinen 3 0 0 0 Farmasia 3 0 0 0 Teologinen 1 0 0 0 yhteensä 249 154 403 1 Keskustakampus 2 Kumpulan kampus 3 Viikin kampus 4 Meilahden kampus Kurssin osallistujien sukupuolijakauma tiedekunnittain Seuraavissa tarkasteluissa edellä olevan taulukon esittämää kurssin osallistujien joukkoa kutsutaan perusjoukoksi. Valitaan tästä perusjoukosta opiskelija satunnaisesti ja tarkastellaan erilaisia toisensa poissulkevia alkeistapahtumia A = Satunnaisesti valittu opiskelija on x. Alkeistapahtumia on 403 kpl. Jokaisella opiskelijalla on sama mahdollisuus tulla valituksi, joten P(A) = 1/403 0.0025. Määritellään tarkemmin tapahtumat H ja K: H = [... ] opiskelija on humanistisesta tiedekunnasta K = [... ] on jostakin keskustakampuksen tiedekunnasta H:lle suotuisia alkeistapahtumia on 12. K:lle suotuisia on yhteensä 228+40+12+1+0=281 joten saadaan P(H) = 12/403 0.03 ja P(K) = 281/403 0.70.

Todennäköisyyslaskennan päättely- tai laskusäännöt Monimutkaisempien tapahtumien todennäköisyyksien määräämistä voidaan olennaisesti helpottaa päättely- tai laskusääntöjen avulla. Ideana on palauttaa tarkastelu yksinkertaisempiin tapahtumiin ja niiden yhdistelmiin. Tärkeimmät käsitteet ja säännöt: 1. toisensa poissulkevat tapahtumat ja yhteenlaskusääntö 2. yhtaikaiset tapahtumat ja yhteenlaskusääntö 3. komplementtitapahtuma ja sen todennäköisyys 4. ehdollinen todennäköisyys ja tulosääntö 5. riippumattomuus ja tulosääntö Päättelysääntöihin perehdytään tässä yhteydessä edellä esitetyn klassisen todennäköisyyden avulla, koska se on käsitteellisesti yksinkertaisinta. Samat säännöt pätevät kuitenkin riippumatta todennäköisyyden tulkintatavasta. Toisensa poissulkevat tapahtumat ja yhteenlaskusääntö Tapahtuma A ja tapahtuma B ovat toisensa poissulkevia, mikäli ne eivät voi esiintyä yhtaikaa. Esiintyy siis vain A tai B (ei A ja B). Oletetaan, että opiskeluoikeuden saisi vain yhteen tiedekuntaan. Tällöin tapahtumat A = [... ] on biotieteellisestä tiedekunnasta B = [... ] on maatalous metsätieteellisestä tiedekunnasta ovat toisensa poissulkevia. Yhteenlaskusääntö toisensa poissulkeville tapahtumille: P(A tai B) = P(A) + P(B) Taulukosta nähdään, että P(A tai B) = 20/403 + 9/403 = 29/403 0.072, joka on samalla todennäköisyys yhdistetylle tapahtumalle A tai B = [... ] on jostakin Viikin kampuksen tiedekunnasta.

Yhtaikaiset tapahtumat ja yhteenlaskusääntö Jos tapahtuma A ja tapahtuma B eivät ole toisensa poissulkevia, niillä on yhteinen osuus (A ja B), joka tulee vähentää pois todennäköisyyksiä laskettaessa. Esimerkiksi tapahtumat A = Satunnaisesti valittu opiskelija on nainen B = [... ] on valtiotieteellisestä tiedekunnasta voivat esiintyä yhtaikaa. Yhteenlaskusääntö yhtaikaisille tapahtumille: P(A tai B) = P(A) + P(B) P(A ja B), Taulukosta nähdään, että P(A ja B) = 148/403, joten P(A tai B) = 249/403 + 228/403 148/403 = 329/403 0.816. Ilman yhteisosuuden vähennystä tulos olisi tässä järjetön (> 1)! Komplementtitapahtuma ja sen todennäköisyys Jos tapahtuma A ei esiinny tarkastellussa satunnaisilmiössä, niin tällöin esiintyy sen komplementtitapahtuma A C. Olkoon edellä olevassa kurssin osallistujien esimerkissä A = Satunnaisesti valittu opiskelija on nainen, jolloin A:n komplementtitapahtuma on A C = Satunnaisesti valittu opiskelija on mies. Komplementtitapahtuman todennäköisyys: P(A C ) = 1 P(A) Taulukosta nähdään, että P(A C ) = 1 P(A) = 1 249/403 = 1 0.618 0.382. Samaan tulokseen päädytään suoralla päättelyllä P(A C ) = 154/403 0.382.

Ehdollinen todennäköisyys Tarkastellaan tapahtumia A ja B olettaen että B esiintyy. Käytännön tutkimuksessa tärkeän tyyppinen kysymys on: Mitä A:n todennäköisyys on, jos B otetaan huomioon? Tätä todennäköisyyttä kutsutaan A:n ehdolliseksi todennäköisyydeksi ehdolla B, ja sitä merkitään P(A B). Olkoot edellä olevassa kurssin osallistujien esimerkissä A = Satunnaisesti valittu opiskelija on nainen ja B = [... ] on valtiotieteellisestä tiedekunnasta. Taulukosta nähdään, että P(A B) = 148/228 0.649. Kun B:n esiintyminen otetaan huomioon, riittää määrätä naisten suhteellinen osuus valtiotieteellisen tiedekunnan opiskelijoista. Huomaa: jos ehtotapahtumaksi vaihdetaan A, tilanne on eri: P(B A) = 148/249 0.594. Ehdollinen todennäköisyys ja tulosääntö Tarkastellaan yhdistettyä tapahtumaa A ja B. Olkoot jälleen A = Satunnaisesti valittu opiskelija on nainen B = [... ] on valtiotieteellisestä tiedekunnasta jolloin A ja B = [... ] on nainen valtiotieteellisestä tiedekunnasta. Tulosääntö yhdistetylle tapahtumalle: P(A ja B) = P(A B) P(B) = P(B A) P(A) Taulukosta nähdään, että P(A ja B) = P(A B) P(B) = 148/228 228/403 0.367, P(A ja B) = P(B A) P(A) = 148/249 249/403 0.367. Jos yhdistetyn tapahtuman A ja B todennäköisyys on helppo määrätä, sen avulla saadaan ehdollinen todennäköisyys P(A B) = P(A ja B) P(B) tai P(B A) = P(A ja B). P(A)

Riippumattomuus ja tulosääntö Jos ehdolliseen todennäköisyyteen P(A B) liittyvässä tilanteessa ehtotapahtumalla B ei ole vaikutusta A:n todennäköisyyteen, niin tapahtumat A ja B ovat riippumattomia, ts. tällöin A:n todennäköisyys ei muutu, otettiin B huomioon tai ei. Tapahtumat A ja B ovat siis riippumattomia, jos P(A B) = P(A) Riippumattomuus on eräs keskeisiä tilastollisia käsitteitä. Tulosääntö riippumattomille tapahtumille: P(A ja B) = P(A) P(B) Sama sääntö pätee myös toisinpäin: jos P(A ja B) = P(A) P(B), niin A ja B ovat riippumattomia. Riippumattomuuden käsitteestä Esimerkki (Ilkka Mellin: Johdatus tilastotieteeseen, 1.kirja, s. 251): Oletetaan, että uurnassa on 3 numeroitua arpaa (1, 2 ja 3), joita nostetaan satunnaisesti. Oletetaan, että on nostettu arpa nro 3. Kaksi toimintatapaa: 1. Palautetaan arpa uurnaan. Tällöin todennäköisyys saada arpa nro 1 on 1/3. Täsmällisemmin: P( nostetaan nro 1 nostetaan nro 3 ) = 1/3 = P( nostetaan nro 1 ). Ehto ei siis vaikuta, joten tapahtumat ovat toisistaan riippumattomia. 2. Ei palauteta arpaa uurnaan. Tällöin todennäköisyys saada arpa nro 1 on 1/2, koska jäljellä on enää kaksi arpaa. Täsmällisemmin: P( nostetaan nro 1 nostetaan nro 3 ) = 1/2 P( nostetaan nro 1 ). Ehto siis vaikuttaa, joten tapahtumat ovat toisistaan riippuvia. Tavat 1 ja 2 vastaavat erilaisia otoksen poimintatapoja (ks. Teema 8). Teoriatasolla täydellinen riippumattomuus on osoitettavissa vain melko yksinkertaisissa tilanteissa. Käytännössä joudutaan riippumattomuudesta tekemään oletuksia joko intuitiivisesti tai sen perusteella, mitä tutkittavasta ilmiöstä tiedetään. Tällaisten oletusten pätevyyttä voidaan (ja on syytä) testata tilastollisesti. Testaamiseen perehdytään Teemassa 9.