Järvitesti Ympäristöteknologia T571SA 7.5.2013

Samankaltaiset tiedostot
SISÄLTÖ. Vuokko Vanhala-Nurmi, 2013 Excel jatko

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

Näillä sivuilla Tilastomatematiikan esimerkit, joissa käsitellään tietokoneen käyttöä tilastollissa operaatioissa, on tehty Excel versiolla.

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Sovellettu todennäköisyyslaskenta B

Väliestimointi (jatkoa) Heliövaara 1

Mat Sovellettu todennäköisyyslasku A. Moniulotteiset jakaumat. Avainsanat:

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

P (X B) = f X (x)dx. xf X (x)dx. g(x)f X (x)dx.

Excel pivot. Sisällys

Tilastotieteen jatkokurssi syksy 2003 Välikoe

1. laskuharjoituskierros, vko 4, ratkaisut

Luottamusvälit. Normaalijakauma johnkin kohtaan

2. Paina hiiren oikeaa näppäintä, pääset valikkoon. Valitse Lisää, tyhjä sarake ilmestyy aktivoidun sarakkeen eteen

Jatkuvat satunnaismuuttujat

Excel 2010 ja QlikView. Mihin ja milloin pivot:ia voi käyttää

Luento 7 Taulukkolaskennan edistyneempiä piirteitä Aulikki Hyrskykari

I. Ristiintaulukointi Excelillä / Microsoft Office 2010

Varma tapahtuma, Yhdiste, Yhdistetty tapahtuma, Yhteenlaskusääntö

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

HARJOITUS 1 Monen taulukkosivun käsittely

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

Harjoitus 7: NCSS - Tilastollinen analyysi

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Juuri 10 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

P(X = x T (X ) = t, θ) = p(x = x T (X ) = t) ei riipu tuntemattomasta θ:sta. Silloin uskottavuusfunktio faktorisoituu

LUENTO 8 TAULUKKOLASKENTA II

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

6. laskuharjoitusten vastaukset (viikot 10 11)

Excel helpoksi hankintojen maailmassa. Ymmärrystä ja tehoa Excel-työskentelyyn.

Tuloperiaate. Oletetaan, että eräs valintaprosessi voidaan jakaa peräkkäisiin vaiheisiin, joita on k kappaletta

5 Lisa materiaali. 5.1 Ristiintaulukointi

Bayesilainen päätöksenteko / Bayesian decision theory

Sovellettu todennäköisyyslaskenta B

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

Järvi 1 Valkjärvi. Järvi 2 Sysijärvi

Todennäköisyyden ominaisuuksia

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Otosavaruus ja todennäköisyys Otosavaruus Ë on joukko, jonka alkiot ovat kokeen tulokset Tapahtuma on otosavaruuden osajoukko

LUENTO 7 TAULUKKOLASKENTA I

MICROSOFT EXCEL 2010

Aineistoista. Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin

Yksikkökate tarkoittaa katetuottoa yhden tuotteen kohdalla. Tämä voidaan määrittää vain jos myytäviä tuotteita on vain yksi.

Oma nimesi Tehtävä (5)

Osa 1: Todennäköisyys ja sen laskusäännöt. Kokonaistodennäköisyyden ja Bayesin kaavat

T Luonnollisten kielten tilastollinen käsittely

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

S Laskennallinen systeemibiologia

4. laskuharjoituskierros, vko 7, ratkaisut

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto

Mat Sovellettu todennäköisyyslasku A

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MATEMATIIKAN KOE, LYHYT OPPIMÄÄRÄ HYVÄN VASTAUKSEN PIIRTEITÄ

Moniulotteisia todennäköisyysjakaumia

Todennäköisyyslaskenta IIa, syyslokakuu 2019 / Hytönen 2. laskuharjoitus, ratkaisuehdotukset

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia

&idx=2&uilang=fi&lang=fi&lvv=2015

T Luonnollisen kielen tilastollinen käsittely Vastaukset 3, ti , 8:30-10:00 Kollokaatiot, Versio 1.1

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

031021P Tilastomatematiikka (5 op)

Kliininen arviointi ja kliininen tieto mikä riittää?

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO JOHDANTO TILASTOLLISEEN PÄÄTTELYYN TODENNÄKÖISYYS...

Todennäköisyys (englanniksi probability)

11. laskuharjoituskierros, vko 15, ratkaisut

pitkittäisaineistoissa

&idx=2&uilang=fi&lang=fi&lvv=2015

TILASTOLLINEN OPPIMINEN

Mat Sovellettu todennäköisyyslasku A

r = n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

Lukuspiraali. Syöte. Tuloste. Esimerkki 1. Esimerkki 2. Esimerkki 3. Tarkastellaan seuraavanlaisia lukuspiraaleita:

P (A)P (B A). P (B) P (A B) = P (A = 0)P (B = 1 A = 0) P (B = 1) P (A = 1)P (B = 1 A = 1) P (B = 1)

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

Inversio-ongelmien laskennallinen peruskurssi Luento 7

7. laskuharjoituskierros, vko 10, ratkaisut

D ( ) E( ) E( ) 2.917

TIETOJEN TUONTI TIETOKANNASTA + PIVOT-TAULUKON JA OLAP-KUUTION TEKO

Genetiikan perusteet 2009

Testaa onko myrkkypitoisuus eri ryhmissä sama. RATK. Lasketaan kaikkien havaintoarvojen summa: k T i = = 486.

MTTTP5, luento Luottamusväli, määritelmä

Sovellettu todennäköisyyslaskenta B

Mat Sovellettu todennäköisyyslasku. Aiheet: Todennäköisyyslaskennan peruskäsitteet Todennäköisyyslaskennan peruslaskusäännöt Avainsanat:

Otoskoko 107 kpl. a) 27 b) 2654

4.1. Olkoon X mielivaltainen positiivinen satunnaismuuttuja, jonka odotusarvo on

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia: Mitä opimme?

Tilastollisia peruskäsitteitä ja Monte Carlo

LIITE 1 VIRHEEN ARVIOINNISTA

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

5/11 6/11 Vaihe 1. 6/10 4/10 6/10 4/10 Vaihe 2. 5/11 6/11 4/11 7/11 6/11 5/11 5/11 6/11 Vaihe 3

Käsitteistä. Reliabiliteetti, validiteetti ja yleistäminen. Reliabiliteetti. Reliabiliteetti ja validiteetti

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

Excel Perusteet Päivi Vartiainen 1

DOORSin Spreadsheet export/import

Transkriptio:

Hans Laihia Mika Tuukkanen 1 LASKENNALLISET JA TILASTOLLISET MENETELMÄT Järvitesti Ympäristöteknologia T571SA 7.5.2013 Sarkola Eino JÄRVITESTI Johdanto Järvien kuntoa tutkitaan monenlaisilla eri menetelmillä. Usein näytteiden analysointi on hidasta ja kallista, ja niitä otetaan lukumääräisesti useita järvien eri syvyyksistä. Kuntoluokituksen nopeuttamiseksi on kehitetty uusia testejä, jonka paikkansapitävyyttä haluttiin tässä harjoituksessa testata. Testin luotettavuutta määritettiin tutkimalla 100 satunnaisesti valittua järveä tietyllä alueella. Testissä tutkitut satunnaismuuttujat olivat Kunto (K), joka kuvasi järven todellista kuntoluokkaa Testi (T), joka luokitteli testin mukaan järven kunnon Kuntoluokat järven todellisen kunnon sekä testin mukaan jaettiin seuraavanlaisesti: 1= huono, 2 = kohtalainen ja 3 = hyvä. Eräällä alueella eri kuntoluokkien todennäköisyydet satunnaisesti valituille järville olivat seuraavat: Huono 40%, kohtalainen 30% ja hyvä 30%. Tehtävässä tuli odottaa, ettei tulosten ehdolliset todennäköisyydet eri kuntoluokissa riipu tutkittavasta alueesta. Järvitestin data oli annettu Moodle opiskelualueella. Tehtävässä on käytetty apuna Excel- taulukkolaskentaohjelmaa, sekä pivot taulukointia. Testin luotettavuus Tehtävän ratkaiseminen aloitettiin luomalla pivot taulukko saadusta Excel aineistosta (järvien tiedot). Pivot taulukossa sarakeotsikko kenttään valittiin kunto ja riviotsikko kenttään testi. Vastaavasti järvien lukumäärä tiedot siirrettiin - arvot -kenttään.

2 Tässä kentässä oltiin kiinnostuneita järvien lukumäärästä, joten arvokentän asetuksista valittiin laskentaperusteeksi määrä ja arvojen esiintymismuodoksi prosenttia kokonaissummasta. Saatu Pivot taulukko kopioitiin erilliseksi Excel-taulukoksi, joka mahdollisti tehdä muutoksia taulukon rivi ja sarake otsikoihin. Excelissä olleet järvitestin tiedot siirrettiin Excelin pivot- taulukkoon, jossa määrät (kunkin kuntoluokan kappalemäärä) vaihdettiin summa kentässä prosenttiosuudeksi. K1 on järven kuntoluokka huono, K2 kohtalainen ja K3 on hyvä. Testin mukaan kuntoluokat jakautuvat T1 on huono, T2 kohtalainen ja T3 hyvä. TAULUKKO 1: Järvien kuntoluokkien prosenttiosuus Riviotsikot K1 K2 K3 Kaikki yhteensä T1 15,00 % 6,00 % 2,00 % 23,00 % T2 4,00 % 40,00 % 3,00 % 47,00 % T3 1,00 % 4,00 % 25,00 % 30,00 % Kaikki yhteensä 20,00 % 50,00 % 30,00 % 100,00 % Seuraavaksi laskettiin ehdolliset todennäköisyydet testin tuloksille eri kuntoluokissa. Ehdollinen todennäköisyys sille, että testin mukaan esim. (T1) ja järven todellisen kuntoluokan mukaan esim. ( järven kunto oli huono, saatiin laskettua kaavalla: T1 15% P ( T1 75% 20% Eli tässä laskussa verrattiin huonon kuntoluokan ( ja huonon testiluokan (T1) prosenttiosuutta huonon kuntoluokan yhteismäärään. Ehdollisten todennäköisyyksien prosenttiosuudet laskettiin kaikkien kuntoluokkien osalta vastaavalla tavalla. TAULUKKO 2: Kuntoluokkien ehdolliset todennäköisyydet P ( K2) P ( K3) T1 75 % 12 % 7 % 94 % T2 20 % 80 % 10 % 110 % T3 5 % 8 % 83 % 96 % Todennäköisyysmallille huomioitiin kuntoluokkien priorijakauma. Nämä laskettiin kertomalla saadut ensitiedot taulukon 2 eri kuntoluokkien ehdollisilla todennäköisyyksillä: P ( T1 T1 * 40%*75% 30%

Vastaavalla tavalla laskettiin testin ehdollinen todennäköisyys kaikille kuntoluokille. 3 TAULUKKO 3: Kuntoluokkien todennäköisyydet priorijakauman kanssa P ( K2) P ( K3) T1 30 % 4 % 2 % 36 % T2 8 % 24 % 3 % 35 % T3 2 % 2 % 25 % 29 % Priorijakauma 40 % 30 % 30 % Priorijakauman avulla saadaan testin todennäköisyysmallin posteriorijakauma. Priorijakaumaa hyväksikäyttäen todennäköisin kuntoluokka testin mukaan näyttäisi olevan huono, sillä huonon testituloksen yhteenlaskettu todennäköisyys on noin 36 %. Lisäksi laskettiin testi-rivit yhteen, jolloin saatiin selville testin antaman todennäköisyyden kokonaismäärä eri kuntoluokille. T1 30,0% P ( K T) 84,3% T1) 35,6% Vastaavalla tavalla laskettiin arvot kaikille kunto- ja testiluokille. TAULUKKO 4: Kuntoluokkien posteriorijakauma P ( K2) P ( K3) P ( T1) 84 % 10 % 6 % P ( T2) 23 % 69 % 9 % P ( T3) 7 % 8 % 85 % Oletetaan, että yksi alueen järvistä on testattu ja testin mukaan järven kunto on kohtalainen (tehtäväksiannossa pyydettiin vapaasti valitsemaan joku järven kuntoluokista). Tällöin todennäköisyysmallin mukaan testin antama kuntoluokka on 69 %:n todennäköisyydellä oikein. Huomattavaa on, että lähes neljäsosa (23%) testin kohtalainen - kuntoluokan tapauksista ovatkin oikeasti kuntoluokan huono järviä. Järven todellinen tila voi suurella todennäköisyydellä olla korkeintaan kohtalainen kuntoluokkaa.

4 Testin luotettavuus 100% 80% 60% 40% 20% 0% Huono Kohtalainen Hyvä Todellinen kunto Testi huono Testi Kohtalainen Testi hyvä KUVA 1: Testin luotettavuus Järven kuntoluokkaa huono mittaa myös testin antama huono tulos noin 84 prosentin todennäköisyydellä (kuva 1). Testille lasketun todennäköisyyden perusteella tehtiin pylväsdiagrammit, josta näkyy etukäteen tiedossa oleva priorijakauma sekä testin ehdollinen todennäköisyys eri kuntoluokkien kohdalla. Johtopäätökset Pivot taulukoinnin avulla Excelissä olevat järvien kuntoluokkien ja testien tulokset saatiin käsiteltyä ja laskettua ilman monivaiheisia laskutoimenpiteitä. Annettuja esitietoja hyväksikäyttäen saatiin selville todennäköisin kuntoluokka testin mukaan eli huono noin 36 %:n todennäköisyydellä. Posteriorijakauman perusteella saadaan selville miten luotettava testi on vertailtaessa tiedossa olevaan järven kuntoluokkaan. Tulosten mukaan testi näyttäisi olevan suhteellisen luotettava siinä tapauksessa kun järven kuntoluokka on huono (84 %) tai hyvä (85 %). Kuntoluokalle kohtalainen testin tulos antaa tulokseksi kohtalainen vain 69 % todennäköisyydellä. Jos taas järven kunto on todellisuudessa kohtalainen, voi testi antaa järven kuntoluokaksi huonon noin 23 %:n ja hyvän noin 8,6 %:n todennäköisyydellä.

LÄHTEET: 5 Sarkola, Eino 2013. Tilastomatematiikan moodle-kurssi. www-dokumentti. https://moodle.mikkeliamk.fi/course/view.php?id=1775. Päivitetty 18.2.2013. Luettu 5.5.2013.