8. Tilasto/etee alkeet ja virhee arvioi/ Kemiassa ja muissa luoo/eteissä käsitellää usei suuria määriä mi;ausdataa. Mi;ausdata käsi;elyä ja jatkojalostusta varte (esim: selostuste ja raporbe kirjoi;amie) pitää hallita aiaki /lasto/etee alkeet, eli käsi;eet kute jakauma, otos, luokka, keskiarvo ja keskihajota. Tällä kurssilla vai hyvi hyvi pitapuolises/: käykää /lasto/etee kursseja jos tarvitse;e äitä taitoja eemmä! Mi;auksissa esiityy väistämä;ä aiaki joki verra virheitä. äide virhelähteide käsi;elyy lii;yvä matema/ikka o siis myös syytä osata. Peruslähtökohta: havaito, mi;aus, malliajo (tms) tuo;aa dataa. Luoo/eteissä data o yleesä umeerista, eli sitä voidaa kuvata umeroilla, tai se voidaa aiaki muu;aa tällaisee muotoo. Olkoo meillä kappale;a datapiste;ä (jokaie vastaa esim. yhtä mi;austa, havaitoa tms). Merkitää e x 1, x 2, x 3,,x. Tätä joukkoa saotaa usei otokseksi. Havaio/tulokse frekvessi kertoo kuika usei se esiityy otoksessa. Esimerkiksi 5 kolikoheito sarja saa;aisi tuo;aa tulokse: kruua, klaava, klaava, kruuu, klaava. Tällöi kruua frekvessi o 2 ja klaava 3. Mikäli otos koostuu esim. reaaliluvuista, se joudutaa yleesä jakamaa luokkii jo;a frekvessie laskemie olisi mielekästä. Luokkii jae;u otos esitetää usei histogrammia. 1
Histogrammi Histogrammissa x- akselia o muu;uja (esim. mitatu suuree) arvo, ja y- akselia frekvessi. Allaolevassa kuvassa (lähde: wikipedia) 100 datapistee otos o jae;u luokkii 0.5 yksikö välei. Jatkuva ja diskreeb jakauma Luoo/eteellisessä kokeessa mitataa yleesä joki suuree arvo äärellie määrä kertoja. Tilasto/eteellisessä mielessä otetaa siis otos k.o. suuree jakaumasta. Jakaumat voivat olla diskree4ejä, jolloi mita;ava suure voi saada vai /e;yjä arvoja (esim. koliko hei;ämise tulos voi olla joko kruua tai klaava, elektroi spi voi olla joko α tai β, je). MatemaaBses/: diskree' suure voi saada äärellise tai korkeitaa umeroituvas2 ääre3ömä määrä arvoja (esim. kokoaisluvut mu3a ei reaaliluvut). Toie vaihtoehto o jatkuva jakauma, jolloi mita;ava suure voi saada ei- umeroituvas/ ääre;ömä määrä eri arvoja (käytäössä siis mikä tahasa suure joka voi saada reaalilukuarvoja). 2
Periaa;eessa useimmat luoo/eteessä esiityvä jakaumat ovat aiee atomiluotee ja kvabmekaiika asiosta diskree;ejä, mu;a käytäössä o mielekästä ole;aa moet jakaumat jatkuviksi. Esim. pitoisuuksia, aerosolihiukkaste halkaisijoita tai molekyylie liike- eergioita kuvataa jatkuvilla jakaumilla. Käytäö sovelluksissa joudutaa usei mallitamaa diskree;ejä jakaumia jatkuvia tai päivastoi. Esimerkki diskree/stä jakaumasta Kolme esimerkkiä jatkuvasta jakaumasta (y - akselilla suhteellie todeäköisyys e;ä saadaa /e;y mi;austulos) 3
Otoksia kuvaavat tuusluvut Yleesä halutaa kuvata otoksia eriäisillä tuusluvuilla. Tärkei ja tuetui äistä o aritmeebe keskiarvo; tämä lisäksi o myös muita keskilukuja kute geometrie keskiarvo, mediaai tai moodi. Keskiarvo lisäksi myös hajotaa kuvaavat luvut (variassi ja keskihajota) ovat yleesä oleellisia. Jos otoksessa o eemmä kui yksi muu;uja (esim mitataa y i, x i lukupareja, vaikkapa aika ja pitoisuus) tarvitaa muitaki tuuslukuja, esim. kovariassi ja korrelaa/okerroi. Erilaisia keskiarvoja Aritmee7e keskiarvo lieee kaikille tu;u: Joskus käytetää myös geometrista keskiarvoa (joka laskemie edelly;ää, e;ä kaikki luvut ovat posi/ivisia): x = 1 Mediaai eli keskiluku: järjestetää havaiot suuruusjärjestyksee; mediaai o keskimmäie luku (tai kahde keskimmäise luvu keskiarvo jos o parillie). Moodi: yleisi arvo (se havaito jolla o suuri frekvessi). Huom: moodeja voi olla yksi tai useampi. x i x 1 x 2 x 3... x 4
c = Esimerkki: ympäristömyrky pitoisuude c määri;ämiseksi järvidedessä suoritebi eri puolilla järveä yhteesä 7 mi;austa, joista saa/i tulokseksi (yksiköissä μmol/l): c i = {1,15 1,20 1,20 1,34 1,52 1,71 2,12} Mi;auste aritmeebe keskiarvo o: 1,15+1, 20 +1, 20 +1,34 +1, 52 +1, 71+ 2,12 µmol/l 1,46 µmol/l 7 Geometrie keskiarvo o 1,43 μmol/l, mediaai 1,34 μmol/l ja moodi (1 kpl) 1,20 μmol/l. (Tässä esimerkissä ämä luvut lieevät paljo vähemmä hyödyllisiä kui aritmeebe keskiarvo.) Hajotaa kuvaavat luvut Pelkkä keskiarvo ei yleesä kerro jakaumasta rii;äväs/, vaa tarvitaa myös /etoa se leveydestä. Kaksi tärkeää lukua ovat variassi ja keskihajota. Variassi σ 2 : σ 2 = 1 (x i x) 2 = x 2 (x) 2 Keskihajota σ (variassi eliöjuuri): σ = 1 (x i x) 2 5
Lasketaa variassi ja keskihajota edellä esitetylle otokselle c i = {1,15 1,20 1,20 1,34 1,52 1,71 2,12} μmol/l σ 2 = 1 7 ((1,15 1, 46)2 + (1, 20 1, 46) 2 + (1, 20 1, 46) 2 + (1,34 1, 46) +(1, 52 1, 46) 2 + (1, 71 1, 46) 2 + (2,12 1, 46) 2 )µmol 2 /L 2 0.125µmol 2 /L 2 σ = σ 2 0.353µmol/L (Oikeas2 pitäisi 2etys2 laskea tarkemmalla keskiarvo arvolla, mu3a tämä ei mahtuut kalvolle). Tästä ähdää keskihajoa hyöty variassii ähde: se o samoissa yksiköissä kui alkuperäie data. Ope4ele laskemaa keskiarvoja ja hajotoja /etokoeella, esim Excelissä AVERAGE, VAR ja STDEV. Kuvassa olevissa jakaumissa A: ja B: keskiarvo o sama, mu;a A:lla o suurempi keskihajota. A:lla ja C:llä taas o sama keskihajota, mu;a eri keskiarvo. Jatkuvie jakaumie keskiarvo ja keskihajota voidaa laskea itegroimalla, mu3a äitä laskuja ei käsitellä tällä kurssilla; kts kirja luvut 21.2-21.6. 6
Piete otoste keskihajota Usei yritetää arvioida jakauma /lastollisia omiaisuuksia piee otokse avulla. Esimerkiksi joki aiee pitoisuuksia ilmassa tai vedessä arvioidaa suori;amalla rajallie joukko mi;auksia. Jos otoskoko () o kovi piei, ataa edellä esitelty kaava hiema liia piee arvo keskihajoalle. Tarkempi kaava o tällöi: σ otos = 1 1 (x i x) 2 Wikipedia: Itui2ivises2 tämä seli3yy sillä, e3ä otoskeskiarvo poikkeaa jouko todellisesta keskiarvosta otokse suutaa, mikä tuo3aisi keskihajoa kaavaa liia piee osoi3aja. Yhdellä pieee3y imi3äjä kompesoi tämä harha ja äi saadaa mahdollisimma hyvä es2maa' perusjouko keskihajoasta. ormaalijakauma Moie suureide jakaumat ouda;avat aiaki likimai s. ormaalijakaumaa (tuetaa myös Gaussia jakaumaa tai kellokäyrää). ormaalijakauma kaava o: f (x) = σ (x µ ) 2 2π e 2σ 2 1 missä μ o jakauma keskiarvo ja σ se keskihajota. Huom: μ o samalla myös mediaai ja moodi. Useat yksikertaiset matemaabset jakaumat (esim. biomijakauma) ouda;avat myös ormaalijakaumaa, ku o rii;ävä suuri. Aiempie kalvoje jatkuvat jakaumat olivat juuri ormaalijakaumia. 7
ormaalijakauma luoossa Muu;uja joka määräytyy moe toisistaa riippuma;oma toise muu;uja kumula/ivisesta vaikutuksesta ouda;aa ormaalijakaumaa. Esimerkiksi ihmiste pituus (joka määräytyy usea geei sekä ympäristötekijöide yhteisvaikutuksesta). Satuaisvirheistä johtuva mi;austuloste hajota ouda;aa yleesä myös ormaalijakaumaa. Moet /lastolliset meetelmät ja tes/t ole;avat virheide oleva ormaalis/ jakautueita. t- tes/ (Stude/ t- tes/) t- tes/llä (josta o useita eri versioita) voidaa laskea todeäköisyys e;ä kaksi otosta ovat peräisi samasta alkuperäisestä jakaumasta. Toie sovellus: todeäköisyys e;ä sovitetu regressiosuora (tästä lisää myöhemmi) kulmakerroi poikkeaa /lastollises/ merki;äväs/ ollasta. Tes/t ole;avat e;ä muu;ujat ovat ormaalis/ jakautueet. Käytäössä t- tes/t lasketaa /etokoeella, esim Excelissä kometo TTEST. äitä ei käsitellä tällä kurssilla pidemmälle (tes/e olemassaolo o hyvä /etää opetelkaa käy;ämää jos ja ku tarvitse;e). 8
Virhee arvioi/ = mi3austarkkude ja määritystarkkuude arvioi2. Erilaisia virheitä: 1. Karkeat virheet Huolima;omuudesta tai työvirheestä johtuva moka Usei huomaa äly;ömää tuloksea 2. SystemaaBset virheet Johtuu esim lai;eisto kalibroiista vääri; mi;a- asteikko o väärä Vaiku;aa aia samaa suutaa, pystytää usei poistamaa 3. Satuaiset mi;ausvirheet Vaiku;aa "oikea tulokse" molemmilla puolilla Esim. silmä tai mi;alai;ee tarkkuus Ei voi kokoaa ehkäistä, mu;a suuruu;a voi arvioida systemaabe vs satuaie virhe 9
Tärkeitä määritelmiä Mi4aukse sisäie tarkkuus Mi;aus o sisäises/ tarkka, jos satuaiste mi;ausvirheide suuruus o piei. Tulos voi sil/ olla aiva väärä, jos systemaabe virhe o suuri! Mi4aukse ulkoie tarkkuus Mi;aus o ulkoises/ tarkka jos se o "oikeas/ oikei". Virhee esi;ämie Absoluu7e virhe Esim: V = (5,4 ± 0,1) L Suhteellie virhe absoluuttie virhe = suuree arvo = 0,1L 100% 1,9% 5,4L 10
Esim: virheide vertaamie Titraustulokset olivat (5,4 ± 0,1) ml ja (108,6 ± 0,8) ml Kumpi mi;aus o tarkempi? Vastaus: riippuu tarkoitetaako absoluu7sta vai suhteellista virhe4ä. AbsoluuBe virhe o suurempi jälkimmäiseässä mi;auksessa. Suhteellie virhe taas o pieempi jälkimmäisessä mi;auksessa: 0,1 ml 5,4 ml 100% 1,9% ja 0,8 ml 100% 0,74% 108,6 ml Mi;austuloste virherajat Riippuvat siitä suoritetaako mi;aus kerra vai toistokokeea. Jos mi4aus suoritetaa kerra: Mi;ari, silmä tms. lukematarkkuus määrää tarkkuude Esim. pui;u massa (12,2 ± 0,2) g Moissa lai;eissa tai laboratorioas/oissa o kerro;u tarkkuus. 11
Mi;austuloste virherajat Jos mi4aus suoritetaa moee kertaa Huom: oletuksea e;ä toistokerrat ovat toisistaa riippuma;omia; esim. /traus, seku/kello käy;ö Mi;aukse arvo saadaa keskiarvoa: x = 1 x i Mi;aukse tarkkuus saadaa keskiarvo keskivirheeä: Δx = (x i x) 2 ( -1) Esim: aoh - liuokse pitoisuus selvitetää /traamalla se 0,001M HCl:llä. Titraustulokset ovat 5,21 ml, 5,32 ml ja 5,27 ml ku 100 ml aoh - äyte /trataa. Laske aoh kosetraa/o. Ratkaisu: Mi;auste keskiarvo o (5,21 ml+ 5,32 ml+ 5,27 ml) V= 3 Keskivirhe o ΔV= (5,21 ml V)2 + (5,32 ml V) 2 + (5,27 ml V) 2 3 2 V 0,001M aoh kosetraa/o o c= 100 ml ΔV 0,001M Ja se virhe Δc= 100 ml Huom: tässä o olete;u e;ä HCl: kosetraa/o ja aoh äy;ee määrä (100 ml) ovat tarkkoja. 12
Suora sovitukse virheet Suora sovituksessa etsitää vakiotermi ja kulmakerroi site e;ä mi;auspisteet sopivat mahdollisimma hyvi suoralle. Käytäössä mitatu ("todellise") ja lasketu arvo välillä o aia eroa. Tämä ero suuruude kertovat vakiotermi ja kulmakertoie stadardipoikkeamat ("virherajat"). Origi- ohjelma, Mathema/ca, Matlab je (jopa jotki taskulaskimet) atavat ämä stadardipoikkeamat. Kaavat löytyvät oppikirjoista, ei käydä läpi tässä. Lasketu suuree virhe Joskus käyte;ävissä oleva mi;alaite mi;aa suoraa halu;ua suure;a. Esimerkiksi vaaka ataa suoraa paio. Tällöi tulokse virheraja pää;elemisee tarvitaa vai /etoa mi;alai;ee tarkkuudesta (ja toistomi;auste määrästä kute edellisissä esimerkeissä). Usei (yleesä) halu;u suure joudutaa kuiteki jollaki tavalla laskemaa mitatusta suureesta tai suureista. Tähä törmää jo kemia alkeiskursseilla: jos liuokse pitoisuus päätellää esimerkiksi /traamalla, tarvitaa /eto sekä /trabliuokse pitoisuudesta e;ä se määrästä. Molemmissa voi olla virheitä: tuloksessa o (aiaki) kaksi virhelähde;ä! 13
Lasketu suuree virhe Mite mita;uje suureide virheet ja suora sovitukse virheet vaiku;avat laske;avaa olevaa suureesee? Lähtökohta: suure u lasketaa toise suuree avulla u = u(x 1, x 2, x 3,..., x ) x i :t toisistaa riippuma;omia x 1, x 2,..., x ovat mi;austuloksia, suora parametrejä tai toistokokee keskiarvoia saatavia tuloksia (tjsp). iide virheet ovat Δx 1, Δx 2,..., Δx Tavoite o määritellä suuree u määritystarkkuus Δu. 1. Fuk/o maksimivirhe Δu max = ( U x i ) MP 2. Fuk/o keskivirhe Δu keskivirhe = Δx i 3. Maksimi- miimimeetelmä Osi;aisderivaa;a arvioidaa mi;auspisteessä ( U 2 ) (Δx i ) 2 x MP i u max = arvo joka u saa ku jokaie virhelähde kasva;aa u:ta u mi = arvo joka u saa ku jokaie virhelähde pieetää u:ta Δu max-mi = u max - u mi 2 14
Esim: Tarkas/ mita;u 0,1 mol ideaalikaasua suljetaa as/aa, joka /lavuus o V = (4,0 ± 0,2) L, ja kaasu paieeksi mitabi p = (754,7 ± 0,2) torr. Laske kaasu lämpö/la. Ratkaisu: pv = RT T = pv R = 484 K. Arvioidaa seuraavaksi eri virheet. 2 1) T: maksimivirhe: ΔT max = ( T ) MP Δx i x i = V, p x i = ( T V ) MP ΔV + ( T p ) Δp MP $ = p ' $ & ) ΔV + V ' & ) % R ( MP % R ( MP Δp " ΔT max = p % " $ ' ΔV + V % $ ' Δp # R & MP # R & MP 100618,4 Pa = 0,1 mol 8,31451 J K -1 mol 2-1 10 4 m 3 0,004 m 3 + 26,7 Pa=24,3K 0,1 mol 8,31451 J K -1-1 mol maksimivirhettä käyttäe saadaa siis T=(484 ± 24)K 2) T: keskivirhe ΔT keskivirhe = ( T V ) 2 (ΔV ) 2 + ( T MP p ) 2 (Δp) 2 MP = 24,2 K Keskivirhettä käyttäe saadaa siis T = (484 ± 24) K 15
3) Maksimi miimikeio (p + Δp)(V + ΔV ) T max = = 508,3996 K R (p - Δp)(V - ΔV ) T mi = = 459, 7366 K R ΔT max-mi = T T max mi 24K 2 Maksimi-miimikeio käyttäe saadaa siis T = (484 ± 24) K Tässä tapauksessa kaikki kolme keioa atoivat sama tulokse, mu;a äi ei aia ole. Esim: Otetaa fuk/o ϒ joka riippuu 7 muu;ujasta seuraavas/: 26r 2 (g γ= p g )t 9 l (1+2,2x)(1,65y) Oletetaa: r mittaustarkkuus o Δr, g p mittaustarkkuus o Δg p g mittaustarkkuus o Δg, t mittaustarkkuus o Δt l mittaustarkkuus o Δl, x mittaustarkkuus o Δx y mittaustarkkuus o Δy Lasketaa virheraja maksimi- miimikeiolla: γ max = 26(r+Δr)2 (g p + Δg p (g -Δg ))(t+δt) 9 (l-δl) (1+2,2(x-Δx))(1,65(y-Δy)) γ mi = 26(r-Δr)2 (g p Δg p (g +Δg ))(t-δt) 9 (l+δl) (1+2,2(x+Δx))(1,65(y+Δy)) Δγ = γ max γ mi 2 16
Pieimmä eliösumma sovitus = PS - sovitus (eglaiksi least squares fit). Tavoite: etsiä sovite;ava fuk/o parametrit jotka kuvaavat mi;ausaieistoa mahdollisimma hyvi. Esim: mi;ausaieisto {x i, y i }, eli o mita;y y: arvoja y i muu;uja x arvoilla x i. Sovitetaa fuk/oo y = a + bx ja yritetää löytää paras mahdollie a ja b. Mkä määrää "parhaa mahdollisimma" sovitukse? Residuaalie eliöide summa Lähtökohtaa o residuaalie eliöide summa: mittauspisteet (a + bx i y i ) 2 = (y i a bx i ) 2 mittauspisteet Residuaali eliöide summa miimi ataa parhaa mahdollise sovitukse. Yleises/: jos sovite;avassa fuk/ossa o kpl parametrejä, miimoimistehtävää tulee yhtälöä, joide avulla parametrie arvot ratkaistaa. Suora sovituksessa parametrejä o kaksi (a ja b), jote miimoimistehtävässä o kaksi yhtälöä. 17
Suora sovitus havaitoa {x i, y i } sovitetaa fuk/oo y = a + bx. Residuaali eliöide summa o: 2 Huom: tässä yhteydessä a ja b ovat siis S = (y i - a - bx i ) tutema;omia muu;ujia; mitatut y i ja x i taas tue;uja vakioita! Ja se miimissä: ds da = 2(y i a bx i ) 1= 0 ds db = 2(y a bx i i) x i = 0 Jaetaa molemmat yhtälöt - 2:lla; saadaa yhtälöpari: (y i a bx i ) = 0 2 (y i x i ax i bx i ) = 0 Jaetaa molemmat yhtälöt :llä, saadaa: = = ( y i a b x i ) = 0 ( y x i i a x i b x 2 i ) = 0 y a bx = 0 yx ax bx 2 = 0 Huom! x: ja y: keskiarvot x = 1 x i, y = 1 lisäksi: y i a = a 1= a = a 18
y a bx = 0 yx ax bx 2 = 0 x = y x ax b(x) 2 = 0 yx ax bx 2 = 0 Väheetää ylemmästä yhtälöstä puoli;ai alempi: y x ax b(x) 2 yx + ax + bx 2 = 0 y x yx b(x) 2 + bx 2 = 0 b = yx y x x 2 (x) 2 Ylemmästä yhtälöstä saadaa yt: a = y x b(x)2 x = y bx Suora sovitus Origi - ohjelmalla Työ vaiheet: 1. Muuta kemiaa kuvaava laki suora yhtälöksi. (Tämä kaa;aa tehdä jo ee harjoitusta /etokoeluokassa!) Esim: p = p 0 e Δ v H R ( 1 T 1 T o ) l(p) = l(p 0 )- Δ v H R ( 1 T 1 T o ) # l(p) = l(p 0 )+ Δ vh & % ( Δ vh $ RT 0 ' R y = a + bx 1 T 19
Suora sovitus Origi - ohjelmalla 2. Kirjoita (ja tarvi4aessa laske) aetut arvot Origi- taulukkoo T p 1/T l p............................................................ Suora sovitus Origi - ohjelmalla 3. Piirrä pisteet koordiaastoo. Mie äy4ääkö kuva järkevältä. l (p) Kuvaaja imi l(p) = 0.002 5.419(1/T) 1/T 4. Tee suora sovitus PS meetelmällä (muista o4aa muisi myös virherajat!) 5. Viimeistele kuvaaja! Akselie imeämie Kuvaaja imeämie Liitä suora sovitukse edot (virherajoiee!) kuvaa 20
Korrelaa/o ja kovariassi Palataa vielä hetkeksi /lasto/eteellisee tarkasteluu. Edellisessä esimerkissä sovitebi suoraa dataa, joka koostui lukuparista {x i, y i }, missä i = 1. Aiemmi esitellyillä kaavoilla voidaa helpos/ laskea esim. x: ja y: keskiarvot ja keskihajoat. Kahde muu;uja otokse kuvamisee tarvitaa aiemmi määriteltyje käsi;eide lisäksi pari uu;a; kovariassi cov(x,y) ja korrelaa/okerroi ρ. Määritelmät: cov(x, y) = 1 ρ = cov(x, y) σ x σ y (x i x)(y i y) = xy x y σ x σ y 1 ρ +1 Kovariassi yksikkö o x: ja y: yksiköide tulo; korrelaa/okerroi taas o dimesioto ja itseisarvoltaa 1. Jos muu;ujat ovat toisistaa riippuma;omat, kovariassi ja korrelaa/o ovat olla. Alhaista korrelaa/ota käytetääki usei todisteea riippuma;omuudesta (vaikka se voi johtua muistaki syistä). Jos x: suuret (ts x: keskiarvoa suuremmat) arvot esiityvät todeäköisemmi myös y: suurte (ts. y: keskiarvoa suurempie) arvoje kassa, kovariassi ja korrela/okerroi ovat posiivisia. Jos x: suuret arvot esiityvät todeäköisemmi y: piete arvoje kassa, kovariassi ja korrelaa/okerroi ovat egaivisia. Itseisarvoltaa suuri korrelaa/okerroi saa;aa tarkoi;aa e;ä x ja y riippuvat jollai tavalla toisistaa, mu;a korrelaa/o ei aia tarkoita syy- seuraussuhde;a; esim. jäätelösyö/ ei aiheuta hukkumiskuolemia. 21