9. Tilasto/etee eri3äi alkeelliset alkeet ja virhee arvioi/ Kemiassa ja muissa luoo/eteissä käsitellää usei suuria määriä mi3ausdataa. Mi3ausdata käsi3elyä ja jatkojalostusta varte (esim: selostuste ja raporbe kirjoi3amie) pitää hallita aiaki /lasto/etee alkeet, eli käsi3eet kute jakauma, otos, luokka, keskiarvo ja keskihajota. Tällä kurssilla vai hyvi hyvi pitapuolises/: käykää /lasto/etee kursseja jos tarvitse3e äitä taitoja eemmä! Mi3auksissa esiityy väistämä3ä aiaki joki verra virheitä. äide virhelähteide käsi3elyy lii3yvä matema/ikka o siis myös syytä osata. Peruslähtökohta: havaito, mi3aus, malliajo (tms) tuo3aa dataa. Luoo/eteissä data o yleesä umeerista, eli sitä voidaa kuvata umeroilla, tai se voidaa aiaki muu3aa tällaisee muotoo. Olkoo meillä kappale3a datapiste3ä (jokaie vastaa esim. yhtä mi3austa, havaitoa tms). Merkitää e x 1, x, x 3,,x. Tätä joukkoa saotaa usei otokseksi. Havaio/tulokse frekvessi kertoo kuika usei se esiityy otoksessa. Esimerkiksi 5 kolikoheito sarja saa3aisi tuo3aa tulokse: kruua, klaava, klaava, kruuu, klaava. Tällöi kruua frekvessi o ja klaava 3. Mikäli otos koostuu esim. reaaliluvuista, se joudutaa yleesä jakamaa luokkii jo3a frekvessie laskemie olisi mielekästä. Luokkii jae3u otos esitetää usei histogrammia. Histogrammi Histogrammissa x- akselia o muu3uja (esim. mitatu suuree) arvo, ja y- akselia frekvessi. Allaolevassa kuvassa (lähde: wikipedia) 100 datapistee otos o jae3u luokkii 0.5 yksikö välei. Jatkuva ja diskreeb jakauma Luoo/eteellisessä kokeessa mitataa yleesä joki suuree arvo äärellie määrä kertoja. Tilasto/eteellisessä mielessä otetaa siis otos k.o. suuree jakaumasta. Jakaumat voivat olla diskree4ejä, jolloi mita3ava suure voi saada vai /e3yjä arvoja (esim. koliko hei3ämise tulos voi olla joko kruua tai klaava, elektroi spi voi olla joko α tai β, je). MatemaaBses/: diskree' suure voi saada äärellise tai korkeitaa umeroituvas ääre3ömä määrä arvoja (esim. kokoaisluvut mu3a ei reaaliluvut). Toie vaihtoehto o jatkuva jakauma, jolloi mita3ava suure voi saada ei- umeroituvas/ ääre3ömä määrä eri arvoja (käytäössä siis mikä tahasa suure joka voi saada reaalilukuarvoja). 1
Periaa3eessa useimmat luoo/eteessä esiityvä jakaumat ovat aiee atomiluotee ja kvabmekaiika asiosta diskree3ejä, mu3a käytäössä o mielekästä ole3aa moet jakaumat jatkuviksi. Esim. pitoisuuksia, aerosolihiukkaste halkaisijoita tai molekyylie liike- eergioita kuvataa jatkuvilla jakaumilla. Käytäö sovelluksissa joudutaa usei mallitamaa diskree3ejä jakaumia jatkuvia tai päivastoi. Kolme esimerkkiä jatkuvasta jakaumasta (y - akselilla suhteellie todeäköisyys e3ä saadaa /e3y mi3austulos) Esimerkki diskree/stä jakaumasta Otoksia kuvaavat tuusluvut Yleesä halutaa kuvata otoksia eriäisillä tuusluvuilla. Tärkei ja tuetui äistä o aritmeebe keskiarvo; tämä lisäksi o myös muita keskilukuja kute geometrie keskiarvo, mediaai tai moodi. Keskiarvo lisäksi myös hajotaa kuvaavat luvut (variassi ja keskihajota) ovat yleesä oleellisia. Jos otoksessa o eemmä kui yksi muu3uja (esim mitataa y i, x i lukupareja, vaikkapa aika ja pitoisuus) tarvitaa muitaki tuuslukuja, esim. kovariassi ja korrelaa/okerroi. Erilaisia keskiarvoja Aritmee7e keskiarvo lieee kaikille tu3u: Joskus käytetää myös geometrista keskiarvoa (joka laskemie edelly3ää, e3ä kaikki luvut ovat posi/ivisia): x 1 x i x 1 x x 3... x Mediaai eli keskiluku: järjestetää havaiot suuruusjärjestyksee; mediaai o keskimmäie luku (tai kahde keskimmäise luvu keskiarvo jos o parillie). Moodi: yleisi arvo (se havaito jolla o suuri frekvessi). Huom: moodeja voi olla yksi tai useampi.
c Esimerkki: ympäristömyrky pitoisuude c määri3ämiseksi järvidedessä suoritebi eri puolilla järveä yhteesä 7 mi3austa, joista saa/i tulokseksi (yksiköissä μmol/l): c i {1,15 1,0 1,0 1,34 1,5 1,71,1} Mi3auste aritmeebe keskiarvo o: 1,15+1, 0 +1, 0 +1,34 +1, 5 +1, 71+,1 µmol/l 1,46 µmol/l 7 Geometrie keskiarvo o 1,43 μmol/l, mediaai 1,34 μmol/l ja moodi (1 kpl) 1,0 μmol/l. (Tässä esimerkissä ämä luvut lieevät paljo vähemmä hyödyllisiä kui aritmeebe keskiarvo.) Hajotaa kuvaavat luvut Pelkkä keskiarvo ei yleesä kerro jakaumasta rii3äväs/, vaa tarvitaa myös /etoa se leveydestä. Kaksi tärkeää lukua ovat variassi ja keskihajota. Variassi σ : σ 1 (x i x) x (x) Keskihajota σ (variassi eliöjuuri): σ 1 (x i x) Lasketaa variassi ja keskihajota edellä esitetylle otokselle c i {1,15 1,0 1,0 1,34 1,5 1,71,1} μmol/l σ 1 7 ((1,15 1, 46) + (1, 0 1, 46) + (1, 0 1, 46) + (1,34 1, 46) +(1, 5 1, 46) + (1, 71 1, 46) + (,1 1, 46) )µmol /L 0.15µmol /L Kuvassa olevissa jakaumissa A: ja B: keskiarvo o sama, mu3a A:lla o suurempi keskihajota. A:lla ja C:llä taas o sama keskihajota, mu3a eri keskiarvo. Jatkuvie jakaumie keskiarvo ja keskihajota voidaa laskea itegroimalla, mu3a äitä laskuja ei käsitellä tällä kurssilla; kts kirja luvut 1.- 1.6. σ σ 0.353µmol/L (Oikeas pitäisi etys laskea tarkemmalla keskiarvo arvolla, mu3a tämä ei mahtuut kalvolle). Tästä ähdää keskihajoa hyöty variassii ähde: se o samoissa yksiköissä kui alkuperäie data. Ope4ele laskemaa keskiarvoja ja hajotoja /etokoeella, esim Excelissä AVERAGE, VAR ja STDEV. 3
Piete otoste keskihajota Usei yritetää arvioida jakauma /lastollisia omiaisuuksia piee otokse avulla. Esimerkiksi joki aiee pitoisuuksia ilmassa tai vedessä arvioidaa suori3amalla rajallie joukko mi3auksia. Jos otoskoko () o kovi piei, ataa edellä esitelty kaava hiema liia piee arvo keskihajoalle. Tarkempi kaava o tällöi: σ otos 1 1 (x i x) Wikipedia: Ituiivises tämä seli3yy sillä, e3ä otoskeskiarvo poikkeaa jouko todellisesta keskiarvosta otokse suutaa, mikä tuo3aisi keskihajoa kaavaa liia piee osoi3aja. Yhdellä pieee3y imi3äjä kompesoi tämä harha ja äi saadaa mahdollisimma hyvä esmaa' perusjouko keskihajoasta. ormaalijakauma Moie suureide jakaumat ouda3avat aiaki likimai s. ormaalijakaumaa (tuetaa myös Gaussia jakaumaa tai kellokäyrää). ormaalijakauma kaava o: (x µ ) 1 f (x) σ π e σ missä μ o jakauma keskiarvo ja σ se keskihajota. Huom: μ o samalla myös mediaai ja moodi. Useat yksikertaiset matemaabset jakaumat (esim. biomijakauma) ouda3avat myös ormaalijakaumaa, ku o rii3ävä suuri. Aiempie kalvoje jatkuvat jakaumat olivat juuri ormaalijakaumia. ormaalijakauma luoossa Muu3uja joka määräytyy moe toisistaa riippuma3oma toise muu3uja kumula/ivisesta vaikutuksesta ouda3aa ormaalijakaumaa. Esimerkiksi ihmiste pituus (joka määräytyy usea geei sekä ympäristötekijöide yhteisvaikutuksesta). Satuaisvirheistä johtuva mi3austuloste hajota ouda3aa yleesä myös ormaalijakaumaa. Moet /lastolliset meetelmät ja tes/t ole3avat virheide oleva ormaalis/ jakautueita. t- tes/ (Stude/ t- tes/) t- tes/llä (josta o useita eri versioita) voidaa laskea todeäköisyys e3ä kaksi otosta ovat peräisi samasta alkuperäisestä jakaumasta. Toie sovellus: todeäköisyys e3ä sovitetu regressiosuora (tästä lisää myöhemmi) kulmakerroi poikkeaa /lastollises/ merki3äväs/ ollasta. Tes/t ole3avat e3ä muu3ujat ovat ormaalis/ jakautueet. Käytäössä t- tes/t lasketaa /etokoeella, esim Excelissä kometo TTEST. äitä ei käsitellä tällä kurssilla pidemmälle (tes/e olemassaolo o hyvä /etää opetelkaa käy3ämää jos ja ku tarvitse3e). 4
Virhee arvioi/ mi3austarkkude ja määritystarkkuude arvioi. Erilaisia virheitä: 1. Karkeat virheet Huolima3omuudesta tai työvirheestä johtuva moka Usei huomaa äly3ömää tuloksea. SystemaaBset virheet Johtuu esim lai3eisto kalibroiista vääri; mi3a- asteikko o väärä Vaiku3aa aia samaa suutaa, pystytää usei poistamaa 3. Satuaiset mi3ausvirheet Vaiku3aa "oikea tulokse" molemmilla puolilla Esim. silmä tai mi3alai3ee tarkkuus Ei voi kokoaa ehkäistä, mu3a suuruu3a voi arvioida systemaabe vs satuaie virhe Tärkeitä määritelmiä Mi4aukse sisäie tarkkuus Mi3aus o sisäises/ tarkka, jos satuaiste mi3ausvirheide suuruus o piei. Tulos voi sil/ olla aiva väärä, jos systemaabe virhe o suuri! Mi4aukse ulkoie tarkkuus Mi3aus o ulkoises/ tarkka jos se o "oikeas/ oikei". Virhee esi3ämie Absoluu7e virhe Esim: V (5,4 ± 0,1) L Suhteellie virhe absoluuttie virhe suuree arvo 0,1L 100% 1,9% 5,4L 5
Esim: virheide vertaamie Titraustulokset olivat (5,4 ± 0,1) ml ja (108,6 ± 0,8) ml Kumpi mi3aus o tarkempi? Vastaus: riippuu tarkoitetaako absoluu7sta vai suhteellista virhe4ä. AbsoluuBe virhe o suurempi jälkimmäiseässä mi3auksessa. Suhteellie virhe taas o pieempi jälkimmäisessä mi3auksessa: Mi3austuloste virherajat Riippuvat siitä suoritetaako mi3aus kerra vai toistokokeea. Jos mi4aus suoritetaa kerra: Mi3ari, silmä tms. lukematarkkuus määrää tarkkuude Esim. pui3u massa (1, ± 0,) g Moissa lai3eissa tai laboratorioas/oissa o kerro3u tarkkuus. 0,1 ml 5,4 ml 100% 1,9% ja 0,8 ml 100% 0,74% 108,6 ml Mi3austuloste virherajat Jos mi4aus suoritetaa moee kertaa Huom: oletuksea e3ä toistokerrat ovat toisistaa riippuma3omia; esim. /traus, seku/kello käy3ö Mi3aukse arvo saadaa keskiarvoa: x 1 x i Mi3aukse tarkkuus saadaa keskiarvo keskivirheeä: Δx (x i x) ( -1) Esim: aoh - liuokse pitoisuus selvitetää /traamalla se 0,001M HCl:llä. Titraustulokset ovat 5,1 ml, 5,3 ml ja 5,7 ml ku 100 ml aoh - äyte /trataa. Laske aoh kosetraa/o. Ratkaisu: Mi3auste keskiarvo o (5,1 ml+ 5,3 ml+ 5,7 ml) V 3 Keskivirhe o ΔV (5,1 ml V) + (5,3 ml V) + (5,7 ml V) 3 V 0,001M aoh kosetraa/o o c 100 ml ΔV 0,001M Ja se virhe Δc 100 ml Huom: tässä o olete3u e3ä HCl: kosetraa/o ja aoh äy3ee määrä (100 ml) ovat tarkkoja. 6
Suora sovitukse virheet Suora sovituksessa etsitää vakiotermi ja kulmakerroi site e3ä mi3auspisteet sopivat mahdollisimma hyvi suoralle. Käytäössä mitatu ("todellise") ja lasketu arvo välillä o aia eroa. Tämä ero suuruude kertovat vakiotermi ja kulmakertoie stadardipoikkeamat ("virherajat"). Origi- ohjelma, Mathema/ca, Matlab je (jopa jotki taskulaskimet) atavat ämä stadardipoikkeamat. Kaavat löytyvät oppikirjoista, ei käydä läpi tässä. Lasketu suuree virhe Joskus käyte3ävissä oleva mi3alaite mi3aa suoraa halu3ua suure3a. Esimerkiksi vaaka ataa suoraa paio. Tällöi tulokse virheraja pää3elemisee tarvitaa vai /etoa mi3alai3ee tarkkuudesta (ja toistomi3auste määrästä kute edellisissä esimerkeissä). Usei (yleesä) halu3u suure joudutaa kuiteki jollaki tavalla laskemaa mitatusta suureesta tai suureista. Tähä törmää jo kemia alkeiskursseilla: jos liuokse pitoisuus päätellää esimerkiksi /traamalla, tarvitaa /eto sekä /trabliuokse pitoisuudesta e3ä se määrästä. Molemmissa voi olla virheitä: tuloksessa o (aiaki) kaksi virhelähde3ä! Lasketu suuree virhe Mite mita3uje suureide virheet ja suora sovitukse virheet vaiku3avat laske3avaa olevaa suureesee? Lähtökohta: suure u lasketaa toise suuree avulla u u(x 1, x, x 3,..., x ) x i :t toisistaa riippuma3omia x 1, x,..., x ovat mi3austuloksia, suora parametrejä tai toistokokee keskiarvoia saatavia tuloksia (tjsp). iide virheet ovat Δx 1, Δx,..., Δx Tavoite o määritellä suuree u määritystarkkuus Δu. 1. Fuk/o maksimivirhe Δu max ( U ) MP Δx i x i. Fuk/o keskivirhe Δu keskivirhe Osi3aisderivaa3a arvioidaa mi3auspisteessä ( U ) (Δx i ) x MP i 3. Maksimi- miimimeetelmä u max arvo joka u saa ku jokaie virhelähde kasva3aa u:ta u mi arvo joka u saa ku jokaie virhelähde pieetää u:ta Δu max-mi u max - u mi 7
Esim: Tarkas/ mita3u 0,1 mol ideaalikaasua suljetaa as/aa, joka /lavuus o V (4,0 ± 0,) L, ja kaasu paieeksi mitabi p (754,7 ± 0,) torr. Laske kaasu lämpö/la. Ratkaisu: pv RT T pv 484 K. R Arvioidaa seuraavaksi eri virheet. 1) T: maksimivirhe: ΔT max ( T ) MP Δx i x i V, p x i ( T V ) MP ΔV + ( T p ) Δp MP $ p ' $ & ) ΔV + V ' & ) % R ( MP % R ( MP Δp " ΔT max p % " $ ' ΔV + V % $ ' Δp # R & MP # R & MP 100618,4 Pa 0,1 mol 8,31451 J K -1 mol -1 10 4 m 3 0,004 m 3 + 6,7 Pa4,3K 0,1 mol 8,31451 J K -1-1 mol maksimivirhettä käyttäe saadaa siis T(484 ± 4)K ) T: keskivirhe ΔT keskivirhe ( T V ) (ΔV ) + ( T MP p ) (Δp) MP 4, K Keskivirhettä käyttäe saadaa siis T (484 ± 4) K 3) Maksimi miimikeio (p + Δp)(V + ΔV ) T max 508,3996 K R (p - Δp)(V - ΔV ) T mi 459, 7366 K R ΔT max-mi T T max mi 4K Maksimi-miimikeio käyttäe saadaa siis T (484 ± 4) K Tässä tapauksessa kaikki kolme keioa atoivat sama tulokse, mu3a äi ei aia ole. Esim: Otetaa fuk/o ϒ joka riippuu 7 muu3ujasta seuraavas/: 6r (g γ p g )t 9 l (1+,x)(1,65y) Oletetaa: r mittaustarkkuus o Δr, g p mittaustarkkuus o Δg p g mittaustarkkuus o Δg, t mittaustarkkuus o Δt l mittaustarkkuus o Δl, x mittaustarkkuus o Δx y mittaustarkkuus o Δy Lasketaa virheraja maksimi- miimikeiolla: γ max 6(r+Δr) (g p + Δg p (g -Δg ))(t+δt) 9 (l-δl) (1+,(x-Δx))(1,65(y-Δy)) γ mi 6(r-Δr) (g p Δg p (g +Δg ))(t-δt) 9 (l+δl) (1+,(x+Δx))(1,65(y+Δy)) Δγ γ max γ mi 8
Pieimmä eliösumma sovitus PS - sovitus (eglaiksi least squares fit). Tavoite: etsiä sovite3ava fuk/o parametrit jotka kuvaavat mi3ausaieistoa mahdollisimma hyvi. Esim: mi3ausaieisto {x i, y i }, eli o mita3y y: arvoja y i muu3uja x arvoilla x i. Sovitetaa fuk/oo y a + bx ja yritetää löytää paras mahdollie a ja b. Mkä määrää "parhaa mahdollisimma" sovitukse? Residuaalie eliöide summa Lähtökohtaa o residuaalie eliöide summa: mittauspisteet (a + bx i y i ) (y i a bx i ) mittauspisteet Residuaali eliöide summa miimi ataa parhaa mahdollise sovitukse. Yleises/: jos sovite3avassa fuk/ossa o kpl parametrejä, miimoimistehtävää tulee yhtälöä, joide avulla parametrie arvot ratkaistaa. Suora sovituksessa parametrejä o kaksi (a ja b), jote miimoimistehtävässä o kaksi yhtälöä. Suora sovitus havaitoa {x i, y i } sovitetaa fuk/oo y a + bx. Residuaali eliöide summa o: Huom: tässä yhteydessä a ja b ovat siis S (y i - a - bx i ) tutema3omia muu3ujia; mitatut y i ja x i taas tue3uja vakioita! Ja se miimissä: ds da (y a bx i i) 1 0 ds db (y a bx i i) x i 0 Jaetaa molemmat yhtälöt - :lla; saadaa yhtälöpari: (y i a bx i ) 0 (y i x i ax i bx i ) 0 Jaetaa molemmat yhtälöt :llä, saadaa: ( y i a b x i ) 0 ( y ix i a x i b x i ) 0 y a bx 0 yx ax bx 0 Huom! x: ja y: keskiarvot x 1 x i, y 1 lisäksi: y i a a 1 a a 9
y a bx 0 yx ax bx 0 y x ax b(x) 0 yx ax bx 0 Väheetää ylemmästä yhtälöstä puoli3ai alempi: Ylemmästä yhtälöstä saadaa yt: x y x ax b(x) yx + ax + bx 0 y x yx b(x) + bx 0 b yx y x x (x) a y x b(x) x y bx Suora sovitus Origi - ohjelmalla Työ vaiheet: 1. Muuta kemiaa kuvaava laki suora yhtälöksi. (Tämä kaa3aa tehdä jo ee harjoitusta /etokoeluokassa!) Esim: p p 0 e Δ v H R ( 1 T 1 ) T o l(p) l(p 0 )- Δ vh R ( 1 T 1 T o ) # l(p) l(p 0 )+ Δ H & v % ( Δ H v 1 $ RT 0 ' R T y a + bx Suora sovitus Origi - ohjelmalla. Kirjoita (ja tarvi4aessa laske) aetut arvot Origi- taulukkoo T p 1/T l p............................................................ Suora sovitus Origi - ohjelmalla 3. Piirrä pisteet koordiaastoo. Mie äy4ääkö kuva järkevältä. l (p) Kuvaaja imi l(p) 0.00 5.419(1/T) 1/T 4. Tee suora sovitus PS meetelmällä (muista o4aa muisi myös virherajat!) 5. Viimeistele kuvaaja! Akselie imeämie Kuvaaja imeämie Liitä suora sovitukse edot (virherajoiee!) kuvaa 10
Korrelaa/o ja kovariassi Palataa vielä hetkeksi /lasto/eteellisee tarkasteluu. Edellisessä esimerkissä sovitebi suoraa dataa, joka koostui lukuparista {x i, y i }, missä i 1. Aiemmi esitellyillä kaavoilla voidaa helpos/ laskea esim. x: ja y: keskiarvot ja keskihajoat. Kahde muu3uja otokse kuvamisee tarvitaa aiemmi määriteltyje käsi3eide lisäksi pari uu3a; kovariassi cov(x,y) ja korrelaa/okerroi ρ. Määritelmät: cov(x, y) 1 ρ (x i x)(y i y) cov(x, y) xy x y 1 ρ +1 σ x σ y σ x σ y Kovariassi yksikkö o x: ja y: yksiköide tulo; korrelaa/okerroi taas o dimesioto ja itseisarvoltaa 1. Jos muu3ujat ovat toisistaa riippuma3omat, kovariassi ja korrelaa/o ovat olla. Alhaista korrelaa/ota käytetääki usei todisteea riippuma3omuudesta (vaikka se voi johtua muistaki syistä). Jos x: suuret (ts x: keskiarvoa suuremmat) arvot esiityvät todeäköisemmi myös y: suurte (ts. y: keskiarvoa suurempie) arvoje kassa, kovariassi ja korrela/okerroi ovat posiivisia. Jos x: suuret arvot esiityvät todeäköisemmi y: piete arvoje kassa, kovariassi ja korrelaa/okerroi ovat egaivisia. Itseisarvoltaa suuri korrelaa/okerroi saa3aa tarkoi3aa e3ä x ja y riippuvat jollai tavalla toisistaa, mu3a korrelaa/o ei aia tarkoita syy- seuraussuhde3a; esim. jäätelösyö/ ei aiheuta hukkumiskuolemia. 11