Kemometriasta Matti Hotokka Fysikaalisen kemian laitos Åbo Akademi Http://www.abo.fi/~mhotokka
Mistä puhutaan? Määritelmiä Määritys, rinnakkaismääritys Mittaustuloksen luotettavuus Kalibrointi Mittausten suunnittelu Satunnaista! Seulonta Katso myös http://www.abo.fi/~mhotokka -> Teaching -> Elementary Statistics.
Määritys Yksi määritys liuosten valmistamisesta mittaukseen ja tuloksen laskemiseen.
Rinnakkaismääritys Jokainen määritys tulee toistaa useita kertoja alusta pitäen. Mittaustulos: Useiden rinnakkaismääritysten keskiarvo. Näin jokaiselle mittaukselle voidaan antaa luotettavuus. Vertailutulos, tausta, referenssi: Mittaustulos tapauksessa, jossa kaikki olosuhteet ovat nimellisarvossaan.
Toisto Toisto: mittausarvon lukeminen uudelleen. Toisto osoittaa kemistin taidon lukea digitaalinäyttöä. Rinnakkaismääritys paljastaa mittauksen kokeelliset virheet.
Mittaustuloksen luotettavuus Usean määrityksen keskiarvo (tai mediaani) Luotettavuuden arviointi Keskihajonta Keskiarvon keskivirhe Luotettavuusrajat (konfidenssirajat) Konfidenssirajat Keskivirhe Hajonta <x>
Mittauksen kalibrointi Herkkyys Toteamisraja Erotuskyky
Kalibrointikäyrä Herkkyys = kulmakerroin Signal, y b 0 x y y = b0 + b1 x y b1 = x Leikkauspiste b 0 voidaan jättää huomiotta, jos mittausta verrataan referenssimittaukseen. Concentration, x
Analyyttinen alue Dynaaminen alue: Ne muuttujan x arvot, joilla mittaustulos ei ole satunnainen. Analyyttinen alue: Ne muuttujan x arvot, joilla mittaustulos voidaan lukea tarkasti. Signal, y DL Dynaaminen alue Analyyttinen alue LoD Concentration, x
Havaitsemisraja DL=Detection Limit Toteamisraja: (DL=Detection limit) Alhaisin muuttujan x arvo, jolla signaali vielä erottuu kohinasta. Kohina määritetään vertailutuloksen hajonnasta. y b y = y + 3 s x = DL 0 DL B B Määritysraja: (LoD=Limit of Determination) Alhaisin muuttujan x arvo, jolla mittaustulos voidaan määrittää käyttökelpoisella tarkkuudella. DL b 1
Näytteenotto Systemaattinen virhe 2000 henkilön puhelinhaastattelu: Syötkö Hesen burgereita? Tulos: 80 % sanoo ehdottomasti en Totuus: 60 % väestöstä käy Hesellä. Mikä meni pieleen? Puhelinhaastattelu aamupäivällä. Kuka on kotona ja vastaa puhelimeen? Eläkeläiset! Sitä osaa väestöstä, joka hiipii salaa Heselle, ei koskaan tavoitettu.
Systemaattinen virhe Muuttujan x (vaikkapa konsentraatio) virhe e e = x x = ( x x) + ( x x ) true Random error Satunnaisvaihtelu true Bias x true x x Systemaattinen virhe
Satunnaisotanta Miksi satunnaistaa Määritykset tulee aina tehdä satunnaisessa järjestyksessä. Response Systemaattinen 1 2 3 4 5 Todellinen Liukuma Response Satunnainen 4 2 1 5 Todellinen 3 Concentration Concentration
Residuaalit Poikkeamat sovituksesta Poikkeamat sovituksesta paljastavat usein systemaatisen virheen. Poikkeama 1 2 3 4 5 Havainto
Satunnainen järjestys Tehtävä: Määritä absorbanssi neljälle eri liuoskonsentraatiolle A, B, C ja D. Menetelmä: Neljän rinnakkaismäärityksen keskiarvo. Numeroi määritykset A 1, A 2, A 3, A 4, B 1, jne.
Satunnainen järjestys Ensimmäinen ajo: Valmista liuokset A 1, B 1, C 1 ja D 1, mittaa. Toinen ajo: Valmista liuokset A 2, B 2, C 2, D 2. A 1, B 1, C 1 D 1 A 2, B 2, C 2 D 2 A 3, B 3, C 3 D 3 A 4, B 4, C 4 D 4 Väärin! Systemaattiset virheet eivät löydy.
Satunnainen järjestys y 4 2 3 2 3 1 4 3 1 4 2 1 4 2 3 A 1, B 1, C 1, D 1 C 2, D 2, A 2, B 2 D 3, A 3, B 3, C 3 B 4, C 4, D 4, A 4 1 A B C D Conc.
Satunnainen järjestys Residuaalit Residues 4 2 3 1 2 3 1 4 3 1 1 4 4 2 2 3 A 1, B 1, C 1, D 1 C 2, D 2, A 2, B 2 D 3, A 3, B 3, C 3 B 4, C 4, D 4, A 4 Liukuma! A B C D Conc.
Huomioitavia muuttujia Säädettävät parametrit Konsentraatio, ph, lämpötila,... Tiedetyt seikat, joihin ei voida vaikuttaa Laitteen ryömiminen,... Tuntemattomat muuttujat, joiden olemassaolo voidaan ennakoida Lähtöaineiden epäpuhtaudet,... Täysin arvaamattomat tekijät
Seulonta Mittaustulokseen vaikuttavat monet seikat, joita voidaan säätää: konsentraatio, ph, lämpötila,... Mitkä näistä ovat tärkeitä ja mitkä voidaan jättää huomiotta (mutta pyritään pitämään niin vakioina kuin mahdollista)? Seulonta: Tärkeiksi arvioiduille suureille valitaan kaksi ääriarvoa suuri (merkintä +1) ja pieni (-1).
Seulonta Kaikki erilaiset kombinaatiot valmistetaan. Niille kaikille mitataan kokeellinen arvo (absorbanssi). Jokaisesta tehdään tietenkin rinnakkaismäärityksiä kokeellisen tarkkuuden määräämiseksi. Erotusta absorbanssi suurilla (+1) miinus pienillä muuttujan arvoilla (-1) verrataan kokeelliseen mittaustarkkuuteen. Näin nähdään mitkä muuttujat ovat tilastollisesti merkittäviä.
Jakautuma X
Jakautuman paikka Keskiarvo (odotusarvo) x, E(x) Moodi Yleisin arvo Mediaani 1 x = N Puolet havainnoista on alapuolella N i= 1 x i
Jakautuman muoto P(X) s X
Jakautuman muoto Alue Suurin arvo - pienin arvo Absoluuttinen keskipoikkeama (MAD) 1/N x i -x Neliöllinen keskipoikkeama (MSD) 1/N (x i - x Varianssi s 2 = 1/(N-1) Hajonta s ) 2 (x i - x ) 2
Näyte versus kaikki Näyte x, s 2 Arvioita Populaatio, Oikeat 2
Kuinka hyvä tulos Näytteen keskiarvo on suureen Kaksi näytettä Kuinka lähellä likiarvo Kaksi eri keskiarvoa :tä näytteen keskiarvo on? X 1 X 3 X X 2 n
Keskiarvon keskivirhe Standard error of mean SE σ = N s N SE E[x]
! Konfidenssirajat Todennäköisyys, että sisällä, on 62 % on rajojen E[x ] ± SE 62 % E[x] SE
$ "# % & Konfidenssirajat Suurempi todennäköisyys, laveammat rajat " rajojen X ± t 0.025 SE sisällä 95 %:n todennäköisyydella; t 0.025 2. 2.5 % + 2.5 % riski tuottaa 95 % konfidenssirajat 2.5 % = 0.025 0.025
' Seulontamalleja Kaksitasomallit, 2 k P-fenyleenidiamiinin (PPD) entsymaattinen hapetus spektrofotometrisesti, vakio enstsyymikonsentraatio 13.6 mg L -1 : Faktori Taso -1 +1 T, C 35 40 ph 4.8 6.4 [PPD], mm 0.5 27.3
2 k -mallit Kombinaatioita on 2 k kappaletta. Se on suuri luku, jos seulottavia muuttujia on useita. Run Coded factor levels T PPD ph 1 +1-1 -1 Point 2 +1 +1-1 3 +1 +1 +1 4 +1-1 +1 5-1 -1-1 6-1 +1-1 7-1 +1 +1 8-1 -1 +1 +1 x 3-1 x 2 +1 x 1 +1
Taguchi-malli L4 (2 3 ) 1 1 1 1 2 2 2 1 2 2 2 1 Neljä koetta kahdeksan sijasta.