Kemometriasta. Matti Hotokka Fysikaalisen kemian laitos Åbo Akademi Http://www.abo.fi/~mhotokka



Samankaltaiset tiedostot
Mittaustulosten tilastollinen käsittely

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Kojemeteorologia. Sami Haapanala syksy Fysiikan laitos, Ilmakehätieteiden osasto

Mittausepävarmuudesta. Markku Viander Turun yliopisto Lääketieteellinen mikrobiologia ja immunologia

Mittaustekniikka (3 op)

Otoskoko 107 kpl. a) 27 b) 2654

Virhearviointi. Fysiikassa on tärkeää tietää tulosten tarkkuus.

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4

On määritettävä puupalikan ja lattian välinen liukukitkakerroin. Sekuntikello, metrimitta ja puupalikka (tai jääkiekko).

t osatekijät vaikuttavat merkittävästi tuloksen epävarmuuteen Mittaustulosten ilmoittamiseen tulee kiinnittää kriittistä

761121P-01 FYSIIKAN LABORATORIOTYÖT 1. Oulun yliopisto Fysiikan tutkinto-ohjelma Kevät 2016

Kemiallisten menetelmien validointi ja mittausepävarmuus Leena Saari Kemian ja toksikologian tutkimusyksikkö

Tilastollinen aineisto Luottamusväli

Teemu Näykki ENVICAL SYKE

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Taajuusmittauskilpailu Hertsien herruus Mittausraportti

Havaitsevan tähtitieteen peruskurssi I

LIITE 1 VIRHEEN ARVIOINNISTA

TASAVIRTAPIIRI - VASTAUSLOMAKE

LIITE 1 VIRHEEN ARVIOINNISTA

Keskipisteen lisääminen 2 k -faktorikokeeseen (ks. Montgomery 9-6)

1.1 Tyhjiön permittiivisyyden mittaaminen tasokondensaattorilla

LIITE 1 VIRHEEN ARVIOINNISTA

Kojemeteorologia (53695) Laskuharjoitus 1

Johdatus tilastotieteeseen

Regressioanalyysi. Kuusinen/Heliövaara 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1

PERMITTIIVISYYS. 1 Johdanto. 1.1 Tyhjiön permittiivisyyden mittaaminen tasokondensaattorilla . (1) , (2) (3) . (4) Permittiivisyys

Aki Taanila AIKASARJAENNUSTAMINEN

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Talousveden kemiallisten määritysmenetelmien oikeellisuus, täsmällisyys ja toteamisraja - vaatimukset STMa 461/2000

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

Vinkkejä opettajille ja odotetut tulokset SIVU 1

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO METODOLOGIAN PERUSTEIDEN KERTAUSTA AINEISTO...

Testejä suhdeasteikollisille muuttujille

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

pitkittäisaineistoissa

ASUINKERROSTALON ÄÄNITEKNISEN LAADUN ARVIOINTI. Mikko Kylliäinen

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking)

Otoskeskiarvo on otossuure, jonka todennäköisyysjakauma tiedetään. Se on normaalijakauma, havainnollistaminen simuloiden

Mittausjärjestelmän kalibrointi ja mittausepävarmuus

7.4 Fotometria CCD kameralla

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Kandidaatintutkielman aineistonhankinta ja analyysi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Harjoitus 2: Matlab - Statistical Toolbox

Aineistokoko ja voima-analyysi

Lisätehtäviä ratkaisuineen luentomonisteen lukuihin 2-4 liittyen

805306A Johdatus monimuuttujamenetelmiin, 5 op

Ellei tutkijalla ole käsitystä mittauksensa validiteetista ja reliabiliteetista, ei johtopäätöksillä

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

/1. MTTTP1, luento Normaalijakauma (kertausta) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

Kuva 1. Ohmin lain kytkentäkaavio. DC; 0 6 V.

Nimi: Muiden ryhmäläisten nimet:

Anturit ja Arduino. ELEC-A4010 Sähköpaja Tomi Pulli Signaalinkäsittelyn ja akustiikan laitos Mittaustekniikka

LIITE 1 VIRHEEN ARVIOINNISTA

pitkittäisaineistoissa

ASPIRIININ MÄÄRÄN MITTAUS VALOKUVAAMALLA

Sovellettu todennäköisyyslaskenta B

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Harjoitus 6 -- Ratkaisut

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

/1. MTTTP1, luento Normaalijakauma (jatkoa) Olkoon Z ~ N(0, 1). Määritellään z siten, että P(Z > z ) =, graafisesti:

1. Kaksoissokkokokeen oleellinen piirre on, etteivät lääkkeen antaja ja lääkkeen saaja tiedä, minkä lääkkeen vaikutusta tutkitaan.

Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä palamisaikaa?

Johdanto. I. TARKKUUS Menetelmä

7. laskuharjoituskierros, vko 10, ratkaisut

Tutkimustiedonhallinnan peruskurssi

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

1. Matikan kurssin arvosanat jakautuivat seuraavalla tavalla:

Havainto uudesta 125 GeV painavasta hiukkasesta

Kvantitatiiviset tutkimusmenetelmät maantieteessä

Tilastollisen analyysin perusteet Luento 2: Tilastolliset testit

LÄÄKETEHTAAN UUMENISSA

Diskreetin satunnaismuuttujan odotusarvo, keskihajonta ja varianssi

3. a) Mitkä ovat tilastolliset mitta-asteikot? b) Millä tavalla nominaaliasteikollisen muuttujan jakauman voi esittää?

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 5

Sovellettu todennäköisyyslaskenta B

FOSFORIPITOISUUS PESUAINEESSA

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

PUHTAAN ILMANVAIHTOJÄRJESTELMÄN TOTEUTTAMINEN JA SAAVUTETUT

1. Matikan kurssin arvosanat jakautuivat seuraavalla tavalla:

4. Seuraavaan ristiintaulukkoon on kerätty tehtaassa valmistettujen toimivien ja ei-toimivien leikkijunien lukumäärät eri työvuoroissa:

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

b6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia.

Perusnäkymä yksisuuntaiseen ANOVAaan

Estimointi. Vilkkumaa / Kuusinen 1

Hypoteesin testaus Alkeet

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Teema 8: Parametrien estimointi ja luottamusvälit

Osa 2: Otokset, otosjakaumat ja estimointi

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

USEAN MUUTTUJAN REGRESSIOMALLIT JA NIIDEN ANA- LYYSI

Higgsin bosonin etsintä CMS-kokeessa LHC:n vuosien 2010 ja 2011 datasta CERN, 13 joulukuuta 2011

Spektrofotometria ja spektroskopia

riippumattomia ja noudattavat samaa jakaumaa.

Transkriptio:

Kemometriasta Matti Hotokka Fysikaalisen kemian laitos Åbo Akademi Http://www.abo.fi/~mhotokka

Mistä puhutaan? Määritelmiä Määritys, rinnakkaismääritys Mittaustuloksen luotettavuus Kalibrointi Mittausten suunnittelu Satunnaista! Seulonta Katso myös http://www.abo.fi/~mhotokka -> Teaching -> Elementary Statistics.

Määritys Yksi määritys liuosten valmistamisesta mittaukseen ja tuloksen laskemiseen.

Rinnakkaismääritys Jokainen määritys tulee toistaa useita kertoja alusta pitäen. Mittaustulos: Useiden rinnakkaismääritysten keskiarvo. Näin jokaiselle mittaukselle voidaan antaa luotettavuus. Vertailutulos, tausta, referenssi: Mittaustulos tapauksessa, jossa kaikki olosuhteet ovat nimellisarvossaan.

Toisto Toisto: mittausarvon lukeminen uudelleen. Toisto osoittaa kemistin taidon lukea digitaalinäyttöä. Rinnakkaismääritys paljastaa mittauksen kokeelliset virheet.

Mittaustuloksen luotettavuus Usean määrityksen keskiarvo (tai mediaani) Luotettavuuden arviointi Keskihajonta Keskiarvon keskivirhe Luotettavuusrajat (konfidenssirajat) Konfidenssirajat Keskivirhe Hajonta <x>

Mittauksen kalibrointi Herkkyys Toteamisraja Erotuskyky

Kalibrointikäyrä Herkkyys = kulmakerroin Signal, y b 0 x y y = b0 + b1 x y b1 = x Leikkauspiste b 0 voidaan jättää huomiotta, jos mittausta verrataan referenssimittaukseen. Concentration, x

Analyyttinen alue Dynaaminen alue: Ne muuttujan x arvot, joilla mittaustulos ei ole satunnainen. Analyyttinen alue: Ne muuttujan x arvot, joilla mittaustulos voidaan lukea tarkasti. Signal, y DL Dynaaminen alue Analyyttinen alue LoD Concentration, x

Havaitsemisraja DL=Detection Limit Toteamisraja: (DL=Detection limit) Alhaisin muuttujan x arvo, jolla signaali vielä erottuu kohinasta. Kohina määritetään vertailutuloksen hajonnasta. y b y = y + 3 s x = DL 0 DL B B Määritysraja: (LoD=Limit of Determination) Alhaisin muuttujan x arvo, jolla mittaustulos voidaan määrittää käyttökelpoisella tarkkuudella. DL b 1

Näytteenotto Systemaattinen virhe 2000 henkilön puhelinhaastattelu: Syötkö Hesen burgereita? Tulos: 80 % sanoo ehdottomasti en Totuus: 60 % väestöstä käy Hesellä. Mikä meni pieleen? Puhelinhaastattelu aamupäivällä. Kuka on kotona ja vastaa puhelimeen? Eläkeläiset! Sitä osaa väestöstä, joka hiipii salaa Heselle, ei koskaan tavoitettu.

Systemaattinen virhe Muuttujan x (vaikkapa konsentraatio) virhe e e = x x = ( x x) + ( x x ) true Random error Satunnaisvaihtelu true Bias x true x x Systemaattinen virhe

Satunnaisotanta Miksi satunnaistaa Määritykset tulee aina tehdä satunnaisessa järjestyksessä. Response Systemaattinen 1 2 3 4 5 Todellinen Liukuma Response Satunnainen 4 2 1 5 Todellinen 3 Concentration Concentration

Residuaalit Poikkeamat sovituksesta Poikkeamat sovituksesta paljastavat usein systemaatisen virheen. Poikkeama 1 2 3 4 5 Havainto

Satunnainen järjestys Tehtävä: Määritä absorbanssi neljälle eri liuoskonsentraatiolle A, B, C ja D. Menetelmä: Neljän rinnakkaismäärityksen keskiarvo. Numeroi määritykset A 1, A 2, A 3, A 4, B 1, jne.

Satunnainen järjestys Ensimmäinen ajo: Valmista liuokset A 1, B 1, C 1 ja D 1, mittaa. Toinen ajo: Valmista liuokset A 2, B 2, C 2, D 2. A 1, B 1, C 1 D 1 A 2, B 2, C 2 D 2 A 3, B 3, C 3 D 3 A 4, B 4, C 4 D 4 Väärin! Systemaattiset virheet eivät löydy.

Satunnainen järjestys y 4 2 3 2 3 1 4 3 1 4 2 1 4 2 3 A 1, B 1, C 1, D 1 C 2, D 2, A 2, B 2 D 3, A 3, B 3, C 3 B 4, C 4, D 4, A 4 1 A B C D Conc.

Satunnainen järjestys Residuaalit Residues 4 2 3 1 2 3 1 4 3 1 1 4 4 2 2 3 A 1, B 1, C 1, D 1 C 2, D 2, A 2, B 2 D 3, A 3, B 3, C 3 B 4, C 4, D 4, A 4 Liukuma! A B C D Conc.

Huomioitavia muuttujia Säädettävät parametrit Konsentraatio, ph, lämpötila,... Tiedetyt seikat, joihin ei voida vaikuttaa Laitteen ryömiminen,... Tuntemattomat muuttujat, joiden olemassaolo voidaan ennakoida Lähtöaineiden epäpuhtaudet,... Täysin arvaamattomat tekijät

Seulonta Mittaustulokseen vaikuttavat monet seikat, joita voidaan säätää: konsentraatio, ph, lämpötila,... Mitkä näistä ovat tärkeitä ja mitkä voidaan jättää huomiotta (mutta pyritään pitämään niin vakioina kuin mahdollista)? Seulonta: Tärkeiksi arvioiduille suureille valitaan kaksi ääriarvoa suuri (merkintä +1) ja pieni (-1).

Seulonta Kaikki erilaiset kombinaatiot valmistetaan. Niille kaikille mitataan kokeellinen arvo (absorbanssi). Jokaisesta tehdään tietenkin rinnakkaismäärityksiä kokeellisen tarkkuuden määräämiseksi. Erotusta absorbanssi suurilla (+1) miinus pienillä muuttujan arvoilla (-1) verrataan kokeelliseen mittaustarkkuuteen. Näin nähdään mitkä muuttujat ovat tilastollisesti merkittäviä.

Jakautuma X

Jakautuman paikka Keskiarvo (odotusarvo) x, E(x) Moodi Yleisin arvo Mediaani 1 x = N Puolet havainnoista on alapuolella N i= 1 x i

Jakautuman muoto P(X) s X

Jakautuman muoto Alue Suurin arvo - pienin arvo Absoluuttinen keskipoikkeama (MAD) 1/N x i -x Neliöllinen keskipoikkeama (MSD) 1/N (x i - x Varianssi s 2 = 1/(N-1) Hajonta s ) 2 (x i - x ) 2

Näyte versus kaikki Näyte x, s 2 Arvioita Populaatio, Oikeat 2

Kuinka hyvä tulos Näytteen keskiarvo on suureen Kaksi näytettä Kuinka lähellä likiarvo Kaksi eri keskiarvoa :tä näytteen keskiarvo on? X 1 X 3 X X 2 n

Keskiarvon keskivirhe Standard error of mean SE σ = N s N SE E[x]

! Konfidenssirajat Todennäköisyys, että sisällä, on 62 % on rajojen E[x ] ± SE 62 % E[x] SE

$ "# % & Konfidenssirajat Suurempi todennäköisyys, laveammat rajat " rajojen X ± t 0.025 SE sisällä 95 %:n todennäköisyydella; t 0.025 2. 2.5 % + 2.5 % riski tuottaa 95 % konfidenssirajat 2.5 % = 0.025 0.025

' Seulontamalleja Kaksitasomallit, 2 k P-fenyleenidiamiinin (PPD) entsymaattinen hapetus spektrofotometrisesti, vakio enstsyymikonsentraatio 13.6 mg L -1 : Faktori Taso -1 +1 T, C 35 40 ph 4.8 6.4 [PPD], mm 0.5 27.3

2 k -mallit Kombinaatioita on 2 k kappaletta. Se on suuri luku, jos seulottavia muuttujia on useita. Run Coded factor levels T PPD ph 1 +1-1 -1 Point 2 +1 +1-1 3 +1 +1 +1 4 +1-1 +1 5-1 -1-1 6-1 +1-1 7-1 +1 +1 8-1 -1 +1 +1 x 3-1 x 2 +1 x 1 +1

Taguchi-malli L4 (2 3 ) 1 1 1 1 2 2 2 1 2 2 2 1 Neljä koetta kahdeksan sijasta.