2. Mittaus ja data 2.1. Johdanto Mittaustyypit
|
|
- Petri Ketonen
- 9 vuotta sitten
- Katselukertoja:
Transkriptio
1 2. Mittaus ja data 2.. Johdato Voidaksemme keksiä tosimaailma relaatioita tarkastelemme sitä kuvaavaa dataa, jote esiksi selvitämme, mitä data perimmiltää o. Data kerätää kuvaamalla mielekiitoaluee oliot eli etiteetit symbolisiksi esityksiksi joki mittausmeetelmä avulla, joka liittää muuttuja arvo olio aettuu omiaisuutee. Kohteide väliset suhteet esitetää umeerisilla relaatioilla muuttujie välillä. Numeeriset esitykset, data-alkiot, talletetaa datajoukkoo, ja juuri e ovat tiedolouhia subjekteja, iitä, joista jotaki todetaa. Mittausprosessi o keskeie. Sitä tutkitaa luvussa luku 28 Luvussa 2.3. pohditaa kahde kohtee välise etäisyyde käsitettä käyttäe kohteista mitattuja vektoreita.tehdyt raakamittaukset saattavat olla tai olla olematta sopivia suoraa tiedolouhitaa. Luku 2.4. käsittelee suppeasti ee tiedolouhitaa datalle tarvittaessa tehtäviä muuoksia. Kute halutaa välttää data keräystavasta aiheutuvia keiotekoisia vaikutteita, ii samoi o estettävä data määrittely vaikutus mahdolliste löydöste omiaisuuksii. Luvussa 2.5. tarkastellaa suppeasti käsitettä datamalli, sille a priori määrättyä rakeetta. Mikää data ei ole täydellistä. Mittausvirhe, puuttuva data, otosvääristymä, ihimilliset virheet ja muut tekijät pilaavat dataa. Ku tiedolouhiassa etsitää epätavallisia hahmoja, o tärkeää ottaa huomioo uo epätäydellisyydet. Ei haluta perustaa johtopäätöksiä hahmoihi, jotka heijastavat virheitä datakeräyksessä. Luvut 2.6. ja 2.7. käsittelevät laatua tässä mielessä. 2. luku Mittaustyypit Mittauksia tyypitetää iide esitystava tai käytö mukaa. Pohdiskellaa esimerkiomaisesti PAINON (käytetää omiaisuude imessä isoja kirjaimia ja sitä vastaavassa muuttujassa pieiä) mittaamista. Olkoo kohteet kivikokoelma. Kivet ovat järjestettävissä PAINON mukaa. Niitä voitaisii asettaa pareittai vaakakuppeihi ja katsoa, kumpi o paiavampi. Täte voitaisii kulleki määrätä joki luku, joka kuvaisi paiojärjestystä suhteessa toisii. Tällöi luku 2 ei kuitekaa tarkoittaisi, että luvulla 4 merkitty kivi olisi edellise kuvaamaa kivee verrattua kaksikertaie paioltaa. Niipä mikä tahasa mootoie (järjestykse säilyttävä) lukujoo olisi tässä kelvollie. 2. luku 30 Sijoitetaa yksi iso kivi toisee vaakakuppii ja kaksi pietä toisee ii, että vaaka o tasapaiossa. Siis kaksi pietä ovat (yllätyksettömästi) yhde iso paioisia. Voidaa kuvata ämä luvuilla myös ii, että järjestykse lisäksi kahde piee kive lukuje summa o yhtä kui suure lukuarvo. Nytkää lukuesitykset eivät ole yksikäsitteisiä. Esim. pieille luvut 2 ja 3 sekä suurelle 5 toteuttavat tämä, mutta ii toteuttavat myös 4, 6 ja 0 vastaavasti. Numeerie esitys heijastaa tutkittava systeemi empiirisiä omiaisuuksia. Kivie väliset suhteet PAINON tapauksessa vastaavat suhteita mitatu muuttuja paio arvoje välillä. Esitykse ojalla voidaa tehdä päätelmiä fysikaalisesta systeemistä. 2. luku 3
2 Kiviesimerkki käsittää kaksi suhdetta: kivie järjestys ja iide yhdistelyomiaisuus. Muut empiiriset systeemit saattavat sisältää vähemmä tai eemmä kui kaksi suhdetta. Järjestysrelaatio o hyvi tavallie. Jos o vai yksi relaatio, se o järjestys. Esim. lääketieteessä taudeilla o vakavuusasteita. Järjestysrelaatio ei useikaa ole riittävä, sillä mm. omiaisuuksilla HIUSTENVÄRI, USKONTO ja OHJELMOIJAN ASUNTO ei ole luoollista järjestystä. Lukuja voidaa silti käyttää esittämää omiaisuuksie arvoja, kute vaalea =, musta = 2, ruskea = 3 je., mutta aioa empiirie suhde tässä o värie erilaisuus. Eipä tässäkää lukuesitys ole yksikäsitteie. Tätä helposti ogelmia aiheuttavaa yksikäsitteisyyde puutetta o rajoitettava. Kivie tapauksessa yksikertaista olisi käyttää iide paioja paioyksikköiä mitattuia. Mittaustyyppejä voidaa tyypittää säilytettävie empiiriste suhteide perusteella, mutta iitä voidaa kuvata myös muuoste suhtee, jotka johtavat iistä käyttökelpoisee umeerisee esitysmuotoo. Numeerie asteikko o äi aettavissa tautie vakavuusasteikoksi, kuha iide välie järjestys säilytetää, ts. o sovellettava mootoista muuosta. Tällaisia asteikkoja kutsutaa järjestysasteikoiksi. Jos kiviesimerkissä käytettäisii kiville 2, 3 ja 5 muuosta, jolla e kuvattaisiiki arvoilla e 2, e 3 ja e 5, empiirie suhde voitaisii yt kuvata yhtälöllä e 2 e 3 = e 5 käyttäe kertomista. Tosi yhteelasku o yksikertaisempaa suositeltavampi. Koska suhde säilyy täte oikeaa, kysymys o suhdeasteikosta. Hiusteväriä esitettäessä ei lukuje suuruusarvolla ole muuta merkitystä kui, että e erottavat värit toisistaa. Kysymys o omiaaliasteikosta. 2. luku luku 33 O olemassa muitaki asteikkoja riippue soveltuvista muuoksista. Yksi o välimatka-asteikko. Tälle o mahdollista mittayksikö vaihto vakiolla kertomalla tai lisäämällä mielivaltaie vakio. Esimerkkeiä käyvät lämpötila (Celcius ja Fahreheit) ja kaleteriaika. Eri mittausasteikoide perusta o tärkeää tutea, jotta voidaa luottaa tiedolouhiassa löydettyje hahmoje aitoutee. O helppo keksiä esimerkki mm. tautie vakavuustapauksesta, jossa voi erilaisilla umeerisilla esityksillä, mitä tulee vakavuude määrittämisee, päätyä ristiriitaisii päätöksii. Tähä asti o tarkasteltu mittauksia, joide empiirisiä suhteita voidaa kuvata umeerisilla suhteilla. Kaikki mittausmeettelyt eivät sovellu äihi puitteisii. Joskus o luoollisempaa pitää mittausmeettelyä määrittelevää omiaisuutea edellise esittävä sijasta. Esim. ELÄMÄNLAATU lääketieteessä mitataa usei tuistamalla ihimillise elämä tekijät, jotka ovat tärkeitä, ja määrittelemällä keio yhdistää eri tekijöitä vastaavat pisteluvut joteki, kute paiotettua summaa. Tietojärjestelmie kehittämisessä pyritää mittaamaa vaadittua TYÖPANOSTA vastaavasti. 2. luku 34 Mittausmeettelyjä, jotka sekä määrittelevät omiaisuude että mittaavat se, kutsutaa operatioaalisiksi tai ei-esittäviksi. Mittausepätarkkuutta ilmeee moesti. Jos esitetää geometrise yksikköeliö halkaisija pituus arvoa eliöjuuri 2:sta, ei sitä havaita, mutta käytäössä tämä o esitettävä desimaalilukua, kute.4,.4 tai.442 je., mutta esitys ei ole koskaa tarkka arvo. Tiedolouhia sovelluksissa, kute tässä kurssissaki, pärjätää tavallisimmilla asteikkotyypeillä, jotka ovat yksiyhtee-muuokset sallivat luokka-asteikot (omiaaliset), järjestetyt eli ordiaaliset luokka-asteikot ja umeeriset (kvatitatiiviset eli reaaliarvoiset) asteikot. 2. luku 35
3 2.3. Etäisyysmitat Moet tiedolouhiassa sovellettavat meetelmät, kute lähimmä aapuri haku ja klusteroiti, perustuvat samalaisuusmittoihi kohteide välillä. Samalaisuus voidaa saada suoraa kohteista, esim. markkioitikyselyssä voidaa pyytää vastaajaa arvioimaa kohteide samalaisuutta. Se voidaa saada myös epäsuorasti mittausvektoreista tai kohteide kuvauksista esimerkkiä makutesti pyydettäessä testaajilta kuvauksia jäätelöide samakaltaisuuksista. Samalaisuude sijasta voidaa tarkastella myös erilaisuutta. Jos samalaisuus pystytää formaalisti määrittelemää, erilaisuus o johdettavissa siitä ja päivastoi. Olkoo s(i, kohteide samalaisuus ja d(i, erilaisuus. Muuos iide välille voidaa määritellä 2. luku 36 Termiä läheisyys käytetää usei yleistermiä viittaamaa jompaakumpaa edellisistä. Kaksi muuta termiä, etäisyys ja metriikka, liittyvät tähä yhteytee. Etäisyyttä käytetää moesti epäformaalisti, kute euklidisessä etäisyydessä alla, mutta metriikka o erilaisuusmitta, joka täyttää ehdot:. d(i, 0 kaikille i ja j ja d(i, = 0, jos ja vai jos i = j. 2. d(i, = d(j,i) kaikille i ja j d( i, = s( i, tai d( i, = 2( s( i, ). 3. d(i, d(i,k) + d(k, kaikille i, j ja k Kolmas ehto o kolmioepäyhtälö. 2. luku 37 Olkoot kohdetta ja p reaalilukuarvoista mittausta kulleki kohteelle. Havaitovektori i:elle kohteelle o x(i) = (x (i), x 2 (i),, x p (i)), i, missä k:e muuttuja arvo i:elle kohteelle o x k (i). Euklidie etäisyys määritellää i:elle ja j:elle kohteelle seuraavasti. p d ( i, ( ( x ( i) x ( ) 2 ) 2 E = k k k= Tämä mitta olettaa joki astee yhteismitallisuutta eri muuttujie välillä. Niipä voisi olla tehokasta, mikäli kuki muuttuja olisi pituusmitta (p: ollessa 2 tai 3 kysymyksessä o fysikaalie etäisyysmitta) tai paiomitta, jolloi kaikki muuttujat o mitattu samalla yksiköllä. Jos toie muuttuja olisi pituus ja toie paio, ei olisi mitää ilmeistä valitaa yksiköksi. Yksikköä muuttamalla voitaisii muuttujie tärkeyttä muuttaa. Koska moesti muuttujat eivät ole yhteismitallisia, o joteki ylitettävä yksikköje valia mielivaltaisuus. Tavaomaie tapa o stadardoida data jakamalla jokaie muuttuja keskihajoallaa, jolloi muuttujia pidetää yhtä tärkeiä. Keskihajota o k:e muuttuja X k estimaatti 2 ˆ σ ( ( ( ) ) ) 2 k = xk i µ k i= 2. luku luku 39
4 jossa µ k o k:e muuttuja keskiarvo, jota voidaa estimoida (jos tutemato) otoskeskiarvolla xk = xk ( i). i= Näi olle jakamalla muuttuja keskihajoalla poistetaa asteiko vaikutus. Jos o joki käsitys jokaise muuttuja suhteellisesta tärkeydestä, voidaa vastaavasti paiottaa iitä käyttäe seuraavasti paiotettua euklidista mittaa. p d 2 2 WE ( i, = ( wk ( xk ( i) xk ( ) ) k= Sekä euklidie että paiotettu euklidie ovat molemmat additiivisia siiä mielessä, että muuttujat vaikuttavat riippumattomasti etäisyysmittaa. Tämä ei aia ole soveliasta. Esim. mitataa kuppie korkeutta ja halkaisijaa. Käytettäessä yhteismitallisia yksikköjä määriteltäisii kuppie samalaisuus äide mittoje suhtee. Oletetaa, että jokaise kupi korkeus o mitattu 00 kertaa ja halkaisija aioastaa kerra, jolloi muuttujia o 0 ja äistä 00 melkei idettistä arvoa. Jos ämä yhdistetää euklidisella etäisyydellä, korkeus domioi, mitä tulee kuppie samalaisuutee. Kuitekaa 99 korkeusmittauksista eivät mitekää vaikuta siihe, mitä todella halutaa mitata. Ne korreloivat voimakkaasti keskeää vai mittausvirhee erottaessa iitä toisistaa. Täte tarvitaa data ohjaama meetelmä. Stadardoiti kuki muuttuja suhtee ei riitä, vaa otetaa huomioo muuttujie välie kovariassi. 2. luku luku 4 Yleisesti esittäe saadaa p:lle muuttujalle p pkovariassimatriisi, jossa alkio (k,l) o k:e ja l:e muuttuja välie kovariassi. Matriisi o selvästi symmetrie. Otokse kovariassi muuttujie X ja Y välillä o seuraava. Cov( X, Y ) = ( x( i) x)( y( i) y), missä x ja y ovat keskiarvoja i= Kovariassi osoittaa, kuika X ja Y vaihtelevat yhdessä. Sillä o suuria arvoja, jos suuret X: arvot liittyvät suurii Y: arvoihi ja vastaavasti pieet X: arvot pieii Y: arvoihi. Jos suuret X: arvot liittyvät pieii Y: arvoihi, se saa egatiivise arvo. Kovariassi arvo riippuu X: ja Y: arvoalueista. Tämä voidaa poistaa stadardoiilla jakamalla X: arvot keskihajoallaa ja samoi Y: tapauksessa. Tulos o otokse korrelaatiokerroi: (x(i)-x)( y( i) y) ρ( X, Y ) = i= ( ( x( i) x) i= i= ( y( i) y) Nytki saadaa edeltävä kaltaisesti yleisemmässä tapauksessa p:lle muuttujalle p p-korrelaatiomatriisi. 2 2 ) 2 2. luku luku 43
5 Kovariassi ja korrelaatio atavat muuttujie välisiä lieaarisia riippuvuuksia. (Täsmällisesti saoe e ovat itseki lieaarisia.) Tarkasteltaessa datapisteitä, jotka ovat tasaisesti jakautueet ympyrä kaarelle tämä keskipistee ollessa origossa, muuttujat ovat selvästi riippuvia, mutta epälieaarisesti, eikä lieaarisesti, jolloi saadaa korrelaatioksi 0. Palataa kahvikuppiesimerkkii. Voidaa poistaa 00 keskeää korreloiva muuttuja vaikutus sisällyttämällä kovariassimatriisi etäisyysmääritelmää. Tämä johtaa Mahalaobis-etäisyytee kahde p-dimesioise mittaukse x(i) ja x( välillä T d ( i, (( ( i) ( ) ( ( i) ( )) 2 MH = x x x x missä T tarkoittaa traspoosia, o p p-kovariassimatriisi, - stadardoi data suhteessa kovariassimatriisii. Huomattakoo, että vaikka vektoria x(i) o ajateltu vaakarivivektoria matriisissa, sovelletaa matriisialgebra tapaa esittää se p -pystyrivi- eli sarakevektoria. Näi olle siiä o mukaa traspooiti pvektori saamiseksi, jotta kertomie kovariassimatriisi kassa o mahdollista. Lopputulos o skalaariarvo. Matriisi (k,l)-alkio o määritelty muuttujie X k ja X l välillä edellise yhtälö tapaa. Euklidie metriikka o yleistettävissä muuteki. Ilmeie yleistys o Mikovski eli L λ -metriikka p ( λ ( x ( i) x ( ) ) λ k k k= 2. luku luku 45 jossa λ. Tällöi euklidie etäisyys o erikoistapaus λ=2. L - metriikka, imeltää myös Mahatta- tai korttelimetriikka, o seuraava. p xk ( i) xk ( k= Moimuuttujaise biääridata yhteydessä voidaa laskea muuttujat, joille kaksi kohdetta saavat sama tai eri arvo. Taulukossa 2.., jossa kaikki kohteille i ja j määritellyt muuttujat p ovat biäärisiä, alkio,, ku i= ja j=, tarkoittaa, että o, sellaista muuttujaa, joilla sekä i että j ovat arvoja. Tapaus λ ataa metriika L seuraavasti. j = j = 0 max xk ( i) xk ( k i =,,0 Erilaisia metriikoita o useita kvatitatiivisia mittauksia varte, jote vaikeutea voi olla sopiva valita. i = 0 0, 0,0 Taulukko 2.. Kahde biäärimuuttuja ristiiluokitus. 2. luku luku 47
6 Biääridatalle mitataa pikemmi samalaisuutta erilaisuude sijasta. Keties ilmeisi samalaisuude mitta o yksikertaie täsmäyskerroi, + eli iide muuttujie määrä, joille kohteilla o sama arvo, jaettua muuttujie kokoaismäärällä p. Toisiaa tässä eivät käy molemmat osoittaja määrät, vaa vai toie pareista (,) ja (0,0) o mielekäs. Jos esim. muuttujat kuvaavat joki omiaisuude läsäoloa () tai poissaoloa (0), ei välttämättä ole mielekäs tilae, että kummallakaa kohteella ei olisi sitä. Tämä tarkastelu johtaa oheisee Jaccardi kertoimee.,,, ,,0 0,0 0, + + 0, 0,0 2. luku 48 Dice kerroi laajetaa edellistä. Jos (0,0)-täsmäys o epärelevatti, ii epätäsmäyste (0,) ja (,0) tulisi olla täsmäyste (,) ja (0,0) välissä. Täte epätäsmäyste (0,) ja (,0) määrä tulisi jakaa kahdella seuraavasti. 2, Moimuuttujaisella biääridatallaki o useita muita mittoja., Luokkamuuttujille, joilla o kahta eemmä arvoja, aetaa arvo, jos kaksi kohdetta ovat samat, ja 0 muutoi, ilmaiste äide summaa osaa kokoaisarvosta p. Additiivisia etäisyysmittoja voidaa käyttää myös sekamuotoiselle datalle, jolloi mukaa voi olla biäärisiä, luokka- ja kvatitatiivisia muuttujia.,0 0, 2. luku Data muutamie Raakadata ei toisiaa ole kätevimmässä muodossa, jolloi voi olla hyödyllistä muutaa sitä esiprosessoitivaiheessa, ee varsiaista aalyysia. Esim. jos mietitää, että muuttuja Y o muuttuja X eliöfuktio, voimme yrittää joko löytää sopiva X 2 : fuktio tai esi korottaa X eliöö muotoo U = X 2, ja sitte sovittaa fuktio U:hu. Tässä ämä ovat ekvivaletteja meettelyjä, mutta joskus jompikumpi voi olla suoraviivaisempi. Esim. 2.. Muuttuja V kuvassa 2.. o selvästi epälieaari suhteessa muuttujaa V 2. Jos muuetaa käyttäe V 2 : kääteislukua, saadaa V 3 = / V 2. Tämä o lieaari suhde kuva 2.2. mukaa. V 2 V Kuva 2.. Yksikertaie epälieaari kuvaus muuttujie V ja V 2 välillä. 2. luku luku 5
7 V 3 V Kuva 2.2. Edeltävä kuva data yksikertaise muuokse V 2 :sta /V 2 :ee jälkee. Toisiaa jakauma muoto o tärkeä, jolloi sovelias muuos o tarpee. Tavaomaie o mm. logaritmie muuos jakauma ollessa vio, josta saadaa äi alkuperäistä symmetrisempi (usei mielellää lähellä ormaalijakaumaa, jota moet tilastolliset päättelyt edellyttävät). Esim Kuvassa 2.3. muuttujat eivät ole vai epälieaarissa suhteessa toisiisa ähde, vaa V 2 : variassi kasvaa V : kasvaessa. Toisiaa päättely perustuu oletuksee, että variassi ei muutu. Tällaisessa (keiotekoisessa) datassa V 2 : eliöjuurimuuos ataa kuvassa 2.4. esitety data. 2. luku luku 53 V 2 V 3 V Kuva 2.3. Toie yksikertaise epälieaari kuvaus, jossa V 2 : variassi kasvaa V : kasvaessa. V Kuva 2.4. Edeltävä kuva data yksikertaise V 2 : eliöjuurimuuokse jälkee. Nyt V 2 : variassi o jokseeki vakio V : kasvaessa. 2. luku luku 55
8 O kuiteki varottava meemästä muuoksissa liia pitkälle. O varottava, ettei muuoksilla luoda keiotekoisia vaikutuksia (artefakteja) dataa ilmiöitä, joita ei alu peri ollut. Tavalliset muuokset käsittävät eliöjuureottamise, kääteisarvo, logaritmit ja muuttuja korottamise positiivisee kokoaislukupotessii. Jotki meetelmät edellyttävät luokkamuuttujie käyttöä. Tällöi o moesti mahdollista muutaa jatkuvat muuttujat (jotka rajoittuvat jolleki lukuvälille) luokkamuuttujiksi käyttäe sopivia kyyksiä jakamaa lukuväli luokkii (äärimmillää biääriseksi). Tässä hukataa eemmä tai vähemmä iformaatiota alkuperäisee ähde. Toisaalta muuokse ollessa oistuut iformaatio kato o käytäössä piei eikä siitä tule vääristymiä tuloksii. Tämä olemme havaieet hyvi Jorma Laurikkala tutkimuksessa käyttäessämme geeettisistä algoritmia (vaati luokkamuuttujia) säätöje etsimisee lääketieteellisestä datasta. 2. luku Data muoto Datajoukot o esitettävä jossaki muodossa, datamallie tai dataskeemoje mukaa. Yksikertaisimmillaa tämä voidaa esittää jo kuvatulla tavalla datamatriisia, josta myös imitystä taulukko toisiaa käytetää. O usei moia kohdetyyppejä aalysoitavaa. Palkamaksutietokaassa saattaisi olla tietoa sekä työtekijöistä että heidä osastoistaa. Edellisistä olisi mm. imi, työtekijä osasto imi, ikä, palkka ja jälkimmäisistä osasto imi, budjetti ja johtaja. Nämä datamatriisit liittyvät toisiisa sama luokkamuuttuja, osasto imi, kautta. Useita tällaisia matriiseja käsittävää tietojoukkoa kutsutaa moirelaatioiseksi dataksi. 2. luku 57 Moirelaatioie data o kuvattavissa yhdeksi datamatriisiksi tai taulukoksi eri tavoi. Mikää tällaie yksittäie taulukko ei kuitekaa parhaite kokoa iformaatiota moirelaatioisesta tietojoukosta. Lisäksi se voi olla muistitilakäytö kaalta huoo ratkaisu, koska voi olla rusaasti redudattia dataa. Jotki tietojoukot eivät sovi hyvi matriisimuotoo. Tällaie o aikasarja, esim. sigaali, jossa peräkkäiset arvot vastaavat aja mukaa otettuja mittauksia. Aikasarja o esitettävissä kahdella muuttujalla, ajalla ja tätä vastaavalla mittausarvolla. Tämä esitetää vektoria, koska alkioilla o olemassa selvä aja määrittelemä järjestys. Merkkijoo o äärellise aakkosto symbolie joo tai sekvessi. Luokkamuuttuja arvoje sekvessi o merkkijoo, samoi luoollise kiele teksti, jossa arvot ovat kirjaimia, välimerkkejä tai välilyötejä. Proteiiit ja DNA- tai RNAsekvessit ovat toie esimerkki (proteiiit sisältävät muutaki tietoa, ovat siis kolmiulotteise avaruude raketeita). Merkkijoo o järjestetty, jolle matriisiesitysmuoto ei yleesä sovellu. Järjestetty datatyyppi o tapahtumajoo. Ku käytettävissä o äärellie aakkosto luokkatapahtumatyyppejä, tapahtumajoo tai sekvessi muodostuu pareista {tapahtuma, tapahtumaaika}. Tämä muistuttaa merkkijooa, mutta kuki alkio o liitetty ajakohtaa. Esimerkkiä o tietoliiketee tapahtumalogi, joka sisältää ajakohda jokaise tapahtuma kohdalla. 2. luku luku 59
9 2.6. Yksittäiste mittauste data laatu Spatiaalie tai kuvadata o kaksi- tai kolmiulotteista, ku taas järjestetty soveltuu yksiulotteisea (yksittäistä muuttujaa kohti). Hierarkkie rakee o edellisiä moimutkaisempi datamalli. esim. laste datajoukko voisi olla ryhmitetty koululuokiksi,, ämä vuosiluokiksi, jotka ovat kouluittai kuissa je. Tiedolouhia sovelluksessa o tärkeää olla tietoie datamallista, muute helposti hukkaa data tärkeitä hahmoja tai erehtyy muilla tavoi. Tiedolouhia vaikuttavuus riippuu oleaisesti data laadusta. Tuettuha o saota roskaa sisää, roskaa ulos (garbage i, garbage out). Laatu määritellää tässä yleesä kahdella tavalla, yksittäiste tietueide laatua tai koko tietojouko laatua, joista tarkastellaa aluksi edeltävää. Mikää mittausmeettely ei ole vapaa virheistä. Mahdolliset virhelähteet ovat ehtymättömät. Niitä voivat olla ihimillie huolimattomuus, istrumetoitivirheet ja riittämätö määrittely sille, mitä mitataa. Mittausistrumetit voivat saada aikaa kahdelaisia virheitä, epätäsmällisyyttä ja epätarkkuutta. 2. luku luku 6 Tilastollisesti ilmaiste ero toistettuje mittauste keskiarvo ja todellise arvo välillä o mittausmeetelmä harha. Täsmällie mittausmeettely o sellaie, jossa o piei vaihtelevuus (usei variassi mukaa määritelty). Käytettäessä täsmällistä meettelyä saadaa kohteelle hyvi samalaisia arvoja vakaissa olosuhteissa. (Tätä ei tulkita tässä kurssissa mm. lukutarkkuudeksi, mikä erheellise kuva helposti voi saada umeerisia tuloksia atavista ohjelmatuotteista.) Tarkka mittausmeettely käsittää sekä piee vaihtelevuude että lähellä todellista arvoa oleva mittausarvo. Mittaus voi olla täsmällie, mutta epätarkka. Esim. hekilö paio mitattua vaatteet, kegät, käykkä ja selkäreppu päällä voi olla täsmällie, mutta se lieee kaukaa siitä, mikä saataisii mitattaessa hekilö vai uimapuku päällä. 2. luku 62 Todellie arvo liittyy tarkkuutee, mutta käsite voi olla liukuva. Jos mitataa esim. hekilö pituutta pyrkie hyvi tarkkaa mittauksee, voidaa havaita häe oleva yö levo jälkee hivee pidempi kui päivä pystyaseossa viettämise jälkee paiovoima vuoksi. Myös astroauttie o todettu veyvä (tilapäisesti) pituutta avaruudessa oleskelu aikaa. Mitattaessa jotaki vähemmä eksaktia muuttujaa, esim. sosiaalista seikkaa, voi tällaise perimmäise todellise arvo kyseealaistaa. Muitaki termejä o käytössä. Mittausmeettely luotettavuus o sama kui se täsmällisyys. Paikkasapitävyys eli validiteetti o sama kui tarkkuus. 2. luku 63
10 2.7. Tietojoukkoje laatu Yksittäiste havaitoje laadu ohella myös kokoaise tietojouko laatua o valvottava. Tilastotieteellie klassie kysymys o tehdä otata ii, että otos edustaa mielekkäästi koko se lähtöpopulaatiota, perusjoukkoa. Tällöi mm. otokse keskiarvoa voidaa käyttää estimoimaa perusjouko keskiarvoa. Estimaatit ovat hyödyllisiä vai, jos e ovat tarkkoja. Mikäli epätarkkuutta esiityy, toise otokse käyttö voisi ataa merkittävästi erilaise estimaati arvo. Tarkastellaa esimerkkiä Tamperee asukkaide paioja. Jos otamme otokse tietojekäsittelyopi opiskelijoista, keskiarvo estimaatti o tällöi epäluotettava mitä ilmeisimmi. 2. luku 64 Sukupuolijakauma tietojekäsittelyopi opiskelijoissa o sage vio, miehiä ehkä. 80 %. Tällöi keskipaio estimaatti olisi selvästi epätarkka. Myös ikäjakauma olisi yksipuolie, hyvi vähä opiskelijoita ikäryhmä [8,50] vuotta ulkopuolella, jote ei auttaisi värvätä esim. kielteopiskelijoita testiryhmää. Harha pysyisi estimaatissa melko todeäköisesti. Eustavie meetelmie epäoistumie voi usei johtua siitä, ettei ole kyetty ottamaa huomioo populaatiomuutosta aja mittaa. Esim. tiety kaupa asiakkaide kulutustottumukset saattavat aja kuluessa muuttua sosiaalise kulttuuri muuttuessa. Moesti koko tietojoukkoa, populaatiota, ei voida tarkastella täydellisesti tämä valtava koo vuoksi. Täte otaa suorittamie luotettavasti o tähdellistä (pohditaa luvussa 4). 2. luku 65 Otokse vääristymä o ähtävissä epätäydellise tiedo erikoistapauksea. Kokoaisia tietueita voi puuttua muute edustavasta otoksesta. Dataa voi puuttua muullaki tavoi. Tietueide yksittäiset ketät (muuttujat) voivat käsittää puuttuvia arvoja. Tavallaa tämä o edeltävää ogelmaa hivee helpompaa, koska tässä setää tiedetää tiedo puuttumie. Epätäydellisestä tiedosta voi kuiteki sytyä merkittäviä haittoja tiedolouhia kaalta. Sellaie lähestymistapa o kuiteki turvallie, jos o mahdollie, että käytetää tietojoukosta aioastaa täydellisiä osia. Poikkeavie havaitoje tai aomalioide tilae o yksi kysymys data laadu yhteydessä. Toisiaa tiedolouhia tehtävä o löytää aomalioita. Viatuistuksessa eemmistöstä poikkeavat tietueet ovat kiiostavia. Käytetää tällöi hahmotuistusmeetelmiä (luku 6 ja 3). Jos toisaalta tavoitteea o globaali malli kehittämie, poikkeavat havaiot saattavat harhauttaa mallissa. Havaioitaessa aioastaa yhtä muuttujaa poikkeavat havaiot o helppo löytää histogrammilla eli pylväsdiagrammilla. Pisteet, jotka ovat kaukaa muista, paljastuvat hätiä. Tilae o kuvattua haasteellisempi usea muuttuja vaikuttaessa yhtä aikaa. Tällöi yksittäiste muuttujie arvot voivat olla aiva kelvollisia, mutta iide yhteisvaikutus tuottaa poikkeava havaio. Esimerkkiä o kuva 2.5. Jos tällaie esiityy vasta moe muuttaja yhteisvaikutuksea, algoritmie lasketa (tietokoe) o välttämätötä. 2. luku luku 67
11 Y Kuva 2.5. Varsi hyvä korrelaatio kaksimuuttujaista dataa, jossa esiityy yksi selkeä poikkeava havaito. X 2. luku 68
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Luennot, osa II
Otokset MS-A050 Todeäköisyyslaskea ja tilastotietee peruskurssi Lueot, osa II Kaksi hyödyllista jakaumaa 3 Estimoiti G. Gripeberg 4 Luottamusvälit Aalto-yliopisto. helmikuuta 05 5 Hypoteesie testaus 6
Tilastolliset menetelmät: Tilastolliset testit
Tilastolliset meetelmät Tilastolliset testit Tilastolliset meetelmät: Tilastolliset testit 8. Tilastollie testaus 9. Testejä suhdeasteikollisille muuttujille. Testejä järjestysasteikollisille muuttujille.
Sormenjälkimenetelmät
Sormejälkimeetelmät Matti Risteli mristeli@iksula.hut.fi Semiaariesitelmä 23.4.2008 T-106.5800 Satuaisalgoritmit Tietotekiika laitos Tekillie korkeakoulu Tiivistelmä Sormejälkimeetelmät ovat satuaisuutta
n = 100 x = 0.6 99%:n luottamusväli µ:lle Vastaus:
1. Tietyllä koeella valmistettavie tiivisterekaide halkaisija keskihajoa tiedetää oleva 0.04 tuumaa. Kyseisellä koeella valmistettuje 100 rekaa halkaisijoide keskiarvo oli 0.60 tuumaa. Määrää 95%: ja 99%:
Epäyhtälöoppia matematiikkaolympialaisten tehtäviin
Epäyhtälöoppia matematiikkaolympialaiste tehtävii Jari Lappalaie ja Ae-Maria Ervall-Hytöe 0 Johdato Epäyhtälöitä reaaliluvuille Cauchy epäyhtälö Kaikille reaaliluvuille a, a,, a ja b, b,, b pätee Cauchy
TILASTOT: johdantoa ja käsitteitä
TILASTOT: johdatoa ja käsitteitä TOD.NÄK JA TILASTOT, MAA10 Tilastotietee tehtävää o esittää ja tulkita tutkimuskohteesee liittyvää havaitoaieistoa eli tilastoaieistoa. Tutkitaa valittua joukkoa ja se
Solmu 3/2010 1. toteutuu kaikilla u,v I ja λ ]0,1[. Se on aidosti konveksi, jos. f ( λu+(1 λ)v ) < λf(u)+(1 λ)f(v) (2)
Solmu 3/200 Epäyhtälöistä, osa 2 Markku Halmetoja Mätä lukio Välillä I määriteltyä fuktiota saotaa koveksiksi, jos se kuvaaja o alaspäi kupera, eli jos kuvaaja mitkä tahasa kaksi pistettä yhdistävä jaa
Valvontakortit. Sovelletun Matematiikan Erikoistyö. Pastinen Tommi 23.4.2010
Valvotakortit Sovelletu Matematiika Erikoistyö Pastie Tommi 3.4. Tässä työssä perehdytää valvotakortteihi tilastollisessa laaduvalvoassa perusteoria ja esimerkkitapauste kautta. Sisältö Johdato... 3 Tilastollisesta
Äärettämän sarjan (tai vain sarjan) sanotaan suppenevan eli konvergoivan, jos raja-arvo lims
75 4 POTENSSISARJOJA 4.1 ÄÄRETTÖMÄT SARJAT Lukujoo { a k } summaa S a a a a a k 0 1 k k0 saotaa äärettömäksi sarjaksi. Summa o s. osasumma. S a a a a a k 0 1 k0 Äärettämä sarja (tai vai sarja) saotaa suppeeva
Tilastollinen todennäköisyys
Tilastollie todeäköisyys TOD.NÄK JA TILASTOT, MAA10 Klassisessa todeäköisyydessä oli ehdot: äärellisyys ja symmetrisyys. Tämä tilae o usei mahdoto ts. alkeistapauksia o usei ääretö määrä tai e eivät ole
4.3 Signaalin autokorrelaatio
5 4.3 Sigaali autokorrelaatio Sigaali autokorrelaatio kertoo kuika paljo sigaali eri illä korreloi itsesä kassa (josta imiki). Se o Fourier-muuokse ohella yksi käyttökelpoisimmista sigaalie aalysoitimeetelmistä.
Kaksiulotteinen normaalijakauma Mitta-asteikot Havaintoaineiston kuvaaminen ja otostunnusluvut
Mat-2.09 Sovellettu todeäköisyyslasku /Ratkaisut Aiheet: Kaksiulotteie ormaalijakauma Mitta-asteikot Havaitoaieisto kuvaamie ja otostuusluvut Avaisaat: Ehdollie jakauma, Ehdollie odotusarvo, Ehdollie variassi,
Stokastiikan perusteet Harjoitukset 1 (Todennäköisyysavaruus, -mitta ja -funktio) 2.11.2015
Stokastiika perusteet Harjoitukset (Todeäköisyysavaruus, -mitta ja -fuktio) 2..205. Määritä potessijoukko 2,ku (a) {0, } (b) {(0, ]} ja ku (c) (0, ]. Ratkaisu: (a) 2 {;, {0}, {}, {0, }} (b) 2 {;, {(0,
LIITTEET Liite A Stirlingin kaavan tarkkuudesta...2. Liite B Lagrangen kertoimet...3
LIITTEET... 2 Liite A Stirligi kaava tarkkuudesta...2 Liite B Lagrage kertoimet... 2 Liitteet Liitteet Liite A Stirligi kaava tarkkuudesta Luoollista logaritmia suureesta! approksimoidaa usei Stirligi
Normaalijakaumasta johdettuja jakaumia. Normaalijakaumasta johdettuja jakaumia. Normaalijakaumasta johdettuja jakaumia: Mitä opimme?
TKK (c) Ilkka Melli (4) Johdato Johdatus todeäköisyyslasketaa TKK (c) Ilkka Melli (4) : Mitä opimme? / Tutustumme tässä luvussa seuraavii ormaalijakaumasta (ks. lukua Jatkuvia jakaumia) johdettuihi jakaumii:
Otantajakauma. Otantajakauman käyttö päättelyssä. Otantajakauman käyttö päättelyssä
Otatajakauma kuvaa tarkasteltava parametri jakauma eri otoksista laskettua parametria o joki yleesä tuusluku, esim. keskiarvo, suhteellie osuus, riskisuhde, korrelaatiokerroi, regressiokerroi, je. parametria
EX1 EX 2 EX =
HY, MTL / Matemaattiste tieteide kadiohjelma Todeäköisyyslasketa IIb, syksy Harjoitus Ratkaisuehdotuksia Tehtäväsarja I. Olkoot X ja X riippumattomia satuaismuuttujia, joille ja olkoo X EX, EX, var X,
SMG-4200 Sähkömagneettisten järjestelmien lämmönsiirto Ehdotukset harjoituksen 6 ratkaisuiksi
SMG-400 Sähkömageettiste järjestelmie lämmösiirto Ehdotukset harjoitukse 6 ratkaisuiksi Tarkastellaa suljetu järjestelmä tehotasaaioa joka o P + P P = P i g out st Oletetaa että verkotetussa alueessa jossa
HY, MTL / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIb, syksy 2018 Harjoitus 3 Ratkaisuehdotuksia.
HY, MTL / Matemaattiste tieteide kadiohjelma Todeäköisyyslasketa IIb, syksy 08 Harjoitus 3 Ratkaisuehdotuksia Tehtäväsarja I Olkoot X ja X riippumattomia satuaismuuttujia, joille ja olkoo X EX, EX, var
Harjoitustehtävien ratkaisuja
3. Mallitamie lukujooje avulla Lukujoo määritelmä harjoituksia Harjoitustehtävie ratkaisuja 3. Laske lukujoo viisi esimmäistä jäsetä, ku a) a 6 ja b) a 6 ja 3 8 c) a ja 3 a) 6,, 8, 4, 30. b) 8,, 6, 0,
Johdatus tilastotieteeseen Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2004) 1
Johdatus tilastotieteesee Otos ja otosjakaumat TKK (c) Ilkka Melli (004) 1 Otos ja otosjakaumat Yksikertaie satuaisotos Otostuusluvut ja otosjakaumat Aritmeettise keskiarvo otosjakauma Otosvariassi otosjakauma
Mat-2.091 Sovellettu todennäköisyyslasku. Tilastolliset testit. Avainsanat:
Mat-.090 Sovellettu todeäköiyylaku A 0. harjoituket Mat-.09 Sovellettu todeäköiyylaku 0. harjoituket / Ratkaiut Aiheet: Avaiaat: Tilatolliet tetit Aritmeettie kekiarvo, Beroulli-jakauma, F-jakauma, F-teti,
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todeäköisyyslaskea ja tilastotietee peruskurssi 4A Satuaisotata ja parametrie estimoiti Lasse Leskelä Matematiika ja systeemiaalyysi laitos Perustieteide korkeakoulu Aalto-yliopisto Syksy 2016,
Osa 2: Otokset, otosjakaumat ja estimointi
Ilkka Melli Tilastolliset meetelmät Osa : Otokset, otosjakaumat ja estimoiti Otokset ja otosjakaumat TKK (c) Ilkka Melli (007) 1 Otokset ja otosjakaumat >> Satuaisotata ja satuaisotokset Otostuusluvut
Tunnuslukuja 27 III TUNNUSLUKUJA
Tuuslukuja 27 III TUNNUSLUKUJA Tuuslukuja 28 Tuuslukuja käytetää, ku tilastoaieistoa havaiollistetaa tiivistetysti yksittäisillä luvuilla. Tuusluvut lasketaa muuttujie arvoje perusteella ja e kuvaavat
Otantajakauman käyttö päättelyssä
Keskiarvo otatajakauma Toisistaa tietämättä kaksi tutkijaa tutkii samaa ilmiötä, jossa perusjoukko koostuu kuudesta tutkittavasta ja tarkoituksea o laskea keskiarvo A: Kokoaistutkimus B: Otatatutkimus
3 10 ei ole rationaaliluku.
Harjoitukset / 011 RATKAISUT Lukuteoria 1. Etsi Eratostheee seulalla samatie kaikki lukua 400 pieemmät alkuluvut. (Tai ohjelmoi tietokoeesi etsimää paljo lisää.) Kirjoita rivii kaikki luvut 1-00. Poista
Sisältö. Kvantitatiivinen metodologia verkossa. Monitasomallintaminen. Monitasomallit. Regressiomalli dummy-muuttujilla.
Kvatitatiivie metodologia verkossa Moitasomallius Pekka Ratae Helsigi yliopisto isältö Moitasomallit Matemaattisia peruskäsitteitä Esimerkki kovariassista Otatavirhe Esimerkki elittävie muuttujie lisäämie
Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille. Testit järjestysasteikollisille muuttujille: Esitiedot
TKK (c Ilkka Melli (004 Johdatus tilastotieteesee TKK (c Ilkka Melli (004 : Mitä opimme? Tarkastelemme tässä luvussa seuraavia järjestysasteikolliste muuttujie testejä: ja merkkitesti parivertailuille
Johdatus tilastotieteeseen Otos ja otosjakaumat. TKK (c) Ilkka Mellin (2005) 1
Johdatus tilastotieteesee Otos ja otosjakaumat TKK (c) Ilkka Melli (005) 1 Otos ja otosjakaumat Yksikertaie satuaisotos Otostuusluvut ja otosjakaumat Aritmeettise keskiarvo ja otosvariassi otosjakaumat
1. (Jatkoa Harjoitus 5A tehtävään 4). Monisteen esimerkin mukaan momenttimenetelmän. n ne(y i Y (n) ) = 2E(Y 1 Y (n) ).
HY / Matematiika ja tilastotietee laitos Tilastollie päättely II, kevät 018 Harjoitus 5B Ratkaisuehdotuksia Tehtäväsarja I 1. (Jatkoa Harjoitus 5A tehtävää ). Moistee esimerki 3.3.3. mukaa momettimeetelmä
S Laskennallinen systeemibiologia
S-4250 Laskeallie systeemibiologia Harjoitus Mittaustuloksea o saatu havaitoparia (x, y ),, (x, y ) Muuttuja y käyttäytymistä voidaa selittää muuttuja x avulla esimerkiksi yksikertaise lieaarise riippuvuude
Johdatus tilastotieteeseen Yhden selittäjän lineaarinen regressiomalli. TKK (c) Ilkka Mellin (2005) 1
Johdatus tilastotieteesee Yhde selittää lieaarie regressiomalli TKK (c) Ilkka Melli (2005) Yhde selittää lieaarie regressiomalli Yhde selittää lieaarie regressiomalli a sitä koskevat oletukset Yhde selittää
9.7 Matriisinormit. Vaasan yliopiston julkaisuja 225. Ei siis lainkaan ongelmia defektiivisyydestä.
Vaasa yliopisto julkaisuja 225 U = 0.1213-0.9359-0.3307-0.1005-0.3430 0.9339 0.9875 0.0801 0.1357 S = V = >> 4.5221 0 0 0 2.2793 0 0 0 1.1642 0.0537-0.8212-0.5681 0.4414-0.4908 0.7512 0.8957 0.2911-0.3361
Tehtäviä neliöiden ei-negatiivisuudesta
Tehtäviä epäyhtälöistä Tehtäviä eliöide ei-egatiivisuudesta. Olkoo a R. Osoita, että 4a 4a. Ratkaisu. 4a 4a a) a 0 a ) 0.. Olkoot a,, R. Osoita, että a a a. Ratkaisu. Kerrotaa molemmat puolet kahdella:
8. laskuharjoituskierros, vko 11, ratkaisut
Mat-2.091 Sovellettu todeäköisyyslasku, kevät -05 Heliövaara, Palo, Melli 8. laskuharjoituskierros, vko 11, ratkaisut D1. Oletetaa, että havaiot X i, i = 1, 2,..., 100 muodostavat yksikertaise satuaisotokse
Tilastollinen päättely II, kevät 2017 Harjoitus 3B
Tilastollie päättely II, kevät 7 Harjoitus 3B Heikki Korpela 3. maaliskuuta 7 Tehtävä. Jatkoa harjoitukse B tehtävii -3. Oletetaa, että x i c kaikilla i, ku c > o vakio. Näytä, että ˆβ, T ja T ovat tarketuvia.
Kertaa tarvittaessa induktiota ja rekursiota koskevia tietoja.
MATEMATIIKAN JA TILASTOTIETEEN LAITOS Aalyysi I Harjoitus 5. 0. 2009 alkavalle viikolle Ratkaisuehdotuksia ( sivua) (Rami Luisto) Laskuharjoituksista saa pistettä, jos laskettu vähitää 50 tehtävää; 3 pistettä,
Esimerkki 2 (Kaupparatsuongelma eli TSP)
10 Esimerkki 2 (Kaupparatsuogelma eli TSP) Kauppamatkustaja o kierrettävä kaupukia site, että hä lähtee kaupugista 1 ja palaa sie sekä käy jokaisessa muussa kaupugissa täsmällee kerra. Matka kaupugista
Mat-2.104 Tilastollisen analyysin perusteet. Testit suhdeasteikollisille muuttujille. Avainsanat:
Mat-.04 Tilastollise aalyysi perusteet / Ratkaisut Aiheet: Avaisaat: Testit suhdeasteikollisille muuttujille Hypoteesi, Kahde riippumattoma otokse t-testit, Nollahypoteesi, p-arvo, Päätössäätö, Testi,
Diskreetin Matematiikan Paja Ratkaisuja viikolle 4. ( ) Jeremias Berg. n(n + 1) 2. k =
Diskreeti Matematiika Paja Ratkaisuja viikolle 4. (7.4-8.4) Jeremias Berg. Osoita iduktiolla että k = ( + ) Ratkaisu: Kute kaikissa iduktiotodistuksissa meidä täytyy siis osoittaa asiaa. Ns. perustapaus,
1 Eksponenttifunktion määritelmä
Ekspoettifuktio määritelmä Selvitimme aikaisemmi tällä kurssilla, millaie potessisarja säilyy derivoiissa muuttumattomaa. Se perusteella määritellää: Määritelmä. Ekspoettifuktio exp : R R määritellää lausekkeella
Seuraavat peruslauseet 1-8 voidaan helposti todistaa integraalin määritelmästä. Integroimisjoukko R oletetaan rajoitetuksi Jordanmitalliseksi
Laaja matematiikka 5 Kevät 200 2. Itegraali omiaisuuksia Seuraavat peruslauseet -8 voidaa helposti todistaa itegraali määritelmästä. Itegroimisjoukko oletetaa rajoitetuksi Jordamitalliseksi joukoksi. Lause
Matematiikan tukikurssi
Matematiika tukikurssi Kurssikerta 1 Iduktiotodistus Iduktiotodistukse logiikka Tutkitaa tapausta, jossa haluamme todistaa joki väittee P() site, että se pätee kaikilla luoollisissa luvuilla. Eli halutaa
= true C = true) θ i2. = true C = false) Näiden arvot löydetään kuten edellä Kun verkko on opetettu, niin havainto [x 1
35 Naiivi Bayes Luokkamuuttua C o Bayes-verko uuri a attribuutit X i ovat se lehtiä Naiivi oletus o, että attribuutit ovat ehdollisesti riippumattomia toisistaa aettua luokka Ku käytössä o Boole muuttuat,
2.5. Eksponenttifunktio ja eksponenttiyhtälöt
Eksoettifuktio ja -htälöt Eksoettifuktio ja eksoettihtälöt Ku otessi käsitettä laajeetaa sallimalla eksoetille muitaki arvoja kui kokoaislukuja, tämä taahtuu ii, että ii saotut otessikaavat ovat voimassa,
10 Kertolaskusääntö. Kahta tapahtumaa tai satunnaisilmiötä sanotaan riippumattomiksi, jos toisen tulos ei millään tavalla vaikuta toiseen.
10 Kertolaskusäätö Kahta tapahtumaa tai satuaisilmiötä saotaa riippumattomiksi, jos toise tulos ei millää tavalla vaikuta toisee. Esim. 1 A = (Heitetää oppaa kerra) ja B = (vedetää yksi kortti pakasta).
Lasketaan kullekin a euron maksuerälle erikseen, kuinka suureksi erä on n vuodessa kasvanut:
Varsi arkiäiväisiä, geometrise joo teoriaa liittyviä käytäö sovellutuksia ovat jaksottaisii maksuihi ja kuoletuslaiaa (auiteettilaiaa) liittyvät robleemat. Tällaisii joutuu lähes jokaie yhteiskutakeloie
Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat Konvergenssikäsitteet ja raja arvolauseet
Ilkka Melli Todeäköisyyslasketa Osa 2: Satuaismuuttujat ja todeäköisyysjakaumat Kovergessikäsitteet ja raja arvolauseet TKK (c) Ilkka Melli (2006) 1 Kovergessikäsitteet ja raja arvolauseet >> Kovergessikäsitteitä
4.7 Todennäköisyysjakaumia
MAB5: Todeäöisyyde lähtöohdat.7 Todeäöisyysjaaumia Luvussa 3 Tuusluvut perehdyimme jo jaauma äsitteesee yleesä ja ormaalijaaumaa vähä taremmi. Lähdetää yt tutustumaa biomijaaumaa ja otetaa se jälee ormaalijaauma
Digitaalinen signaalinkäsittely Signaalit, jonot
Digitaalie sigaalikäsittely Sigaalit, joot Teemu Saarelaie, teemu.saarelaie@kyamk.fi Lähteet: Ifeachor, Jervis, Digital Sigal Processig: A Practical Approach H.Huttue, Sigaalikäsittely meetelmät, Opitomoiste,
Matematiikan tukikurssi
Matematiika tukikurssi Kurssikerta 3 1 Lisää iduktiota Jatketaa iduktio tarkastelua esimerki avulla. Yritetää löytää kaava : esimmäise (positiivise) parittoma luvu summalle eli summalle 1 + 3 + 5 + 7 +...
Mat-2.090 Sovellettu todennäköisyyslasku A
Mat-.090 Sovellettu todeäköiyylaku A Mat-.090 Sovellettu todeäköiyylaku A / Ratkaiut Aiheet: Avaiaat: Tilatollite aieito keräämie ja mittaamie Tilatollite aieitoje kuvaamie Oto ja otojakaumat Aritmeettie
Insinöörimatematiikka IA
Isiöörimatematiikka IA Harjoitustehtäviä. Selvitä oko propositio ( p q r ( p q r kotradiktio. Ratkaisu: Kirjoitetaa totuustaulukko: p q r ( p q r p q r ( p q r ( p q r 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Kuluttajahintaindeksi (KHI) Kuluttajahintaindeksi (KHI) Kysymys Miten mitata rahan arvon muutoksia?
Kuluttajahitaideksi (KHI) Kysymys Mite mitata raha arvo muutoksia? Kuluttajahitaideksi (KHI) o sovittu kulutustavaroide ja palveluide hitakehitykse mittari. KHI muodostetaa paiotettua keskiarvoa eri pääryhmie
Markov-ketjun hetkittäinen käyttäytyminen
Matematiika ja systeemiaalyysi laitos 1B Markov-ketju hetkittäie käyttäytymie Tämä harjoitukse tavoitteea o oppia muodostamaa Markov-malleja satuaisilmiöille, piirtämää tiettyä siirtymämatriisia vastaava
Mat Tilastollisen analyysin perusteet, kevät 2007
Mitä tilastotiede o? Mat-.04 Tilastollise aalyysi perusteet, kevät 007. lueto: Johdato Tilastotiede kehittää ja soveltaa meetelmiä: reaalimaailma ilmiöistä johtopäätökset ilmiöitä kuvaavie tietoje perusteella
T Datasta tietoon, syksy 2005 Laskuharjoitus 8.12., ratkaisuja Jouni Seppänen
T-1.1 Datasta tietoo, syksy 5 Laskuharjoitus.1., ratkaisuja Joui Seppäe 1. Simuloidaa tasoittaista algoritmia. Esimmäisessä vaiheessa ehdokkaia ovat kaikki yhde muuttuja joukot {a}, {b}, {c} ja {d}. Aaltosulkeide
Tilastollinen päättömyys, kevät 2017 Harjoitus 5b
Tilastollie päättömyys, kevät 07 Harjoitus b Heikki Korpela 3. helmikuuta 07 Tehtävä. a Olkoot Y,..., Y Bθ. Johda uskottavuusosamäärä testisuuree ry, Waldi testisuuree wy ja Rao pistemäärätestisuuree uy
MATP153 Approbatur 1B Harjoitus 1, ratkaisut Maanantai
MATP53 Approbatur B Harjoitus, ratkaisut Maaatai..05. (Lämmittelytehtävä.) Oletetaa, että op = 7 tutia työtä. Kuika mota tutia Oili Opiskelija työsketelee itseäisesti kurssilla, joka laajuus o 4 op, ku
Ryhmän osajoukon generoima aliryhmä ja vapaat ryhmät
Ryhmä osajouko geeroima aliryhmä ja vapaat ryhmät LuK-tutkielma Joose Heioe Matemaattiste tieteide tutkito-ohjelma Oulu yliopisto Kevät 2017 Sisältö Johdato 2 1 Ryhmät ja aliryhmät 2 1.1 Ryhmä.................................
Osa 2: Otokset, otosjakaumat ja estimointi
Ilkka Melli Tilastolliset meetelmät Osa 2: Otokset, otosjakaumat ja estimoiti Estimoitimeetelmät TKK (c) Ilkka Melli (2007) Estimoitimeetelmät >> Todeäköisyysjakaumie parametrie estimoiti Suurimma uskottavuude
pq n s n Kyllä Ei N Jäsenyys 5,4% 94.6 % 1500 Adressi 21,6% 78.4 % 1495 Lahjoitus 23,7% 76.3 % 1495 Mielenosoitus 1,1% 98.9 % 1489
Perusjoukko ja otos Kvatitatiiviset meetelmät Sami Fredriksso Yleie valtio-oppioppi Havaitoyksikkö o empiirise mittaukse kohde Perusjoukko o kaikkie havaitoyksiköide muodostama kokoaisuus Otos o perusjoukkoa
Mat Sovellettu todennäköisyyslasku A. Otos- ja otosjakaumat Estimointi Estimointimenetelmät Väliestimointi. Avainsanat:
Mat-.090 Sovellettu todeäköisyyslasku A Mat-.090 Sovellettu todeäköisyyslasku A / Ratkaisut Aiheet: Avaisaat: Otos- ja otosjakaumat Estimoiti Estimoitimeetelmät Väliestimoiti Aritmeettie keskiarvo, Beroulli-jakauma,
( ) k 1 = a b. b 1) Binomikertoimen määritelmän mukaan yhtälön vasen puoli kertoo kuinka monta erilaista b-osajoukkoa on a-joukolla.
Kombiatoriikka, kesä 2010 Harjoitus 2 Ratkaisuehdotuksia (RT) (5 sivua) Käytä tehtävissä 1-3 kombiatorista päättelyä. 1. Osoita, että kaikilla 0 b a pätee ( ) a a ( ) k 1 b b 1 kb Biomikertoime määritelmä
Yhden selittäjän lineaarinen regressiomalli
Ilkka Melli Tilastolliset meetelmät Osa 4: Lieaarie regressioaalyysi Yhde selittäjä lieaarie regressiomalli TKK (c) Ilkka Melli (007) Yhde selittäjä lieaarie regressiomalli >> Yhde selittäjä lieaarie regressiomalli
Ehdollinen todennäköisyys
Ehdollie todeäköisyys Kerrataa muutama todeäköisyyslaskea laskusäätö. Tapahtuma E komplemettitapahtuma E o "E ei tapahdu". Koska todeäköisyyksie summa o 1, P ( E = 1 P (E. Joskus o helpompi laskea komplemettitapahtuma
Luento 7 Luotettavuus Koherentit järjestelmät
Lueto 7 Luotettavuus Koheretit järjestelmät Ja-Erik Holmberg Systeemiaalyysi laboratorio Aalto-yliopisto perustieteide korkeakoulu PL 00, 00076 Aalto ja-erik.holmberg@riskpilot.fi Määritelmä Tarkasteltava
2 avulla. Derivaatta on nolla, kun. g( 3) = ( 3) 2 ( 3) 5 ( 3) + 6 ( 3) = 72 > 0. x =
TAMMI PYRAMIDI NUMEERISIA JA ALGEBRALLISIA MENETELMIÄ PARITTOMAT RATKAISUT 7 Tiedosto vai hekilökohtaisee käyttöö. Kaikelaie sisällö kopioiti kielletty. a) g( ) = 5 + 6 Koska g o eljäe astee polyomi, ii
Luento 6 Luotettavuus Koherentit järjestelmät
Lueto 6 Luotettavuus Koheretit järjestelmät Ja-Erik Holmberg Systeemiaalyysi laboratorio PL 00, 00076 Aalto ja-erik.holmberg@riskpilot.fi ja-erik.holmberg@aalto.fi Määritelmä Tarkasteltava yksikö luotettavuus
811312A Tietorakenteet ja algoritmit, , Harjoitus 4, Ratkaisu
81112A Tietoraketeet ja algoritmit, 217-218, Harjoitus 4, Ratkaisu Harjoitukse aiheita ovat algoritmie aikakompleksisuus ja lajittelualgoritmit Tehtävä 4.1 Selvitä seuraavie rekursioyhtälöide ratkaisuje
Matematiikan tukikurssi. Kertausta 1. välikokeeseen. Tehtävät
Matematiika tukikurssi Kertausta. välikokeesee Tehtävät Algebraa Tämä kappale sisältää rusaasti harjoitustehtäviä. Suurimpaa osaa tehtävistä löytyy ratkaisut lopusta. Syyä rusaasee tehtävämäärää o, että
Testejä suhdeasteikollisille muuttujille
Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman
3.2 Polynomifunktion kulku. Lokaaliset ääriarvot
3. Polyomifuktio kulku. Lokaaliset ääriarvot Tähäastiste opitoje perusteella osataa piirtää esiasteise polyomifuktio kuvaaja, suora, ku se yhtälö o aettu. Osataa myös pääpiirtei hahmotella toise astee
Oppimistavoite tälle luennolle
Oppiistavoite tälle lueolle Yksikköoperaatiot ja teolliset prosessit CHEM-A00 (5 op) Tislaus ja uutto Yärtää erotusprosessie suuittelu perusteet Tutea tislaukse ja uuto toiitaperiaatteet Tutea tpillisipiä
Otannasta ja mittaamisesta
Otannasta ja mittaamisesta Tilastotiede käytännön tutkimuksessa - kurssi, kesä 2001 Reijo Sund Aineistot Kvantitatiivisen tutkimuksen aineistoksi kelpaa periaatteessa kaikki havaintoihin perustuva informaatio,
811312A Tietorakenteet ja algoritmit , Harjoitus 1 ratkaisu
83A Tietoraketeet ja algoritmit 06-07, Harjoitus ratkaisu Harjoitukse aiheea o algoritmie oikeellisuus. Tehtävä. Kahvipurkkiogelma. Kahvipurkissa P o valkoisia ja mustia kahvipapuja, yhteesä vähitää kaksi
Otoskoko 107 kpl. a) 27 b) 2654
1. Tietyllä koneella valmistettavien tiivisterenkaiden halkaisijan keskihajonnan tiedetään olevan 0.04 tuumaa. Kyseisellä koneella valmistettujen 100 renkaan halkaisijoiden keskiarvo oli 0.60 tuumaa. Määrää
Tilastollinen päättömyys, kevät 2017 Harjoitus 6A
Tilastollie päättömyys, kevät 07 Harjoitus 6A Heikki Korpela 8. helmikuuta 07 Tehtävä. Moistee teht. 5.. Olkoo Y,..., Y riippumato otos ekspoettiperhee jakaumasta, joka ptf/tf o muotoa fy i ; θ cθhye φθtyi
Matematiikan tukikurssi
Matematiika tukikurssi Kertauslueto. välikokeesee Algebraa Tämäkertaie kurssimoiste sisältää rusaasti harjoitustehtäviä. Syyä tähä o se, että matematiikkaa oppii parhaite itse tekemällä ja laskemalla.
Johdatus todennäköisyyslaskentaan Konvergenssikäsitteet ja raja-arvolauseet. TKK (c) Ilkka Mellin (2004) 1
Johdatus todeäköisyyslasketaa Kovergessikäsitteet ja raja-arvolauseet TKK (c) Ilkka Melli (2004) 1 Kovergessikäsitteet ja raja-arvolauseet Kovergessikäsitteitä Suurte lukuje lait Keskeie raja-arvolause
LIITE 1 VIRHEEN ARVIOINNISTA
1 LIITE 1 VIRHEEN ARVIOINNISTA Mihin tarvitset virheen arviointia? Mittaustulokset ovat aina todellisten luonnonvakioiden ja tutkimuskohdetta kuvaavien suureiden likiarvoja, vaikka mittauslaite olisi miten
Teoria. Tilastotietojen keruu
S-38.348 Tietoverkkoje simuloiti / Tuloste keruu ja aalyysi Teoria Johdato simuloitii Simuloii kulku -- prosessi realisaatioide tuottamie Satuaismuuttuja arvota aetusta jakaumasta Tuloste keruu ja aalyysi
Tilastotieteen perusteet
VAASAN YLIOPISTO Tilastotieteeperusteet Luetoruko Christia Gustafsso SISÄLLYSLUETTELO 1. JOHDANTO... 3 1.1. Mitä tilastotiede o?... 3 1.. Tilastotietee historiaa... 4. HAVAINTOAINEISTO JA MITTAAMINEN...
Algebra I Matematiikan ja tilastotieteen laitos Ratkaisuehdotuksia harjoituksiin 5 (6 sivua)
Algebra I Matematiika ja tilastotietee laitos Ratkaisuehdotuksia harjoituksii 5 (6 sivua) 14.2. 17.2.2011 1. Määritellää kuvaus f : S 3 S 3, f(α) = (123) α. Osoita, että f o bijektio. Mikä o se kääteiskuvaukse
1. osa, ks. Solmu 2/ Kahden positiivisen luvun harmoninen, geometrinen, aritmeettinen ja + 1 u v 2 1
Epäyhtälötehtävie ratkaisuja. osa, ks. Solmu 2/200. Kahde positiivise luvu harmoie, geometrie, aritmeettie ja kotraharmoie keskiarvo määritellää yhtälöillä H = 2 +, G = uv, A = u + v 2 u v ja C = u2 +
5. Lineaarisen optimoinnin perusprobleemat
2 5. Lieaarise optimoii perusprobleemat Optimoitiprobleema o lieaarise optimoii tehtävä, jos kohdefuktio o lieaarie fuktio ja rajoitusehdot ovat lieaarisia yhtälöitä tai lieaarisia epäyhtälöitä. Yleisessä
LIITE 1 VIRHEEN ARVIOINNISTA
Oulun yliopisto Fysiikan opetuslaboratorio Fysiikan laboratoriotyöt 1 1 LIITE 1 VIRHEEN RVIOINNIST Mihin tarvitset virheen arviointia? Mittaustuloksiin sisältyy aina virhettä, vaikka mittauslaite olisi
ja läpäisyaika lasketaan (esim) integraalilla (5.3.1), missä nyt reitti s on z-akselilla:
10 a) Valo opeus levyssä o vakio v 0 = c / 0, jote ajaksi matkalla L laskemme L t0 = = 0 L. v0 c b) Valo opeus levyssä riippuu z:sta: c c v ( z) = = ( z ) 0 (1 + 3az 3 ) ja läpäisyaika lasketaa (esim)
MATEMATIIKAN JA TILASTOTIETEEN LAITOS
f ( ) JYVÄSKYLÄN YLIOPISTO Harjoituste 3 ratkaisut MATEMATIIKAN JA TILASTOTIETEEN LAITOS Topologiset vektoriavaruudet 3.1. Jokaie kompakti joukko K R määrää fuktioavaruudessa E = C(R ) = {f : R R f o jatkuva}
DEE Sähkömagneettisten järjestelmien lämmönsiirto
DEE-54 Sähköageettiste järjestelie läösiirto Lueto 7 Sähköageettiste järjestelie läösiirto Risto Mikkoe..4 Läöjohtuise leie osittaisdiffereretiaalihtälö t E g c p Sähköageettiste järjestelie läösiirto
Johdatus tilastotieteeseen Estimointimenetelmät. TKK (c) Ilkka Mellin (2005) 1
Johdatus tilastotieteesee Estimoitimeetelmät TKK (c) Ilkka Melli (2005) 1 Estimoitimeetelmät Todeäköisyysjakaumie parametrie estimoiti Momettimeetelmä Normaalijakauma parametrie estimoiti Ekspoettijakauma
Kompleksiluvut. Johdanto
Kompleksiluvut Johdato Tuomo Pirie tuomo.pirie@tut.fi Aikoje kuluessa o matematiikassa kohdattu tilateita, jolloi käytetyt määrittelyt ja rajoitukset (esimerkiksi käytetyt lukujoukot) eivät ole olleet
MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt
MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt Matriisihajotelmat: Schur ja Jordan Riikka Kangaslampi Matematiikan ja systeemianalyysin laitos Aalto-yliopisto 2015 1 / 18 R. Kangaslampi Matriisihajotelmat:
****************************************************************** ****************************************************************** 7 Esim.
8.3. Kombiaatiot MÄÄRITELMÄ 6 Merkitä k, joka luetaa yli k:, tarkoittaa lause- ketta k = k! ( k)! 6 3 2 1 6 Esim. 1 3 3! = = = = 3! ( 3)! 3 2 1 3 2 1 3 2 1 Laskimesta löydät äppäime, jolla kertomia voi
Työ 55, Säteilysuojelu
Työ 55, Säteilysuojelu Ryhmä: 18 Pari: 1 Joas Alam Atti Tehiälä Selostukse laati: Joas Alam Mittaukset tehty: 7.4.000 Selostus jätetty: 1.5.000 1. Johdato Tutkimme työssämme kolmea eri säteilylajia:, ja
5.3 Matriisin kääntäminen adjungaatilla
Vaasa yliopisto julkaisuja 08 Sec:MatIvAdj 53 Matriisi käätämie adjugaatilla Määritelmä 3 -matriisi A adjugaatti o -matriisi adj(a) (α i j ), missä α i j ( ) i+ j det(a ji ) (, joka o siis alkioo a ji
110. 111. 112. 113. 114. 4. Matriisit ja vektorit. 4.1. Matriisin käsite. 4.2. Matriisialgebra. Olkoon A = , B = Laske A + B, 5 14 9, 1 3 3
4 Matriisit ja vektorit 4 Matriisin käsite 42 Matriisialgebra 0 2 2 0, B = 2 2 4 6 2 Laske A + B, 2 A + B, AB ja BA A + B = 2 4 6 5, 2 A + B = 5 9 6 5 4 9, 4 7 6 AB = 0 0 0 6 0 0 0, B 22 2 2 0 0 0 6 5