Aineiston visualisointimenetelmiä
|
|
- Inkeri Mäkelä
- 6 vuotta sitten
- Katselukertoja:
Transkriptio
1 Aineiston visualisointimenetelmiä Petri Koistinen Matematiikan ja tilastotieteen laitos Helsingin yliopisto pek/rekmen05/ R-esimerkkejä tiedostossa pek/rekmen05/rvis.txt
2 Yleistä tilastoaineiston visualisoinnista Tilastoaineistojen visualisoinnissa tahdotaan löytää tai havainnollistaa numeerisessa aineistossa ilmeneviä abstrakteja yhteyksiä. Tilastoaineiston visualisointi on luonteeltaan aivan erilaista kuin konkreettisten kolmiulotteisten esineiden ja ilmiöiden visualisointi. Visualisoinnin lähtökohtana voi olla alkuperäinen aineisto, tai siitä muokkaamalla saatu numeerinen esitys. Esimerkkejä aineiston muokkaamisesta: muuttujiin sovelletaan muunnoksia esitetään muuttujien korrelaatiomatriisi kuvana tarkastellaan residuaaleja mallin sovituksen jälkeen. Moniulotteinen skaalaus: alkuperäisten havaintojen sijasta visualisoidaan kaksi- tai kolmiulotteinen pisteistö, jossa samanlaiset havainnot kuvautuvat lähekkäin ja erilaiset kauemmas toisistaan. Eri menetelmissä määritellään eri tavoilla, milloin alkuperäiset havainnot ovat samanlaisia ja milloin ne ovat erilaisia.
3 Tämän esitelmän tavoitteet Tehdään katsaus erilaisiin tilastoaineiston visualisointimenetelmiin ja katsellaan niistä esimerkkejä. Keskitytään menetelmiin, joista on hyötyä kartoittavassa (explorative) dataanalyysissä. yleisönä on tutkija itse ajatuksena on hyödyntää ihmisen näköjärjestelmän kykyä löytää nopeasti säännönmukaisuuksia kuvista tarkasteltavia kuvioita voi olla suuri määrä, ja ne voivat olla mitä tahansa tutkijalle tuttua tyyppiä suurta osaa kuvioista katsellaan vain hetkinen, joten yhden kuvan laatimiseen ei kannata haaskata paljoa aikaa. Suuremmalle yleisölle tarkoitetun tilastografiikan tuottaminen on luonteeltaan erilaista: kuvioiden pitää olla yksinkertaisia ja yleisölle tuttua tyyppiä. Yhden kuvan hiomiseen voidaan käyttää tunteja tai päiviä.
4 Työkalut Demonstroin tilastokuvioita R-ohjelmointiympäristössä. R:n etuja ovat mm. seuraavat. R on ilmainen, sen lähdekoodi on saatavilla ja R on saatavilla erilaisiin käyttöjärjestelmiin. R on suosittu akateemisissa piireissä, minkä takia siihen saadaan nopeasti implementaatiot uusille tilastomenetelmille. R:ssä on (toistaiseksi) vähän työkaluja dynaamisen kolmiulotteisen grafiikan käyttöön. Tämän takia demonstroin tiettyjä dynaamisen visualisoinnin käsitteitä ja menetelmiä ilmaisella ggobi-ohjelmalla.
5 Eräitä R:n erikoispiirteitä R on komentopohjainen ohjelma. Etu: voit ohjelmoida omia funktiota. Haitta: hankalampi oppia kuin valikkopohjainen ohjelma, joka tarjoaa vain rajatun määrän eri vaihtoehtoja. Muuttujan nimessä saa esiintyä piste (esim. oma.ihana.muuttujani); skandinaavisia merkkejä sekä alaviivaa kannattaa välttää. Vektoreita muodostetaan funktiolla c() (esim. v = c(1, 4, 2, 5)) ja niitä indeksoidaan hakasuluilla. Esim. v[1] indeksinä skalaari v[1:3] indeksinä numeerinen vektori v[v < 3] indeksinä totuusarvoinen vektori. Vektorit voivat olla esim. numeerisia, totuusarvoisia tai faktoreita (kategorisia muuttujia).
6 Useimmat komennoista ovat funktiokutsuja, ja niistä saa avustusta. Esim. funktioista barplot() saa avustusta komennolla help(komento) tai?komento. Funktioiden argumenteilla voi olla oletusarvoja, ja nimetyt argumentit voi antaa mielivaltaisessa järjestyksessä. Esim. barplot(x, horiz = T). Tilastollisia malleja ja joitakin tilastokuvioita spesifioidaan erityisellä kaavakielellä. Esim. lauseke y ~ x tarkoittaa grafiikkakomennossa sitä, että muuttuja y piirretään muuttujan x funktiona. Lauseke y ~ x f voi grafiikkakomennossa tarkoittaa sitä, että muuttuja y piirretään muuttujan x funktiona, kun ehdollistetaan faktorin f arvoilla. (Käytännössä tällöin piirretään monta kuviota.)
7 R:n datakehikot Havaintoaineistot esitetään tavallisesti tietotyyppinä, jonka nimi on datakehikko eli data frame. R:ssä on valmiina lukuisia aineistoja, jotka saa käyttöön komennolla data(aineiston.nimi). Esimerkki: > data(iris) > str(iris) data.frame : 150 obs. of 5 variables: $ Sepal.Length: num $ Sepal.Width : num $ Petal.Length: num $ Petal.Width : num $ Species : Factor w/ 3 levels "setosa","versic..",..: > iris Sepal.Length Sepal.Width Petal.Length Petal.Width Species setosa setosa... Tässä aineistossa on 150 havaintoa viidestä muuttujasta, joista yksi (Species) on faktori ja muut numeerisia. Muuttujan Sepal.Length 150 arvoa saadaan näkyviin antamalla komento iris$sepal.length.
8 Grafiikka R:ssä Melkein kaikki asiat voidaan R:ssä tehdä monella tavalla, niin myös grafiikan tuottaminen. Perusgrafiikkakirjastosta löytyy esim. funktio plot, jolla voidaan tehdä kaksiulotteisia piste- ja viivakuvioita. Tälle funktiolle voidaan antaa paljon erilaisia argumentteja, joista osa on dokumentoitu funktion plot ja osa funktion par avustustekstissä. Funktiolla par hallinnoidaan perusgrafiikan parametrejä. Kirjastosta MASS löytyy mm. funktio truehist, joka tuottaa histogrammeja monipuolisemmin kuin perusgrafiikkakirjaston funktio hist. Kirjasto lattice tarjoaa edellisistä erillisen ja erittäin monipuolisen lähestymistavan tilastokuvioiden tekoon. Erillisyys tarkoittaa mm. sitä, että par-funktio ei vaikuta lattice-kirjaston graafisiin parametreihin, vaan niitä voi asettaa eräällä toisella funktiolla. Kirjasto tarjoaa komentoja, jotka ovat samantapaisia kuin S-Plus-ohjelman Trellis-funktiot.
9 Yksiulotteinen kategorinen aineisto Kategorisen muuttujan saamien arvojen frekvenssit voidaan taulukoida, ja frekvenssejä voidaan visualisoida pylväskuviona tai piirakkakuviona. Piirakkakuviosta on vaikea hahmottaa frekvenssien eroja.
10 Yksi numeerinen muuttuja: pistekuvio Pieni yksiulotteinen aineisto voidaan havainnollistaa piirtämällä siitä pistekuvio. Jos luvut ovat pyöristettyjä, pisteet piirtyvät helposti päällekkäin (overplotting). Asiaa voidaan auttaa täristämällä (jitter) pisteitä eli lisäämällä koordinaatteihin vähän kohinaa. Jos aineistossa on numeerisen muuttujan lisäksi kategorinen muuttuja (faktori), niin numeerisen muuttujan jakaumaa eri kategorisen muuttujan määräämissä luokissa voidaan tutkia ehdollistamalla pistekuviot kategorisen muuttujan arvoilla.
11 Yksi numeerinen muuttuja: laatikkokuvio Laatikkokuviossa (boxplot, box-and-whiskers plot) aineiston jakauma esitetään laatikkona, joka ulottuu alakvartiilista yläkvartiiliin, ja jonka keskelle vielä merkitään mediaanin kohta. Lisäksi piirretään viikset kohtiin, joiden ulkopuolella olevia havaintoja voidaan (tietyn kriteerin mielessä) pitää vieraina havaintoina (outlier), ja vieraat havainnot voidaan vielä esittää erikseen pisteinä.
12 Yksi numeerinen muuttuja: histogrammi Histogrammeja on montaa eri lajia. Tavanomaisessa eli frekvenssihistogrammissa piirretään pylväät osoittamaan eri luokkaväleihin sattuneiden havaintojen frekvenssit. Tiheyshistogrammissa luokan frekvenssi jaetaan otoskoolla sekä luokkavälin leveydellä, jolloin saadaan tiheysfunktioestimaatti. Tulos riippuu kummassakin tapauksessa voimakkaasti sekä luokkavälin leveydestä että histogrammin aloituspisteestä.
13 Yksi numeerinen muuttuja: tiheysfunktioestimaatit Tiheyshistogrammi on havaintojen tiheysfunktion eräs estimaatti. On olemassa parempia tapoja estimoida tätä tiheysfunktiota. ASH (averaged shifted histogram) -menetelmässä eli histogrammien siirtokeskiarvo -menetelmässä lasketaan keskiarvo lukuisista samalla luokkavälin leveydellä mutta eri aloituspisteillä lasketuista tiheyshistogrammeista. ASH on käytössä esim. ggobi-ohjelmassa. Tiheysfunktion ydinestimaatissa estimaatti lasketaan kaavalla ˆf(x) = 1 n n i=1 1 h K ( ) x xi jossa K on jokin sopiva tiheysfunktio eli ydin, x 1,..., x n ovat havaitut arvot ja h on nimeltään silotusparametri (smoothing parameter) tai kaistanleveys (bandwidth). Tulos riippuu oleellisesti h:n arvosta, ja h:n valintaan on kirjallisuudessa esitetty lukuisia eri menetelmiä. Funktiossa density käytetään oletusarvoisesti erästä yksinkertaista peukalosääntöä, joka usein toimii ihan mukavasti. h
14 Yksi numeerinen muuttuja: kvantiilikuvio Kvantiilikuviolla (QQ plot) voidaan verrata aineiston empiiristä jakaumaa johonkin teoreettiseen jakaumaan, useimmiten standardinormaalijakaumaan N(0, 1), jolloin puhutaan normaalijakaumakuviosta (normal probability plot). Jakauman kvantiilifunktio on sen kertymäfunktion käänteisfunktio. Fakta: jos X on satunnaismuuttuja, ja Y = ax + b, jossa a, b vakioita ja a > 0, niin niiden kvantiilifunktioiden q X ja q Y välillä on yhteys q Y (u) = aq X (u) + b, u. Tämän takia vertaamalla annettua kvantiilifunktiota esim. standardinormaalijakauman N(0, 1) kvantiilifunktioon saadaan saman tien verrattua annettua jakaumaa kaikkien normaalijakaumien kanssa. Kvantiilikuviossa toinen verrattavista kvantiilifunktioista on aineiston perusteella laskettu empiirinen kvantiilifunktio. Eri tilasto-ohjelmissa saatetaan empiiriselle kvantiilifunktiolle käyttää vähän erilaisia määritelmiä.
15 Kaksi tai kolme numeerista muuttujaa: hajontakuvio Hajontakuviossa (parvikuvio, pistekuvio,...) (scatter plot) muuttujien saamat arvot eri otosyksiköissä piirretään kaksi- tai kolmiulotteisen avaruuden pisteinä. Jos aineistossa on numeeristen muuttujien lisäksi kategorinen muuttuja, niin voidaan erotella kategorisen muuttujan eri arvot käyttämällä eri pistetyyppejä. Kolmiulotteisen hajontakuvion hahmottamista auttaa ratkaisevasti, jos katselusuunnan pääsee valitsemaan interaktiivisesti.
16 Kaksi tai useampia kategorisia muuttujia: mosaiikkikuvio Kun muuttujien saamat arvot ristiintaulukoidaan, tuloksena saatava taulukko voidaan visualisoida mosaiikkikuviona, josta voidaan yrittää arvioida esim. muuttujein mahdollista riippumattomuutta.
17 Useita numeerisia muuttujia: monta näkymää Aineistosta tehdään monta kuvaa tai näkymää (multiple views), jotka ovat yhteydessä (linked) keskenään. Staattisen grafiikan tapauksessa näkymät tyypillisesti yhdistetään sillä tavalla, että niissä käytetään yhteistä asteikkoa (ainakin jollakin akselilla). Dynaamisen grafiikan tapauksessa yhdistävänä tekijänä voi olla sileä liike animaatiossa. Kuvioita voidaan yhdistää myös sillä tavalla, että aineistoon avataan monta näkymää, jotka käyttävät eri visualisointimenetelmiä, ja kun jossakin näkymässä valitaan (brushing, suom. harjaaminen) osa aineistosta, tämä osa korostetaan grafiikan keinoin yhtenäisesti kaikissa näkymissä.
18 Useita numeerisia muuttujia: ehdollistetut hajontakuviot Edellä on jo mainittu ehdollistaminen kategorisen muuttujan arvoilla (tai useampien kategoristen muuttujien arvoilla). Voidaan myös edollistaa numeerisen muuttujan arvolla siten, että sen vaihteluväli jaetaan osaväleihin, jotka voivat haluttaessa mennä hieman päällekkäin. Kirjastossa lattice tällainen jako toteutetaan tietorakenteessa, jonka nimi on shingle (suom. mm. kattotiili, paanu). Jokaista osaväliä kohti piirretään hajontakuvio siitä osasta aineistoa, jossa ehdollistavan muuttujan arvo sattuu kyseiseen osaväliin.
19 Useita numeerisia muuttujia: hajontakuviomatriisi Hajontakuviomatriisissa (scatter plot matrix, splom, vanhempi nimitys draugtman s plot, draftman s plot) esitetään kaikki eri muuttujaparien hajontakuviot matriisin muotoon järjestettynä. Ruuduissa (i, j) ja (j, i) olevat hajontakuviot ovat toistensa peilikuvia. Eri ruudut on yhdistetty toisiinsa siten, että yhdellä vaakarivillä olevilla ruuduilla on yhteinen pystyakselin asteikko ja yhdellä pystyrivillä olevilla ruuduilla on yhteinen vaaka-akselin asteikko. Kategorisia muuttujia ei kannata ottaa mukaan hajontakuviomatriisiin, vaan niiden arvot kannattaa (mahdollisuuksien mukaan) esittää eri pistetyypeillä tai eri väreillä. Toinen mahdollisuus on piirtää useita hajontakuviomatriiseja, jotka on ehdollistettu kategoristen muuttujien eri arvokombinaatioille.
20 Useita numeerisia muuttujia: rinnakkaiskoordinaatit Jos aineistossa on k muuttujaa, niin rinnakkaiskoordinaattikuviossa (parallel coordinate plot) piirretään rinnakkain k koordinaattiakselia, ja kukin havainto esitetään viivana, joka yhdistää havainnon koordinaatit toisiinsa.
21 Liikaa muuttujia: kuvaukset alempiin dimensioihin Jos muuttujia on satoja, mikään edellisistä tekniikoista ei enää ole käyttökelpoinen. Tällöin täytyy aineisto kuvata visualisointia varten jollakin tavalla alempaan ulottuvuuteen, jossa visualisointi onnistuu. Esimerkkejä: Traditionaalisia ratkaisuja: visualisoidaan vaan osaa muuttujista, visualisoidaan muutamaa ensimmäistä pääkomponenttia. Grand tour: visualisoidaan aineistoa dynaamisesti siten, että se projisoidaan kaksiulotteiselle tasolle, jonka suunta vaihtuu sileästi animaation kuluessa. Projektion haku (projection pursuit): projisoidaan aineisto aliavaruuteen, jonka suunta etsitään siten, että projektio näyttää mahdollisimman mielenkiintoiselta (jonkin kriteerin mielessä). Moniulotteinen skaalaus: alkuperäisten havaintojen sijasta visualisoidaan kaksitai kolmiulotteinen pisteistö, jossa samanlaiset havainnot kuvautuvat lähekkäin ja erilaiset kauemmas toisistaan. BayMiner-ohjelmassa käytetään apuna erästä uutta ja sofistikoitunutta toteutusta moniulotteisesta skaalauksesta.
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi 2016
LisätiedotMS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi 2016
Lisätiedot805306A Johdatus monimuuttujamenetelmiin, 5 op
monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos K:n lähimmän naapurin menetelmä (K-Nearest neighbours) Tarkastellaan aluksi pientä (n = 9) kurjenmiekka-aineistoa, joka on seuraava:
LisätiedotMONISTE 2 Kirjoittanut Elina Katainen
MONISTE 2 Kirjoittanut Elina Katainen TILASTOLLISTEN MUUTTUJIEN TYYPIT 1 Mitta-asteikot Tilastolliset muuttujat voidaan jakaa kahteen päätyyppiin: kategorisiin ja numeerisiin muuttujiin. Tämän lisäksi
LisätiedotR: mikä, miksi ja miten?
R: mikä, miksi ja miten? Ilmari Ahonen Matematiikan ja tilastotieteen laitos, Turun yliopisto SSL R-Webinaari 2015 Vähän minusta Valmistuin maisteriksi Turun yliopistossa 2012 Teen neljättä vuotta väitöskirjaa
LisätiedotMS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,
LisätiedotHannu mies LTK 180 Johanna nainen HuTK 168 Laura nainen LuTK 173 Jere mies NA 173 Riitta nainen LTK 164
86118P JOHDATUS TILASTOTIETEESEEN Harjoituksen 3 ratkaisut, viikko 5, kevät 19 1. a) Havaintomatriisissa on viisi riviä (eli tilastoyksikköä) ja neljä saraketta (eli muuttujaa). Hannu mies LTK 18 Johanna
Lisätiedot805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016)
805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016) Tavoitteet (teoria): Hallita autokovarianssifunktion ominaisuuksien tarkastelu. Osata laskea autokovarianssifunktion spektriiheysfunktio. Tavoitteet
LisätiedotHarjoitus 2: Matlab - Statistical Toolbox
Harjoitus 2: Matlab - Statistical Toolbox Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen tavoitteet Satunnaismuuttujat ja todennäköisyysjakaumat
Lisätiedot0 kun x < 0, 1/3 kun 0 x < 1/4, 7/11 kun 1/4 x < 6/7, 1 kun x 1, 1 kun x 6/7,
HY / Matematiikan ja tilastotieteen laitos Todennäköisyyslaskenta II, syksy 07 Harjoitus Ratkaisuehdotuksia Tehtäväsarja I. Mitkä seuraavista funktioista F, F, F ja F 4 ovat kertymäfunktioita? Mitkä niistä
LisätiedotEsimerkki 1: auringonkukan kasvun kuvailu
GeoGebran LASKENTATAULUKKO Esimerkki 1: auringonkukan kasvun kuvailu Auringonkukka (Helianthus annuus) on yksivuotinen kasvi, jonka varren pituus voi aurinkoisina kesinä hyvissä kasvuolosuhteissa Suomessakin
LisätiedotMat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi
Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi Diskreetit muuttujat,
LisätiedotEstimointi. Vilkkumaa / Kuusinen 1
Estimointi Vilkkumaa / Kuusinen 1 Motivointi Tilastollisessa tutkimuksessa oletetaan jonkin jakauman generoineen tutkimuksen kohteena olevaa ilmiötä koskevat havainnot Tämän mallina käytettävän todennäköisyysjakauman
LisätiedotTUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas
TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas JAKAUMAN MUOTO Vinous, skew (g 1, γ 1 ) Kertoo jakauman symmetrisyydestä Vertailuarvona on nolla, joka vastaa symmetristä jakaumaa (mm. normaalijakauma)
LisätiedotYhtälöryhmä matriisimuodossa. MS-A0004/A0006 Matriisilaskenta. Tarkastellaan esimerkkinä lineaarista yhtälöparia. 2x1 x 2 = 1 x 1 + x 2 = 5.
2. MS-A4/A6 Matriisilaskenta 2. Nuutti Hyvönen, c Riikka Kangaslampi Matematiikan ja systeemianalyysin laitos Aalto-yliopisto 5.9.25 Tarkastellaan esimerkkinä lineaarista yhtälöparia { 2x x 2 = x + x 2
LisätiedotMS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä.
MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä. Antti Rasila Matematiikan ja systeemianalyysin laitos Aalto-yliopisto Kevät 2016
Lisätiedot9. Vektorit. 9.1 Skalaarit ja vektorit. 9.2 Vektorit tasossa
9. Vektorit 9.1 Skalaarit ja vektorit Skalaari on koon tai määrän mitta. Tyypillinen esimerkki skalaarista on massa. Lukumäärä on toinen hyvä esimerkki skalaarista. Vektorilla on taas suuruus ja suunta.
LisätiedotGeoGebra tutkivan oppimisen välineenä: havainto-hypoteesi-testaus
GeoGebra tutkivan oppimisen välineenä: havainto-hypoteesi-testaus Mitä jäi mieleen viime viikosta? Mitä mieltä olet tehtävistä, joissa GeoGebralla työskentely yhdistetään paperilla jaettaviin ohjeisiin
LisätiedotHY, MTO / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIa, syksy 2018 Harjoitus 3 Ratkaisuehdotuksia.
HY, MTO / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIa, syksy 8 Harjoitus Ratkaisuehdotuksia Tehtäväsarja I. Mitkä seuraavista funktioista F, F, F ja F 4 ovat kertymäfunktioita? Mitkä
LisätiedotKuvioita, taulukoita ja tunnuslukuja. Aki Taanila 2.2.2011
Kuvioita, taulukoita ja tunnuslukuja Aki Taanila 2.2.2011 1 Tilastokuviot Pylväs Piirakka Viiva Hajonta 2 Kuviossa huomioitavia asioita 1 Kuviolla tulee olla tarkoitus ja tehtävä (minkä tiedon haluat välittää
LisätiedotTilastotieteen kertaus. Kuusinen/Heliövaara 1
Tilastotieteen kertaus Kuusinen/Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla reaalimaailman ilmiöistä voidaan tehdä johtopäätöksiä tilanteissa, joissa
Lisätiedottilastotieteen kertaus
tilastotieteen kertaus Keskiviikon 24.1. harjoitukset pidetään poikkeuksellisesti klo 14-16 luokassa Y228. Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla
LisätiedotInsinöörimatematiikka D
Insinöörimatematiikka D M. Hirvensalo mikhirve@utu.fi V. Junnila viljun@utu.fi Matematiikan ja tilastotieteen laitos Turun yliopisto 2015 M. Hirvensalo mikhirve@utu.fi V. Junnila viljun@utu.fi Luentokalvot
LisätiedotParetoratkaisujen visualisointi
Paretoratkaisujen visualisointi Optimointiopin seminaari - Kevät 2000 / 1 Esityksen sisältö Vaihtoehtoisten kohdevektorien visualisointi Arvopolut Palkkikaaviot Tähtikoordinaatit Hämähäkinverkkokaavio
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 30. lokakuuta 2007 Antti Rasila () TodB 30. lokakuuta 2007 1 / 23 1 Otos ja otosjakaumat (jatkoa) Frekvenssi ja suhteellinen frekvenssi Frekvenssien odotusarvo
LisätiedotJuuri 10 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty
Juuri 0 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty 9..08 Kertaus K. a) Alapaineiden pienin arvo on ja suurin arvo 74, joten vaihteluväli on [, 74]. b) Alapaineiden keskiarvo on 6676870774
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 11. lokakuuta 2007 Antti Rasila () TodB 11. lokakuuta 2007 1 / 15 1 Johdantoa tilastotieteeseen Peruskäsitteitä Tilastollisen kuvailun ja päättelyn menetelmiä
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 3. marraskuuta 2007 Antti Rasila () TodB 3. marraskuuta 2007 1 / 18 1 Varianssin luottamusväli, jatkoa 2 Bernoulli-jakauman odotusarvon luottamusväli 3
Lisätiedot9. Tila-avaruusmallit
9. Tila-avaruusmallit Aikasarjan stokastinen malli ja aikasarjasta tehdyt havainnot voidaan esittää joustavassa ja monipuolisessa muodossa ns. tila-avaruusmallina. Useat aikasarjat edustavat dynaamisia
LisätiedotTilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta
Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman
LisätiedotMatematiikan kotitehtävä 2, MAA 10 Todennäköisyys ja tilastot
Matematiikan kotitehtävä 2, MAA 10 Todennäköisyys ja tilastot Sievin lukio Tehtävien ratkaisut tulee olla esim. Libre officen -writer ohjelmalla tehtyjä. Liitä vastauksiisi kuvia GeoGebrasta ja esim. TI-nSpire
LisätiedotOsa 2: Otokset, otosjakaumat ja estimointi
Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin
LisätiedotTUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas
TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas TEOREETTISISTA JAKAUMISTA Usein johtopäätösten teko helpottuu huomattavasti, jos tarkasteltavan muuttujan perusjoukon jakauma noudattaa
LisätiedotEstimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?
TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (2004) 2 Mitä opimme? 1/4 Tilastollisen tutkimuksen tavoitteena on tehdä johtopäätöksiä prosesseista, jotka generoivat reaalimaailman
LisätiedotTeema 3: Tilastollisia kuvia ja tunnuslukuja
Teema 3: Tilastollisia kuvia ja tunnuslukuja Tilastoaineiston peruselementit: havainnot ja muuttujat havainto: yhtä havaintoyksikköä koskevat tiedot esim. henkilön vastaukset kyselylomakkeen kysymyksiin
LisätiedotJohdatus todennäköisyyslaskentaan Kertymäfunktio. TKK (c) Ilkka Mellin (2005) 1
Johdatus todennäköisyyslaskentaan Kertymäfunktio TKK (c) Ilkka Mellin (2005) 1 Kertymäfunktio Kertymäfunktio: Määritelmä Diskreettien jakaumien kertymäfunktiot Jatkuvien jakaumien kertymäfunktiot TKK (c)
LisätiedotMäärällisen aineiston esittämistapoja. Aki Taanila
Määrällisen aineiston esittämistapoja Aki Taanila 7.11.2011 1 Muuttujat Aineiston esittämisen kannalta muuttujat voidaan jaotella kolmeen tyyppiin: Kategoriset (esimerkiksi sukupuoli, koulutus) Asteikolla
LisätiedotJohdatus tilastotieteeseen Tilastollisten aineistojen kuvaaminen. TKK (c) Ilkka Mellin (2005) 1
Johdatus tilastotieteeseen Tilastollisten aineistojen kuvaaminen TKK (c) Ilkka Mellin (2005) 1 Tilastollisten aineistojen kuvaaminen Havaintoarvojen jakauma Tunnusluvut Suhdeasteikollisten muuttujien tunnusluvut
LisätiedotTilastolliset ohjelmistot 805340A. Pinja Pikkuhookana
Tilastolliset ohjelmistot 805340A Pinja Pikkuhookana Sisältö 1 SPSS 1.1 Yleistä 1.2 Aineiston syöttäminen 1.3 Aineistoon tutustuminen 1.4 Kuvien piirtäminen 1.5 Kuvien muokkaaminen 1.6 Aineistojen muokkaaminen
LisätiedotJohdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1
Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia TKK (c) Ilkka Mellin (2005) 1 Normaalijakaumasta johdettuja jakaumia Johdanto χ 2 -jakauma F-jakauma t-jakauma TKK (c) Ilkka Mellin
LisätiedotTilastolliset toiminnot
-59- Tilastolliset toiminnot 6.1 Aineiston esittäminen graafisesti Tilastollisen aineiston tallentamisvälineiksi TI-84 Plus tarjoaa erityiset listamuuttujat L1,, L6, jotka löytyvät 2nd -toimintoina vastaavilta
Lisätiedot805324A (805679S) Aikasarja-analyysi Harjoitus 3 (2016)
805324A (805679S) Aikasarja-analyysi Harjoitus 3 (2016) Tavoitteet (teoria): Hallita multinormaalijakauman määritelmä. Ymmärtää likelihood-funktion ja todennäköisyystiheysfunktion ero. Oppia kirjoittamaan
LisätiedotJohdantoa. Jokaisen matemaatikon olisi syytä osata edes alkeet jostakin perusohjelmistosta, Java MAPLE. Pascal MathCad
Johdantoa ALGORITMIT MATEMA- TIIKASSA, MAA Vanhan vitsin mukaan matemaatikko tietää, kuinka matemaattinen ongelma ratkaistaan, mutta ei osaa tehdä niin. Vitsi on ajalta, jolloin käytännön laskut eli ongelman
Lisätiedot3.1 Lineaarikuvaukset. MS-A0004/A0006 Matriisilaskenta. 3.1 Lineaarikuvaukset. 3.1 Lineaarikuvaukset
31 MS-A0004/A0006 Matriisilaskenta 3 Nuutti Hyvönen, c Riikka Kangaslampi Matematiikan ja systeemianalyysin laitos Aalto-yliopisto 2292015 Lineaariset yhtälöt ovat vektoreille luonnollisia yhtälöitä, joita
LisätiedotMS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,
LisätiedotKopulafunktiot. Joonas Ollila 12. lokakuuta 2011
Kopulafunktiot Joonas Ollila 12. lokakuuta 2011 Työn saa tallentaa ja julkistaa Aalto-yliopiston avoimilla verkkosivuilla. Muilta osin kaikki oikeudet pidätetään. Kopula-sanan alkuperä Kopula tarkoittaa
LisätiedotParetoratkaisujen visualisointi. Optimointiopin seminaari / Kevät 2000 Esitelmä 11 Petteri Kekäläinen 45305L
Paretoratkaisujen visualisointi Optimointiopin seminaari / Kevät 2000 Esitelmä 11 Petteri Kekäläinen 45305L 1. Johdanto Monitavoiteoptimointitehtävät ovat usein laajuutensa takia vaikeasti hahmotettavia
LisätiedotPOHDIN - projekti. Funktio. Vektoriarvoinen funktio
POHDIN - projekti Funktio Funktio f joukosta A joukkoon B tarkoittaa sääntöä, joka liittää jokaiseen joukon A alkioon jonkin alkion joukosta B. Yleensä merkitään f : A B. Usein käytetään sanaa kuvaus synonyymina
LisätiedotHarjoitus 7: NCSS - Tilastollinen analyysi
Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen
LisätiedotNumeeriset menetelmät TIEA381. Luento 6. Kirsi Valjus. Jyväskylän yliopisto. Luento 6 () Numeeriset menetelmät / 33
Numeeriset menetelmät TIEA381 Luento 6 Kirsi Valjus Jyväskylän yliopisto Luento 6 () Numeeriset menetelmät 4.4.2013 1 / 33 Luennon 6 sisältö Interpolointi ja approksimointi Polynomi-interpolaatio: Vandermonden
LisätiedotMS-A0305 Differentiaali- ja integraalilaskenta 3 Luento 1: Moniulotteiset integraalit
MS-A35 ifferentiaali- ja integraalilaskenta 3 Luento 1: Moniulotteiset integraalit Antti Rasila Aalto-yliopisto Syksy 215 Antti Rasila (Aalto-yliopisto) MS-A35 Syksy 215 1 / 24 Skalaarikenttä Olkoon R
LisätiedotNumeeriset menetelmät
Numeeriset menetelmät Luento 11 Ti 11.10.2011 Timo Männikkö Numeeriset menetelmät Syksy 2011 Luento 11 Ti 11.10.2011 p. 1/34 p. 1/34 Automaattiset integrointialgoritmit Numeerisen integroinnin tarkkuuteen
LisätiedotJärvi 1 Valkjärvi. Järvi 2 Sysijärvi
Tilastotiedettä Tilastotieteessä kerätään tietoja yksittäisistä asioista, ominaisuuksista tai tapahtumista. Näin saatua tietoa käsitellään tilastotieteen menetelmin ja saatuja tuloksia voidaan käyttää
Lisätiedotpitkittäisaineistoissa
Puuttuvan tiedon ongelma p. 1/18 Puuttuvan tiedon ongelma pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto mtl.uta.fi/tilasto/sekamallit/puupitkit.pdf
LisätiedotJohdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1
Johdatus tilastotieteeseen Estimointi TKK (c) Ilkka Mellin (2005) 1 Estimointi Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin ominaisuudet TKK (c) Ilkka Mellin (2005) 2 Estimointi:
Lisätiedot805306A Johdatus monimuuttujamenetelmiin, 5 op
monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Lineaarinen erotteluanalyysi (LDA, Linear discriminant analysis) Erotteluanalyysin avulla pyritään muodostamaan selittävistä muuttujista
LisätiedotKandidaatintutkielman aineistonhankinta ja analyysi
Kandidaatintutkielman aineistonhankinta ja analyysi Anna-Kaisa Ylitalo M 315, anna-kaisa.ylitalo@jyu.fi Musiikin, taiteen ja kulttuurin tutkimuksen laitos Jyväskylän yliopisto 2018 2 Havaintomatriisi Havaintomatriisi
LisätiedotMoniulotteisia todennäköisyysjakaumia
Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (007) 1 Moniulotteisia todennäköisyysjakaumia >> Multinomijakauma Kaksiulotteinen
LisätiedotYleistä tietoa kokeesta
Yleistä tietoa kokeesta Kurssikoe on ma 18.12. klo 12.00-14.30 (jossakin auditorioista). Huomaa tasatunti! Seuraava erilliskoe on ke 10.1.2018 klo 10-14, johon ilmoittaudutaan Oodissa (ilmoittautumisaika
Lisätiedot6. laskuharjoitusten vastaukset (viikot 10 11)
6. laskuharjoitusten vastaukset (viikot 10 11) 1. a) Sivun 102 hypergeometrisen jakauman määritelmästä saadaan µ µ 13 39 13! 13 12 11 10 9 µ 0! 8! 1! 2 2! 2 1 0 49 48! 47!! 14440 120 31187200 120 1287
LisätiedotYhtälöryhmä matriisimuodossa. MS-A0007 Matriisilaskenta. Tarkastellaan esimerkkinä lineaarista yhtälöparia. 2x1 x 2 = 1 x 1 + x 2 = 5.
2. MS-A000 Matriisilaskenta 2. Nuutti Hyvönen, c Riikka Kangaslampi Matematiikan ja systeemianalyysin laitos Aalto-yliopisto 2..205 Tarkastellaan esimerkkinä lineaarista yhtälöparia { 2x x 2 = x x 2 =
LisätiedotTilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu JMP:llä
Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi Esimerkit laskettu JMP:llä Antti Hyttinen Tampereen teknillinen yliopisto 29.12.2003 ii Ohjelmien
LisätiedotOpiskelijanumero Yleisarvio Työläys Hyödyllisyys 12345A K K B U 3 3 3
Luku 6 Datajoukkojen jakaumat, tunnusluvut ja kuvaajat Lasse Leskelä Aalto-yliopisto. lokakuuta 207 6. Datajoukko ja datakehikko Tässä monisteessa datajoukko tarkoittaa järjestettyä listaa keskenään samantyyppisiä
LisätiedotMS-A0305 Differentiaali- ja integraalilaskenta 3 Luento 1: Moniulotteiset integraalit
MS-A35 ifferentiaali- ja integraalilaskenta 3 Luento : Moniulotteiset integraalit Antti Rasila Matematiikan ja systeemianalyysin laitos Aalto-yliopisto Syksy 26 Antti Rasila (Aalto-yliopisto) MS-A35 Syksy
LisätiedotMS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4A Parametrien estimointi Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016, periodi
Lisätiedotb6) samaan perusjoukkoon kohdistuu samanaikaisesti useampia tutkimuksia.
806109P TILASTOTIETEEN PERUSMENETELMÄT I 1. välikoe 11.3.2011 (Jari Päkkilä) VALITSE VIIDESTÄ TEHTÄVÄSTÄ NELJÄ JA VASTAA VAIN NIIHIN! 1. Valitse kohdissa A-F oikea (vain yksi) vaihtoehto. Oikeasta vastauksesta
LisätiedotAloitusohje versiolle 4.0
Mikä on Geogebra? Aloitusohje versiolle 4.0 dynaamisen matematiiikan työvälineohjelma helppokäyttöisessä paketissa oppimisen ja opetuksen avuksi kaikille koulutustasoille vuorovaikutteiset geometria, algebra,
Lisätiedot1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet
VAASAN YLIOPISTO/AVOIN YLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia 1 KURSSIKYSELYAINEISTO: 1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka
LisätiedotTilastollisten aineistojen kuvaaminen
Ilkka Mellin Tilastolliset menetelmät Osa 1: Johdanto Tilastollisten aineistojen kuvaaminen TKK (c) Ilkka Mellin (2007) 1 Tilastollisten aineistojen kuvaaminen >> Havaintoarvojen jakauma Tunnusluvut Suhdeasteikollisten
LisätiedotTilastollinen aineisto Luottamusväli
Tilastollinen aineisto Luottamusväli Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos Tilastollinen aineisto p.1/20 Johdanto Kokeellisessa tutkimuksessa tutkittavien suureiden
Lisätiedot4 / 2013 TI-NSPIRE CAS TEKNOLOGIA LUKIOSSA. T3-kouluttajat: Olli Karkkulainen ja Markku Parkkonen
4 / 2013 TI-NSPIRE CAS TEKNOLOGIA LUKIOSSA T3-kouluttajat: Olli Karkkulainen ja Markku Parkkonen 1 2 TI-Nspire CX CAS kämmenlaite kevään 2013 pitkän matematiikan kokeessa Tehtävä 1. Käytetään komentoa
LisätiedotPäättelyn voisi aloittaa myös edellisen loppupuolelta ja näyttää kuten alkupuolella, että välttämättä dim W < R 1 R 1
Lineaarialgebran kertaustehtävien b ratkaisuista. Määritä jokin kanta sille reaalikertoimisten polynomien lineaariavaruuden P aliavaruudelle, jonka virittää polynomijoukko {x, x+, x x }. Ratkaisu. Olkoon
LisätiedotIlkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi
Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2006) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin
Lisätiedotmlvektori 1. Muista, että Jacobin matriisi koostuu vektori- tai skalaariarvoisen funktion F ensimmäisistä
Aalto-yliopisto, Matematiikan ja Systeemianalyysin laitos mlvektori 1. Muista, että Jacobin matriisi koostuu vektori- tai skalaariarvoisen funktion F ensimmäisistä osittaisderivaatoista: y 1... J F =.
LisätiedotEi välttämättä, se voi olla esimerkiksi Reuleaux n kolmio:
Inversio-ongelmista Craig, Brown: Inverse problems in astronomy, Adam Hilger 1986. Havaitaan oppositiossa olevaa asteroidia. Pyörimisestä huolimatta sen kirkkaus ei muutu. Projisoitu pinta-ala pysyy ilmeisesti
LisätiedotOppimistavoitematriisi
Oppimistavoitematriisi Lineaarialgebra ja matriisilaskenta I Arvosanaan 1 2 riittävät Arvosanaan 5 riittävät Yhtälöryhmät (YR) Osaan ratkaista ensimmäisen asteen yhtälöitä ja yhtälöpareja Osaan muokata
LisätiedotOppimistavoitematriisi
Oppimistavoitematriisi Lineaarialgebra ja matriisilaskenta I Esitiedot Arvosanaan 1 2 riittävät Arvosanaan 3 4 riittävät Arvosanaan 5 riittävät Yhtälöryhmät (YR) Osaan ratkaista ensimmäisen asteen yhtälöitä
LisätiedotTehtävät. 1. Ratkaistava epäyhtälöt. a) 2(4 x) < 12, b) 5(x 2 4x + 3) < 0, c) 3 2x 4 > 6. 1/10. Sukunimi (painokirjaimin)
1/10 Tehtävä 1 2 3 4 5 6 7 8 9 10 Yhteensä Pisteet (tarkastaja merkitsee) Kokeessa on kymmenen tehtävää, joista jokainen on erillisellä paperilla. Jokaisen tehtävän maksimipistemäärä on 6 pistettä. Ratkaise
LisätiedotTestejä suhdeasteikollisille muuttujille
Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman
LisätiedotThe decimal point is 1 digit(s) to the right of the
806118P JOHDATUS TILASTOTIETEESEEN Mikroluokkaharjoitus 2/3, kevät 2019, viikko 6 Käynnistä R-ohjelma valinnoilla Start -> Programs -> R -> R x64 3.4.2. Käytämme tässä harjoituksessa R-ohjelmaa pääasiassa
LisätiedotIlkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Kertymäfunktio. TKK (c) Ilkka Mellin (2007) 1
Ilkka Mellin Todennäköisyyslaskenta Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat Kertymäfunktio TKK (c) Ilkka Mellin (2007) 1 Kertymäfunktio >> Kertymäfunktio: Määritelmä Diskreettien jakaumien
LisätiedotPeilaus pisteen ja suoran suhteen Pythonin Turtle moduulilla
Peilaus pisteen ja suoran suhteen Pythonin Turtle moduulilla ALKUHARJOITUS Kynän ja paperin avulla peilaaminen koordinaatistossa a) Peilaa pisteen (0,0) suhteen koordinaatistossa sijaitseva - neliö, jonka
LisätiedotTässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)
R-ohjelman käyttö data-analyysissä Panu Somervuo 2014 Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. 0) käynnistetään R-ohjelma Huom.1 allaolevissa ohjeissa '>' merkki on R:n
LisätiedotIlkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia
Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (006) 1 Moniulotteisia todennäköisyysjakaumia >> Multinomijakauma Kaksiulotteinen
LisätiedotSAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä. Antti Suoperä 16.11.2009
SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä Antti Suoperä 16.11.2009 SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä: Matriisi ja vektori laskennan ohjelmisto edellyttää
LisätiedotKäytetään satunnaismuuttujaa samoin kuin tilastotieteen puolella:
8.1 Satunnaismuuttuja Käytetään satunnaismuuttujaa samoin kuin tilastotieteen puolella: Esim. Nopanheitossa (d6) satunnaismuuttuja X kertoo silmäluvun arvon. a) listaa kaikki satunnaismuuttujan arvot b)
LisätiedotDiskriminanttianalyysi I
Diskriminanttianalyysi I 12.4-12.5 Aira Hast 24.11.2010 Sisältö LDA:n kertaus LDA:n yleistäminen FDA FDA:n ja muiden menetelmien vertaaminen Estimaattien laskeminen Johdanto Lineaarinen diskriminanttianalyysi
LisätiedotMoniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia: Mitä opimme?
TKK (c) Ilkka Mellin (4) Moniulotteisia todennäköisyysjakaumia Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (4) Moniulotteisia todennäköisyysjakaumia: Mitä
Lisätiedot8. Muita stokastisia malleja 8.1 Epölineaariset mallit ARCH ja GARCH
8. Muita stokastisia malleja 8.1 Epölineaariset mallit ARCH ja GARCH Osa aikasarjoista kehittyy hyvin erityyppisesti erilaisissa tilanteissa. Esimerkiksi pörssikurssien epävakaus keskittyy usein lyhyisiin
LisätiedotAINEISTON ESITTÄMINEN JA KUVAILU 5. luku
Aki Taanila AINEISTON ESITTÄMINEN JA KUVAILU 5. luku Koko materiaali löytyy osoitteesta http://www.haaga-helia.fi/~taaak 16.6.2010 5 GRAAFINEN ESITTÄMINEN Noudata numerotiedon graafisessa esittämisessä
Lisätiedot1. Kuusisivuista noppaa heitetään, kunnes saadaan silmäluku 5 tai 6. Olkoon X niiden heittojen lukumäärä, joilla tuli 1, 2, 3 tai 4.
HY / Matematiikan ja tilastotieteen laitos Todennäköisyyslaskenta II, syksy 206 Kurssikoe 28.0.206 Ratkaisuehdotuksia. Kuusisivuista noppaa heitetään, kunnes saadaan silmäluku 5 tai 6. Olkoon X niiden
LisätiedotMatematiikan kotitehtävä 2, MAA 10 Todennäköisyys ja tilastot
Matematiikan kotitehtävä 2, MAA 10 Todennäköisyys ja tilastot Sievin lukio Tehtävien ratkaisut tulee olla esim. Libre officen -writer ohjelmalla tehtyjä. Liitä vastauksiisi kuvia GeoGebrasta ja esim. TI-nSpire
LisätiedotTilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä
Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä Sisältö Riippumattomuus Jos P(A B) = P(A)P(B), niin tapahtumat A ja B ovat toisistaan riippumattomia. (Keskustelimme
LisätiedotTilastollinen päättely II, kevät 2017 Harjoitus 2A
Tilastollinen päättely II, kevät 07 Harjoitus A Heikki Korpela 3. tammikuuta 07 Tehtävä. (Monisteen tehtävä.3 Olkoot Y,..., Y n Exp(λ. Kirjoita vastaava tilastollisen mallin lauseke (ytf. Muodosta sitten
LisätiedotJatkuvat satunnaismuuttujat
Jatkuvat satunnaismuuttujat Satunnaismuuttuja on jatkuva jos se voi ainakin periaatteessa saada kaikkia mahdollisia reaalilukuarvoja ainakin tietyltä väliltä. Täytyy ymmärtää, että tällä ei ole mitään
Lisätiedotpisteet Frekvenssi frekvenssi Yhteensä
806118P JOHDATUS TILASTOTIETEESEEN Loppukoe 15.3.2018 (Jari Päkkilä) 1. Kevään -17 Johdaus tilastotieteeseen -kurssin opiskelijoiden harjoitusaktiivisuudesta saatujen pisteiden frekvenssijakauma: Harjoitus-
Lisätiedot11 Raja-arvolauseita ja approksimaatioita
11 Raja-arvolauseita ja approksimaatioita Tässä luvussa esitellään sellaisia kuuluisia todennäköisyysteorian raja-arvolauseita, joita sovelletaan usein tilastollisessa päättelyssä. Näiden raja-arvolauseiden
LisätiedotMS-A0003/A0005 Matriisilaskenta Laskuharjoitus 1 / vko 44
MS-A0003/A0005 Matriisilaskenta Laskuharjoitus / vko Tehtävä (L): Käynnistä Matlab-ohjelma ja kokeile laskea sillä muutama peruslaskutoimitus: laske jokin yhteen-, vähennys-, kerto- ja jakolasku. Laske
LisätiedotTeema 7: Todennäköisyyksien laskentaa
Teema 7: Todennäköisyyksien laskentaa Teemassa 6 tutustuttiin todennäköisyyden ja satunnaisuuden käsitteisiin sekä todennäköisyyslaskennan perusteisiin. Seuraavaksi tätä aihepiiriä syvennetään perehtymällä
Lisätiedotr > y x z x = z y + y x z y + y x = r y x + y x = r
HY / Matematiikan ja tilastotieteen laitos Vektorianalyysi I, syksy 018 Harjoitus Ratkaisuehdotukset Tehtävä 1. Osoita, että avoin kuula on avoin joukko ja suljettu kuula on suljettu joukko. Ratkaisu.
Lisätiedot