R-kurssi Jarno Tuimala

Koko: px
Aloita esitys sivulta:

Download "R-kurssi. 14.4.2010 Jarno Tuimala"

Transkriptio

1 R-kurssi Jarno Tuimala

2 Osallistujat 1. Pirjo Wacklin 2. Ilja Ritamo 3. Noora Alakulppi 4. Tiina Leppänen 5. Eeva Nyberg-Oksanen 6. Ville Parviainen 7. Tanja Kaartinen 8. Milla Mikkola 9. Teemu Laakso 10. Eeva-Lotta Arola 11. Virpi Kiuru 12. Marjatta Kiminkinen 13. Elina Pusa 14. Juha Eronen

3 Ohjelma Asennus, aputoiminnot, datan lukeminen R-ohjelmistoon Lounas Osa-aineiston poimiminen, aineiston kuvaileminen (keskiarvo, keskihajonta, ym.) Kahvi Grafiikka (hajontakuvio, histogrammi, pylväskaavio, ym.) ja tilastollinen testaus (t-testi, Khiin neliötesti, tms.) Kertaus ja opintopiirin aiheiden suunnitelu

4 R:n asentaminen

5

6

7 R:n rakenne Kaksi osaa Ydin (base) Tämä pitää asentaa ensin Laajennuspaketit (contrib) Nämä laajentavat toiminnallisuutta Neljä paikkaa: CRAN (R:n kotisivuilla) Bioconductor (www.bioconductor.org) OmegaHat (www.omegahat.org) R-Forge (www.-r-forger.org)

8 Asennus Lataa asennusohjelma CRAN:sta, esimerkiksi: ows/base/r win32.exe. Asennukseen ei tarvitse järjestelmän valvojan tunnuksia, jos asennusvaiheessa poistaa ruksin kohdasta Save Version Number to Registry.

9

10 Miten löytää sopiva paketti?

11 Pakettien asentaminen 1. 2.

12 Pakettien käyttäminen Paketin tarjoaminen työkalujen käyttöön ei riitä paketin asentaminen, vaan paketti on ladattava muistiin ennen jokaista käyttökertaa.

13 Apua I/II Hakutoiminnot R-projektin etusivu SuNET:in CRAN

14 Apua II/III

15 Apua III/III

16 Harjoitus 1 Asenna kurssikäyttöön tarkoitettu R käyttämällesi koneelle Luo työpöydälle kansio kurssidata, ja hae sinne tiedostot rairuoho.txt nopat.txt Tiedostot löydät (Internet-selaimella) osoitteesta:

17 Peruskäyttö Aineiston valmistelu ja lukeminen Aineiston manipulointi

18 Aineiston valmistelu Excelissä I/II Yksi otsikkorivi, ei ääkkösiä Havainnot riveillä Muuttujat sarakkeissa

19 Aineiston valmistelu Excelissä I/II

20 Aineiston lukeminen R:ään I/II jarno <read.table("jarno.txt", header=true, na.strings="na", Riippuu koneesta sep="\t", dec=".", strip.white=true)

21 Aineiston lukeminen R:ään II/II Suositeltava aloitustapa aina! jarno <- read.table("jarno.txt", header=true, sep="\t")

22 Harjoitus 2 Lue kurssidata-kansiosta kumpikin aineisto R:ään. Tallenna tiedoston rairuoho.txt aineisto R:ssä nimellä rairuoho, ja tiedoston nopat.txt aineisto nimellä nopat.

23 Komentojen rakenne I/II read.table( "jarno.txt", header=true, sep="\t" ) Komento + sulut + argumentit Mitä tehdään mille tai miten tehdään

24 Komentojen rakenne II/II read.table(file="jarno.txt", header=true, sep="\t") read.table("jarno.txt", TRUE, "\t")

25 Objektiin tallentaminen Aineisto on R:ssä aina tallennettu jonkin nimiseen objektiin. Uusi objekti luodaan esimerkiksi komennolla: jarno<-read.table(file="jarno.txt", header=true, sep="\t") kun luetaan tiedostosta Jo olemassa oleva objekti voidaan kopioida toiselle nimelle: jarno2<-jarno Aina sama kolmen osan rakenne: nimi <- tallennettava tieto

26 Osa-aineiston poimiminen I/ Aineisto objektissa students:

27 Osa-aineiston poimiminen II/ Aineisto objektissa students Halutaan poimia yksi kokonainen sarake Käytetään objektin nimen perässä merkintää $, jota seuraa sarakkeen nimi Opiskelijoiden pituudet saadaan siis erilleen merkinnällä: students$height

28 Osa-aineiston poimiminen III/ Aineisto objektissa students Sarake voidaan erottaa myös käyttämällä alaindeksiä, jota merkitään objektin nimen perässä olevilla hakasuluilla Alaindeksiä käyttäen sama sarake (ensimmäinen vasemmalta) poimittaisiin: students[,1]

29 Osa-aineiston poimiminen IV/ Aineisto objektissa students Rivien poimiminen onnistuu vain alaindeksiä käyttäen Poimitaan ensimmäinen rivi: students[1,]

30 Osa-aineiston poimiminen V/ Aineisto objektissa students Poimitaan ensimmäisen sarakkeen ensimmäinen havainto: students[1,1] rivit sarakkeet

31 Osa-aineiston poimiminen VI/ Aineisto objektissa students:

32 Osa-aineiston poimiminen VII/ Poimitaan kaikki naiset (sarakkeen gender perusteella siis) Testataan onko havainto naisesta käyttäen vertailuoperaattoria == (kaksi yhtäsuuruusmerkkiä) students$gender=="female" Talletetaan tieto objektiin f: f<-students$gender=="female" Poimitaan alaindeksiä ja objektia f käyttäen oikeat rivit: female<-students[f,]

33 Osa-aineiston poimiminen VIII/ female<-students[f,] Objektin voi tulostaa ruudulle! female height shoesize gender population female tampere female tampere female tampere female tampere female tampere

34 Taulukon nimet ja koko Taulukon koko: dim() dim(students) Sarakkeiden nimet: colnames() colnames(students) Rivien nimet: rownames() rownames(students)

35 Harjoitus 3 Tarkastele rairuohoaineistoa: Selvitä aineiston rivien ja sarakkeiden määrä Mitkä ovat sarakkeiden nimet? Tee rairuohoaineistosta kaksi pienempää aineistoa, yksi vesikäsitellyille ja toinen ravinnekäsitellyille viljelmille Käsittelytieto löytyy sarakkeesta treatment, jossa arvo water=vesikäsittely ja nutrient=ravinnekäsittely Tallenna nämä aineistot objekteihin water ja nutrient

36 Aineiston lajittelu I/IV Kokonaisen taulukon lajittelu tapahtuu komennolla order(), joka yhdistetään alaindeksiin. Aineisto objektissa students:

37 Aineiston lajittelu II/IV Lajitellaan pituuden perusteella. Luodaan ensin objekti ind, joka kertoo mihin järjestykseen taulukon havainnot pitää laittaa: ind<-order(students$height)

38 Aineiston lajittelu III/IV ind

39 Aineiston lajittelu IV/IV students[ind,] height shoesize gender population female tampere female tampere female tampere female tampere female tampere male tampere male tampere male tampere male tampere male tampere

40 Aineiston lajittelu, yhteenveto 1. Lajittelujärjestyksen selvittäminen ind<-order(students$height) 2. Lajittelu (=aineiston poiminta) students[ind,]

41 Muuttujien uudelleen koodaaminen Muuttuja voidaan koodata uudelleen mm. komennolla ifelse(). Tämä on usein näppärää esimerkiksi, kun halutaan esittää kuvioissa eri ryhmiin kuuluvat havainnot eri väreillä. Koodataan sukupuoli eri väreillä (mies=sininen, nainen=punainen) cols<-ifelse(students$gender=="male", "blue", "red")

42 Muuttujien uudelleen koodaaminen cols<-ifelse(students$gender=="male", "blue", "red") "Jos sukupuoli on mies, palautetaan blue, muutoin palautetaan red."

43 Harjoitus 4 Lajittele rairuohoaineisto viljelyalustan (bed) mukaiseen järjestyksen. Koodaa käsittely (treatment) värikoodein siten, että vesikäsittelyä vastaa sininen väri, ja ravinnekäsittelyä punainen väri.

44 Grafiikka ja aineiston kuvailu

45 Aineiston kuvailu I/ > summary(students) height shoesize Min. :158.0 Min. : st Qu.: st Qu.:38.00 Median :170.0 Median :40.00 Mean :170.3 Mean : rd Qu.: rd Qu.:42.75 Max. :181.0 Max. :44.00 > mean(students$height) [1] > sd(students$height) [1] gender female:5 male :5 population tampere:10

46 Aineiston kuvailu II/ > min(students$height) [1] 158 > max(students$height) [1] 181 > range(students$height) [1] > median(students$height) [1] 170

47 Ryhmäkohtaiset arvot > aggregate(students$height, list(students$gender), mean) Group.1 x 1 female male > aggregate(students$height, list(students$gender), sd) Group.1 x 1 female male aggregate(students$height, list(students$gender), mean) mille ryhmät suure

48 Hajontakuvio I/ > plot(x=students$height, y=students$shoesize)

49 Hajontakuvio II/ > plot(x=students$height, y=students$shoesize, xlab="pituus", ylab="kengännumero", main="opiskelijat")

50 Hajontakuvio III/ > cols<-ifelse(students$gender=="male", "blue", "red") > plot(x=students$height, y=students$shoesize, xlab="pituus", ylab="kengännumero", main="opiskelijat", col=cols)

51 Hajontakuvio IV/ > cols<-ifelse(students$gender=="male", "blue", "red") > plot(x=students$height, y=students$shoesize, xlab="pituus", ylab="kengännumero", main="opiskelijat", col=cols, las=1, pch=19)

52 Viivakuvio I > plot(x=students$height, y=students$shoesize, xlab="pituus", ylab="kengännumero", main="opiskelijat", las=1, type="l")

53 Viivakuvio II > plot(x=students$height, y=students$shoesize, xlab="pituus", ylab="kengännumero", main="opiskelijat", las=1, type="l", lwd=3)

54 Viivakuvio III > plot(x=students$height, y=students$shoesize, xlab="pituus", ylab="kengännumero", main="opiskelijat", las=1, type="l", lwd=3, lty=2, col="red")

55 Histogrammi hist(students$height)

56 Laatikkokuvio I > boxplot(students$height)

57 Laatikkokuvio II/ > boxplot(students$height~students$gender)

58 Pylväskaavio I/ > barplot(table(students$shoesize))

59 Pylväskaavio II/ > barplot((students$shoesize), col=cols)

60 Pylväskaavio III/ > barplot((students$shoesize), col=cols, las=1, main="naisten ja miesten kengänkoko")

61 Pylväskaavio IV/ > barplot(sort(students$shoesize), col=cols, las=1, main="naisten ja miesten kengänkoko", names.arg=sort(students$shoesize))

62 Harjoitus 5 Miten rairuohon 3. päivän (muuttuja day3) ja 7. päivän (muuttuja day7) pituudet suhtautuvat toisiinsa? Käytä hajontakuviota. Onko 7. päivän mittausten jakauma yksihuippuinen ja symmetrinen eli jojkseenkin normaalinen? Käytä histogrammia ja laatikkokuviota. Kuvaa mustan nopan arvojen jakaumaa pylväskaaviolla (noppa-aineiston muuttuja black).

63 Tilastolliset testit

64 Taulukointi komento table() Yhdestä muuttujasta: > table(students$gender) #lkm female male 5 5 > prop.table(table(students$gender)) #% female male

65 Taulukointi - kaksi muuttujaa > table(students$gender, students$shoesize) female male

66 Khiin neliötesti I/ Tarvitaan taulukko, joko tiedostosta luettu tai komennolla table() muodostettu Käytetään tässä yhden nopan taulukoituja tuloksia: > noppa V

67 Khiin neliötesti II/ Yhteensopivuustesti (noudattaako muuttuja oletettua jakaumaa vai ei) Nopan tapauksessa kaikkien tapausten oletetaan olevan yhtä yleisiä (tasajakauma) Seuraavan sivun esimerkki

68 Khiin neliötesti III/ > chisq.test(noppa) Chi-squared test for given probabilities data: noppa X-squared = 11.8, df = 5, p-value =

69 Khiin neliötesti IV/ Jos testataan yhteensopivuutta johonkin muuhun kuin tasajakaumaan, esimerkki genotyyppifrekvenssejä, pitää eri luokkien todennäköisyys määritellä Genotyypit: AA, AT ja TT Alleelifrekvenssit: A=0,9, T=0.1 Aineisto: 750 AA, 50 AT ja 200 TT

70 Khiin neliötesti V/ Aineisto (objektissa geno): Testi: chisq.test(x=geno$havaittu, p=gene$tn) Tulos: X-squared = , df = 2, p-value < 2.2e-16

71 Khiin neliötesti VI/ Riippumattomuustesti (Onko muuttujien jakaumien välillä eroa) Luodaan aineisto (objektiin F): F <- matrix(c(33,14,8,18,31,25,14,12), 4,2) Tai luetaan se Excelistä:

72 Khiin neliötesti VII/ > chisq.test(f) Pearson's Chi-squared test data: F X-squared = , df = 3, pvalue =

73 Fisherin testi > fisher.test(f) Fisher's Exact Test for Count Data data: F p-value = alternative hypothesis: two.sided

74 F-testi I/ F-testi vertaa kahden otoksen variansseja. Esimerkiksi students-aineistossa voidaan verrata miesten ja naisten pituuksien variansseja Tehdään ensin aineistot: males<-students[students$gender=="male",] females<-students[students$gender=="female",] Ja sitten testi (seuraavalla sivulla)

75 F-testi II/ > var.test(males$height, females$height) F test to compare two variances data: males$height and females$height F = 0.875, num df = 4, denom df = 4, p-value = alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: sample estimates: ratio of variances 0.875

76 T-testi I/ T-testi vertaa kahden otoksen keskiarvoja Testistä on useita variaatioita, tässä kahden riippumattoman populaation testi Ennen testin tekemistä on syytä testata, ovatko otosten varianssi yhtä suuret (ks. F-testi) Students-aineistossa eri sukupuolten pituuksien varianssi oli yhtä suurta Itse testiesimerkki seuraavalla sivulla

77 T-testi II/ > t.test(males$height, females$height, var.equal=true) Two Sample t-test data: males$height and females$height t = , df = 8, p-value = alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: sample estimates: mean of x mean of y

78 Harjoitus 6 Testaa Khiin neliötestillä noppa-aineiston nopat, ja päättele, ovatko ne harhattomia (kaikkia lukuja saadaan suunnilleen yhtä paljon) Testaa onko vesi- ja ravinnekäsittelyissä eroa (muuttuja treatment), kun vasteena on viljelmän seitsemäntenä päivänä mitattu pituus (muuttuja day7).

79 Kertaus

80 Mikä jäi epäselväksi?

81 Opintopiirin suunnittelu

82 Opintopiiri Kuusi kertaa: Ajankohta: klo Paikka: Netti

83 Aiheita Oman aineiston lukeminen (jokainen tuo omaa aineistoa, jos sitä on)»puuttuvat arvot»toistettavat toimenpiteet (uusien komentojen luominen) Regressiot»Muunnokset (box-cox ym.)»lineaarinen regressio 5.5. Hierarkkinen data (Bioconductor?) Tiedonlouhinta ja visualisointi Menetelmien / laitteiden validointi Laadunvalvontatilastot (vakioraportit)

84 Opintopiiri Automatisointi Oman datan lukeminen Puuttuvat arvot

85

86

87

88 Automatisointi 1. Tee tekstitiedosto, jossa tarvittavat komennot ovat, ja aja se komennolla source(). 2. Tee komennoista funktio. hello<-function(x) { print("hello World!") } 1. Tee laajennuspaketti

89 Oman datan lukeminen Jos et tiedä, missä muodossa aineistosi on, tarkastele sitä ensin Notepad:ssä ja Excelissä. Onko aineisto taulukossa? Onko joka rivillä yhtä monta havaintoa? Onko sarakkeilla otsikot? Mikä erottaa sarakkeita? Mikä on desimaalierotin?

90 Oman datan lukeminen read.table() Taulukkoaineistolle read.fwf() read.spss() SPSS-datalle, paketissa foreign scan() readlines() Lukee rivin kerrallaan

91 Puuttuvat arvot na.omit() mean(1:10, na.rm=true) mean(na.omit(1:10)) impute() library(e1071) impute(1:10)

92 Opintopiiri Muuttujien muunnokset Regressio

93 Lineaarinen regressio Yleinen lineaarinen malli lineaarinen regressio varianssianalyysi kovarianssianalyysi Työvaiheet Mallien sovitus Mallin valinta Oletusten tarkistus Validointi

94 Mallien sovitus dat<-read.table("rairuoho.txt", header=t, sep="\t") fit0<-lm(day7~1, data=dat) fit1<-lm(day7~bed*treatment, data=dat) fit1<-lm(day7~bed+treatment+ bed:treatment, data=dat) fit2<-lm(day7~bed, data=dat) fit3<-lm(day7~treatment, data=dat)

95 Tulosten tarkastelu I summary(fit1) Call: lm(formula = day7 ~ bed + treatment + bed:treatment, data = dat) Residuals: Min 1Q Median Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) < 2e-16 *** bedmould bedpaper *** bedpaper treatmentwater bedmould2:treatmentwater bedpaper4:treatmentwater bedpaper8:treatmentwater Signif. codes: 0 *** ** 0.01 * Residual standard error: on 40 degrees of freedom Multiple R-squared: 0.532, Adjusted R-squared: F-statistic: on 7 and 40 DF, p-value: 3.862e-05

96 Tulosten tarkastelu II anova(fit1) Analysis of Variance Table Response: day7 Df Sum Sq Mean Sq F value Pr(>F) bed e-05 *** treatment ** bed:treatment Residuals Signif. codes: 0 *** ** 0.01 *

97 Mallin valinta > AIC(fit0, fit1, fit2, fit3) df AIC fit fit fit fit

98 Oletusten tarkistus I par(mfrow=c(2,2)) plot(fit1)

99 Oletusten tarkistus II boxplot(resid(fit1)~ dat$bed) boxplot(resid(fit1)~ dat$treatment) boxplot(resid(fit1)~ dat$bed*dat$treatment)

100 Muunnokset I Simuloidaan data: d<-rexp(1000, 10) Jakauma: hist(d)

101 Muunnokset II d2<-log(d) hist(d2) HUOM! jos taul.: log(taul$d2)

102 Muunnokset III Logaritmi - log() Oikealle vinojen jakaumien tapauksessa Neliöjuuri - sqrt() Lukumäärät Eksponentti exp() tai ^ Logaritmin käänteisfunktio

103 Muunnokset IV boxcox(fit1) Jos l<>0: day7b<(day7^1.4-1)/1.4 Jos l==0 day7b<log(day7)

104 Opintopiiri "Hierarkkisen" datan analysointi

105 (G)(N)LME Generalized (non)linear mixed effect models (GNLME) Aineistossa fixed ja random muuttujia tai aineisto hierarkkista fixed: asetettu tiettyihin arvoihin koetta suoritettaessa random: edustavat mahdollisia muuttujan arvoja, mutteivät sisällä kaikkia mahdollisia arvoja Maa/kunta/koulu/luokka/oppilas toistomittauksia samoista henkilöistä (parittaisen ttestin laajennus)

106 Sekamallit R:ssä Balansoitu eksperimentti: aov() Ei-balansoitu eksperimentti: nlme lme() lme4 lmer() Bioinformatiikka: limma lmfit() ebayes()

107 Yleisiä piirteitä Hankalia käyttää Syntaksi on hankalaa ja vaihtelee paketista toiseen Eivät aina konvergoidu Kaikkia oletuksia ei voi testata Vaarallisia käyttää Sama malli voidaan usein sovittaa usealla eri tavalla Vaativat asian melko syvällistä ymmärtämistä, jotta analyysi menee oikein

108

109

110

111 # Reading data dat<-read.table("http://koti.mbnet.fi/tuimala/ oppaat/r/data/rairuoho_long.txt", header=t, sep="\t") # General linear model fit<-lm(pituus~kasittely, data=dat2) summary(fit) #kasittelywater *** # Mixed model fit4<-lme(pituus~kasittely, random=~1 viljelma, data=dat2) summary(fit4) #kasittelywater e-04

112 # Reading data dat<-read.table("http://koti.mbnet.fi/tuimala/ oppaat/r/data/rairuoho_long.txt", header=t, sep="\t") # Loads the library library(nlme) # NULL model fit0<-lme(pituus~1, random=~1 viljelma, data=dat) # Model time (random intercept model) fit1<-lme(pituus~paiva, random=~1 viljelma, data=dat2) # Model time (random intercept and slope model) fit2<-lme(pituus~poly(paiva, 3), random=~paiva viljelma, data=dat) # Modeling error structures fit3<-lme(pituus~poly(paiva, 3)+kasittely, random=~paiva viljelma, data=dat, weights=varexp()) # Model selection AIC(fit1, fit2, fit3) # Assumptions plot(fit3, pch=19, cex=1.5) # Result summary(fit3)

113 Linear mixed-effects model fit by REML Data: dat2 AIC BIC loglik Random effects: Formula: ~paiva viljelma Structure: General positive-definite, Log-Cholesky parametrization StdDev Corr (Intercept) (Intr) paiva Residual Variance function: Structure: Exponential of variance covariate Formula: ~fitted(.) Parameter estimates: expon Fixed effects: pituus ~ poly(paiva, 3) + kasittely Value Std.Error DF t-value p-value (Intercept) poly(paiva, 3) poly(paiva, 3) poly(paiva, 3) kasittelywater Correlation: (Intr) p(,3)1 p(,3)2 p(,3)3 poly(paiva, 3) poly(paiva, 3) poly(paiva, 3) kasittelywater Standardized Within-Group Residuals: Min Q1 Med Q Number of Observations: 288 Number of Groups: 48 Max

114

115

116

117 Opintopiiri Tiedon louhinta

118 Koodia # Luetaan aineisto dat<-read.table("http://koti.mbnet.fi/tuimala/oppaat/r/data/index2010_data.txt", header=t, sep="\t", quote="", strip.white=t, row.names=1) # Hierarkkinen ryhmittelyanalyysi heatmap(na.omit(as.matrix(dat)), mar=c(12,5), scale="none") heatmap(t(na.omit(as.matrix(dat))), mar=c(10,0), scale="none", cexcol=0.4) # Rinnakkaiskoordinaattikuvio matplot(t(dat), type="l", col=1, lwd=2, lty=1) matplot(t(dat), type="l", col="# ", lwd=2, lty=1) # K-means ryhmittelyanalyysi km<-kmeans(na.omit(dat), centers=9, nstart=100) par(mfrow=c(3,3)) for(i in 1:9) { d<-dat[km$cluster==i,] matplot(t(d), type="l", col=1, lwd=2, lty=1, main=paste("ryhmä ", i, sep="")) } # Yksi lm-malli kullekin riville sovitettuna # Ei toimi, tässä vain ajatuksellisena esimerkkinä fit1<-lm(t(dat2)~groups)

119 Tiedonlouhinta Joukko menetelmiä joilla pyritään löytämään oleellinen suurista tietomassoista Vrt. EDA Menettelytapa, jossa aineistoa selotaan uusien hypoteesien muodostamiseksi tai testattvaksi soveltuvien hypoteesien löytämiseksi

120 Tiedonlouhinnan menetelmät Ryhmittelyanalyysi Erotteluanalyysi Regressio Assosiaatiosäännöt

121 Hierarkkinen ryhmittelyanalyysi

122 Rinnakkaiskoordinaatit

123 Rinnakkaiskoordinaatit

124 K-means

125 Tag cloud

126 Tag cloud

127 Opintopiiri Menetelmien vertailu

128 Mitä määrittää? Lineaarisuus Lineaarinen regressio ja kuvat Tarkkuus MethComp-paketti

129 fit1<-lm(a~c, data=dat) summary(fit) Call: lm(formula = A ~ C, data = dat) Residuals: Min 1Q Median Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) C e-15 *** --Signif. codes: 0 *** ** 0.01 * Residual standard error: on 18 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 1 and 18 DF, p-value: 1.360e-15

130 Perustiedot Selitysaste Multiple R-squared: Korrelaatiokerroin sqrt(0.9732) = Leikkauspiste Estimate Std. Error t value Pr(> t ) (Intercept) Kulmakerroin t ) Estimate Std. Error t value Pr(>

131 Jäännöskaavio

132 Käyrä? fit2<-lm(a~poly(c, 2), data=dat) fit3<-lm(a~poly(c, 3), data=dat) AIC(fit1, fit2, fit3) df AIC fit fit fit

133 Neliösummat anova(fit1) Analysis of Variance Table Response: A Df Sum Sq Mean Sq F value Pr(>F) C e15 *** Residuals sum(resid(fit1)^2)

134 MethComp-paketti p/

135 library(methcomp) dat<-read.table("hb.txt", header=t) dat2<-data.frame(y=c(dat$a,dat$c), meth=c(rep("a", 20), rep("c", 20)), item=rep(1:20, 2), repl=rep(1, 40)) summary(meth(dat2)) plot(meth(dat2)) par(mar=c(4,4,1,4)); BA.plot(Meth(dat2), reg.line=false) par(mar=c(4,4,1,4)); BA.plot(Meth(dat2), reg.line=true)

136 #Replicates Method 1 #Items #Obs: 40 Values: min med max A C

137

138

139 plot(dat$a, dat$c) bothlines(dat$a, dat$c) f<-ggplot(dat, aes(a, C)) f + stat_smooth(method = "lm") + geom_point() f<-ggplot(dat, aes((a+c)/2, C/A)) f + stat_smooth(method = "lm") + geom_point() f<-ggplot(dat, aes(a, C)) f + stat_smooth() + geom_point()

140

141

142

143

144 dat<-read.table("rairuoho.txt", header=t, sep="\t") fit<-lm(day7~day3, data=dat) plot(x=dat$day3, y=dat$day7, pch=19, cex=1.5, xlab="day 3", ylab="day 7", las=1) abline(fit, lwd=2, col="red") fit<-lm(day7~bed+treatment, data=dat) par(mfrow=c(2,2)) termplot(fit, rug=t, se=t) termplot(fit, rug=t, se=t, partial.resid=t) library(arm) par(mar=c(5,10,5,5)) coefplot(fit, intercept=t) library(effects) ae<-alleffects(fit) plot(ae, 'bed') n < set.seed(17) age <- rnorm(n, 50, 10) blood.pressure <- rnorm(n, 120, 15) cholesterol <- rnorm(n, 200, 25) sex <- factor(sample(c('female','male'), n,true)) label(age) <- 'Age' label(cholesterol) <- 'Total Cholesterol' label(blood.pressure) <- 'Systolic Blood Pressure' label(sex) <- 'Sex' units(cholesterol) <- 'mg/dl' units(blood.pressure) <- 'mmhg' L <-.4*(sex=='male') +.045*(age-50) + (log(cholesterol - 10)-5.2)*(-2*(sex=='female') + 2*(sex=='male')) y <- ifelse(runif(n) < plogis(l), 1, 0) ddist <- datadist(age, blood.pressure, cholesterol, sex) options(datadist='ddist') fit <- lrm(y ~ blood.pressure + sex * (age + rcs(cholesterol,4))) s <- summary(fit, age=c(50,60,70)) plot(s, log=true, at=c(.1,.5,1,1.5,2,4,8)) options(datadist=null) f <- lrm(y ~ lsp(age,50)+sex*rcs(cholesterol,4)+blood.pressure) nom <- nomogram(f, fun=function(x)1/(1+exp(-x)), # or fun=plogis fun.at=c(.001,.01,.05,seq(.1,.9,by=.1),.95,.99,.999), funlabel="risk of Death", xfrac=.45) print(nom) plot(fit, age=seq(20,80,length=100), sex=na, conf.int=false)

145

146

147

148

149

150

151

152

153

154

155

156

157 Hoitojaksojen lukumäärä ja verivalmisteiden käyttö hoitojaksoa kohden Map of the Market 0 Verenkiertoelinten sairaudet Muut kasvaimet 0 7 Tuki- ja liikuntaelinten sairaudet Veren pahanlaatuiset kasvaimet 14 7 Tartunta- ja loistauteja Muualla luokittelemattomat oireet Synn. epämuodostumat 14 Hermoston sairaudet Mielenterveyden häiriöt Ihon ja Umpierit.- ravitsemus alaiskudokja aineenvaihdunta sen sairaudet Eräät perinataaliaikana alk. tilat Tekijöitä, jotka vaik. terveyteen Virtsa- ja sukupuolielinten sairaudet Hengityselinten sairaudet Veren sairaudet Raskaus, synnytys, lapsivuoteus Vammat, myrkytykset ja ulk. syyt Korvan ja kartiolis. sairaudet Silmän ja apuelinten sairaudet Ruuansulatuselinten sairaudet

158

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot) R-ohjelman käyttö data-analyysissä Panu Somervuo 2014 Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. 0) käynnistetään R-ohjelma Huom.1 allaolevissa ohjeissa '>' merkki on R:n

Lisätiedot

(d) Laske selittäjään paino liittyvälle regressiokertoimelle 95 %:n luottamusväli ja tulkitse tulos lyhyesti.

(d) Laske selittäjään paino liittyvälle regressiokertoimelle 95 %:n luottamusväli ja tulkitse tulos lyhyesti. 2. VÄLIKOE vuodelta -14 1. Liitteessä 1 on esitetty R-ohjelmalla saatuja tuloksia aineistosta, johon on talletettu kahdenkymmenen satunnaisesti valitun miehen paino (kg), vyötärön ympärysmitta (cm) ja

Lisätiedot

Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu JMP:llä

Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu JMP:llä Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi Esimerkit laskettu JMP:llä Antti Hyttinen Tampereen teknillinen yliopisto 29.12.2003 ii Ohjelmien

Lisätiedot

Residuaalit. Residuaalit. UK Ger Fra US Austria. Maat

Residuaalit. Residuaalit. UK Ger Fra US Austria. Maat TAMPEREEN YLIOPISTO Tilastollisen mallintamisen harjoitustyö Teemu Kivioja ja Mika Helminen Epätasapainoisen koeasetelman analyysi Worksheet 5 Matematiikan, tilastotieteen ja filosofian laitos Tilastotiede

Lisätiedot

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa 9. luento Pertti Palo 22.11.2012 Käytännön asioita Eihän kukaan paikallaolijoista tee 3 op kurssia? 2. seminaarin ilmoittautuminen. 2. harjoitustyön

Lisätiedot

Pylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 2003 LKM 14.8% 11.2% 19.7% 4.9% 3.6% 45.

Pylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 2003 LKM 14.8% 11.2% 19.7% 4.9% 3.6% 45. Pylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 8.8% 8.9%.%.% 9.7%.7% Etelä Länsi Itä Oulu Lappi Ahvenanmaa Länsi Etelä Itä Oulu Lappi Ahvenanmaa Läänien

Lisätiedot

Ilmoittaudu Weboodissa klo (sali L4) pidettävään 1. välikokeeseen!

Ilmoittaudu Weboodissa klo (sali L4) pidettävään 1. välikokeeseen! 8069 TILASTOTIETEEN PERUSMENETELMÄT I Harjoitus 7, viikko 9, kevät 2013 (Muut kuin taloustieteiden tiedekunnan opiskelijat) MUISTA MIKROLUOKKAHARJOITUKSET VIIKOLLA 9! Ilmoittaudu Weboodissa 4.3.2013 klo

Lisätiedot

1. Tietokoneharjoitukset

1. Tietokoneharjoitukset 1. Tietokoneharjoitukset Aluksi Tällä kurssilla käytetään R-ohjelmistoa, jonka käyttämisestä lienee muutama sana paikallaan. R-ohjelmisto on laajasti käytetty vapaassa levityksessä oleva ammattimaiseen

Lisätiedot

ATH-koulutus: R ja survey-kirjasto THL 16.2.2011. 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1

ATH-koulutus: R ja survey-kirjasto THL 16.2.2011. 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1 ATH-koulutus: R ja survey-kirjasto THL 16.2.2011 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1 Sisältö Otanta-asetelman kuvaaminen R:llä ja survey-kirjastolla Perustunnusluvut Regressioanalyysit 16. 2. 2011

Lisätiedot

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat Päättely yhden selittäjän lineaarisesta regressiomallista Ennustaminen, Ennuste, Ennusteen luottamusväli, Estimaatti, Estimaattori,

Lisätiedot

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös): Tilastollinen tietojenkäsittely / SPSS Harjoitus 5 Tarkastellaan ensin aineistoa KUNNAT. Kyseessähän on siis kokonaistutkimusaineisto, joten tilastollisia testejä ja niiden merkitsevyystarkasteluja ei

Lisätiedot

Perusnäkymä yksisuuntaiseen ANOVAaan

Perusnäkymä yksisuuntaiseen ANOVAaan Metsämuuronen 2006. TTP Tutkimuksen tekemisen perusteet ihmistieteissä Taulukko.51.1 Analyysiin mukaan tulevat muuttujat Mja selite Merkitys mallissa F1 Ensimmäinen faktoripistemuuttuja Selitettävä muuttuja

Lisätiedot

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit s t ja t kahden Sisältö t ja t t ja t kahden kahden t ja t kahden t ja t Tällä luennolla käsitellään epäparametrisia eli

Lisätiedot

5 Osa 5: Ohjelmointikielen perusteita

5 Osa 5: Ohjelmointikielen perusteita 5 Osa 5: Ohjelmointikielen perusteita 5.1 Omat funktiot R on lausekekieli: Kaikki komennot kuten funktiokutsut ja sijoitusoperaatiot ovat lausekkeita. Lausekkeet palauttavat jonkin arvon. Lausekkeita voidaan

Lisätiedot

Harjoitus 7: NCSS - Tilastollinen analyysi

Harjoitus 7: NCSS - Tilastollinen analyysi Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen

Lisätiedot

Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 3: Frekvenssiaineistojen asetelmaperusteinen analyysi: Perusteita

Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 3: Frekvenssiaineistojen asetelmaperusteinen analyysi: Perusteita Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 3: Frekvenssiaineistojen asetelmaperusteinen analyysi: Perusteita risto.lehtonen@helsinki.fi OHC Survey Tilastollinen analyysi Kysymys: Millä

Lisätiedot

SPSS-perusteet. Sisältö

SPSS-perusteet. Sisältö SPSS-perusteet Sisältö Ikkunat 3 Päävalikot 5 Valikot 6 Aineiston käsittely 6 Muuttujamuunnokset 7 Aineistojen kuvailu analyysit 8 Havaintomatriisin luominen ja käsittely 10 Muulla sovelluksella tehdyn

Lisätiedot

2. Tietokoneharjoitukset

2. Tietokoneharjoitukset 2. Tietokoneharjoitukset Demotehtävät 2.1 Jatkoa kotitehtävälle. a) Piirrä aineistosta pistediagrammi (KULUTUS, SAIRAST) ja siihen estimoitu regressiosuora. KULUTUS on selitettävä muuttuja. b) Määrää estimoidusta

Lisätiedot

Perhevapaiden palkkavaikutukset

Perhevapaiden palkkavaikutukset Perhevapaiden palkkavaikutukset Perhe ja ura tasa-arvon haasteena seminaari, Helsinki 20.11.2007 Jenni Kellokumpu Esityksen runko 1. Tutkimuksen tavoite 2. Teoria 3. Aineisto, tutkimusasetelma ja otos

Lisätiedot

RISTIINTAULUKOINTI JA Χ 2 -TESTI

RISTIINTAULUKOINTI JA Χ 2 -TESTI RISTIINTAULUKOINTI JA Χ 2 -TESTI Kvantitatiiviset tutkimusmenetelmät maantieteessä Ti 27.10.2015, To 2.11.2015 Miisa Pietilä & Laura Hokkanen miisa.pietila@oulu.fi laura.hokkanen@outlook.com KURSSIKERRAN

Lisätiedot

Esim Brand lkm keskiarvo keskihajonta A ,28 5,977 B ,06 3,866 C ,95 4,501

Esim Brand lkm keskiarvo keskihajonta A ,28 5,977 B ,06 3,866 C ,95 4,501 Esim. 2.1.1. Brand lkm keskiarvo keskihajonta A 10 251,28 5,977 B 10 261,06 3,866 C 10 269,95 4,501 y = 260, 76, n = 30 SS 1 = (n 1 1)s 2 1 = (10 1)5, 977 2 321, 52 SS 2 = (n 2 1)s 2 2 = (10 1)3, 8662

Lisätiedot

Testejä suhdeasteikollisille muuttujille

Testejä suhdeasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman

Lisätiedot

Mat-2.104 Tilastollisen analyysin perusteet. Testit suhdeasteikollisille muuttujille. Avainsanat:

Mat-2.104 Tilastollisen analyysin perusteet. Testit suhdeasteikollisille muuttujille. Avainsanat: Mat-.04 Tilastollise aalyysi perusteet / Ratkaisut Aiheet: Avaisaat: Testit suhdeasteikollisille muuttujille Hypoteesi, Kahde riippumattoma otokse t-testit, Nollahypoteesi, p-arvo, Päätössäätö, Testi,

Lisätiedot

SPSS-pikaohje. Jukka Jauhiainen OAMK / Tekniikan yksikkö

SPSS-pikaohje. Jukka Jauhiainen OAMK / Tekniikan yksikkö SPSS-pikaohje Jukka Jauhiainen OAMK / Tekniikan yksikkö SPSS on ohjelmisto tilastollisten aineistojen analysointiin. Hyvinvointiteknologian ATK-luokassa on asennettuna SPSS versio 13.. Huom! Ainakin joissakin

Lisätiedot

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n = 1. Tutkitaan paperin ominaispainon X(kg/dm 3 ) ja puhkaisulujuuden Y (m 2 ) välistä korrelaatiota. Tiettyä laatua olevasta paperierästä on otettu satunnaisesti 10 arkkia ja määritetty jokaisesta arkista

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KAKSIULOTTEISEN EMPIIRISEN JAKAUMAN TARKASTELU Jatkuvat muuttujat: hajontakuvio Koehenkilöiden pituus 75- ja 80-vuotiaana ID Pituus 75 Pituus 80 1 156

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1 Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus TKK (c) Ilkka Mellin (2007) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset

Lisätiedot

Load

Load Tampereen yliopisto Tilastollinen mallintaminen Mikko Alivuotila ja Anne Puustelli Lentokoneiden rakennuksessa käytettävien metallinkiinnittimien puristuskestävyys Matematiikan, tilastotieteen ja filosofian

Lisätiedot

Kvantitatiiviset menetelmät

Kvantitatiiviset menetelmät Kvantitatiiviset menetelmät HUOM! Tentti pidetään tiistaina.. klo 6-8 V ls. Uusintamahdollisuus on rästitentissä.. ke 6 PR sali. Siihen tulee ilmoittautua WebOodissa 9. 8.. välisenä aikana. Soveltuvan

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas JAKAUMAN MUOTO Vinous, skew (g 1, γ 1 ) Kertoo jakauman symmetrisyydestä Vertailuarvona on nolla, joka vastaa symmetristä jakaumaa (mm. normaalijakauma)

Lisätiedot

A250A0050 Ekonometrian perusteet Tentti

A250A0050 Ekonometrian perusteet Tentti A250A0050 Ekonometrian perusteet Tentti 28.9.2016 Tentissä ei saa käyttää laskinta. Tentistä saa max 80 pistettä. Hyväksytysti suoritetusta harjoitustyöstä saa max 20 pistettä. Huom. Merkitse vastauspaperin

Lisätiedot

JY / METODIFESTIVAALI 2013 PRE-KURSSI: KYSELYTUTKIMUS DEMOT

JY / METODIFESTIVAALI 2013 PRE-KURSSI: KYSELYTUTKIMUS DEMOT JY / METODIFESTIVAALI 2013 PRE-KURSSI: KYSELYTUTKIMUS DEMOT SPSS-ohjelmiston Complex Samples- toiminto otoksen poiminnassa ja estimaattien laskennassa Mauno Keto, lehtori Mikkelin AMK / Liiketalouden laitos

Lisätiedot

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170 VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 4.6.2013 Ratkaisut ja arvostelu 1.1 Satunnaismuuttuja X noudattaa normaalijakaumaa a) b) c) d) N(170, 10 2 ). Tällöin P (165 < X < 175) on likimain

Lisätiedot

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1 Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia TKK (c) Ilkka Mellin (2005) 1 Normaalijakaumasta johdettuja jakaumia Johdanto χ 2 -jakauma F-jakauma t-jakauma TKK (c) Ilkka Mellin

Lisätiedot

ASENNUS- JA KÄYTTÖOHJE

ASENNUS- JA KÄYTTÖOHJE ASENNUS- JA KÄYTTÖOHJE YKSIKKÖHINTA SOPIMUKSEN TOTEUTUNEET MÄÄRÄT-SOVELLUS CMPRO5 VERSIO 2.8 PÄIVITETTY HEINÄKUU 2010 COPYRIGHT 2010 ARTEMIS FINLAND OY. ALL RIGHTS RESERVED. KÄYTTÖOHJE SIVU 2 (12) SISÄLLYSLUETTELO

Lisätiedot

2. Aineiston kuvailua

2. Aineiston kuvailua 2. Aineiston kuvailua Avaa (File/Open/Data ) aineistoikkunaan tiedosto tilp150.sav. Aineisto on koottu Tilastomenetelmien peruskurssilla olleilta. Tiedot osallistumisesta demoihin, tenttipisteet, tenttien

Lisätiedot

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking)

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking) 7. Lohkominen ja sulautus 2 k kokeissa Lohkominen (Blocking) Lohkotekijät muodostuvat faktoreista, joiden suhteen ei voida tehdä (täydellistä) satunnaistamista. Esimerkiksi faktorikokeessa raaka-aine-erät

Lisätiedot

Normaalijakaumasta johdettuja jakaumia

Normaalijakaumasta johdettuja jakaumia Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Normaalijakaumasta johdettuja jakaumia TKK (c) Ilkka Mellin (2007) 1 Normaalijakaumasta johdettuja jakaumia >> Johdanto χ 2 -jakauma F-jakauma

Lisätiedot

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1 Tilastotieteen kertaus Vilkkumaa / Kuusinen 1 Motivointi Reaalimaailman ilmiöihin liittyy tyypillisesti satunnaisuutta ja epävarmuutta Ilmiöihin liittyvien havaintojen ajatellaan usein olevan peräisin

Lisätiedot

I. Ristiintaulukointi Excelillä / Microsoft Office 2010

I. Ristiintaulukointi Excelillä / Microsoft Office 2010 Savonia-ammattikorkeakoulu Liiketalous Kuopio Tutkimusmenetelmät Likitalo & Mäkelä I. Ristiintaulukointi Excelillä / Microsoft Office 2010 Tässä ohjeessa on mainittu ensi Excelin valinnan/komennon englanninkielinen

Lisätiedot

Määrällisen aineiston esittämistapoja. Aki Taanila

Määrällisen aineiston esittämistapoja. Aki Taanila Määrällisen aineiston esittämistapoja Aki Taanila 7.11.2011 1 Muuttujat Aineiston esittämisen kannalta muuttujat voidaan jaotella kolmeen tyyppiin: Kategoriset (esimerkiksi sukupuoli, koulutus) Asteikolla

Lisätiedot

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi 2016

Lisätiedot

pitkittäisaineistoissa

pitkittäisaineistoissa Puuttuvan tiedon käsittelystä p. 1/18 Puuttuvan tiedon käsittelystä pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto Puuttuvan tiedon

Lisätiedot

Health 2000/2011 Surveys. Statistical Analysis using SAS and SAS-Callable SUDAAN Packages 17.6.2013. Esa Virtala. etunimi.sukunimi@thl.

Health 2000/2011 Surveys. Statistical Analysis using SAS and SAS-Callable SUDAAN Packages 17.6.2013. Esa Virtala. etunimi.sukunimi@thl. Health 2000/2011 Surveys Statistical Analysis using SAS and SAS-Callable SUDAAN Packages 17.6.2013 Esa Virtala etunimi.sukunimi@thl.fi Terveyden ja hyvinvoinnin laitos (THL) PL 30 00271 Helsinki Puhelin:

Lisätiedot

Til.yks. x y z

Til.yks. x y z Tehtävien ratkaisuja. a) Tilastoyksiköitä ovat työntekijät: Vatanen, Virtanen, Virtanen ja Voutilainen; muuttujina: ikä, asema, palkka, lasten lkm (ja nimikin voidaan tulkita muuttujaksi, jos niin halutaan)

Lisätiedot

Mediaanikorko on kiinteäkorkoiselle lainalle korkeampi. Tämä hypoteesi vastaa taloustieteen käsitystä korkojen määräytymismekanismista.

Mediaanikorko on kiinteäkorkoiselle lainalle korkeampi. Tämä hypoteesi vastaa taloustieteen käsitystä korkojen määräytymismekanismista. Mat-2.04 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Testit järjestysasteikollisille muuttujille Testit laatueroasteikollisille muuttujille Hypoteesi, Mannin ja Whitneyn testi (Wilcoxonin

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi Yksiulotteisen

Lisätiedot

Sisällysluettelo 6 VARIANSSIANALYYSI. Metsämuuronen: Monimuuttujamenetelmien perusteet SPSS-ympäristössä ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON...

Sisällysluettelo 6 VARIANSSIANALYYSI. Metsämuuronen: Monimuuttujamenetelmien perusteet SPSS-ympäristössä ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON... Sisällysluettelo ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON...5 SISÄLLYSLUETTELO... 6 LYHYT SANASTO VASTA-ALKAJILLE... 7 1. MONIMUUTTUJAMENETELMÄT IHMISTIETEISSÄ... 9 1.1 MONIMUUTTUJA-AINEISTON ERITYISPIIRTEITÄ...

Lisätiedot

Harjoitus 1 -- Ratkaisut

Harjoitus 1 -- Ratkaisut Kun teet harjoitustyöselostuksia Mathematicalla, voit luoda selkkariin otsikon (ja mahdollisia alaotsikoita...) määräämällä soluille erilaisia tyylejä. Uuden solun tyyli määrätään painamalla ALT ja jokin

Lisätiedot

MS-C2128 Ennustaminen ja aikasarja-analyysi 2. harjoitukset / Tehtävät Kotitehtävä: 3,4

MS-C2128 Ennustaminen ja aikasarja-analyysi 2. harjoitukset / Tehtävät Kotitehtävä: 3,4 MS-C2128 Ennustaminen ja aikasarja-analyysi 2. harjoitukset / Tehtävät Kotitehtävä: 3,4 Tehtävä 2.1. Jatkoa tietokonetehtävälle 1.2: (a) Piirrä aineistosta pisteparvikuvaaja (KULUTUS, SAIRAST) ja siihen

Lisätiedot

Nuoruusiän vaikutus aikuisen painoindeksiin Data-analyysin perusmenetelmät Harjoitustyö. Lassi Miinalainen

Nuoruusiän vaikutus aikuisen painoindeksiin Data-analyysin perusmenetelmät Harjoitustyö. Lassi Miinalainen Nuoruusiän vaikutus aikuisen painoindeksiin Data-analyysin perusmenetelmät Harjoitustyö Lassi Miinalainen lassimii@paju.oulu. 23.1.2012 Sisältö 1 Aineisto 2 1.1 Muuttujat...............................

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin

Lisätiedot

TUTKIMUSOPAS. SPSS-opas

TUTKIMUSOPAS. SPSS-opas TUTKIMUSOPAS SPSS-opas Johdanto Tässä oppaassa esitetään SPSS-tilasto-ohjelman alkeita, kuten Excel-tiedoston avaaminen, tunnuslukujen laskeminen ja uusien muuttujien muodostaminen. Lisäksi esitetään esimerkkien

Lisätiedot

ATH-koulutus: Stata 11 THL ATH-koulutus / Tommi Härkänen 1

ATH-koulutus: Stata 11 THL ATH-koulutus / Tommi Härkänen 1 ATH-koulutus: Stata 11 THL 16.2.2011 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1 Sisältö Otanta-asetelman kuvaaminen Stata 11:llä Perustunnusluvut Regressioanalyysit Mallivakiointi 16. 2. 2011 ATH-koulutus

Lisätiedot

805324A (805679S) Aikasarja-analyysi Harjoitus 3 (2016)

805324A (805679S) Aikasarja-analyysi Harjoitus 3 (2016) 805324A (805679S) Aikasarja-analyysi Harjoitus 3 (2016) Tavoitteet (teoria): Hallita multinormaalijakauman määritelmä. Ymmärtää likelihood-funktion ja todennäköisyystiheysfunktion ero. Oppia kirjoittamaan

Lisätiedot

Teema 3: Tilastollisia kuvia ja tunnuslukuja

Teema 3: Tilastollisia kuvia ja tunnuslukuja Teema 3: Tilastollisia kuvia ja tunnuslukuja Tilastoaineiston peruselementit: havainnot ja muuttujat havainto: yhtä havaintoyksikköä koskevat tiedot esim. henkilön vastaukset kyselylomakkeen kysymyksiin

Lisätiedot

TYÖKYVYTTÖMYYSRISKIN HALLINTA. Seppo Kettunen 8.5.2015

TYÖKYVYTTÖMYYSRISKIN HALLINTA. Seppo Kettunen 8.5.2015 TYÖKYVYTTÖMYYSRISKIN HALLINTA Seppo Kettunen 8.5.2015 MITÄ ON TYÖKYKY? Työ ja työympäristö Ammattitaito Terveydentila Sosiaaliset suhteet Ihminen Eläkelainsäädäntö Henkilöstöpolitiikka Työyhteisö TYÖKYKY

Lisätiedot

Seinäjoki: Erikoissairaanhoidon kustannusten ja käytön analyysi

Seinäjoki: Erikoissairaanhoidon kustannusten ja käytön analyysi Seinäjoki: Erikoissairaanhoidon kustannusten ja käytön analyysi VK ESH:n laskennalliset kustannukset HILMO- tietojen* perusteella eri sairaaloiden hinnoin vuotta kohti Hilmo 2005-2007 * Etelä- Pohjanmaan

Lisätiedot

Soini: Erikoissairaanhoidon kustannusten ja käytön analyysi

Soini: Erikoissairaanhoidon kustannusten ja käytön analyysi Soini: Erikoissairaanhoidon kustannusten ja käytön analyysi VK ESH:n laskennalliset kustannukset HILMO- tietojen* perusteella eri sairaaloiden hinnoin vuotta kohti Hilmo 2005-2007 * Etelä- Pohjanmaan SHP

Lisätiedot

Harjoitus 1 -- Ratkaisut

Harjoitus 1 -- Ratkaisut Kun teet harjoitustyöselostuksia Mathematicalla, voit luoda selkkariin otsikon (ja mahdollisia alaotsikoita...) määräämällä soluille erilaisia tyylejä. Uuden solun tyyli määrätään painamalla ALT ja jokin

Lisätiedot

Töysä: Erikoissairaanhoidon kustannusten ja käytön analyysi

Töysä: Erikoissairaanhoidon kustannusten ja käytön analyysi Töysä: Erikoissairaanhoidon kustannusten ja käytön analyysi VK ESH:n laskennalliset kustannukset HILMO- tietojen* perusteella eri sairaaloiden hinnoin vuotta kohti Hilmo 2005-2007 * Etelä- Pohjanmaan SHP

Lisätiedot

Matriisit ovat matlabin perustietotyyppejä. Yksinkertaisimmillaan voimme esitellä ja tallentaa 1x1 vektorin seuraavasti: >> a = 9.81 a = 9.

Matriisit ovat matlabin perustietotyyppejä. Yksinkertaisimmillaan voimme esitellä ja tallentaa 1x1 vektorin seuraavasti: >> a = 9.81 a = 9. Python linkit: Python tutoriaali: http://docs.python.org/2/tutorial/ Numpy&Scipy ohjeet: http://docs.scipy.org/doc/ Matlabin alkeet (Pääasiassa Deni Seitzin tekstiä) Matriisit ovat matlabin perustietotyyppejä.

Lisätiedot

Kurikka: Erikoissairaanhoidon kustannusten ja käytön analyysi

Kurikka: Erikoissairaanhoidon kustannusten ja käytön analyysi Kurikka: Erikoissairaanhoidon kustannusten ja käytön analyysi VK ESH:n laskennalliset kustannukset HILMO- tietojen* perusteella eri sairaaloiden hinnoin vuotta kohti Hilmo 2005-2007 * Etelä- Pohjanmaan

Lisätiedot

Testit järjestysasteikollisille muuttujille

Testit järjestysasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit järjestysasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit järjestysasteikollisille muuttujille >> Järjestysasteikollisten

Lisätiedot

Alajärvi: Erikoissairaanhoidon kustannusten ja käytön analyysi

Alajärvi: Erikoissairaanhoidon kustannusten ja käytön analyysi Alajärvi: Erikoissairaanhoidon kustannusten ja käytön analyysi VK ESH:n laskennalliset kustannukset HILMO- tietojen* perusteella eri sairaaloiden hinnoin vuotta kohti Hilmo 2005-2007 * Etelä- Pohjanmaan

Lisätiedot

Evijärvi: Erikoissairaanhoidon kustannusten ja käytön analyysi

Evijärvi: Erikoissairaanhoidon kustannusten ja käytön analyysi Evijärvi: Erikoissairaanhoidon kustannusten ja käytön analyysi VK ESH:n laskennalliset kustannukset HILMO- tietojen* perusteella eri sairaaloiden hinnoin vuotta kohti Hilmo 2005-2007 * Etelä- Pohjanmaan

Lisätiedot

Ylistaro: Erikoissairaanhoidon kustannusten ja käytön analyysi

Ylistaro: Erikoissairaanhoidon kustannusten ja käytön analyysi Ylistaro: Erikoissairaanhoidon kustannusten ja käytön analyysi VK ESH:n laskennalliset kustannukset HILMO- tietojen* perusteella eri sairaaloiden hinnoin vuotta kohti Hilmo 2005-2007 * Etelä- Pohjanmaan

Lisätiedot

Harha mallin arvioinnissa

Harha mallin arvioinnissa Esitelmä 12 Antti Toppila sivu 1/18 Optimointiopin seminaari Syksy 2010 Harha mallin arvioinnissa Antti Toppila 13.10.2010 Esitelmä 12 Antti Toppila sivu 2/18 Optimointiopin seminaari Syksy 2010 Sisältö

Lisätiedot

Mat Sovellettu todennäköisyyslasku. Aiheet: Todennäköisyyslaskennan peruskäsitteet Todennäköisyyslaskennan peruslaskusäännöt Avainsanat:

Mat Sovellettu todennäköisyyslasku. Aiheet: Todennäköisyyslaskennan peruskäsitteet Todennäköisyyslaskennan peruslaskusäännöt Avainsanat: Mat-2.091 Sovellettu todennäköisyyslasku Aiheet: Todennäköisyyslaskennan peruskäsitteet Todennäköisyyslaskennan peruslaskusäännöt Avainsanat: Alkeistapahtuma, Ehdollinen todennäköisyys, Erotustapahtuma,

Lisätiedot

Parametrin estimointi ja bootstrap-otanta

Parametrin estimointi ja bootstrap-otanta Parametrin estimointi ja bootstrap-otanta Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo Tutkimustiedonhallinnan peruskurssi Parametrin estimointi ja bootstrap-otanta 1/27 Kevät 2003 Käytännön asioista

Lisätiedot

ROVANIEMEN KAUPUNKI. Havaintoja sairauspoissaoloista ja analyysi syistä

ROVANIEMEN KAUPUNKI. Havaintoja sairauspoissaoloista ja analyysi syistä ROVANIEMEN KAUPUNKI Havaintoja sairauspoissaoloista ja analyysi syistä SAIRAUSLOMA Ei ole olemassa subjektiivista sairauslomaoikeutta, vaan kyse on työkyvyttömäksi todetun henkilön sosiaaliturvasta Ei

Lisätiedot

Grafiikka, satunnaislukuja, jakaumia ja yleistettyjä lineaarisia malleja

Grafiikka, satunnaislukuja, jakaumia ja yleistettyjä lineaarisia malleja Grafiikka, satunnaislukuja, jakaumia ja yleistettyjä lineaarisia malleja Jari Oksanen Tiistai 13. syyskuuta 2005 Tiivistelmä Aluksi laajennettiin ja kerrattiin edellisen päivän grafiikan virittelyä kosekavaa

Lisätiedot

LOHJAN SEUTUKUNTA. Menetetyt elinvuodet 1983 2004 (PYLL)

LOHJAN SEUTUKUNTA. Menetetyt elinvuodet 1983 2004 (PYLL) LOHJAN SEUTUKUNTA Menetetyt elinvuodet 1983 24 (PYLL) LAUSUNTO 1 (1) 28.11.26 MENETETYT ELINVUODET (PYLL) -INDEKSI (PYLL = Potential Years of Life Lost) Efeko Oy tuotti Hiiden alueen kuntien ja Kirkkonummen

Lisätiedot

Tilastollisten menetelmien käyttö Kelan tutkimustoiminnassa

Tilastollisten menetelmien käyttö Kelan tutkimustoiminnassa Tilastollisten menetelmien käyttö Kelan tutkimustoiminnassa Risto Lehtonen Helsingin yliopisto Kela 1 Tilastokeskuksen SAS-seminaari 16.11.2009 Aiheita Kelan tutkimustoiminta SAS-sovellukset vaativien

Lisätiedot

Työ tehdään itsenäisesti yhden hengen ryhmissä. Ideoita voi vaihtaa koodia ei.

Työ tehdään itsenäisesti yhden hengen ryhmissä. Ideoita voi vaihtaa koodia ei. Harjoitustyö 1 Harjoitustyö Tehtävä: ohjelmoi lötköjen kansoittamaa alkulimaa simuloiva olioperustainen ohjelma Java-kielellä. Lötköt säilötään linkitetyille listalle ja tekstitiedostoon. Työ tehdään itsenäisesti

Lisätiedot

SQL-perusteet, SELECT-, INSERT-, CREATE-lauseet

SQL-perusteet, SELECT-, INSERT-, CREATE-lauseet SQL-perusteet, SELECT-, INSERT-, CREATE-lauseet A271117, Tietokannat Teemu Saarelainen teemu.saarelainen@kyamk.fi Lähteet: Leon Atkinson: core MySQL Ari Hovi: SQL-opas TTY:n tietokantojen perusteet-kurssin

Lisätiedot

Kvantitatiivinen genetiikka moniste s. 56

Kvantitatiivinen genetiikka moniste s. 56 Kvantitatiivinen genetiikka moniste s. 56 - määrällisten ominaisuuksien periytymisen hallinta - mendelismi oli aluksi vastatuulessa siksi että darwinistit, joilla oli paljon valtaa Britanniassa, olivat

Lisätiedot

Estimointi. Otantajakauma

Estimointi. Otantajakauma Otantajakauma Otantajakauma kuvaa jonkin parametrin arvojen (esim. keskiarvon) jakauman kaikille tietyn kokoisille otoksille. jotka perusjoukosta voidaan muodostaa Histogrammissa otantajakauman parametrin

Lisätiedot

Naisnäkökulma sijoittamiseen. 24.3.2007 Vesa Puttonen

Naisnäkökulma sijoittamiseen. 24.3.2007 Vesa Puttonen Naisnäkökulma sijoittamiseen 24.3.2007 Vesa Puttonen Miten sukupuolella voi olla mitään tekemistä sijoittamisen kanssa??? Naiset elävät (keskimäärin) pidempään kuin miehet Naiset saavat (keskimäärin) vähemmän

Lisätiedot

Tilastollinen testaaminen tai Tilastollinen päättely. Geneettinen analyysi

Tilastollinen testaaminen tai Tilastollinen päättely. Geneettinen analyysi Tilastollinen testaaminen tai Tilastollinen päättely Geneettinen analyysi Tilastollisen testaamisen tarkoitus Tilastollisten testien avulla voidaan tutkia otantapopulaatiota (perusjoukkoa) koskevien väittämien

Lisätiedot

Opetus talteen ja jakoon oppilaille. Kokemuksia Aurajoen lukion tuotantoluokan toiminnasta Anna Saivosalmi 9.9.2011

Opetus talteen ja jakoon oppilaille. Kokemuksia Aurajoen lukion tuotantoluokan toiminnasta Anna Saivosalmi 9.9.2011 Opetus talteen ja jakoon oppilaille Kokemuksia Aurajoen lukion tuotantoluokan toiminnasta Anna Saivosalmi 9.9.2011 Aurajoen lukio ISOverstaan jäsen syksystä 2010 lähtien ISOverstas on maksullinen verkko-oppimisen

Lisätiedot

Kvantitatiiviset menetelmät

Kvantitatiiviset menetelmät Kvantitatiiviset menetelmät HUOM! Tentti pidetään tiistaina.. klo 6-8 Vuorikadulla V0 ls Muuttujien muunnokset Usein empiirisen analyysin yhteydessä tulee tarve muuttaa aineiston muuttujia Esim. syntymävuoden

Lisätiedot

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1 Estimointi - tehdään päätelmiä perusjoukon ominaisuuksista (keskiarvo, riskisuhde jne.) otoksen perusteella - mitä suurempi otos, sitä tarkemmat estimaatit Otokseen perustuen määritellään otantajakaumalta

Lisätiedot

Tutkimuksen suunnittelu / tilastolliset menetelmät. Marja-Leena Hannila Itä-Suomen yliopisto / Terveystieteiden tdk 25.8.2011

Tutkimuksen suunnittelu / tilastolliset menetelmät. Marja-Leena Hannila Itä-Suomen yliopisto / Terveystieteiden tdk 25.8.2011 Tutkimuksen suunnittelu / tilastolliset menetelmät Marja-Leena Hannila Itä-Suomen yliopisto / Terveystieteiden tdk 25.8.2011 Kvantitatiivisen tutkimuksen vaiheet Suunnittelu Datan keruu Aineiston analysointi

Lisätiedot

HELIA TIKO-05 1 (17) ICT03D Tieto ja tiedon varastointi Räty, Virkki

HELIA TIKO-05 1 (17) ICT03D Tieto ja tiedon varastointi Räty, Virkki HELIA TIKO-05 1 (17) SQL / DML 4 Alikyselyt...2 Joukko-operaatiot...7 Yhdiste, unioni...8 Leikkaus...9 Erotus... 10 Tietokannan datan muokkaus... 11 Lisäys... 11 Yhden rivin lisääminen... 12 Useamman rivin

Lisätiedot

OULUNKAAREN SEUTUKUNTA. Menetetyt elinvuodet 1983 2004 (PYLL)

OULUNKAAREN SEUTUKUNTA. Menetetyt elinvuodet 1983 2004 (PYLL) OULUNKAAREN SEUTUKUNTA Menetetyt elinvuodet 1983 24 (PYLL) LAUSUNTO 1 (1) 21.8.26 MENETETYT ELINVUODET (PYLL) -INDEKSI (PYLL = Potential Years of Life Lost) Efeko Oy tuotti Oulunkaaren seutukunnan tilauksesta

Lisätiedot

Ristivalidointia ja grafiikkaa

Ristivalidointia ja grafiikkaa Ristivalidointia ja grafiikkaa Jari Oksanen Maanantai 12. syyskuuta 2005 Tiivistelmä Tässä monisteessa on maantain tapahtumien yhteenveto. Aloitimme Eija Hurmeen kurssipäiväkirjalla ja sen jälkeen päätiomme

Lisätiedot

Metsänpoika - metsästysseurojen karttaohjelma

Metsänpoika - metsästysseurojen karttaohjelma Metsänpoika - metsästysseurojen karttaohjelma Esittelyversion asentaminen: Jos asennus on toimitettu CD:llä, niin aseta levyke CD-asemaan, avaa levy ja valitse käsky "Asenna". Jos lataat ohjelman netistä,

Lisätiedot

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä! VAASAN YLIOPISTO/KESÄYLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia A KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun

Lisätiedot

ABHELSINKI UNIVERSITY OF TECHNOLOGY

ABHELSINKI UNIVERSITY OF TECHNOLOGY Tilastollinen testaus Tilastollinen testaus Tilastollisessa testauksessa tutkitaan tutkimuskohteita koskevien oletusten tai väitteiden paikkansapitävyyttä havaintojen avulla. Testattavat oletukset tai

Lisätiedot

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle - Sisältö - - - Varianssianalyysi Varianssianalyysissä (ANOVA) testataan oletusta normaalijakautuneiden otosten odotusarvojen

Lisätiedot

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä arvon Sisältö arvon Bootstrap-luottamusvälit arvon arvon Oletetaan, että meillä on n kappaletta (x 1, y 1 ),

Lisätiedot

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio 17.11.2015/1 MTTTP5, luento 17.11.2015 Luku 5 Parametrien estimointi 5.1 Piste-estimointi Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla

Lisätiedot

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 2

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 2 OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 2 Luento 2 Kuvailevat tilastolliset menetelmät Käytetyimmät tilastolliset menetelmät käyttäjäkokemuksen

Lisätiedot

Luento 7 Taulukkolaskennan edistyneempiä piirteitä Aulikki Hyrskykari

Luento 7 Taulukkolaskennan edistyneempiä piirteitä Aulikki Hyrskykari Luento 7 Taulukkolaskennan edistyneempiä piirteitä 25.10.2016 Aulikki Hyrskykari Luento 7 o Kertausta: suhteellinen ja absoluuttinen viittaus o Tekstitiedoston tuonti Exceliin o Tietojen lajittelu, suodatus

Lisätiedot

Todennäköisyyden ominaisuuksia

Todennäköisyyden ominaisuuksia Todennäköisyyden ominaisuuksia 0 P(A) 1 (1) P(S) = 1 (2) A B = P(A B) = P(A) + P(B) (3) P(A) = 1 P(A) (4) P(A B) = P(A) + P(B) P(A B) (5) Tapahtuman todennäköisyys S = {e 1,..., e N }. N A = A. Kun alkeistapaukset

Lisätiedot

TASAVIRTAPIIRI - VASTAUSLOMAKE

TASAVIRTAPIIRI - VASTAUSLOMAKE TASAVIRTAPIIRI - VASTAUSLOMAKE Ryhmä Tekijä 1 Pari Tekijä 2 Päiväys Assistentti Täytä mittauslomake lyijykynällä. Muista erityisesti virhearviot ja suureiden yksiköt! 4 Esitehtävät 1. Mitä tarkoitetaan

Lisätiedot

LAPUA. Menetetyt elinvuodet 1983 2004 (PYLL)

LAPUA. Menetetyt elinvuodet 1983 2004 (PYLL) LAPUA Menetetyt elinvuodet 1983 24 (PYLL) LAUSUNTO 1 (1) 12.1.27 MENETETYT ELINVUODET (PYLL) -INDEKSI (PYLL = Potential Years of Life Lost) Efeko Oy tuotti Etelä-Pohjanmaan sairaanhoitopiirin tilauksesta

Lisätiedot

SEINÄJOKI. Menetetyt elinvuodet 1983 2004 (PYLL)

SEINÄJOKI. Menetetyt elinvuodet 1983 2004 (PYLL) SEINÄJOKI Menetetyt elinvuodet 1983 24 (PYLL) LAUSUNTO 1 (1) 12.1.27 MENETETYT ELINVUODET (PYLL) -INDEKSI (PYLL = Potential Years of Life Lost) Efeko Oy tuotti Etelä-Pohjanmaan sairaanhoitopiirin tilauksesta

Lisätiedot

Esimerkkejä vaativuusluokista

Esimerkkejä vaativuusluokista Esimerkkejä vaativuusluokista Seuraaville kalvoille on poimittu joitain esimerkkejä havainnollistamaan algoritmien aikavaativuusluokkia. Esimerkit on valittu melko mielivaltaisesti laitoksella tehtävään

Lisätiedot