R-kurssi Jarno Tuimala

Koko: px
Aloita esitys sivulta:

Download "R-kurssi. 14.4.2010 Jarno Tuimala"

Transkriptio

1 R-kurssi Jarno Tuimala

2 Osallistujat 1. Pirjo Wacklin 2. Ilja Ritamo 3. Noora Alakulppi 4. Tiina Leppänen 5. Eeva Nyberg-Oksanen 6. Ville Parviainen 7. Tanja Kaartinen 8. Milla Mikkola 9. Teemu Laakso 10. Eeva-Lotta Arola 11. Virpi Kiuru 12. Marjatta Kiminkinen 13. Elina Pusa 14. Juha Eronen

3 Ohjelma Asennus, aputoiminnot, datan lukeminen R-ohjelmistoon Lounas Osa-aineiston poimiminen, aineiston kuvaileminen (keskiarvo, keskihajonta, ym.) Kahvi Grafiikka (hajontakuvio, histogrammi, pylväskaavio, ym.) ja tilastollinen testaus (t-testi, Khiin neliötesti, tms.) Kertaus ja opintopiirin aiheiden suunnitelu

4 R:n asentaminen

5

6

7 R:n rakenne Kaksi osaa Ydin (base) Tämä pitää asentaa ensin Laajennuspaketit (contrib) Nämä laajentavat toiminnallisuutta Neljä paikkaa: CRAN (R:n kotisivuilla) Bioconductor (www.bioconductor.org) OmegaHat (www.omegahat.org) R-Forge (www.-r-forger.org)

8 Asennus Lataa asennusohjelma CRAN:sta, esimerkiksi: ows/base/r win32.exe. Asennukseen ei tarvitse järjestelmän valvojan tunnuksia, jos asennusvaiheessa poistaa ruksin kohdasta Save Version Number to Registry.

9

10 Miten löytää sopiva paketti?

11 Pakettien asentaminen 1. 2.

12 Pakettien käyttäminen Paketin tarjoaminen työkalujen käyttöön ei riitä paketin asentaminen, vaan paketti on ladattava muistiin ennen jokaista käyttökertaa.

13 Apua I/II Hakutoiminnot R-projektin etusivu SuNET:in CRAN

14 Apua II/III

15 Apua III/III

16 Harjoitus 1 Asenna kurssikäyttöön tarkoitettu R käyttämällesi koneelle Luo työpöydälle kansio kurssidata, ja hae sinne tiedostot rairuoho.txt nopat.txt Tiedostot löydät (Internet-selaimella) osoitteesta:

17 Peruskäyttö Aineiston valmistelu ja lukeminen Aineiston manipulointi

18 Aineiston valmistelu Excelissä I/II Yksi otsikkorivi, ei ääkkösiä Havainnot riveillä Muuttujat sarakkeissa

19 Aineiston valmistelu Excelissä I/II

20 Aineiston lukeminen R:ään I/II jarno <read.table("jarno.txt", header=true, na.strings="na", Riippuu koneesta sep="\t", dec=".", strip.white=true)

21 Aineiston lukeminen R:ään II/II Suositeltava aloitustapa aina! jarno <- read.table("jarno.txt", header=true, sep="\t")

22 Harjoitus 2 Lue kurssidata-kansiosta kumpikin aineisto R:ään. Tallenna tiedoston rairuoho.txt aineisto R:ssä nimellä rairuoho, ja tiedoston nopat.txt aineisto nimellä nopat.

23 Komentojen rakenne I/II read.table( "jarno.txt", header=true, sep="\t" ) Komento + sulut + argumentit Mitä tehdään mille tai miten tehdään

24 Komentojen rakenne II/II read.table(file="jarno.txt", header=true, sep="\t") read.table("jarno.txt", TRUE, "\t")

25 Objektiin tallentaminen Aineisto on R:ssä aina tallennettu jonkin nimiseen objektiin. Uusi objekti luodaan esimerkiksi komennolla: jarno<-read.table(file="jarno.txt", header=true, sep="\t") kun luetaan tiedostosta Jo olemassa oleva objekti voidaan kopioida toiselle nimelle: jarno2<-jarno Aina sama kolmen osan rakenne: nimi <- tallennettava tieto

26 Osa-aineiston poimiminen I/ Aineisto objektissa students:

27 Osa-aineiston poimiminen II/ Aineisto objektissa students Halutaan poimia yksi kokonainen sarake Käytetään objektin nimen perässä merkintää $, jota seuraa sarakkeen nimi Opiskelijoiden pituudet saadaan siis erilleen merkinnällä: students$height

28 Osa-aineiston poimiminen III/ Aineisto objektissa students Sarake voidaan erottaa myös käyttämällä alaindeksiä, jota merkitään objektin nimen perässä olevilla hakasuluilla Alaindeksiä käyttäen sama sarake (ensimmäinen vasemmalta) poimittaisiin: students[,1]

29 Osa-aineiston poimiminen IV/ Aineisto objektissa students Rivien poimiminen onnistuu vain alaindeksiä käyttäen Poimitaan ensimmäinen rivi: students[1,]

30 Osa-aineiston poimiminen V/ Aineisto objektissa students Poimitaan ensimmäisen sarakkeen ensimmäinen havainto: students[1,1] rivit sarakkeet

31 Osa-aineiston poimiminen VI/ Aineisto objektissa students:

32 Osa-aineiston poimiminen VII/ Poimitaan kaikki naiset (sarakkeen gender perusteella siis) Testataan onko havainto naisesta käyttäen vertailuoperaattoria == (kaksi yhtäsuuruusmerkkiä) students$gender=="female" Talletetaan tieto objektiin f: f<-students$gender=="female" Poimitaan alaindeksiä ja objektia f käyttäen oikeat rivit: female<-students[f,]

33 Osa-aineiston poimiminen VIII/ female<-students[f,] Objektin voi tulostaa ruudulle! female height shoesize gender population female tampere female tampere female tampere female tampere female tampere

34 Taulukon nimet ja koko Taulukon koko: dim() dim(students) Sarakkeiden nimet: colnames() colnames(students) Rivien nimet: rownames() rownames(students)

35 Harjoitus 3 Tarkastele rairuohoaineistoa: Selvitä aineiston rivien ja sarakkeiden määrä Mitkä ovat sarakkeiden nimet? Tee rairuohoaineistosta kaksi pienempää aineistoa, yksi vesikäsitellyille ja toinen ravinnekäsitellyille viljelmille Käsittelytieto löytyy sarakkeesta treatment, jossa arvo water=vesikäsittely ja nutrient=ravinnekäsittely Tallenna nämä aineistot objekteihin water ja nutrient

36 Aineiston lajittelu I/IV Kokonaisen taulukon lajittelu tapahtuu komennolla order(), joka yhdistetään alaindeksiin. Aineisto objektissa students:

37 Aineiston lajittelu II/IV Lajitellaan pituuden perusteella. Luodaan ensin objekti ind, joka kertoo mihin järjestykseen taulukon havainnot pitää laittaa: ind<-order(students$height)

38 Aineiston lajittelu III/IV ind

39 Aineiston lajittelu IV/IV students[ind,] height shoesize gender population female tampere female tampere female tampere female tampere female tampere male tampere male tampere male tampere male tampere male tampere

40 Aineiston lajittelu, yhteenveto 1. Lajittelujärjestyksen selvittäminen ind<-order(students$height) 2. Lajittelu (=aineiston poiminta) students[ind,]

41 Muuttujien uudelleen koodaaminen Muuttuja voidaan koodata uudelleen mm. komennolla ifelse(). Tämä on usein näppärää esimerkiksi, kun halutaan esittää kuvioissa eri ryhmiin kuuluvat havainnot eri väreillä. Koodataan sukupuoli eri väreillä (mies=sininen, nainen=punainen) cols<-ifelse(students$gender=="male", "blue", "red")

42 Muuttujien uudelleen koodaaminen cols<-ifelse(students$gender=="male", "blue", "red") "Jos sukupuoli on mies, palautetaan blue, muutoin palautetaan red."

43 Harjoitus 4 Lajittele rairuohoaineisto viljelyalustan (bed) mukaiseen järjestyksen. Koodaa käsittely (treatment) värikoodein siten, että vesikäsittelyä vastaa sininen väri, ja ravinnekäsittelyä punainen väri.

44 Grafiikka ja aineiston kuvailu

45 Aineiston kuvailu I/ > summary(students) height shoesize Min. :158.0 Min. : st Qu.: st Qu.:38.00 Median :170.0 Median :40.00 Mean :170.3 Mean : rd Qu.: rd Qu.:42.75 Max. :181.0 Max. :44.00 > mean(students$height) [1] > sd(students$height) [1] gender female:5 male :5 population tampere:10

46 Aineiston kuvailu II/ > min(students$height) [1] 158 > max(students$height) [1] 181 > range(students$height) [1] > median(students$height) [1] 170

47 Ryhmäkohtaiset arvot > aggregate(students$height, list(students$gender), mean) Group.1 x 1 female male > aggregate(students$height, list(students$gender), sd) Group.1 x 1 female male aggregate(students$height, list(students$gender), mean) mille ryhmät suure

48 Hajontakuvio I/ > plot(x=students$height, y=students$shoesize)

49 Hajontakuvio II/ > plot(x=students$height, y=students$shoesize, xlab="pituus", ylab="kengännumero", main="opiskelijat")

50 Hajontakuvio III/ > cols<-ifelse(students$gender=="male", "blue", "red") > plot(x=students$height, y=students$shoesize, xlab="pituus", ylab="kengännumero", main="opiskelijat", col=cols)

51 Hajontakuvio IV/ > cols<-ifelse(students$gender=="male", "blue", "red") > plot(x=students$height, y=students$shoesize, xlab="pituus", ylab="kengännumero", main="opiskelijat", col=cols, las=1, pch=19)

52 Viivakuvio I > plot(x=students$height, y=students$shoesize, xlab="pituus", ylab="kengännumero", main="opiskelijat", las=1, type="l")

53 Viivakuvio II > plot(x=students$height, y=students$shoesize, xlab="pituus", ylab="kengännumero", main="opiskelijat", las=1, type="l", lwd=3)

54 Viivakuvio III > plot(x=students$height, y=students$shoesize, xlab="pituus", ylab="kengännumero", main="opiskelijat", las=1, type="l", lwd=3, lty=2, col="red")

55 Histogrammi hist(students$height)

56 Laatikkokuvio I > boxplot(students$height)

57 Laatikkokuvio II/ > boxplot(students$height~students$gender)

58 Pylväskaavio I/ > barplot(table(students$shoesize))

59 Pylväskaavio II/ > barplot((students$shoesize), col=cols)

60 Pylväskaavio III/ > barplot((students$shoesize), col=cols, las=1, main="naisten ja miesten kengänkoko")

61 Pylväskaavio IV/ > barplot(sort(students$shoesize), col=cols, las=1, main="naisten ja miesten kengänkoko", names.arg=sort(students$shoesize))

62 Harjoitus 5 Miten rairuohon 3. päivän (muuttuja day3) ja 7. päivän (muuttuja day7) pituudet suhtautuvat toisiinsa? Käytä hajontakuviota. Onko 7. päivän mittausten jakauma yksihuippuinen ja symmetrinen eli jojkseenkin normaalinen? Käytä histogrammia ja laatikkokuviota. Kuvaa mustan nopan arvojen jakaumaa pylväskaaviolla (noppa-aineiston muuttuja black).

63 Tilastolliset testit

64 Taulukointi komento table() Yhdestä muuttujasta: > table(students$gender) #lkm female male 5 5 > prop.table(table(students$gender)) #% female male

65 Taulukointi - kaksi muuttujaa > table(students$gender, students$shoesize) female male

66 Khiin neliötesti I/ Tarvitaan taulukko, joko tiedostosta luettu tai komennolla table() muodostettu Käytetään tässä yhden nopan taulukoituja tuloksia: > noppa V

67 Khiin neliötesti II/ Yhteensopivuustesti (noudattaako muuttuja oletettua jakaumaa vai ei) Nopan tapauksessa kaikkien tapausten oletetaan olevan yhtä yleisiä (tasajakauma) Seuraavan sivun esimerkki

68 Khiin neliötesti III/ > chisq.test(noppa) Chi-squared test for given probabilities data: noppa X-squared = 11.8, df = 5, p-value =

69 Khiin neliötesti IV/ Jos testataan yhteensopivuutta johonkin muuhun kuin tasajakaumaan, esimerkki genotyyppifrekvenssejä, pitää eri luokkien todennäköisyys määritellä Genotyypit: AA, AT ja TT Alleelifrekvenssit: A=0,9, T=0.1 Aineisto: 750 AA, 50 AT ja 200 TT

70 Khiin neliötesti V/ Aineisto (objektissa geno): Testi: chisq.test(x=geno$havaittu, p=gene$tn) Tulos: X-squared = , df = 2, p-value < 2.2e-16

71 Khiin neliötesti VI/ Riippumattomuustesti (Onko muuttujien jakaumien välillä eroa) Luodaan aineisto (objektiin F): F <- matrix(c(33,14,8,18,31,25,14,12), 4,2) Tai luetaan se Excelistä:

72 Khiin neliötesti VII/ > chisq.test(f) Pearson's Chi-squared test data: F X-squared = , df = 3, pvalue =

73 Fisherin testi > fisher.test(f) Fisher's Exact Test for Count Data data: F p-value = alternative hypothesis: two.sided

74 F-testi I/ F-testi vertaa kahden otoksen variansseja. Esimerkiksi students-aineistossa voidaan verrata miesten ja naisten pituuksien variansseja Tehdään ensin aineistot: males<-students[students$gender=="male",] females<-students[students$gender=="female",] Ja sitten testi (seuraavalla sivulla)

75 F-testi II/ > var.test(males$height, females$height) F test to compare two variances data: males$height and females$height F = 0.875, num df = 4, denom df = 4, p-value = alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: sample estimates: ratio of variances 0.875

76 T-testi I/ T-testi vertaa kahden otoksen keskiarvoja Testistä on useita variaatioita, tässä kahden riippumattoman populaation testi Ennen testin tekemistä on syytä testata, ovatko otosten varianssi yhtä suuret (ks. F-testi) Students-aineistossa eri sukupuolten pituuksien varianssi oli yhtä suurta Itse testiesimerkki seuraavalla sivulla

77 T-testi II/ > t.test(males$height, females$height, var.equal=true) Two Sample t-test data: males$height and females$height t = , df = 8, p-value = alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: sample estimates: mean of x mean of y

78 Harjoitus 6 Testaa Khiin neliötestillä noppa-aineiston nopat, ja päättele, ovatko ne harhattomia (kaikkia lukuja saadaan suunnilleen yhtä paljon) Testaa onko vesi- ja ravinnekäsittelyissä eroa (muuttuja treatment), kun vasteena on viljelmän seitsemäntenä päivänä mitattu pituus (muuttuja day7).

79 Kertaus

80 Mikä jäi epäselväksi?

81 Opintopiirin suunnittelu

82 Opintopiiri Kuusi kertaa: Ajankohta: klo Paikka: Netti

83 Aiheita Oman aineiston lukeminen (jokainen tuo omaa aineistoa, jos sitä on)»puuttuvat arvot»toistettavat toimenpiteet (uusien komentojen luominen) Regressiot»Muunnokset (box-cox ym.)»lineaarinen regressio 5.5. Hierarkkinen data (Bioconductor?) Tiedonlouhinta ja visualisointi Menetelmien / laitteiden validointi Laadunvalvontatilastot (vakioraportit)

84 Opintopiiri Automatisointi Oman datan lukeminen Puuttuvat arvot

85

86

87

88 Automatisointi 1. Tee tekstitiedosto, jossa tarvittavat komennot ovat, ja aja se komennolla source(). 2. Tee komennoista funktio. hello<-function(x) { print("hello World!") } 1. Tee laajennuspaketti

89 Oman datan lukeminen Jos et tiedä, missä muodossa aineistosi on, tarkastele sitä ensin Notepad:ssä ja Excelissä. Onko aineisto taulukossa? Onko joka rivillä yhtä monta havaintoa? Onko sarakkeilla otsikot? Mikä erottaa sarakkeita? Mikä on desimaalierotin?

90 Oman datan lukeminen read.table() Taulukkoaineistolle read.fwf() read.spss() SPSS-datalle, paketissa foreign scan() readlines() Lukee rivin kerrallaan

91 Puuttuvat arvot na.omit() mean(1:10, na.rm=true) mean(na.omit(1:10)) impute() library(e1071) impute(1:10)

92 Opintopiiri Muuttujien muunnokset Regressio

93 Lineaarinen regressio Yleinen lineaarinen malli lineaarinen regressio varianssianalyysi kovarianssianalyysi Työvaiheet Mallien sovitus Mallin valinta Oletusten tarkistus Validointi

94 Mallien sovitus dat<-read.table("rairuoho.txt", header=t, sep="\t") fit0<-lm(day7~1, data=dat) fit1<-lm(day7~bed*treatment, data=dat) fit1<-lm(day7~bed+treatment+ bed:treatment, data=dat) fit2<-lm(day7~bed, data=dat) fit3<-lm(day7~treatment, data=dat)

95 Tulosten tarkastelu I summary(fit1) Call: lm(formula = day7 ~ bed + treatment + bed:treatment, data = dat) Residuals: Min 1Q Median Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) < 2e-16 *** bedmould bedpaper *** bedpaper treatmentwater bedmould2:treatmentwater bedpaper4:treatmentwater bedpaper8:treatmentwater Signif. codes: 0 *** ** 0.01 * Residual standard error: on 40 degrees of freedom Multiple R-squared: 0.532, Adjusted R-squared: F-statistic: on 7 and 40 DF, p-value: 3.862e-05

96 Tulosten tarkastelu II anova(fit1) Analysis of Variance Table Response: day7 Df Sum Sq Mean Sq F value Pr(>F) bed e-05 *** treatment ** bed:treatment Residuals Signif. codes: 0 *** ** 0.01 *

97 Mallin valinta > AIC(fit0, fit1, fit2, fit3) df AIC fit fit fit fit

98 Oletusten tarkistus I par(mfrow=c(2,2)) plot(fit1)

99 Oletusten tarkistus II boxplot(resid(fit1)~ dat$bed) boxplot(resid(fit1)~ dat$treatment) boxplot(resid(fit1)~ dat$bed*dat$treatment)

100 Muunnokset I Simuloidaan data: d<-rexp(1000, 10) Jakauma: hist(d)

101 Muunnokset II d2<-log(d) hist(d2) HUOM! jos taul.: log(taul$d2)

102 Muunnokset III Logaritmi - log() Oikealle vinojen jakaumien tapauksessa Neliöjuuri - sqrt() Lukumäärät Eksponentti exp() tai ^ Logaritmin käänteisfunktio

103 Muunnokset IV boxcox(fit1) Jos l<>0: day7b<(day7^1.4-1)/1.4 Jos l==0 day7b<log(day7)

104 Opintopiiri "Hierarkkisen" datan analysointi

105 (G)(N)LME Generalized (non)linear mixed effect models (GNLME) Aineistossa fixed ja random muuttujia tai aineisto hierarkkista fixed: asetettu tiettyihin arvoihin koetta suoritettaessa random: edustavat mahdollisia muuttujan arvoja, mutteivät sisällä kaikkia mahdollisia arvoja Maa/kunta/koulu/luokka/oppilas toistomittauksia samoista henkilöistä (parittaisen ttestin laajennus)

106 Sekamallit R:ssä Balansoitu eksperimentti: aov() Ei-balansoitu eksperimentti: nlme lme() lme4 lmer() Bioinformatiikka: limma lmfit() ebayes()

107 Yleisiä piirteitä Hankalia käyttää Syntaksi on hankalaa ja vaihtelee paketista toiseen Eivät aina konvergoidu Kaikkia oletuksia ei voi testata Vaarallisia käyttää Sama malli voidaan usein sovittaa usealla eri tavalla Vaativat asian melko syvällistä ymmärtämistä, jotta analyysi menee oikein

108

109

110

111 # Reading data dat<-read.table("http://koti.mbnet.fi/tuimala/ oppaat/r/data/rairuoho_long.txt", header=t, sep="\t") # General linear model fit<-lm(pituus~kasittely, data=dat2) summary(fit) #kasittelywater *** # Mixed model fit4<-lme(pituus~kasittely, random=~1 viljelma, data=dat2) summary(fit4) #kasittelywater e-04

112 # Reading data dat<-read.table("http://koti.mbnet.fi/tuimala/ oppaat/r/data/rairuoho_long.txt", header=t, sep="\t") # Loads the library library(nlme) # NULL model fit0<-lme(pituus~1, random=~1 viljelma, data=dat) # Model time (random intercept model) fit1<-lme(pituus~paiva, random=~1 viljelma, data=dat2) # Model time (random intercept and slope model) fit2<-lme(pituus~poly(paiva, 3), random=~paiva viljelma, data=dat) # Modeling error structures fit3<-lme(pituus~poly(paiva, 3)+kasittely, random=~paiva viljelma, data=dat, weights=varexp()) # Model selection AIC(fit1, fit2, fit3) # Assumptions plot(fit3, pch=19, cex=1.5) # Result summary(fit3)

113 Linear mixed-effects model fit by REML Data: dat2 AIC BIC loglik Random effects: Formula: ~paiva viljelma Structure: General positive-definite, Log-Cholesky parametrization StdDev Corr (Intercept) (Intr) paiva Residual Variance function: Structure: Exponential of variance covariate Formula: ~fitted(.) Parameter estimates: expon Fixed effects: pituus ~ poly(paiva, 3) + kasittely Value Std.Error DF t-value p-value (Intercept) poly(paiva, 3) poly(paiva, 3) poly(paiva, 3) kasittelywater Correlation: (Intr) p(,3)1 p(,3)2 p(,3)3 poly(paiva, 3) poly(paiva, 3) poly(paiva, 3) kasittelywater Standardized Within-Group Residuals: Min Q1 Med Q Number of Observations: 288 Number of Groups: 48 Max

114

115

116

117 Opintopiiri Tiedon louhinta

118 Koodia # Luetaan aineisto dat<-read.table("http://koti.mbnet.fi/tuimala/oppaat/r/data/index2010_data.txt", header=t, sep="\t", quote="", strip.white=t, row.names=1) # Hierarkkinen ryhmittelyanalyysi heatmap(na.omit(as.matrix(dat)), mar=c(12,5), scale="none") heatmap(t(na.omit(as.matrix(dat))), mar=c(10,0), scale="none", cexcol=0.4) # Rinnakkaiskoordinaattikuvio matplot(t(dat), type="l", col=1, lwd=2, lty=1) matplot(t(dat), type="l", col="# ", lwd=2, lty=1) # K-means ryhmittelyanalyysi km<-kmeans(na.omit(dat), centers=9, nstart=100) par(mfrow=c(3,3)) for(i in 1:9) { d<-dat[km$cluster==i,] matplot(t(d), type="l", col=1, lwd=2, lty=1, main=paste("ryhmä ", i, sep="")) } # Yksi lm-malli kullekin riville sovitettuna # Ei toimi, tässä vain ajatuksellisena esimerkkinä fit1<-lm(t(dat2)~groups)

119 Tiedonlouhinta Joukko menetelmiä joilla pyritään löytämään oleellinen suurista tietomassoista Vrt. EDA Menettelytapa, jossa aineistoa selotaan uusien hypoteesien muodostamiseksi tai testattvaksi soveltuvien hypoteesien löytämiseksi

120 Tiedonlouhinnan menetelmät Ryhmittelyanalyysi Erotteluanalyysi Regressio Assosiaatiosäännöt

121 Hierarkkinen ryhmittelyanalyysi

122 Rinnakkaiskoordinaatit

123 Rinnakkaiskoordinaatit

124 K-means

125 Tag cloud

126 Tag cloud

127 Opintopiiri Menetelmien vertailu

128 Mitä määrittää? Lineaarisuus Lineaarinen regressio ja kuvat Tarkkuus MethComp-paketti

129 fit1<-lm(a~c, data=dat) summary(fit) Call: lm(formula = A ~ C, data = dat) Residuals: Min 1Q Median Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) C e-15 *** --Signif. codes: 0 *** ** 0.01 * Residual standard error: on 18 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 1 and 18 DF, p-value: 1.360e-15

130 Perustiedot Selitysaste Multiple R-squared: Korrelaatiokerroin sqrt(0.9732) = Leikkauspiste Estimate Std. Error t value Pr(> t ) (Intercept) Kulmakerroin t ) Estimate Std. Error t value Pr(>

131 Jäännöskaavio

132 Käyrä? fit2<-lm(a~poly(c, 2), data=dat) fit3<-lm(a~poly(c, 3), data=dat) AIC(fit1, fit2, fit3) df AIC fit fit fit

133 Neliösummat anova(fit1) Analysis of Variance Table Response: A Df Sum Sq Mean Sq F value Pr(>F) C e15 *** Residuals sum(resid(fit1)^2)

134 MethComp-paketti p/

135 library(methcomp) dat<-read.table("hb.txt", header=t) dat2<-data.frame(y=c(dat$a,dat$c), meth=c(rep("a", 20), rep("c", 20)), item=rep(1:20, 2), repl=rep(1, 40)) summary(meth(dat2)) plot(meth(dat2)) par(mar=c(4,4,1,4)); BA.plot(Meth(dat2), reg.line=false) par(mar=c(4,4,1,4)); BA.plot(Meth(dat2), reg.line=true)

136 #Replicates Method 1 #Items #Obs: 40 Values: min med max A C

137

138

139 plot(dat$a, dat$c) bothlines(dat$a, dat$c) f<-ggplot(dat, aes(a, C)) f + stat_smooth(method = "lm") + geom_point() f<-ggplot(dat, aes((a+c)/2, C/A)) f + stat_smooth(method = "lm") + geom_point() f<-ggplot(dat, aes(a, C)) f + stat_smooth() + geom_point()

140

141

142

143

144 dat<-read.table("rairuoho.txt", header=t, sep="\t") fit<-lm(day7~day3, data=dat) plot(x=dat$day3, y=dat$day7, pch=19, cex=1.5, xlab="day 3", ylab="day 7", las=1) abline(fit, lwd=2, col="red") fit<-lm(day7~bed+treatment, data=dat) par(mfrow=c(2,2)) termplot(fit, rug=t, se=t) termplot(fit, rug=t, se=t, partial.resid=t) library(arm) par(mar=c(5,10,5,5)) coefplot(fit, intercept=t) library(effects) ae<-alleffects(fit) plot(ae, 'bed') n < set.seed(17) age <- rnorm(n, 50, 10) blood.pressure <- rnorm(n, 120, 15) cholesterol <- rnorm(n, 200, 25) sex <- factor(sample(c('female','male'), n,true)) label(age) <- 'Age' label(cholesterol) <- 'Total Cholesterol' label(blood.pressure) <- 'Systolic Blood Pressure' label(sex) <- 'Sex' units(cholesterol) <- 'mg/dl' units(blood.pressure) <- 'mmhg' L <-.4*(sex=='male') +.045*(age-50) + (log(cholesterol - 10)-5.2)*(-2*(sex=='female') + 2*(sex=='male')) y <- ifelse(runif(n) < plogis(l), 1, 0) ddist <- datadist(age, blood.pressure, cholesterol, sex) options(datadist='ddist') fit <- lrm(y ~ blood.pressure + sex * (age + rcs(cholesterol,4))) s <- summary(fit, age=c(50,60,70)) plot(s, log=true, at=c(.1,.5,1,1.5,2,4,8)) options(datadist=null) f <- lrm(y ~ lsp(age,50)+sex*rcs(cholesterol,4)+blood.pressure) nom <- nomogram(f, fun=function(x)1/(1+exp(-x)), # or fun=plogis fun.at=c(.001,.01,.05,seq(.1,.9,by=.1),.95,.99,.999), funlabel="risk of Death", xfrac=.45) print(nom) plot(fit, age=seq(20,80,length=100), sex=na, conf.int=false)

145

146

147

148

149

150

151

152

153

154

155

156

157 Hoitojaksojen lukumäärä ja verivalmisteiden käyttö hoitojaksoa kohden Map of the Market 0 Verenkiertoelinten sairaudet Muut kasvaimet 0 7 Tuki- ja liikuntaelinten sairaudet Veren pahanlaatuiset kasvaimet 14 7 Tartunta- ja loistauteja Muualla luokittelemattomat oireet Synn. epämuodostumat 14 Hermoston sairaudet Mielenterveyden häiriöt Ihon ja Umpierit.- ravitsemus alaiskudokja aineenvaihdunta sen sairaudet Eräät perinataaliaikana alk. tilat Tekijöitä, jotka vaik. terveyteen Virtsa- ja sukupuolielinten sairaudet Hengityselinten sairaudet Veren sairaudet Raskaus, synnytys, lapsivuoteus Vammat, myrkytykset ja ulk. syyt Korvan ja kartiolis. sairaudet Silmän ja apuelinten sairaudet Ruuansulatuselinten sairaudet

158

Yleinen lineaarinen malli eli usean selittäjän lineaarinen regressiomalli

Yleinen lineaarinen malli eli usean selittäjän lineaarinen regressiomalli MS-C2128 Ennustaminen ja aikasarja-analyysi 1. harjoitukset / Tehtävät Kotitehtävät: 2 Aiheet: Aluksi Yleinen lineaarinen malli eli usean selittäjän lineaarinen regressiomalli Tällä kurssilla käytetään

Lisätiedot

R: mikä, miksi ja miten?

R: mikä, miksi ja miten? R: mikä, miksi ja miten? Ilmari Ahonen Matematiikan ja tilastotieteen laitos, Turun yliopisto SSL R-Webinaari 2015 Vähän minusta Valmistuin maisteriksi Turun yliopistossa 2012 Teen neljättä vuotta väitöskirjaa

Lisätiedot

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3 OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 3 Tutkimussuunnitelman rakenne-ehdotus Otsikko 1. Motivaatio/tausta 2. Tutkimusaihe/ -tavoitteet ja kysymykset

Lisätiedot

Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu JMP:llä

Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu JMP:llä Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi Esimerkit laskettu JMP:llä Antti Hyttinen Tampereen teknillinen yliopisto 29.12.2003 ii Ohjelmien

Lisätiedot

ATH-koulutus: R ja survey-kirjasto THL 16.2.2011. 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1

ATH-koulutus: R ja survey-kirjasto THL 16.2.2011. 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1 ATH-koulutus: R ja survey-kirjasto THL 16.2.2011 16. 2. 2011 ATH-koulutus / Tommi Härkänen 1 Sisältö Otanta-asetelman kuvaaminen R:llä ja survey-kirjastolla Perustunnusluvut Regressioanalyysit 16. 2. 2011

Lisätiedot

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat Päättely yhden selittäjän lineaarisesta regressiomallista Ennustaminen, Ennuste, Ennusteen luottamusväli, Estimaatti, Estimaattori,

Lisätiedot

5 Osa 5: Ohjelmointikielen perusteita

5 Osa 5: Ohjelmointikielen perusteita 5 Osa 5: Ohjelmointikielen perusteita 5.1 Omat funktiot R on lausekekieli: Kaikki komennot kuten funktiokutsut ja sijoitusoperaatiot ovat lausekkeita. Lausekkeet palauttavat jonkin arvon. Lausekkeita voidaan

Lisätiedot

Perusnäkymä yksisuuntaiseen ANOVAaan

Perusnäkymä yksisuuntaiseen ANOVAaan Metsämuuronen 2006. TTP Tutkimuksen tekemisen perusteet ihmistieteissä Taulukko.51.1 Analyysiin mukaan tulevat muuttujat Mja selite Merkitys mallissa F1 Ensimmäinen faktoripistemuuttuja Selitettävä muuttuja

Lisätiedot

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset.

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset. Mat-.04 Tilastollisen analyysin perusteet Mat-.04 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Testit suhdeasteikollisille muuttujille Hypoteesi, Kahden riippumattoman otoksen t-testit,

Lisätiedot

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit

Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit Tilastollisen analyysin perusteet Luento 3: Epäparametriset tilastolliset testit s t ja t kahden Sisältö t ja t t ja t kahden kahden t ja t kahden t ja t Tällä luennolla käsitellään epäparametrisia eli

Lisätiedot

RISTIINTAULUKOINTI JA Χ 2 -TESTI

RISTIINTAULUKOINTI JA Χ 2 -TESTI RISTIINTAULUKOINTI JA Χ 2 -TESTI Kvantitatiiviset tutkimusmenetelmät maantieteessä Ti 27.10.2015, To 2.11.2015 Miisa Pietilä & Laura Hokkanen miisa.pietila@oulu.fi laura.hokkanen@outlook.com KURSSIKERRAN

Lisätiedot

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös): Tilastollinen tietojenkäsittely / SPSS Harjoitus 5 Tarkastellaan ensin aineistoa KUNNAT. Kyseessähän on siis kokonaistutkimusaineisto, joten tilastollisia testejä ja niiden merkitsevyystarkasteluja ei

Lisätiedot

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit. A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät

Lisätiedot

b1) harhattomuutta, b2) helppoutta, b3) herkkyyttä, b4) mitta-asteikkoa, b5) standardointia, b6) tarkkuutta.

b1) harhattomuutta, b2) helppoutta, b3) herkkyyttä, b4) mitta-asteikkoa, b5) standardointia, b6) tarkkuutta. 806109P TILASTOTIETEEN PERUSMENETELMÄT I 1. välikoe 9.3.2012 (Jari Päkkilä) VALITSE VIIDESTÄ TEHTÄVÄSTÄ NELJÄ JA VASTAA VAIN NIIHIN! 1. Valitse kohdissa A-F oikea (vain yksi) vaihtoehto. Oikeasta vastauksesta

Lisätiedot

Tarkista vielä ennen analysoinnin aloittamista seuraavat seikat:

Tarkista vielä ennen analysoinnin aloittamista seuraavat seikat: Yleistä Tilastoapu on Excelin sisällä toimiva apuohjelma, jonka avulla voit analysoida tilastoaineistoja. Tilastoapu toimii Excelin Windows-versioissa Excel 2007, Excel 2010 ja Excel 2013. Kun avaat Tilastoavun,

Lisätiedot

Perhevapaiden palkkavaikutukset

Perhevapaiden palkkavaikutukset Perhevapaiden palkkavaikutukset Perhe ja ura tasa-arvon haasteena seminaari, Helsinki 20.11.2007 Jenni Kellokumpu Esityksen runko 1. Tutkimuksen tavoite 2. Teoria 3. Aineisto, tutkimusasetelma ja otos

Lisätiedot

R-KIELEN PERUSTEET JARNO TUIMALA Helsinki 2010

R-KIELEN PERUSTEET JARNO TUIMALA Helsinki 2010 R-KIELEN PERUSTEET R-KIELEN PERUSTEET JARNO TUIMALA Helsinki 2010 2010 Jarno Tuimala ISBN 978-952-92-7020-0 (nid.) ISBN 978-952-92-7021-7 (PDF) Books on Demand GmbH Norderstedt, Saksa 2010 1. painos Sisällysluettelo

Lisätiedot

Mat-2.104 Tilastollisen analyysin perusteet. Testit suhdeasteikollisille muuttujille. Avainsanat:

Mat-2.104 Tilastollisen analyysin perusteet. Testit suhdeasteikollisille muuttujille. Avainsanat: Mat-.04 Tilastollise aalyysi perusteet / Ratkaisut Aiheet: Avaisaat: Testit suhdeasteikollisille muuttujille Hypoteesi, Kahde riippumattoma otokse t-testit, Nollahypoteesi, p-arvo, Päätössäätö, Testi,

Lisätiedot

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet VAASAN YLIOPISTO/AVOIN YLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia 1 KURSSIKYSELYAINEISTO: 1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka

Lisätiedot

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi Mat-2.2104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Yhteensopivuuden ja homogeenisuden testaaminen Bowmanin ja Shentonin testi, Hypoteesi, 2 -homogeenisuustesti, 2 -yhteensopivuustesti,

Lisätiedot

Puheentutkimuksen tilastoanalyysin perusteet. 8. luento. Pertti Palo 20.1.2012

Puheentutkimuksen tilastoanalyysin perusteet. 8. luento. Pertti Palo 20.1.2012 Puheentutkimuksen tilastoanalyysin perusteet 8. luento Pertti Palo 20.1.2012 Käytännön asioita Viimeisen seminaarin siirto: 2.3. 10-12 -> 2.3. 14-16. Miten seminaarin luentokuulustelun voi korvata? Harjoitustöiden

Lisätiedot

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta? Yhden otoksen suhteellisen osuuden testaus Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta? Hypoteesit H 0 : p = p 0 H 1 : p p 0 tai H 1 : p > p 0 tai H 1 : p < p 0 Suhteellinen osuus

Lisätiedot

Testejä suhdeasteikollisille muuttujille

Testejä suhdeasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman

Lisätiedot

Katsaus R :ään, tilastolliseen ohjelmointiympäristöön

Katsaus R :ään, tilastolliseen ohjelmointiympäristöön Katsaus R :ään, tilastolliseen ohjelmointiympäristöön 1 Johdanto Halusin tehdä harjoitustyöni kertomalla vaihtoehtoisesta tilastollisesta ohjelmasta, sillä käytän paljon Linux-ympäristöä, jolle kurssilla

Lisätiedot

TILASTOLLISTEN MENETELMIEN KIRJO JA KÄYTTÖ LÄÄKETIETEEN TUTKIMUSJULKAISUISSA. Pentti Nieminen 03.11.2014

TILASTOLLISTEN MENETELMIEN KIRJO JA KÄYTTÖ LÄÄKETIETEEN TUTKIMUSJULKAISUISSA. Pentti Nieminen 03.11.2014 TILASTOLLISTEN MENETELMIEN KIRJO JA KÄYTTÖ LÄÄKETIETEEN TUTKIMUSJULKAISUISSA LUKIJAN NÄKÖKULMA 2 TAUSTAKYSYMYKSIÄ 3 Mitä tutkimusmenetelmiä ja taitoja opiskelijoille tulisi opettaa koulutuksen eri vaiheissa?

Lisätiedot

SEM1, työpaja 2 (12.10.2011)

SEM1, työpaja 2 (12.10.2011) SEM1, työpaja 2 (12.10.2011) Rakenneyhtälömallitus Mplus-ohjelmalla POLKUMALLIT Tarvittavat tiedostot voit ladata osoitteesta: http://users.utu.fi/eerlaa/mplus Esimerkki: Planned behavior Ajzen, I. (1985):

Lisätiedot

Health 2000/2011 Surveys. Statistical Analysis using SAS and SAS-Callable SUDAAN Packages 17.6.2013. Esa Virtala. etunimi.sukunimi@thl.

Health 2000/2011 Surveys. Statistical Analysis using SAS and SAS-Callable SUDAAN Packages 17.6.2013. Esa Virtala. etunimi.sukunimi@thl. Health 2000/2011 Surveys Statistical Analysis using SAS and SAS-Callable SUDAAN Packages 17.6.2013 Esa Virtala etunimi.sukunimi@thl.fi Terveyden ja hyvinvoinnin laitos (THL) PL 30 00271 Helsinki Puhelin:

Lisätiedot

7 Osa 7: Pidempiä esimerkkejä R:n käytöstä

7 Osa 7: Pidempiä esimerkkejä R:n käytöstä 7 Osa 7: Pidempiä esimerkkejä R:n käytöstä R:n pääasiallinen käyttö monelle on tilastollisten menetelmien suorittaminen. Käydään nyt läpi joitain esimerkkitilanteita, alkaen aineiston luvusta ja päättyen

Lisätiedot

1 Johdanto 2. 2 Työkansion asettaminen 3. 3 Aineistojen lukeminen 3 3.1 DAT-tiedosto... 3 3.2 SPSS-tiedosto... 3 3.3 Excel... 3

1 Johdanto 2. 2 Työkansion asettaminen 3. 3 Aineistojen lukeminen 3 3.1 DAT-tiedosto... 3 3.2 SPSS-tiedosto... 3 3.3 Excel... 3 Sisältö 1 Johdanto 2 2 Työkansion asettaminen 3 3 Aineistojen lukeminen 3 3.1 DAT-tiedosto........................... 3 3.2 SPSS-tiedosto........................... 3 3.3 Excel................................

Lisätiedot

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet VAASAN YLIOPISTO/KESÄYLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia A KURSSIKYSELYAINEISTO: 1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka

Lisätiedot

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1

Ilkka Mellin Tilastolliset menetelmät. Osa 3: Tilastolliset testit. Tilastollinen testaus. TKK (c) Ilkka Mellin (2007) 1 Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Tilastollinen testaus TKK (c) Ilkka Mellin (2007) 1 Tilastolliset testit >> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KAKSIULOTTEISEN EMPIIRISEN JAKAUMAN TARKASTELU Jatkuvat muuttujat: hajontakuvio Koehenkilöiden pituus 75- ja 80-vuotiaana ID Pituus 75 Pituus 80 1 156

Lisätiedot

JY / METODIFESTIVAALI 2013 PRE-KURSSI: KYSELYTUTKIMUS DEMOT

JY / METODIFESTIVAALI 2013 PRE-KURSSI: KYSELYTUTKIMUS DEMOT JY / METODIFESTIVAALI 2013 PRE-KURSSI: KYSELYTUTKIMUS DEMOT SPSS-ohjelmiston Complex Samples- toiminto otoksen poiminnassa ja estimaattien laskennassa Mauno Keto, lehtori Mikkelin AMK / Liiketalouden laitos

Lisätiedot

SPSS-pikaohje. Jukka Jauhiainen OAMK / Tekniikan yksikkö

SPSS-pikaohje. Jukka Jauhiainen OAMK / Tekniikan yksikkö SPSS-pikaohje Jukka Jauhiainen OAMK / Tekniikan yksikkö SPSS on ohjelmisto tilastollisten aineistojen analysointiin. Hyvinvointiteknologian ATK-luokassa on asennettuna SPSS versio 13.. Huom! Ainakin joissakin

Lisätiedot

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking)

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking) 7. Lohkominen ja sulautus 2 k kokeissa Lohkominen (Blocking) Lohkotekijät muodostuvat faktoreista, joiden suhteen ei voida tehdä (täydellistä) satunnaistamista. Esimerkiksi faktorikokeessa raaka-aine-erät

Lisätiedot

Harjoituksen aiheena on tietokantapalvelimen asentaminen ja testaaminen. Asennetaan MySQL-tietokanta. Hieman linkkejä:

Harjoituksen aiheena on tietokantapalvelimen asentaminen ja testaaminen. Asennetaan MySQL-tietokanta. Hieman linkkejä: Linux-harjoitus 6 Harjoituksen aiheena on tietokantapalvelimen asentaminen ja testaaminen. Asennetaan MySQL-tietokanta. Hieman linkkejä: http://www.mysql.com/, MySQL-tietokantaohjelman kotisivu. http://www.mysql.com/doc/en/index.html,

Lisätiedot

SAS ja R yhteiskäyttö

SAS ja R yhteiskäyttö Maria Valaste Kela & Helsingin yliopisto 24.5.2012 SAS Technical Club Sisällys 1 2 3 Tunnuslukuja (R) Hierarkkinen ryhmittely Kuva 4 Aineiston luominen Moni-imputointi R:ssä Tulosten yhdistäminen institution-logo-filen

Lisätiedot

1. a) Luettele hyvän kvantitatiivisen tutkimuksen perusvaatimukset. b) Miten tutkimusraportissa arvioit tutkimuksen luotettavuutta?

1. a) Luettele hyvän kvantitatiivisen tutkimuksen perusvaatimukset. b) Miten tutkimusraportissa arvioit tutkimuksen luotettavuutta? 1. a) Luettele hyvän kvantitatiivisen tutkimuksen perusvaatimukset. b) Miten tutkimusraportissa arvioit tutkimuksen luotettavuutta? 2. Tehtävät 2-4 sekä 6 10 liittyvät keväällä 2002 suoritettuun ammattikorkeakoulusta

Lisätiedot

ASENNUS- JA KÄYTTÖOHJE

ASENNUS- JA KÄYTTÖOHJE ASENNUS- JA KÄYTTÖOHJE YKSIKKÖHINTA SOPIMUKSEN TOTEUTUNEET MÄÄRÄT-SOVELLUS CMPRO5 VERSIO 2.8 PÄIVITETTY HEINÄKUU 2010 COPYRIGHT 2010 ARTEMIS FINLAND OY. ALL RIGHTS RESERVED. KÄYTTÖOHJE SIVU 2 (12) SISÄLLYSLUETTELO

Lisätiedot

KAAVAT. Sisällysluettelo

KAAVAT. Sisällysluettelo Excel 2013 Kaavat Sisällysluettelo KAAVAT KAAVAT... 1 Kaavan tekeminen... 2 Kaavan tekeminen osoittamalla... 2 Kaavan kopioiminen... 3 Kaavan kirjoittaminen... 3 Summa-funktion lisääminen... 4 Suorat eli

Lisätiedot

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 2. TODENNÄKÖISYYS...

Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 2. TODENNÄKÖISYYS... Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN... 8 1.1 INDUKTIO JA DEDUKTIO... 9 1.2 SYYT JA VAIKUTUKSET... 11 TEHTÄVIÄ... 13

Lisätiedot

Empiirinen projekti. Olli-Matti Laine Kauppatieteet

Empiirinen projekti. Olli-Matti Laine Kauppatieteet Empiirinen projekti Olli-Matti Laine Kauppatieteet 1 Contents 1. Johdanto... 3 2. Kuvaileva osa... 4 3. Analyysiosa... 17 4. Yhteenveto... 35 2 1. Johdanto Tutkin projektissa tilastollisin menetelmin kansantaloudellisia

Lisätiedot

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta Tilastollisen analyysin perusteet Luento 1: ja hajonta Sisältö Havaittujen arvojen jakauma Havaittujen arvojen jakaumaa voidaan kuvailla ja esitellä tiivistämällä havaintoarvot sopivaan muotoon. Jakauman

Lisätiedot

IBM SPSS Statistics 21 (= SPSS 21)

IBM SPSS Statistics 21 (= SPSS 21) Tarja Heikkilä IBM SPSS Statistics 21 (= SPSS 21) SPSS = Statistical Package for Social Sciences Ohjelman käynnistys Aloitusikkuna Päävalikot Työkalut Muuttujat (Variables) Tapaukset (Cases) Tyhjä datataulukko

Lisätiedot

TESTINVALINTATEHTÄVIEN VASTAUKSET

TESTINVALINTATEHTÄVIEN VASTAUKSET TESTINVALINTATEHTÄVIEN VASTAUKSET Vastaukset on merkitty keltaisella, muuttujien mittaustasot muuttujan kuvauksen perässä ja muu osa vastauksesta kysymyksen perässä. Tehtävä 1. Talousmatematiikan kurssin

Lisätiedot

Opetus talteen ja jakoon oppilaille. Kokemuksia Aurajoen lukion tuotantoluokan toiminnasta Anna Saivosalmi 9.9.2011

Opetus talteen ja jakoon oppilaille. Kokemuksia Aurajoen lukion tuotantoluokan toiminnasta Anna Saivosalmi 9.9.2011 Opetus talteen ja jakoon oppilaille Kokemuksia Aurajoen lukion tuotantoluokan toiminnasta Anna Saivosalmi 9.9.2011 Aurajoen lukio ISOverstaan jäsen syksystä 2010 lähtien ISOverstas on maksullinen verkko-oppimisen

Lisätiedot

Teema 3: Tilastollisia kuvia ja tunnuslukuja

Teema 3: Tilastollisia kuvia ja tunnuslukuja Teema 3: Tilastollisia kuvia ja tunnuslukuja Tilastoaineiston peruselementit: havainnot ja muuttujat havainto: yhtä havaintoyksikköä koskevat tiedot esim. henkilön vastaukset kyselylomakkeen kysymyksiin

Lisätiedot

Matemaatikot ja tilastotieteilijät

Matemaatikot ja tilastotieteilijät Matemaatikot ja tilastotieteilijät Matematiikka/tilastotiede ammattina Tilastotiede on matematiikan osa-alue, lähinnä todennäköisyyslaskentaa, mutta se on myös itsenäinen tieteenala. Tilastotieteen tutkijat

Lisätiedot

Laskuharjoitus 9, tehtävä 6

Laskuharjoitus 9, tehtävä 6 Aalto-yliopiston perustieteiden korkeakoulu Jouni Pousi Systeemianalyysin laboratorio Mat-2.4129 Systeemien identifiointi Laskuharjoitus 9, tehtävä 6 Tämä ohje sisältää vaihtoehtoisen tavan laskuharjoituksen

Lisätiedot

TUTKIMUSOPAS. SPSS-opas

TUTKIMUSOPAS. SPSS-opas TUTKIMUSOPAS SPSS-opas Johdanto Tässä oppaassa esitetään SPSS-tilasto-ohjelman alkeita, kuten Excel-tiedoston avaaminen, tunnuslukujen laskeminen ja uusien muuttujien muodostaminen. Lisäksi esitetään esimerkkien

Lisätiedot

Esimerkkiaineisto ALKOKULU Olemme käyttäneet 3. harjoituksissa esimerkkinä aineistoa, joka käsittelee yksityisiä kulutusmenoja

Esimerkkiaineisto ALKOKULU Olemme käyttäneet 3. harjoituksissa esimerkkinä aineistoa, joka käsittelee yksityisiä kulutusmenoja MS-C2128 Ennustaminen ja aikasarja-analyysi 6. harjoitukset / Tehtävät Kotitehtävä: 4 Esimerkkiaineisto ALKOKULU Olemme käyttäneet 3. harjoituksissa esimerkkinä aineistoa, joka käsittelee yksityisiä kulutusmenoja

Lisätiedot

Mikkeli. Menetetyt elinvuodet 1987-2011 (PYLL)

Mikkeli. Menetetyt elinvuodet 1987-2011 (PYLL) Mikkeli Menetetyt elinvuodet 987-2 (PYLL) Mikkeli 27-2 Menetetyt elinvuodet -indeksi (Potential Years of Life Lost = PYLL) Verrattuna koko maan lukuihin Kaikki kuolinsyyt (A-R99,V-Y89) Pahanlaatuiset kasvaimet

Lisätiedot

TYÖKYVYTTÖMYYSRISKIN HALLINTA. Seppo Kettunen 8.5.2015

TYÖKYVYTTÖMYYSRISKIN HALLINTA. Seppo Kettunen 8.5.2015 TYÖKYVYTTÖMYYSRISKIN HALLINTA Seppo Kettunen 8.5.2015 MITÄ ON TYÖKYKY? Työ ja työympäristö Ammattitaito Terveydentila Sosiaaliset suhteet Ihminen Eläkelainsäädäntö Henkilöstöpolitiikka Työyhteisö TYÖKYKY

Lisätiedot

Ryhmäkirjeen hyödyntäminen

Ryhmäkirjeen hyödyntäminen Ryhmäkirjeen hyödyntäminen hannele.rajaniemi@jyu.fi konkkola@cc.jyu.fi Sisältö Joukkokirje-toiminnon (Wordin ja Excelin yhteiskäytön) periaatteet Excel tietolähteenä tutuksi (valmis harjoitustiedosto)

Lisätiedot

Graph. COMPUTE x=rv.normal(0,0.04). COMPUTE y=rv.normal(0,0.04). execute.

Graph. COMPUTE x=rv.normal(0,0.04). COMPUTE y=rv.normal(0,0.04). execute. COMPUTE x=rv.ormal(0,0.04). COMPUTE y=rv.ormal(0,0.04). execute. compute hplib_man_r = hplib_man + x. compute arvokons_man_r = arvokons_man + y. GRAPH /SCATTERPLOT(BIVAR)=hplib_man_r WITH arvokons_man_r

Lisätiedot

Naisnäkökulma sijoittamiseen. 24.3.2007 Vesa Puttonen

Naisnäkökulma sijoittamiseen. 24.3.2007 Vesa Puttonen Naisnäkökulma sijoittamiseen 24.3.2007 Vesa Puttonen Miten sukupuolella voi olla mitään tekemistä sijoittamisen kanssa??? Naiset elävät (keskimäärin) pidempään kuin miehet Naiset saavat (keskimäärin) vähemmän

Lisätiedot

Tutkimuksen suunnittelu / tilastolliset menetelmät. Marja-Leena Hannila Itä-Suomen yliopisto / Terveystieteiden tdk 25.8.2011

Tutkimuksen suunnittelu / tilastolliset menetelmät. Marja-Leena Hannila Itä-Suomen yliopisto / Terveystieteiden tdk 25.8.2011 Tutkimuksen suunnittelu / tilastolliset menetelmät Marja-Leena Hannila Itä-Suomen yliopisto / Terveystieteiden tdk 25.8.2011 Kvantitatiivisen tutkimuksen vaiheet Suunnittelu Datan keruu Aineiston analysointi

Lisätiedot

SAS:n käyttö Työterveyslaitoksessa. Pertti Mutanen

SAS:n käyttö Työterveyslaitoksessa. Pertti Mutanen SAS:n käyttö Työterveyslaitoksessa Pertti Mutanen Edistämme työn terveellisyyttä ja turvallisuutta osana hyvää elämää Työterveyslaitos Arbetshälsoinstitutet Itsenäinen julkisoikeudellinen yhteisö Sosiaali-

Lisätiedot

R-ohjelmiston lisäpaketit ja data

R-ohjelmiston lisäpaketit ja data R-ohjelmiston lisäpaketit ja data Vesa Pekkanen Matti Kiiski 14. syyskuuta 2012 Tämä on lyhyt johdatus R-ohjelmiston kirjastojen käyttöönottoon ja datan lukemiseen. Hyödyllisiä komentoja: help.start()

Lisätiedot

Tilastollisten menetelmien käyttö Kelan tutkimustoiminnassa

Tilastollisten menetelmien käyttö Kelan tutkimustoiminnassa Tilastollisten menetelmien käyttö Kelan tutkimustoiminnassa Risto Lehtonen Helsingin yliopisto Kela 1 Tilastokeskuksen SAS-seminaari 16.11.2009 Aiheita Kelan tutkimustoiminta SAS-sovellukset vaativien

Lisätiedot

Vedä ja pudota Maamittauslaitoksen JPEG2000-ortoilmakuva GeoTIFF-muotoon

Vedä ja pudota Maamittauslaitoksen JPEG2000-ortoilmakuva GeoTIFF-muotoon Vedä ja pudota Maamittauslaitoksen JPEG2000-ortoilmakuva GeoTIFF-muotoon Jukka Rahkonen http://latuviitta.org Viimeksi muutettu 16. lokakuuta 2012 Tiivistelmä Latuviitta.ogr -sivuston palautteessa kaivattiin

Lisätiedot

Tilastolliset ohjelmistot 805340A. Pinja Pikkuhookana

Tilastolliset ohjelmistot 805340A. Pinja Pikkuhookana Tilastolliset ohjelmistot 805340A Pinja Pikkuhookana Sisältö 1 SPSS 1.1 Yleistä 1.2 Aineiston syöttäminen 1.3 Aineistoon tutustuminen 1.4 Kuvien piirtäminen 1.5 Kuvien muokkaaminen 1.6 Aineistojen muokkaaminen

Lisätiedot

Aki Taanila YHDEN SELITTÄJÄN REGRESSIO

Aki Taanila YHDEN SELITTÄJÄN REGRESSIO Aki Taanila YHDEN SELITTÄJÄN REGRESSIO 26.4.2011 SISÄLLYS JOHDANTO... 1 LINEAARINEN MALLI... 1 Selityskerroin... 3 Excelin funktioita... 4 EKSPONENTIAALINEN MALLI... 4 MALLIN KÄYTTÄMINEN ENNUSTAMISEEN...

Lisätiedot

1. KAKSISUUNTAINEN VARIANSSIANALYYSI: TULOSTEN TULKINTA

1. KAKSISUUNTAINEN VARIANSSIANALYYSI: TULOSTEN TULKINTA Mat-2.104 Tilastollisen analyysin perusteet / Ratkaisut Aiheet: Avainsanat: Kaksisuuntainen varianssianalyysi Bonferronin menetelmä, F-testi, Jäännösneliösumma, Kaksisuuntainen varianssianalyysi Kokonaiskeskiarvo,

Lisätiedot

Tilastollisten menetelmien perusteet II TILTP3 Luentorunko

Tilastollisten menetelmien perusteet II TILTP3 Luentorunko Tilastollisten menetelmien perusteet II TILTP3 Luentorunko Raija Leppälä 29. helmikuuta 2012 Sisältö 1 Johdanto 2 1.1 Jatkuvista jakaumista 2 1.1.1 Normaalijakauma 2 1.1.2 Studentin t-jakauma 3 1.2 Satunnaisotos,

Lisätiedot

ROVANIEMEN KAUPUNKI. Havaintoja sairauspoissaoloista ja analyysi syistä

ROVANIEMEN KAUPUNKI. Havaintoja sairauspoissaoloista ja analyysi syistä ROVANIEMEN KAUPUNKI Havaintoja sairauspoissaoloista ja analyysi syistä SAIRAUSLOMA Ei ole olemassa subjektiivista sairauslomaoikeutta, vaan kyse on työkyvyttömäksi todetun henkilön sosiaaliturvasta Ei

Lisätiedot

ASENNUS JA KÄYTTÖOHJE

ASENNUS JA KÄYTTÖOHJE ASENNUS JA KÄYTTÖOHJE YKSIKKÖHINTALUETTELON HINNOITTELU SOVELLUS CMPRO5 VERSIO 2.8 PÄIVITETTY HEINÄKUU 2010 COPYRIGHT 2010 ARTEMIS FINLAND OY. ALL RIGHTS RESERVED. YH-LUETTELON HINNOITTELU SISÄLLYSLUETTELO

Lisätiedot

Ohjeita kvantitatiiviseen tutkimukseen

Ohjeita kvantitatiiviseen tutkimukseen 1 Metropolia ammattikorkeakoulu Liiketalouden yksikkö Pertti Vilpas Ohjeita kvantitatiiviseen tutkimukseen Osa 2 KVANTITATIIVISEN TUTKIMUSAINEISTON ANALYYSI Sisältö: 1. Frekvenssi- ja prosenttijakaumat.2

Lisätiedot

TAPAUS-VERROKKITUTKIMUS

TAPAUS-VERROKKITUTKIMUS TAPAUS-VERROKKI TUTKIMUKSEN TYYPIT JA TULOSTEN ANALYYSI Simo Näyhä Jari Jokelainen Kansanterveystieteen ja yleislääketieteen laitoksen jatkokoulutusmeeting.3.4.2007 TAPAUS-VERROKKITUTKIMUS Idea Tutkimusryhmät

Lisätiedot

HARJOITUS 1 Monen taulukkosivun käsittely

HARJOITUS 1 Monen taulukkosivun käsittely Excel Harjoituksia 5 1 (8) HARJOITUS 1 Monen taulukkosivun käsittely 1. Aloita uusi työkirja 2. Nimeä taulukkosivut seuraavalla sivulla olevan mallin mukaan, tarvittaessa lisää taulukkosivuja valitsemalla

Lisätiedot

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 2

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 2 OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi Luento 2 Luento 2 Kuvailevat tilastolliset menetelmät Käytetyimmät tilastolliset menetelmät käyttäjäkokemuksen

Lisätiedot

Testit järjestysasteikollisille muuttujille

Testit järjestysasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit järjestysasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit järjestysasteikollisille muuttujille >> Järjestysasteikollisten

Lisätiedot

Harjoitus 1 -- Ratkaisut

Harjoitus 1 -- Ratkaisut Kun teet harjoitustyöselostuksia Mathematicalla, voit luoda selkkariin otsikon (ja mahdollisia alaotsikoita...) määräämällä soluille erilaisia tyylejä. Uuden solun tyyli määrätään painamalla ALT ja jokin

Lisätiedot

SPSS OPAS. Metropolia Liiketalous

SPSS OPAS. Metropolia Liiketalous 1 Metropolia Liiketalous SPSS OPAS Aihe sivu 1. Ohjelman periaate 2 2. Aineistoikkuna 3 3. Frekvenssit 4 4. Muuttujien arvojen luokittelu 5 5. Tunnusluvut 6 6. Ristiintaulukointi 7 7. Hajontakaavio 8 8.Korrelaatio

Lisätiedot

VeRan laboratoriotietojen siirtoformaatti

VeRan laboratoriotietojen siirtoformaatti FCG Finnish Consulting Group Oy VERA TOIMINTAOHJEET Rev./pvm 1.03 Hyväksytty 30.4.2010 Sisältö Käyttö Vastuuhenkilö VeRan tiedonsiirtoformaatti Laboratoriot, jotka toimittavat tulokset suoraan VeRaan.

Lisätiedot

Hirvensalmi. Menetetyt elinvuodet 1984-2008 (PYLL)

Hirvensalmi. Menetetyt elinvuodet 1984-2008 (PYLL) Menetetyt elinvuodet 1984-28 (PYLL) 24-28 Menetetyt elinvuodet -indeksi (Potential Years of Life Lost = PYLL) Verrattuna koko maan lukuihin Kaikki kuolinsyyt (A-R99,V1-Y89) Pahanlaatuiset kasvaimet (C-C97)

Lisätiedot

Kangasniemi. Menetetyt elinvuodet 1984-2008 (PYLL)

Kangasniemi. Menetetyt elinvuodet 1984-2008 (PYLL) Menetetyt elinvuodet 1984-28 (PYLL) 24-28 Menetetyt elinvuodet -indeksi (Potential Years of Life Lost = PYLL) Verrattuna koko maan lukuihin Kaikki kuolinsyyt (A-R99,V1-Y89) Pahanlaatuiset kasvaimet (C-C97)

Lisätiedot

LOHJAN SEUTUKUNTA. Menetetyt elinvuodet 1983 2004 (PYLL)

LOHJAN SEUTUKUNTA. Menetetyt elinvuodet 1983 2004 (PYLL) LOHJAN SEUTUKUNTA Menetetyt elinvuodet 1983 24 (PYLL) LAUSUNTO 1 (1) 28.11.26 MENETETYT ELINVUODET (PYLL) -INDEKSI (PYLL = Potential Years of Life Lost) Efeko Oy tuotti Hiiden alueen kuntien ja Kirkkonummen

Lisätiedot

Tilastomenetelmien lopputyö

Tilastomenetelmien lopputyö Tarja Heikkilä Tilastomenetelmien lopputyö Lopputyössä on esimerkkejä erilaisista tilastomenetelmistä. Datatiedosto Harjoitusdata.sav on muokattu tätä harjoitusta varten, joten se ei vastaa kaikkien muuttujien

Lisätiedot

Vertailutestien tulosten tulkinta Mikä on hyvä tulos?

Vertailutestien tulosten tulkinta Mikä on hyvä tulos? Vertailutestien tulosten tulkinta Mikä on hyvä tulos? Pertti Virtala PANK-menetelmäpäivä 29.1.2015 Sisältö Mittaustarkkuuden käsitteitä Mittaustarkkuuden analysointi Stabiilius Kohdistuvuus Toistettavuus

Lisätiedot

2. Yhden selittäajäan lineaarinen regressiomalli. 2.1 Malli ja parametrien estimointi. Malli:

2. Yhden selittäajäan lineaarinen regressiomalli. 2.1 Malli ja parametrien estimointi. Malli: 2. Yhden selittäajäan lineaarinen regressiomalli Regressio-termi peräaisin Galtonilta. IsÄan ja pojan pituus: PitkÄa isäa lyhyempi poika, lyhyt isäa pidempi poika. Son height (cm) 21 2 19 18 17 16 15 15

Lisätiedot

MS-C2{04 Tilastollisen analyysin perusteet

MS-C2{04 Tilastollisen analyysin perusteet MS-C2{04 Tilastollisen analyysin perusteet Tentti 7.4.20 4A/irtanen Kirjoita selvästi jokaiseen koepaperiin alla mainitussa järjestyksessä: OHlprrn (i) (ii) MS-C204 TAP 7.4.204 opiskelijanumero + kirjain

Lisätiedot

Mäntyharju. Menetetyt elinvuodet 1984-2008 (PYLL)

Mäntyharju. Menetetyt elinvuodet 1984-2008 (PYLL) Menetetyt elinvuodet 1984-28 (PYLL) 24-28 Menetetyt elinvuodet -indeksi (Potential Years of Life Lost = PYLL) Verrattuna koko maan lukuihin Kaikki kuolinsyyt (A-R99,V1-Y89) Pahanlaatuiset kasvaimet (C-C97)

Lisätiedot

Kvantitatiiviset tutkimusmenetelmät maantieteessä

Kvantitatiiviset tutkimusmenetelmät maantieteessä Kvantitatiiviset tutkimusmenetelmät maantieteessä Harjoitukset: 2 Muuttujan normaaliuden testaaminen, merkitsevyys tasot ja yhden otoksen testit FT Joni Vainikka, Yliopisto-opettaja, GO218, joni.vainikka@oulu.fi

Lisätiedot

Todennäköisyysjakaumia

Todennäköisyysjakaumia 8.9.26 Kimmo Vattulainen Todennäköisyysjakaumia Seuraavassa esitellään kurssilla MAT-25 Todennäköisyyslaskenta esille tulleita diskreettejä todennäköisyysjakaumia Diskreetti tasajakauma Bernoullijakauma

Lisätiedot

Tilastolliset toiminnot

Tilastolliset toiminnot -59- Tilastolliset toiminnot 6.1 Aineiston esittäminen graafisesti Tilastollisen aineiston tallentamisvälineiksi TI-84 Plus tarjoaa erityiset listamuuttujat L1,, L6, jotka löytyvät 2nd -toimintoina vastaavilta

Lisätiedot

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4 1. JOHDANTO TILASTOLLISEEN PÄÄTTELYYN...6 1.1 INDUKTIO JA DEDUKTIO...7 1.2 SYYT JA VAIKUTUKSET...9

Lisätiedot

USEAN MUUTTUJAN REGRESSIOMALLIT JA NIIDEN ANA- LYYSI

USEAN MUUTTUJAN REGRESSIOMALLIT JA NIIDEN ANA- LYYSI TEORIA USEAN MUUTTUJAN REGRESSIOMALLIT JA NIIDEN ANA- LYYSI Regressiomalleilla kuvataan tilanteita, jossa suureen y arvot riippuvat joukosta ns selittäviä muuttujia x 1, x 2,..., x p oletetun funktiomuotoisen

Lisätiedot

Aki Taanila VARIANSSIANALYYSI

Aki Taanila VARIANSSIANALYYSI Aki Taanila VARIANSSIANALYYSI 18.5.2007 VARIANSSIANALYYSI 1 JOHDANTO...2 VARIANSSIANALYYSI...3 Yksisuuntainen varianssianalyysi...3 Kaksisuuntainen varianssianalyysi ilman toistoja...6 Kaksisuuntainen

Lisätiedot

TIETOKONE DATA-ANALYYSIN APUVÄLINEENÄ PIKAOPAS

TIETOKONE DATA-ANALYYSIN APUVÄLINEENÄ PIKAOPAS TIETOKONE DATA-ANALYYSIN APUVÄLINEENÄ PIKAOPAS 1 Johdanto Oppilaslaboratorion mittausdatan analyysiä voi helpottaa huomattavasti käyttämällä apuna tietokoneohjelmia. Sen sijaan, että esimerkiksi laskisimme

Lisätiedot

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty 30.11.2012

Luentokalvoja tilastollisesta päättelystä. Kalvot laatinut Aki Taanila Päivitetty 30.11.2012 Luentokalvoja tilastollisesta päättelystä Kalvot laatinut Aki Taanila Päivitetty 30.11.2012 Otanta Otantamenetelmiä Näyte Tilastollinen päättely Otantavirhe Otanta Tavoitteena edustava otos = perusjoukko

Lisätiedot

H6: Tehtävänanto. Taulukkolaskennan perusharjoitus. Harjoituksen tavoitteet

H6: Tehtävänanto. Taulukkolaskennan perusharjoitus. Harjoituksen tavoitteet H6: Tehtävänanto Taulukkolaskennan perusharjoitus Ennen kuin aloitat harjoituksen teon, lue siihen liittyvä taustamateriaali. Se kannattaa käydä läpi kokeilemalla samalla siinä annetut esimerkit käyttämässäsi

Lisätiedot

SISÄLTÖ 1 TILASTOJEN KÄYTTÖ...7 MITÄ TILASTOTIEDE ON?

SISÄLTÖ 1 TILASTOJEN KÄYTTÖ...7 MITÄ TILASTOTIEDE ON? SISÄLTÖ 1 TILASTOJEN KÄYTTÖ...7 MITÄ TILASTOTIEDE ON?...7 TILASTO...7 TILASTOTIEDE...8 HISTORIAA...9 TILASTOTIETEEN NYKYINEN ASEMA...9 TILASTOLLISTEN MENETELMIEN ROOLIT ERI TYYPPISET AINEISTOT JA ONGELMAT...10

Lisätiedot

OULUNKAAREN SEUTUKUNTA. Menetetyt elinvuodet 1983 2004 (PYLL)

OULUNKAAREN SEUTUKUNTA. Menetetyt elinvuodet 1983 2004 (PYLL) OULUNKAAREN SEUTUKUNTA Menetetyt elinvuodet 1983 24 (PYLL) LAUSUNTO 1 (1) 21.8.26 MENETETYT ELINVUODET (PYLL) -INDEKSI (PYLL = Potential Years of Life Lost) Efeko Oy tuotti Oulunkaaren seutukunnan tilauksesta

Lisätiedot

SQL-perusteet, SELECT-, INSERT-, CREATE-lauseet

SQL-perusteet, SELECT-, INSERT-, CREATE-lauseet SQL-perusteet, SELECT-, INSERT-, CREATE-lauseet A271117, Tietokannat Teemu Saarelainen teemu.saarelainen@kyamk.fi Lähteet: Leon Atkinson: core MySQL Ari Hovi: SQL-opas TTY:n tietokantojen perusteet-kurssin

Lisätiedot

Harjoitus 9: Excel - Tilastollinen analyysi

Harjoitus 9: Excel - Tilastollinen analyysi Harjoitus 9: Excel - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tutustuminen regressioanalyysiin

Lisätiedot

MICROSOFT EXCEL 2010

MICROSOFT EXCEL 2010 1 MICROSOFT EXCEL 2010 Taulukkolaskentaohjelman jatkokurssin tärkeitä asioita 2 Taulukkolaskentaohjelmalla voit Käyttää tietokonetta ruutupaperin ja taskulaskimen korvaajana Laatia helposti ylläpidettäviä

Lisätiedot

Johdatus Stata-ohjelmistoon

Johdatus Stata-ohjelmistoon Johdatus Stata-ohjelmistoon Jani Erola Turun yliopisto, sosiaalitieteiden laitos 8.11.2010 Jani Erola (Turun yliopisto) Stata 2010 8.11.2010 1 / 27 Sisällys 1 Miksi Stata? 2 Aloitus 3 Aineiston manipulointi

Lisätiedot

4 / 2013 TI-NSPIRE CAS TEKNOLOGIA LUKIOSSA. T3-kouluttajat: Olli Karkkulainen ja Markku Parkkonen

4 / 2013 TI-NSPIRE CAS TEKNOLOGIA LUKIOSSA. T3-kouluttajat: Olli Karkkulainen ja Markku Parkkonen 4 / 2013 TI-NSPIRE CAS TEKNOLOGIA LUKIOSSA T3-kouluttajat: Olli Karkkulainen ja Markku Parkkonen 1 2 TI-Nspire CX CAS kämmenlaite kevään 2013 pitkän matematiikan kokeessa Tehtävä 1. Käytetään komentoa

Lisätiedot