naaraat < read.table(' head=t, sep=',')

Save this PDF as:
 WORD  PNG  TXT  JPG

Koko: px
Aloita esitys sivulta:

Download "naaraat < read.table('http://cs.joensuu.fi/pages/whamalai/dm13/naaraatvalikoitu.csv', head=t, sep=',')"

Transkriptio

1 naaraat < read.table(' head=t, sep=',') printf < function(...) { print(sprintf(...)) c_by_method < NULL # Listataan ne muuttujaparit, joilla jokin korrelaatio on itseisarvoltaan >= 0.4. for (m in c('pearson', 'kendall', 'spearman')) { printf('method: %s', m) printf(' ') c < cor(naaraat, method = m) c_by_method[[m]] < as.matrix(c) for (i in 1:(length(c[1,]) 1)) { for (j in ((i+1):length(c[,1]))) { if(abs(c[i,j]) >= 0.4) { printf("%s vs. %s: %f", names(c[1,])[i], names(c[,1])[j], c[i,j]) printf('') # Koostetaan muuttujaparikohtaisten korrelaatiokertoimien eroista MSE:t, jolloin erikoisimmat poikkeamat on helppo löytää. c_avg < as.matrix( c_by_method[['kendall']] + c_by_method[['pearson']] + c_by_method[['spearman']] ) / 3 mse < ((c_by_method[['kendall']] c_avg) ** 2 + (c_by_method[['pearson']] c_avg) ** 2 + (c_by_method[['spearman']] c_avg) ** 2) / 3 mse > 0.34 * max(mse) # Toisistaan poikkeavimpia korrelaatiokertoimia saavat X4 X5, X4 X6, X4 X8, X5 X6 ja X6 X8. for(i in list(c(4,5), c(4,6), c(4,8), c(5,6), c(6,8))) { printf('%s %s', names(c[1,])[i[1]], names(c[,1])[i[2]]) for(m in c('pearson', 'kendall', 'spearman')) { printf(' %s: %f', m, c_by_method[[m]][i[1],i[2]]) # Näille muuttujapareille yhteistä on se, että Pearsonin korrelaatiokerroin on suurin, kun taas Kendallin ja Spearmanin kertoimet ovat samalla tasolla. # Tähän eräs ilmeinen syy on se, että Pearsonin korrelaatiokerroin on herkkä outliereille. # Jännimmältä vaikuttavat arvojen perusteella parit X4 X8 ja X4 X6 (kendall ja spearman negatiivisia), piirrelläänpä ainakin ne.. plot(naaraat[,4], naaraat[,8]) #Yksi outlier. plot(naaraat[,4], naaraat[,6]) #Näemmä pari selvää outlieria. plot(naaraat[,4], naaraat[,6]) #Näemmä pari selvää outlieria. plot(naaraat[,5], naaraat[,6]) #Muutama outlier. plot(naaraat[,6], naaraat[,8]) #Pari outlieriä.

2 #b kohta # Valitaan jokin sopiva raja arvo, joka tuottaa riittävästi mielenkiintoisia pareja. sum(mse < * max(mse)) # = 25 (diagonaalialkiot + 3 muuttujaparia) mse < * max(mse) # Tarkasteltavia pareja 1 5, ja plot(naaraat[,1], naaraat[,5]) plot(naaraat[,13], naaraat[,19]) plot(naaraat[,14], naaraat[,18]) # Tarkasteltujen muuttujien nimet: names(naaraat)[c(1,5,13,14,18,19)] #1 ja 19 eivät ole edes järjestysmuuttujia. # Näissä muuttujapareissa toinen muuttujista on selvästi luokitteleva ja toinen jatkuvaluonteinen. c_by_method[['pearson']][mse < * max(mse)] #Pearsonin korrelaatiokertoimet niiden muuttujaparien osalta, joissa eri korrelaatiokerrointyypit eivät liiemmin poikkea toisistaan. # Havaitaan siis, että juuri näissä muuttujapareissa ei ole liiemmin korrelaatiotakaan (1.000 korrelaatiot ovat diagonaalialkiolta eli muuttujan korrelaatio itsensä kanssa, joka ei luonnollisestikaan meitä kiinnosta). ################################################################################ [1] "Method: pearson" [1] " " [1] "X1.vaika X13.batratio: " [1] "X2.paino X7.thymusratio: " [1] "X2.paino X9.neitsyt: " [1] "X2.paino X10.rasitus: " [1] "X2.paino X15.hanta: " [1] "X2.paino X17.vart: " [1] "X2.paino X18.painoind: " [1] "X4.maksaratio X5.pernaratio: " [1] "X4.maksaratio X6.sydanratio: " [1] "X4.maksaratio X8.umpisratio: " [1] "X5.pernaratio X6.sydanratio: " [1] "X5.pernaratio X7.thymusratio: " [1] "X6.sydanratio X7.thymusratio: " [1] "X6.sydanratio X18.painoind: " [1] "X7.thymusratio X9.neitsyt: " [1] "X7.thymusratio X13.batratio: " [1] "X7.thymusratio X15.hanta: " [1] "X7.thymusratio X17.vart: " [1] "X7.thymusratio X18.painoind: " [1] "X9.neitsyt X10.rasitus: " [1] "X9.neitsyt X15.hanta: "

3 [1] "X9.neitsyt X17.vart: " [1] "X9.neitsyt X18.painoind: " [1] "X10.rasitus X15.hanta: " [1] "X10.rasitus X17.vart: " [1] "X10.rasitus X18.painoind: " [1] "X11.gonratio X12.uusrasvaratio: " [1] "X15.hanta X17.vart: " [1] "X15.hanta X18.painoind: " [1] "X17.vart X18.painoind: " [1] "" [1] "Method: kendall" [1] " " [1] "X2.paino X7.thymusratio: " [1] "X2.paino X9.neitsyt: " [1] "X2.paino X10.rasitus: " [1] "X2.paino X15.hanta: " [1] "X2.paino X17.vart: " [1] "X2.paino X18.painoind: " [1] "X7.thymusratio X9.neitsyt: " [1] "X7.thymusratio X15.hanta: " [1] "X7.thymusratio X17.vart: " [1] "X7.thymusratio X18.painoind: " [1] "X9.neitsyt X10.rasitus: " [1] "X9.neitsyt X15.hanta: " [1] "X9.neitsyt X17.vart: " [1] "X9.neitsyt X18.painoind: " [1] "X10.rasitus X18.painoind: " [1] "X11.gonratio X12.uusrasvaratio: " [1] "X15.hanta X17.vart: " [1] "X15.hanta X18.painoind: " [1] "X17.vart X18.painoind: " [1] "" [1] "Method: spearman" [1] " " [1] "X1.vaika X13.batratio: " [1] "X2.paino X7.thymusratio: " [1] "X2.paino X9.neitsyt: " [1] "X2.paino X10.rasitus: " [1] "X2.paino X15.hanta: " [1] "X2.paino X17.vart: " [1] "X2.paino X18.painoind: " [1] "X6.sydanratio X10.rasitus: " [1] "X6.sydanratio X18.painoind: " [1] "X7.thymusratio X9.neitsyt: " [1] "X7.thymusratio X10.rasitus: " [1] "X7.thymusratio X15.hanta: "

4 [1] "X7.thymusratio X17.vart: " [1] "X7.thymusratio X18.painoind: " [1] "X9.neitsyt X10.rasitus: " [1] "X9.neitsyt X15.hanta: " [1] "X9.neitsyt X17.vart: " [1] "X9.neitsyt X18.painoind: " [1] "X10.rasitus X15.hanta: " [1] "X10.rasitus X17.vart: " [1] "X10.rasitus X18.painoind: " [1] "X11.gonratio X12.uusrasvaratio: " [1] "X15.hanta X17.vart: " [1] "X15.hanta X18.painoind: " [1] "X17.vart X18.painoind: " poikkeavuudet: [1] "X4.maksaratio X5.pernaratio" [1] " pearson: " [1] " kendall: " [1] " spearman: " [1] "X4.maksaratio X6.sydanratio" [1] " pearson: " [1] " kendall: " [1] " spearman: " [1] "X4.maksaratio X8.umpisratio" [1] " pearson: " [1] " kendall: " [1] " spearman: " [1] "X5.pernaratio X6.sydanratio" [1] " pearson: " [1] " kendall: " [1] " spearman: " [1] "X6.sydanratio X8.umpisratio" [1] " pearson: " [1] " kendall: " [1] " spearman: " samankaltaisuudet: > c_by_method[['pearson']][mse < * max(mse)] #Pearsonin korrelaatiokertoimet niiden muuttujaparien osalta, joissa eri korrelaatiokerrointyypit eivã t liiemmin poikkea toisistaan.

5 [1] [7] [13] [19] [25] [31] [37] [43] [49] [55] [61] [67] [73] [79] [85] #muuttujaparit 1 ja 5 sekä 2 ja 8

6 Siis Correctly Classified Instances arvot ovat a: b(oletus): b(0): b(15): c: d: e: f(naiivi): f(naiivi ): f(bayesnet): f(bayesnet ): = datasta poistettu painot ja ratiot hantaa ja sydanta lukuunottamatta Huomioita Bayes luokittelija vaikuttaa pärjäävän paremmin useamman muuttujan ollessa jatkuvaluonteisia. Toisaalta Bayes luokittelija hyötyy (valistuneella arvauksella) siistitystä datasta. J48 suoriutuu likimain yhtä hyvin molemmissa tapauksissa. Luulisin jollain valistuneella arvauksella / peukalosäännöllä yhden piilotason neuroverkon kykenevään jopa parempaankin tulokseen kuin ilman piilotasoa. Heikoimmat tulokset diskretoidulla datalla ajettu naiivi Bayes sekä BayesNet. Paras tulos numeerista dataa vasten ajetulla BayesNetillä. Muuten tulokset ovat melko sievästi %:n tuntumassa.

7 $ # Ensinnäkin muutama perustesti. Ensin kaksimuuttujainen data, jossa karteesisen tulon {0,1,2..63 x {0,1,2..63 kaikki alkiot. $ java cp cls Mutuali summary_testi_tas.csv 1 2 mi= e 16 $ # Kaksimuuttujainen data, jossa laskeva suora (0,0), ( 1,1),.., ( 255,255). $ java cp cls Mutuali summary_testi_ lin.csv 1 2 mi= $ cat summary_testi_ lin.csv #testi_ lin.csv 1, 255.0,0.0,3 2,0.0,255.0,4 $ nano summary_testi_ lin.csv $ cat summary_testi_ lin.csv #testi_ lin.csv 1, 255.0,0.0,4 2,0.0,255.0,4 $ java cp cls Mutuali summary_testi_ lin.csv 1 2 mi=1.0 $ # Vaikuttaisi ilmeisesti toimivan. $ # Nappasinpa kokeiltavaksi hieman kiihtyvyysdataa omasta harjoitustyöaiheesta. Ensimmäinen muuttuja (aika) on luonnollisesti tiputettu pois. $ java cp cls Mutuali summary_implant_axis.csv 3 4 mi= mi= mi= $ # Siis mitä ilmeisemmin muuttujien välillä on hieman korrelaatiota, kuten olettaa saattaa. Vähiten keskenään korreloivat x ja z muuttuja.

8 lehma < read.table(' head=t, sep=',') lehma$c < factor(lehma$c) koulutus < 1:1000 #valitaan tuhat riviä koulutusdataksi S < cov(lehma[koulutus, 6]) #kovarianssimatriisi talteen #olettamalla C järjestysmuuttujaksi voidaan lähteä kokeilemaan lineaariregressiomallia y < as.matrix(c(lehma[koulutus,6])) #selitettävä(t) muuttuja(t) x < as.matrix(cbind((rep(1, length(lehma[koulutus,6]))), lehma[koulutus, 6])) #selittävät muuttujat xtemp < solve(t(x) %*% x) %*% t(x) #hirvittävä pns häkkyrä, jollaisia laskettiin liniksessä #näillä voi vähän tutkia, mitä on saatu nyt aikaan #head(xtemp) #str(xtemp) #str(y) #mjaa, kai tarkoitus oli käyttää xtempiä, mutta käyhän se näinkin (regressiomallin mukaiset betakertoimet) betamat < solve(t(x) %*% x) %*% t(x) %*% y #tutkailuja #str(x) #str(y) #PCA: kovarianssimatriisin ominaisarvoja/ vektoreita tarvitaan PCA:han eigs < eigen(s) cumsum(eigs$values / sum(eigs$values)) #pari ekaa pääkomponenttia tuo esille valtaosan eroista #yksittäisten koordinaattien plottailut (vaihda # v tuosta vertailtavia sarakepareja, nykyisellään siis 2. ja 5. sarake luetaan x ja y koordinaateiksi) plot(lehma[koulutus,c(5,2)], col = c('blue', 'red', 'green')[lehma$c]) #PCA: vertailun vuoksi parin ekan pääkomponentin mukaan sovitellut havainnot plot(as.matrix(lehma[koulutus, 6]) %*% eigs$vectors[,1:2], col = c('blue', 'red', 'green')[lehma$c]) #näissähän alkaisi olla jo mahdollisuus karkeasti erotella toiminnot toisistaan #testataanpa jollakin yksittäisellä havainnolla as.matrix(cbind(1, lehma[1444, 6])) %*% betamat # ~1.086 lehma[1444,6] # = 1 #testataanpa loppudatalla kokonaisuudessaan (indeksoinnissa negatiivinen arvo siis meinaa "jätä pois", eli esim. lehma[ koulutus,] valitsee rivit, joita ei käytetty koulutukseen) arvatut < as.matrix(cbind(1, lehma[ koulutus, 6])) %*% betamat oikein < sum((round(arvatut) c(lehma[ koulutus,6])) == 0)

9 testilehmia < length(lehma[ koulutus,1]) #arvausprosentti: oikein / testilehmia #siis 82,26 % #################### PCA ###################### #huom! eigs laskettu jo edellä y < as.matrix(c(lehma[koulutus,6])) #selitettävä(t) muuttuja(t) x < as.matrix(cbind((rep(1, length(lehma[koulutus,6]))), as.matrix(lehma[koulutus, 6]) %*% eigs$vectors)) #selittävät muuttujat, tällä kertaa muunnettu pääkomponenttien mukaan betamat < solve(t(x) %*% x) %*% t(x) %*% y #testataanpa jollakin yksittäisellä havainnolla as.matrix(cbind(1, as.matrix(lehma[1444, 6]) %*% eigs$vectors)) %*% betamat # edelleen ~1.086 lehma[1444,6] # = 1 #testataanpa koko loppudatalla arvatut < as.matrix(cbind(1, as.matrix(lehma[ koulutus, 6]) %*% eigs$vectors)) %*% betamat oikein < sum((round(arvatut) c(lehma[ koulutus,6])) == 0) testilehmia < length(lehma[ koulutus,1]) #arvausprosentti: oikein / testilehmia #edelleen 82,26 % #################### PCA (muuttujia karsittu) ###################### #huom! eigs laskettu jo edellä y < as.matrix(c(lehma[koulutus,6])) #selitettävä(t) muuttuja(t) x < as.matrix(cbind((rep(1, length(lehma[koulutus,6]))), as.matrix(lehma[koulutus, 6]) %*% eigs$vectors[,1:2])) #selittävät muuttujat, tällä kertaa muunnettu pääkomponenttien mukaan betamat < solve(t(x) %*% x) %*% t(x) %*% y #testataanpa jollakin yksittäisellä havainnolla as.matrix(cbind(1, as.matrix(lehma[1444, 6]) %*% eigs$vectors[,1:2])) %*% betamat # nyt ~ lehma[1444,6] # = 1 #testataanpa koko loppudatalla arvatut < as.matrix(cbind(1, as.matrix(lehma[ koulutus, 6]) %*% eigs$vectors[,1:2])) %*% betamat oikein < sum((round(arvatut) c(lehma[ koulutus,6])) == 0) testilehmia < length(lehma[ koulutus,1])

10 #arvausprosentti: oikein / testilehmia #nyt 79,44 % (ennen 82,26 %) #siis typistämällä tarkasteltavia muuttujia sopivalla muunnoksella (PCA) viidestä kahteen kadotetaan tässä tapauksessa verrattain vähän luokittelutarkkuuden suhteen (alle 3 %:n ero) #parempia luokittelutuloksia ei luonnollisesti saada, mutta "luokittelutarkkuus / muuttujien lkm" lukuarvon kasvu on ainakin vaikuttava #pari esimerkkiplottausta (1 4, 5 2) muuttujapareista #PCA ja virheellisesti luokitellut havainnot

11

HAVAITUT JA ODOTETUT FREKVENSSIT

HAVAITUT JA ODOTETUT FREKVENSSIT HAVAITUT JA ODOTETUT FREKVENSSIT F: E: Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies (1) 59 28 4 91 Nainen (2) 5 14 174 193 Yhteensä 64 42 178 284 Usein Harvoin Ei tupakoi Yhteensä (1) (2) (3) Mies

Lisätiedot

vkp 4*(1+0)/(32-3)-1= vkp 2*(1+0)/(32-3)=

vkp 4*(1+0)/(32-3)-1= vkp 2*(1+0)/(32-3)= JÄRJESTYSKORRELAATIO 1. Hannu ja Kerttu pitävät karamelleista, mutta heidän mieltymyksensä poikkeavat hieman. Hannun mielestä punaiset karkit ovat parhaita ja keltaiset miellyttävät häntä vähiten. Kerttu

Lisätiedot

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4

Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4 Sisällysluettelo ESIPUHE 1. PAINOKSEEN... 3 ESIPUHE 2. PAINOKSEEN... 3 SISÄLLYSLUETTELO... 4 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 6 1.1 KESKEISTEN KÄSITTEIDEN KERTAUSTA... 7 1.2 AIHEESEEN PEREHTYMINEN...

Lisätiedot

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas Itse arvioidun terveydentilan ja sukupuolen välinen riippuvuustarkastelu. Jyväskyläläiset 75-vuotiaat miehet ja naiset vuonna 1989.

Lisätiedot

4 Riippuvuus 1. Esimerkki 4. Korrelaation laskeminen SPSS-ohjelmalla rajatusta aineistosta

4 Riippuvuus 1. Esimerkki 4. Korrelaation laskeminen SPSS-ohjelmalla rajatusta aineistosta 4 Riippuvuus 1 Esimerkki 4. Korrelaation laskeminen SPSS-ohjelmalla rajatusta aineistosta x 2 = sisaruksien luku- Tarkastellaan äidin ja lapsen pituuden välistä riippuvuutta havaintomatriisilla, joka on

Lisätiedot

Korrelaatiokerroin. Hanna Heikkinen. Matemaattisten tieteiden laitos. 23. toukokuuta 2012

Korrelaatiokerroin. Hanna Heikkinen. Matemaattisten tieteiden laitos. 23. toukokuuta 2012 Korrelaatiokerroin Hanna Heikkinen 23. toukokuuta 2012 Matemaattisten tieteiden laitos Esimerkki 1: opiskelijoiden ja heidän äitiensä pituuksien sirontakuvio, n = 61 tyttären pituus (cm) 155 160 165 170

Lisätiedot

Vapaus. Määritelmä. Vektorijono ( v 1, v 2,..., v k ) on vapaa eli lineaarisesti riippumaton, jos seuraava ehto pätee:

Vapaus. Määritelmä. Vektorijono ( v 1, v 2,..., v k ) on vapaa eli lineaarisesti riippumaton, jos seuraava ehto pätee: Vapaus Määritelmä Oletetaan, että v 1, v 2,..., v k R n, missä n {1, 2,... }. Vektorijono ( v 1, v 2,..., v k ) on vapaa eli lineaarisesti riippumaton, jos seuraava ehto pätee: jos c 1 v 1 + c 2 v 2 +

Lisätiedot

I Data ja sen esiprosessointi

I Data ja sen esiprosessointi Tiedonlouhinta 2013 Kotikoe (palautuspäivä 24.6.2012) Tee tehtäviä kaikista osioista. (Kannattaa ehdottomasti tehdä kaikki tehtävät! Silloin harjoitustyökin sujuu helpommin.) Tehtävät arvostellaan ja mikäli

Lisätiedot

Vapaus. Määritelmä. jos c 1 v 1 + c 2 v c k v k = 0 joillakin c 1,..., c k R, niin c 1 = 0, c 2 = 0,..., c k = 0.

Vapaus. Määritelmä. jos c 1 v 1 + c 2 v c k v k = 0 joillakin c 1,..., c k R, niin c 1 = 0, c 2 = 0,..., c k = 0. Vapaus Määritelmä Oletetaan, että v 1, v 2,..., v k R n, missä n {1, 2,... }. Vektorijono ( v 1, v 2,..., v k ) on vapaa eli lineaarisesti riippumaton, jos seuraava ehto pätee: jos c 1 v 1 + c 2 v 2 +

Lisätiedot

Kannan vektorit siis virittävät aliavaruuden, ja lisäksi kanta on vapaa. Lauseesta 7.6 saadaan seuraava hyvin käyttökelpoinen tulos:

Kannan vektorit siis virittävät aliavaruuden, ja lisäksi kanta on vapaa. Lauseesta 7.6 saadaan seuraava hyvin käyttökelpoinen tulos: 8 Kanta Tässä luvussa tarkastellaan aliavaruuden virittäjävektoreita, jotka muodostavat lineaarisesti riippumattoman jonon. Merkintöjen helpottamiseksi oletetaan luvussa koko ajan, että W on vektoreiden

Lisätiedot

2.8. Kannanvaihto R n :ssä

2.8. Kannanvaihto R n :ssä 28 Kannanvaihto R n :ssä Seuraavassa kantavektoreiden { x, x 2,, x n } järjestystä ei saa vaihtaa Vektorit ovat pystyvektoreita ( x x 2 x n ) on vektoreiden x, x 2,, x n muodostama matriisi, missä vektorit

Lisätiedot

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet VAASAN YLIOPISTO/AVOIN YLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia 1 KURSSIKYSELYAINEISTO: 1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka

Lisätiedot

Mat Tilastollisen analyysin perusteet, kevät 2007

Mat Tilastollisen analyysin perusteet, kevät 2007 Mat-.104 Tilastollisen analyysin perusteet, kevät 007 8. luento: Usean selittäjän lineaarinen regressiomalli Kai Virtanen 1 Usean selittäjän lineaarinen regressiomalli Selitettävän muuttujan havaittujen

Lisätiedot

Determinantti. Määritelmä

Determinantti. Määritelmä Determinantti Määritelmä Oletetaan, että A on n n-neliömatriisi. Merkitään normaaliin tapaan matriisin A alkioita lyhyesti a ij = A(i, j). (a) Jos n = 1, niin det(a) = a 11. (b) Muussa tapauksessa n det(a)

Lisätiedot

Matemaattinen Analyysi, k2012, L1

Matemaattinen Analyysi, k2012, L1 Matemaattinen Analyysi, k22, L Vektorit Merkitsemme koulumatematiikasta tuttua vektoria v = 2 i + 3 j sarake matriisilla ( ) 2 v = v = = ( 2 3 ) T 3 Merkintätavan muutos helpottaa jatkossa siirtymistä

Lisätiedot

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio Tilastollisen analyysin perusteet Luento 9: lineaarinen lineaarinen Sisältö lineaarinen lineaarinen lineaarinen Lineaarinen Oletetaan, että meillä on n kappaletta (x 1, y 1 ), (x 2, y 2 )..., (x n, y n

Lisätiedot

YLEISKUVA - Kysymykset

YLEISKUVA - Kysymykset INSIGHT Käyttöopas YLEISKUVA - Kysymykset 1. Insight - analysointityökalun käytön mahdollistamiseksi täytyy kyselyn raportti avata Beta - raportointityökalulla 1. Klikkaa Insight välilehteä raportilla

Lisätiedot

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET 16..015 1. a Poliisivoimien suuruuden lisäksi piirikuntien rikostilastoihin vaikuttaa monet muutkin tekijät. Esimerkiksi asukkaiden keskimääräinen

Lisätiedot

7 Osa 7: Pidempiä esimerkkejä R:n käytöstä

7 Osa 7: Pidempiä esimerkkejä R:n käytöstä 7 Osa 7: Pidempiä esimerkkejä R:n käytöstä R:n pääasiallinen käyttö monelle on tilastollisten menetelmien suorittaminen. Käydään nyt läpi joitain esimerkkitilanteita, alkaen aineiston luvusta ja päättyen

Lisätiedot

Vektoreiden virittämä aliavaruus

Vektoreiden virittämä aliavaruus Vektoreiden virittämä aliavaruus Määritelmä Oletetaan, että v 1, v 2,... v k R n. Näiden vektoreiden virittämä aliavaruus span( v 1, v 2,... v k ) tarkoittaa kyseisten vektoreiden kaikkien lineaarikombinaatioiden

Lisätiedot

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle - Sisältö - - - Varianssianalyysi Varianssianalyysissä (ANOVA) testataan oletusta normaalijakautuneiden otosten odotusarvojen

Lisätiedot

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Regressioanalyysi. Vilkkumaa / Kuusinen 1 Regressioanalyysi Vilkkumaa / Kuusinen 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Halutaan selittää selitettävän muuttujan havaittujen arvojen vaihtelua selittävien muuttujien havaittujen

Lisätiedot

Lineaarialgebra ja matriisilaskenta II Syksy 2009 Laskuharjoitus 1 ( ) Ratkaisuehdotuksia Vesa Ala-Mattila

Lineaarialgebra ja matriisilaskenta II Syksy 2009 Laskuharjoitus 1 ( ) Ratkaisuehdotuksia Vesa Ala-Mattila Lineaarialgebra ja matriisilaskenta II Syksy 29 Laskuharjoitus (9. - 3..29) Ratkaisuehdotuksia Vesa Ala-Mattila Tehtävä. Olkoon V vektoriavaruus. Todistettava: jos U V ja W V ovat V :n aliavaruuksia, niin

Lisätiedot

Aki Taanila YHDEN SELITTÄJÄN REGRESSIO

Aki Taanila YHDEN SELITTÄJÄN REGRESSIO Aki Taanila YHDEN SELITTÄJÄN REGRESSIO 26.4.2011 SISÄLLYS JOHDANTO... 1 LINEAARINEN MALLI... 1 Selityskerroin... 3 Excelin funktioita... 4 EKSPONENTIAALINEN MALLI... 4 MALLIN KÄYTTÄMINEN ENNUSTAMISEEN...

Lisätiedot

Regressioanalyysi. Kuusinen/Heliövaara 1

Regressioanalyysi. Kuusinen/Heliövaara 1 Regressioanalyysi Kuusinen/Heliövaara 1 Regressioanalyysin idea ja tavoitteet Regressioanalyysin idea: Oletetaan, että haluamme selittää jonkin selitettävän muuttujan havaittujen arvojen vaihtelun joidenkin

Lisätiedot

Lineaarialgebra, kertausta aiheita

Lineaarialgebra, kertausta aiheita Lineaarialgebra, kertausta aiheita Matriisitulo käänteismatriisi determinantin kehittäminen determinantin ominaisuudet adjungaatti ja Cramerin kaavat yhtälöryhmän eri esitystavat Gauss-Jordan -algoritmi

Lisätiedot

Havaitsevan tähtitieteen peruskurssi I. Datan käsittely. Jyri Lehtinen. kevät Helsingin yliopisto, Fysiikan laitos

Havaitsevan tähtitieteen peruskurssi I. Datan käsittely. Jyri Lehtinen. kevät Helsingin yliopisto, Fysiikan laitos Datan käsittely Helsingin yliopisto, Fysiikan laitos kevät 2013 3. Datan käsittely Luennon sisältö: Havaintovirheet tähtitieteessä Korrelaatio Funktion sovitus Aikasarja-analyysi 3.1 Havaintovirheet Satunnaiset

Lisätiedot

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet VAASAN YLIOPISTO/KESÄYLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia A KURSSIKYSELYAINEISTO: 1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka

Lisätiedot

Viherseinien efekti Tilastoanalyysi

Viherseinien efekti Tilastoanalyysi Viherseinien efekti Tilastoanalyysi Risto Heikkinen Tutkimuskysymykset Seinän vaikutus koettuun haittoihin työympäristössä? Seinän vaikutus oireiden määrään? Mitkä tekijät selittävät viherseinän jatkokäytön

Lisätiedot

Lineaarikuvauksen R n R m matriisi

Lineaarikuvauksen R n R m matriisi Lineaarikuvauksen R n R m matriisi Lauseessa 21 osoitettiin, että jokaista m n -matriisia A vastaa lineaarikuvaus L A : R n R m, jolla L A ( v) = A v kaikilla v R n. Osoitetaan seuraavaksi käänteinen tulos:

Lisätiedot

S Laskennallinen Neurotiede

S Laskennallinen Neurotiede S-114.3812 Laskennallinen Neurotiede Laskuharjoitus 3 8.12.2006 Heikki Hyyti 60451P Tehtävä 2 Tehtävässä 2 piti tehdä 100 hermosolun assosiatiivinen Hopfield-muistiverkko. Verkko on rakennettu Matlab-ohjelmaan

Lisätiedot

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 3. Kaksiulotteiset satunnaismuuttujat

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 3. Kaksiulotteiset satunnaismuuttujat .9. Kaksiulotteiset satunnaismuuttujat MS-A Todennäköisslaskennan ja tilastotieteen peruskurssi Viikko Moniulotteiset satunnaismuuttujat sekä niiden jakaumat ja tunnusluvut; Moniulotteisia jakaumia Usein

Lisätiedot

Keskipisteen lisääminen 2 k -faktorikokeeseen (ks. Montgomery 9-6)

Keskipisteen lisääminen 2 k -faktorikokeeseen (ks. Montgomery 9-6) Mat-.3 Koesuunnittelu ja tilastolliset mallit kevät Keskipisteen lisääminen k -faktorikokeeseen (ks. Montgomery 9-6) Esim (Montg. ex. 9-, 6-): Tutkitaan kemiallisen prosessin saannon Y riippuvuutta faktoreista

Lisätiedot

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO... 6 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 8 2. AINEISTO...

Metsämuuronen: Tilastollisen kuvauksen perusteet ESIPUHE... 4 SISÄLLYSLUETTELO... 6 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 8 2. AINEISTO... Sisällysluettelo ESIPUHE... 4 ALKUSANAT E-KIRJA VERSIOON... SISÄLLYSLUETTELO... 6 1. METODOLOGIAN PERUSTEIDEN KERTAUSTA... 8 1.1 KESKEISTEN KÄSITTEIDEN KERTAUSTA...9 1.2 AIHEESEEN PEREHTYMINEN...9 1.3

Lisätiedot

Milloin A diagonalisoituva?

Milloin A diagonalisoituva? Milloin A diagonalisoituva? ) Oletus: A on diagonalisoituva eli D = TAT, jollakin D = diag(λ, λ 2,..., λ n ). A:n ja D:n ominaisarvot ovat samat λ, λ 2,..., λ n ovat myös A:n ominaisarvot... D e i = D

Lisätiedot

Ratkaisuehdotukset LH 3 / alkuvko 45

Ratkaisuehdotukset LH 3 / alkuvko 45 Ratkaisuehdotukset LH 3 / alkuvko 45 Tehtävä : Olkoot A, B, X R n n, a, b R n ja jokin vektorinormi. Kätetään vektorinormia vastaavasta operaattorinormista samaa merkintää. Nätä, että. a + b a b, 2. A

Lisätiedot

Määrällisen aineiston esittämistapoja. Aki Taanila

Määrällisen aineiston esittämistapoja. Aki Taanila Määrällisen aineiston esittämistapoja Aki Taanila 24.4.2017 1 Kategoriset muuttujat Lukumääriä Prosentteja (muista n-arvot) Pylväitä 2 Yhteenvetotaulukko (frekvenssitaulukko) TAULUKKO 1. Asunnon tyyppi

Lisätiedot

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n = 1. Tutkitaan paperin ominaispainon X(kg/dm 3 ) ja puhkaisulujuuden Y (m 2 ) välistä korrelaatiota. Tiettyä laatua olevasta paperierästä on otettu satunnaisesti 10 arkkia ja määritetty jokaisesta arkista

Lisätiedot

Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia: Mitä opimme?

Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia: Mitä opimme? TKK (c) Ilkka Mellin (4) Moniulotteisia todennäköisyysjakaumia Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (4) Moniulotteisia todennäköisyysjakaumia: Mitä

Lisätiedot

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170 VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 4.6.2013 Ratkaisut ja arvostelu 1.1 Satunnaismuuttuja X noudattaa normaalijakaumaa a) b) c) d) N(170, 10 2 ). Tällöin P (165 < X < 175) on likimain

Lisätiedot

TILASTOLLISTEN MENETELMIEN KIRJO JA KÄYTTÖ LÄÄKETIETEEN TUTKIMUSJULKAISUISSA. Pentti Nieminen 03.11.2014

TILASTOLLISTEN MENETELMIEN KIRJO JA KÄYTTÖ LÄÄKETIETEEN TUTKIMUSJULKAISUISSA. Pentti Nieminen 03.11.2014 TILASTOLLISTEN MENETELMIEN KIRJO JA KÄYTTÖ LÄÄKETIETEEN TUTKIMUSJULKAISUISSA LUKIJAN NÄKÖKULMA 2 TAUSTAKYSYMYKSIÄ 3 Mitä tutkimusmenetelmiä ja taitoja opiskelijoille tulisi opettaa koulutuksen eri vaiheissa?

Lisätiedot

Tässä dokumentissa on ensimmäisten harjoitusten malliratkaisut MATLABskripteinä. Voit kokeilla itse niiden ajamista ja toimintaa MATLABissa.

Tässä dokumentissa on ensimmäisten harjoitusten malliratkaisut MATLABskripteinä. Voit kokeilla itse niiden ajamista ja toimintaa MATLABissa. Laskuharjoitus 1A Mallit Tässä dokumentissa on ensimmäisten harjoitusten malliratkaisut MATLABskripteinä. Voit kokeilla itse niiden ajamista ja toimintaa MATLABissa. 1. tehtävä %% 1. % (i) % Vektorit luodaan

Lisätiedot

MTTTP1, luento KERTAUSTA

MTTTP1, luento KERTAUSTA 26.9.2017/1 MTTTP1, luento 26.9.2017 KERTAUSTA Varianssi, kaava (2) http://www.sis.uta.fi/tilasto/mtttp1/syksy2017/kaavat.pdf n i i n i i x x n x n x x n s 1 2 2 1 2 2 1 1 ) ( 1 1 Mittaa muuttujan arvojen

Lisätiedot

Matriisi-vektori-kertolasku, lineaariset yhtälöryhmät

Matriisi-vektori-kertolasku, lineaariset yhtälöryhmät Matematiikan peruskurssi K3/P3, syksy 25 Kenrick Bingham 825 Toisen välikokeen alueen ydinasioita Alla on lueteltu joitakin koealueen ydinkäsitteitä, joiden on hyvä olla ensiksi selvillä kokeeseen valmistauduttaessa

Lisätiedot

Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia. TKK (c) Ilkka Mellin (2005) 1

Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia. TKK (c) Ilkka Mellin (2005) 1 Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (005) 1 Moniulotteisia todennäköisyysjakaumia Multinomijakauma Kaksiulotteinen normaalijakauma TKK (c) Ilkka

Lisätiedot

Matematiikan tukikurssi, kurssikerta 3

Matematiikan tukikurssi, kurssikerta 3 Matematiikan tukikurssi, kurssikerta 3 1 Epäyhtälöitä Aivan aluksi lienee syytä esittää luvun itseisarvon määritelmä: { x kun x 0 x = x kun x < 0 Siispä esimerkiksi 10 = 10 ja 10 = 10. Seuraavaksi listaus

Lisätiedot

TESTINVALINTATEHTÄVIEN VASTAUKSET

TESTINVALINTATEHTÄVIEN VASTAUKSET TESTINVALINTATEHTÄVIEN VASTAUKSET Vastaukset on merkitty keltaisella, muuttujien mittaustasot muuttujan kuvauksen perässä ja muu osa vastauksesta kysymyksen perässä. Tehtävä 1. Talousmatematiikan kurssin

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin

Lisätiedot

Determinantti. Määritelmä

Determinantti. Määritelmä Determinantti Määritelmä Oletetaan, että A on n n-neliömatriisi Merkitään normaaliin tapaan matriisin A alkioita lyhyesti a ij = A(i, j) (a) Jos n = 1, niin det(a) = a 11 (b) Muussa tapauksessa n det(a)

Lisätiedot

Laskennallinen data-analyysi II

Laskennallinen data-analyysi II Laskennallinen data-analyysi II Saara Hyvönen, Saara.Hyvonen@cs.helsinki.fi Kevät 2007 Ulottuvuuksien vähentäminen, SVD, PCA Laskennallinen data-analyysi II, kevät 2007, Helsingin yliopisto visualisointi

Lisätiedot

Pistetulo eli skalaaritulo

Pistetulo eli skalaaritulo Pistetulo eli skalaaritulo VEKTORIT, MAA4 Pistetulo on kahden vektorin välinen tulo. Tarkastellaan ensin kahden vektorin välistä kulmaa. Vektorien a ja, kun a 0, välinen kulma on (kuva) kovera kun a vektorit

Lisätiedot

Lineaarialgebra ja matriisilaskenta I

Lineaarialgebra ja matriisilaskenta I Lineaarialgebra ja matriisilaskenta I 6.6.2013 HY / Avoin yliopisto Jokke Häsä, 1/22 Kertausta: Kääntyvien matriisien lause Lause 1 Oletetaan, että A on n n -neliömatriisi. Seuraavat ehdot ovat yhtäpitäviä.

Lisätiedot

Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu JMP:llä

Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu JMP:llä Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi Esimerkit laskettu JMP:llä Antti Hyttinen Tampereen teknillinen yliopisto 29.12.2003 ii Ohjelmien

Lisätiedot

TUTKIMUSOPAS. SPSS-opas

TUTKIMUSOPAS. SPSS-opas TUTKIMUSOPAS SPSS-opas Johdanto Tässä oppaassa esitetään SPSS-tilasto-ohjelman alkeita, kuten Excel-tiedoston avaaminen, tunnuslukujen laskeminen ja uusien muuttujien muodostaminen. Lisäksi esitetään esimerkkien

Lisätiedot

MATHM Hypermedian jatko-opintoseminaari

MATHM Hypermedian jatko-opintoseminaari Erotteluanalyysi 24.3.2006 Miika Huikkola MATHM-67500 Hypermedian jatko-opintoseminaari Olemme käsitelleet tähän mennessä seuraavia tilastollisia menetelmiä ja datan analyysimenelmiä Regressioanalyysi

Lisätiedot

Sovellusohjelmointi Matlab-ympäristössä: Vertaisverkon koneiden klusterointi

Sovellusohjelmointi Matlab-ympäristössä: Vertaisverkon koneiden klusterointi Sovellusohjelmointi Matlab-ympäristössä: Vertaisverkon koneiden klusterointi 28.4.2013 Annemari Auvinen (annauvi@st.jyu.fi) Anu Niemi (anniemi@st.jyu.fi) 1 Sisällysluettelo 1 JOHDANTO... 2 2 KÄYTETYT MENETELMÄT...

Lisätiedot

Osittaistuenta Gaussin algoritmissa: Etsitään 1. sarakkeen itseisarvoltaan suurin alkio ja vaihdetaan tämä tukialkioiksi (eli ko. rivi 1. riviksi).

Osittaistuenta Gaussin algoritmissa: Etsitään 1. sarakkeen itseisarvoltaan suurin alkio ja vaihdetaan tämä tukialkioiksi (eli ko. rivi 1. riviksi). Liukuluvut Tietokonelaskuissa käytetään liukulukuja: mikä esittää lukua ± α α α M β k ± ( M α i β i )β k, i= β on järjestelmän kantaluku, α α M liukuluvun mantissa, α,, α M lukuja,,,, β, siten että α Esimerkki

Lisätiedot

Moniulotteisia todennäköisyysjakaumia

Moniulotteisia todennäköisyysjakaumia Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia TKK (c) Ilkka Mellin (007) 1 Moniulotteisia todennäköisyysjakaumia >> Multinomijakauma Kaksiulotteinen

Lisätiedot

4.3. Matemaattinen induktio

4.3. Matemaattinen induktio 4.3. Matemaattinen induktio Matemaattinen induktio: Deduktion laji Soveltuu, kun ominaisuus on osoitettava olevan voimassa luonnollisilla luvuilla. Suppea muoto P(n) : Ominaisuus, joka joka riippuu luvusta

Lisätiedot

Ominaisarvo ja ominaisvektori

Ominaisarvo ja ominaisvektori Määritelmä Ominaisarvo ja ominaisvektori Oletetaan, että A on n n -neliömatriisi. Reaaliluku λ on matriisin ominaisarvo, jos on olemassa sellainen vektori v R n, että v 0 ja A v = λ v. Vektoria v, joka

Lisätiedot

1 Matriisit ja lineaariset yhtälöryhmät

1 Matriisit ja lineaariset yhtälöryhmät 1 Matriisit ja lineaariset yhtälöryhmät 11 Yhtälöryhmä matriisimuodossa m n-matriisi sisältää mn kpl reaali- tai kompleksilukuja, jotka on asetetettu suorakaiteen muotoiseksi kaavioksi: a 11 a 12 a 1n

Lisätiedot

Yhtälöryhmä matriisimuodossa. MS-A0004/A0006 Matriisilaskenta. Tarkastellaan esimerkkinä lineaarista yhtälöparia. 2x1 x 2 = 1 x 1 + x 2 = 5.

Yhtälöryhmä matriisimuodossa. MS-A0004/A0006 Matriisilaskenta. Tarkastellaan esimerkkinä lineaarista yhtälöparia. 2x1 x 2 = 1 x 1 + x 2 = 5. 2. MS-A4/A6 Matriisilaskenta 2. Nuutti Hyvönen, c Riikka Kangaslampi Matematiikan ja systeemianalyysin laitos Aalto-yliopisto 5.9.25 Tarkastellaan esimerkkinä lineaarista yhtälöparia { 2x x 2 = x + x 2

Lisätiedot

Tehtävä 1. (a) JYVÄSKYLÄN YLIOPISTO Matematiikan ja tilastotieteen laitos Parametrittomat ja robustit menetelmät Harjoitukset 7, vastaukset

Tehtävä 1. (a) JYVÄSKYLÄN YLIOPISTO Matematiikan ja tilastotieteen laitos Parametrittomat ja robustit menetelmät Harjoitukset 7, vastaukset JYVÄSKYLÄN YLIOPISTO Matematiikan ja tilastotieteen laitos Parametrittomat ja robustit menetelmät Harjoitukset 7, vastaukset 12.05.2009 Tehtävä 1 (a) x

Lisätiedot

A = a b B = c d. d e f. g h i determinantti on det(c) = a(ei fh) b(di fg) + c(dh eg). Matriisin determinanttia voi merkitä myös pystyviivojen avulla:

A = a b B = c d. d e f. g h i determinantti on det(c) = a(ei fh) b(di fg) + c(dh eg). Matriisin determinanttia voi merkitä myös pystyviivojen avulla: 11 Determinantti Neliömatriisille voidaan laskea luku, joka kertoo muun muassa, onko matriisi kääntyvä vai ei Tätä lukua kutsutaan matriisin determinantiksi Determinantilla on muitakin sovelluksia, mutta

Lisätiedot

5 Lineaariset yhtälöryhmät

5 Lineaariset yhtälöryhmät 5 Lineaariset yhtälöryhmät Edellisen luvun lopun esimerkissä päädyttiin yhtälöryhmään, jonka ratkaisemisesta riippui, kuuluuko tietty vektori eräiden toisten vektorien virittämään aliavaruuteen Tämäntyyppisiä

Lisätiedot

Lehmän poikimiskäyttäytymistä indikoivien piirteideneristys. Tiedonlouhinta 2013 Sari Kajava, Ville Kumpulainen, Nina Hänninen

Lehmän poikimiskäyttäytymistä indikoivien piirteideneristys. Tiedonlouhinta 2013 Sari Kajava, Ville Kumpulainen, Nina Hänninen Lehmän poikimiskäyttäytymistä indikoivien piirteideneristys kiihtyvyysdatasta Tiedonlouhinta 2013 Sari Kajava, Ville Kumpulainen, Nina Hänninen Sisältö Yleiskuva Alkuperäisen datan kuvaus Esiprosessointi

Lisätiedot

SISÄLTÖ 1 TILASTOJEN KÄYTTÖ...7 MITÄ TILASTOTIEDE ON?

SISÄLTÖ 1 TILASTOJEN KÄYTTÖ...7 MITÄ TILASTOTIEDE ON? SISÄLTÖ 1 TILASTOJEN KÄYTTÖ...7 MITÄ TILASTOTIEDE ON?...7 TILASTO...7 TILASTOTIEDE...8 HISTORIAA...9 TILASTOTIETEEN NYKYINEN ASEMA...9 TILASTOLLISTEN MENETELMIEN ROOLIT ERI TYYPPISET AINEISTOT JA ONGELMAT...10

Lisätiedot

Matematiikka B2 - TUDI

Matematiikka B2 - TUDI Matematiikka B2 - TUDI Miika Tolonen 3. syyskuuta 2012 Miika Tolonen Matematiikka B2 - TUDI 1 Kurssin sisältö (1/2) Matriisit Laskutoimitukset Lineaariset yhtälöryhmät Gaussin eliminointi Lineaarinen riippumattomuus

Lisätiedot

Vapaus. Määritelmä. jos c 1 v 1 + c 2 v c k v k = 0 joillakin c 1,..., c k R, niin c 1 = 0, c 2 = 0,..., c k = 0.

Vapaus. Määritelmä. jos c 1 v 1 + c 2 v c k v k = 0 joillakin c 1,..., c k R, niin c 1 = 0, c 2 = 0,..., c k = 0. Vapaus Määritelmä Oletetaan, että v 1, v 2,..., v k R n, missä n {1, 2,... }. Vektorijono ( v 1, v 2,..., v k ) on vapaa eli lineaarisesti riippumaton, jos seuraava ehto pätee: jos c 1 v 1 + c 2 v 2 +

Lisätiedot

Toinen harjoitustyö. ASCII-grafiikkaa 2017

Toinen harjoitustyö. ASCII-grafiikkaa 2017 Toinen harjoitustyö ASCII-grafiikkaa 2017 Yleistä Tehtävä: tee Javalla ASCII-merkkeinä esitettyä grafiikkaa käsittelevä ASCIIArt17-ohjelma omia operaatioita ja taulukoita käyttäen. Työ tehdään pääosin

Lisätiedot

BIOSTATISTIIKKAA ESIMERKKIEN AVULLA. Kurssimoniste (luku 4) Janne Pitkäniemi. Helsingin Yliopisto Kansanterveystieteen laitos

BIOSTATISTIIKKAA ESIMERKKIEN AVULLA. Kurssimoniste (luku 4) Janne Pitkäniemi. Helsingin Yliopisto Kansanterveystieteen laitos BIOSTATISTIIKKAA ESIMERKKIEN AVULLA Kurssimoniste (luku 4) Janne Pitkäniemi Helsingin Yliopisto Kansanterveystieteen laitos Helsinki, 005 Biostatistiikkaa esimerkkien avulla 1 Janne Pitkäniemi, syksy 005

Lisätiedot

Mat Lineaarinen ohjelmointi

Mat Lineaarinen ohjelmointi Mat-.4 Lineaarinen ohjelmointi..7 Luento 7 Duaalisimple ja herkkyysanalyysi (kirja 4.5, 5., 5.5-5.6) Lineaarinen ohjelmointi - Syksy 7 / Duaalisimple Herkkyysanalyysi Luentorunko Parametrinen ohjelmointi

Lisätiedot

MS-C1340 Lineaarialgebra ja

MS-C1340 Lineaarialgebra ja MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt QR-hajotelma ja pienimmän neliösumman menetelmä Riikka Kangaslampi Kevät 2017 Matematiikan ja systeemianalyysin laitos Aalto-yliopisto PNS-ongelma PNS-ongelma

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi Yksiulotteisen

Lisätiedot

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot) R-ohjelman käyttö data-analyysissä Panu Somervuo 2014 Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. 0) käynnistetään R-ohjelma Huom.1 allaolevissa ohjeissa '>' merkki on R:n

Lisätiedot

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä

Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä Tilastollisen analyysin perusteet Luento 6: Korrelaatio ja riippuvuus tilastotieteessä Sisältö Riippumattomuus Jos P(A B) = P(A)P(B), niin tapahtumat A ja B ovat toisistaan riippumattomia. (Keskustelimme

Lisätiedot

Insinöörimatematiikka D, laskuharjoituksien esimerkkiratkaisut

Insinöörimatematiikka D, laskuharjoituksien esimerkkiratkaisut Insinöörimatematiikka D, 29.3.2016 4. laskuharjoituksien esimerkkiratkaisut 1. Olkoon u (4,0,4,2) ja v ( 1,1,3,5) vektoreita vektoriavaruudessa R 4. Annetun sisätulon (x,y) indusoima normi on x (x,x) ja

Lisätiedot

MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt

MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt ja pienimmän neliösumman menetelmä Riikka Kangaslampi Matematiikan ja systeemianalyysin laitos Aalto-yliopisto 2015 1 / 18 R. Kangaslampi QR ja PNS PNS-ongelma

Lisätiedot

4.6 Matriisin kääntäminen rivioperaatioilla

4.6 Matriisin kääntäminen rivioperaatioilla Vaasan liopiston julkaisuja 9 kuva.plot(,n, k-o,,n, k-s,,n3, k-d ); kuva.set_label( kausi ); kuva.set_label( lkm ); kuva.ais([,,,8]); kuva = fig.add_subplot(); kuva.plot(,tulo, k-o ); kuva.set_label( kausi

Lisätiedot

3 Lineaariset yhtälöryhmät ja Gaussin eliminointimenetelmä

3 Lineaariset yhtälöryhmät ja Gaussin eliminointimenetelmä 3 Lineaariset yhtälöryhmät ja Gaussin eliminointimenetelmä Lineaarinen m:n yhtälön yhtälöryhmä, jossa on n tuntematonta x 1,, x n on joukko yhtälöitä, jotka ovat muotoa a 11 x 1 + + a 1n x n = b 1 a 21

Lisätiedot

Lineaarialgebra ja matriisilaskenta I

Lineaarialgebra ja matriisilaskenta I Lineaarialgebra ja matriisilaskenta I 17.5.2017 Helsingin yliopisto Matematiikan ja tilastotieteen laitos Martina Aaltonen, martina.aaltonen@helsinki.fi, 1/18 Siirry istumaan jonkun viereen. Kaikilla on

Lisätiedot

1 Kannat ja kannanvaihto

1 Kannat ja kannanvaihto 1 Kannat ja kannanvaihto 1.1 Koordinaattivektori Oletetaan, että V on K-vektoriavaruus, jolla on kanta S = (v 1, v 2,..., v n ). Avaruuden V vektori v voidaan kirjoittaa kannan vektorien lineaarikombinaationa:

Lisätiedot

2.2 Gaussin eliminaatio. 2.2 Gaussin eliminaatio. 2.2 Gaussin eliminaatio. 2.2 Gaussin eliminaatio

2.2 Gaussin eliminaatio. 2.2 Gaussin eliminaatio. 2.2 Gaussin eliminaatio. 2.2 Gaussin eliminaatio x = x 2 = 5/2 x 3 = 2 eli Ratkaisu on siis x = (x x 2 x 3 ) = ( 5/2 2) (Tarkista sijoittamalla!) 5/2 2 Tämä piste on alkuperäisten tasojen ainoa leikkauspiste Se on myös piste/vektori jonka matriisi A

Lisätiedot

SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä. Antti Suoperä 16.11.2009

SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä. Antti Suoperä 16.11.2009 SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä Antti Suoperä 16.11.2009 SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä: Matriisi ja vektori laskennan ohjelmisto edellyttää

Lisätiedot

2.5. Matriisin avaruudet ja tunnusluvut

2.5. Matriisin avaruudet ja tunnusluvut 2.5. Matriisin avaruudet ja tunnusluvut m n-matriisi A Lineaarikuvaus A : V Z, missä V ja Z ovat sopivasti valittuja, dim V = n, dim Z = m (yleensä V = R n tai C n ja Z = R m tai C m ) Kuva-avaruus ja

Lisätiedot

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi

Lisätiedot

Ortogonaalinen ja ortonormaali kanta

Ortogonaalinen ja ortonormaali kanta Ortogonaalinen ja ortonormaali kanta Määritelmä Kantaa ( w 1,..., w k ) kutsutaan ortogonaaliseksi, jos sen vektorit ovat kohtisuorassa toisiaan vastaan eli w i w j = 0 kaikilla i, j {1, 2,..., k}, missä

Lisätiedot

Ohjelmoinnin perusteet, syksy 2006

Ohjelmoinnin perusteet, syksy 2006 Ohjelmoinnin perusteet, syksy 2006 Esimerkkivastaukset 1. harjoituksiin. Alkuperäiset esimerkkivastaukset laati Jari Suominen. Vastauksia muokkasi Jukka Stenlund. 1. Esitä seuraavan algoritmin tila jokaisen

Lisätiedot

7 Vapaus. 7.1 Vapauden määritelmä

7 Vapaus. 7.1 Vapauden määritelmä 7 Vapaus Kuten edellisen luvun lopussa mainittiin, seuraavaksi pyritään ratkaisemaan, onko annetussa aliavaruuden virittäjäjoukossa tarpeettomia vektoreita Jos tällaisia ei ole, virittäjäjoukkoa kutsutaan

Lisätiedot

Diskriminanttianalyysi I

Diskriminanttianalyysi I Diskriminanttianalyysi I 12.4-12.5 Aira Hast 24.11.2010 Sisältö LDA:n kertaus LDA:n yleistäminen FDA FDA:n ja muiden menetelmien vertaaminen Estimaattien laskeminen Johdanto Lineaarinen diskriminanttianalyysi

Lisätiedot

Lineaarialgebra ja matriisilaskenta I

Lineaarialgebra ja matriisilaskenta I Lineaarialgebra ja matriisilaskenta I 30.5.2013 HY / Avoin yliopisto Jokke Häsä, 1/19 Käytännön asioita Kurssi on suunnilleen puolessa välissä. Kannattaa tarkistaa tavoitetaulukosta, mitä on oppinut ja

Lisätiedot

ALKON MYYMÄLÄN VAIKUTUS YMPÄRISTÖNSÄ PÄIVITTÄISTAVARAMYYNTIIN 9.11.2005. A.C. Nielsen Finland Oy

ALKON MYYMÄLÄN VAIKUTUS YMPÄRISTÖNSÄ PÄIVITTÄISTAVARAMYYNTIIN 9.11.2005. A.C. Nielsen Finland Oy ALKON MYYMÄLÄN VAIKUTUS YMPÄRISTÖNSÄ PÄIVITTÄISTAVARAMYYNTIIN 9.11.2005 1(8) Alkon myymälän vaikutus ympäristönsä päivittäistavaramyyntiin: 1. Tutkimuksen tavoite 2. Menetelmä Tutkimuksen tavoitteena on

Lisätiedot

Tampereen yliopisto Tietokonegrafiikka 2013 Tietojenkäsittelytiede Harjoitus

Tampereen yliopisto Tietokonegrafiikka 2013 Tietojenkäsittelytiede Harjoitus Tampereen yliopisto Tietokonegrafiikka 201 Tietojenkäsittelytiede Harjoitus 6 1..201 1. Tarkastellaan Gouraudin sävytysmallia. Olkoon annettuna kolmio ABC, missä A = (0,0,0), B = (2,0,0) ja C = (1,2,0)

Lisätiedot

Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 3

Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 3 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 3 Aiheet: Satunnaisvektorit ja moniulotteiset jakaumat Tilastollinen riippuvuus ja lineaarinen korrelaatio Satunnaisvektorit ja moniulotteiset

Lisätiedot

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio Sisältö Regressioanalyysissä tavoitteena on tutkia yhden tai useamman selittävän muuttujan vaikutusta selitettävään muuttujaan. Sen avulla

Lisätiedot

Insinöörimatematiikka D

Insinöörimatematiikka D Insinöörimatematiikka D M. Hirvensalo mikhirve@utu.fi V. Junnila viljun@utu.fi A. Lepistö alepisto@utu.fi Matematiikan ja tilastotieteen laitos Turun yliopisto 2016 M. Hirvensalo V. Junnila A. Lepistö

Lisätiedot

I Keskiarvot ja hajonnat muuttujista 3-26 niin, että luokittelevana muuttujana on muuttuja 2 eli sukupuoli

I Keskiarvot ja hajonnat muuttujista 3-26 niin, että luokittelevana muuttujana on muuttuja 2 eli sukupuoli I Keskiarvot ja hajonnat muuttujista 3-26 niin, että luokittelevana muuttujana on muuttuja 2 eli sukupuoli Group Statistics Luk1 Kirj1 Kielt1 Khuol1 Kirjall1 Ilmharj1 äyt1 Viest1 Sanaluokat1 Luk2 Kirj2

Lisätiedot

1. (a) Seuraava algoritmi tutkii, onko jokin luku taulukossa monta kertaa:

1. (a) Seuraava algoritmi tutkii, onko jokin luku taulukossa monta kertaa: Tietorakenteet, laskuharjoitus 10, ratkaisuja 1. (a) Seuraava algoritmi tutkii, onko jokin luku taulukossa monta kertaa: SamaLuku(T ) 2 for i = 1 to T.length 1 3 if T [i] == T [i + 1] 4 return True 5 return

Lisätiedot

Tarkista vielä ennen analysoinnin aloittamista seuraavat seikat:

Tarkista vielä ennen analysoinnin aloittamista seuraavat seikat: Yleistä Tilastoapu on Excelin sisällä toimiva apuohjelma, jonka avulla voit analysoida tilastoaineistoja. Tilastoapu toimii Excelin Windows-versioissa Excel 2007, Excel 2010 ja Excel 2013. Kun avaat Tilastoavun,

Lisätiedot

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit.

r = 0.221 n = 121 Tilastollista testausta varten määritetään aluksi hypoteesit. A. r = 0. n = Tilastollista testausta varten määritetään aluksi hypoteesit. H 0 : Korrelaatiokerroin on nolla. H : Korrelaatiokerroin on nollasta poikkeava. Tarkastetaan oletukset: - Kirjoittavat väittävät

Lisätiedot