CLT255: Tulosten esittäminen ja niiden arviointi tilastomenetelmillä

Samankaltaiset tiedostot
Luento 7 Taulukkolaskennan edistyneempiä piirteitä Aulikki Hyrskykari

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Matriisit ovat matlabin perustietotyyppejä. Yksinkertaisimmillaan voimme esitellä ja tallentaa 1x1 vektorin seuraavasti: >> a = 9.81 a = 9.

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

TEEMA 2 TAULUKKODATAN KÄSITTELY JA TIEDON VISUALISOINTI LUENTO 3

Harjoitus 1: Matlab. Harjoitus 1: Matlab. Mat Sovelletun matematiikan tietokonetyöt 1. Syksy 2006

9 Matriisit. 9.1 Matriisien laskutoimituksia

5 Osa 5: Ohjelmointikielen perusteita

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Lineaarialgebra ja matriisilaskenta I

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

H6: Tehtävänanto. Taulukkolaskennan perusharjoitus. Harjoituksen tavoitteet

Yleinen lineaarinen malli eli usean selittäjän lineaarinen regressiomalli

Matriisit, L20. Laskutoimitukset. Matriisikaavoja. Aiheet. Määritelmiä ja merkintöjä. Laskutoimitukset. Matriisikaavoja. Matriisin transpoosi

Matriisien tulo. Matriisit ja lineaarinen yhtälöryhmä

Matlabperusteita, osa 1. Heikki Apiola Matlab-perusteita, osa 1. Heikki Apiola. 12. maaliskuuta 2012

Kalenterimerkintöjen siirtäminen Notesista

HARJOITUSKERTA 1: SPSS-OHJELMAN PERUSKÄYTTÖ JA MUUTTUJAMUUNNOKSET

LUENTO 4 TAULUKKOLASKENTA

Matriiseista. Emmi Koljonen

Matriisipotenssi. Koska matriisikertolasku on liitännäinen (sulkuja ei tarvita; ks. lause 2), voidaan asettaa seuraava määritelmä: ja A 0 = I n.

2.8. Kannanvaihto R n :ssä

I. Ristiintaulukointi Excelillä / Microsoft Office 2010

LUENTO 8 TAULUKKOLASKENTA II

YHTEYDEN OTTAMINEN CSC:N KONEELLE HIPPU

DOORSin Spreadsheet export/import

CLT131: Tekstityökalut 2011, seitsemäs luento

BM20A0700, Matematiikka KoTiB2

T STATIIKKA 2 (3 OP.) OAMK

Matlab- ja Maple- ohjelmointi

Ville Turunen: Mat Matematiikan peruskurssi P1 1. välikokeen alueen teoriatiivistelmä 2007

Esko Turunen Luku 3. Ryhmät

Matriisilaskenta Laskuharjoitus 1 - Ratkaisut / vko 37

Numeeriset menetelmät

Matematiikka B2 - Avoin yliopisto

1 Johdanto 2. 2 Työkansion asettaminen 3. 3 Aineistojen lukeminen DAT-tiedosto SPSS-tiedosto Excel... 3

1 Kannat ja kannanvaihto

Ortogonaalinen ja ortonormaali kanta

Matriisit, L20. Laskutoimitukset. Matriisikaavoja. Aiheet. Määritelmiä ja merkintöjä. Laskutoimitukset. Matriisikaavoja. Matriisin transpoosi

Johdatus L A TEXiin. 7. Taulukot ja kuvat. Dept. of Mathematical Sciences

805306A Johdatus monimuuttujamenetelmiin, 5 op

Johdatus L A TEXiin. 8. Taulukot ja kuvat. Matemaattisten tieteiden laitos

Matriisit, kertausta. Laskutoimitukset. Matriisikaavoja. Aiheet. Määritelmiä ja merkintöjä. Laskutoimitukset. Matriisikaavoja. Matriisin transpoosi

Valitse ruudun yläosassa oleva painike Download Scilab.

Johdatus L A TEXiin. 7. Taulukot ja kuvat. Dept. of Mathematical Sciences

Matriisilaskenta. Harjoitusten 3 ratkaisut (Kevät 2019) 1. Olkoot AB = ja 2. Osoitetaan, että matriisi B on matriisin A käänteismatriisi.

Matemaattiset ohjelmistot A. Osa 2: MATLAB

SPSS-perusteet. Sisältö

Tilastojen visualisointi Excelillä. PiKe-kehittämiskirjasto Leena Parviainen

Toteumatietojen tiedostolataus sisäiseen laskentaan Käsikirja

Tässä dokumentissa on ensimmäisten harjoitusten malliratkaisut MATLABskripteinä. Voit kokeilla itse niiden ajamista ja toimintaa MATLABissa.

Kun valitset Raportit, Lisää uusi, voit ryhtyä rakentamaan uutta raporttia alusta alkaen itse.

MS-A0207 Differentiaali- ja integraalilaskenta 2 (Chem) Yhteenveto, osa I

MS-A0003/A0005 Matriisilaskenta Laskuharjoitus 1 / vko 44

1.1. Määritelmiä ja nimityksiä

Lataa Terveystiedosta tositoimiin - Seija Sihvola. Lataa

GDAL ja WFS: suora muunnos ogr2ogr-ohjelmalla

DOORS Word DOORS SoftQA Pekka Mäkinen

Lataa Reittejä luontosuhteeseen. Lataa

Lineaarialgebra ja matriisilaskenta II Syksy 2009 Laskuharjoitus 1 ( ) Ratkaisuehdotuksia Vesa Ala-Mattila

Kuva 7.2 vastaustaulu harjoitukseen 7.2

Talousmatematiikan perusteet: Luento 9. Matriisien peruskäsitteet Yksinkertaiset laskutoimitukset Transponointi Matriisitulo

Asiakkaan lisätietokentät

PIKAOHJE USEIDEN VASTAANOTTAJIEN LISÄÄMISEEN YHTIÖN JAKELULISTOILLE

Asialista. CLT131: Tekstityökalut 2011, kahdeksas luento. Merkistöistä ja kalvostoista. Asialista. Tommi A Pirinen

Lineaarialgebra II, MATH.1240 Matti laaksonen, Lassi Lilleberg

LUENTO 5 TAULUKKOLASKENTA

Tilastolliset toiminnot

Determinantti 1 / 30

Insinöörimatematiikka D

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

Yhteenlaskun ja skalaarilla kertomisen ominaisuuksia

Pankkitositteen tietojen kohdentaminen

Lataa Sähkömagneettiset kentät. Lataa

Lineaarialgebra a, kevät 2019 Harjoitus 6 (ratkaisuja Maple-dokumenttina) > restart; with(linalg): # toteuta ihan aluksi!

1. Tietokoneharjoitukset

Heikki Apiola, Juha Kuortti, Miika Oksman. 5. lokakuuta Matlabperusteita, osa 1

Muuttujien määrittely

1 Matriisit ja lineaariset yhtälöryhmät

Insinöörimatematiikka D

CLT131: Tekstityökalut 2011, kahdeksas luento

Lataa Kaikki mitä haluat tietää kauneustoimenpiteistä - Anna Bäsen. Lataa

Lataa Lääkäriksi. Lataa. Lataa kirja ilmaiseksi suomalainen Lääkäriksi Lataa Luettu Kuunnella E-kirja Suomi epub, Pdf, ibook, Kindle, Txt, Doc, Mobi

Lataa Suomen mielenterveyden kenttä. Lataa

Lataa Hoivasanat. Lataa. Lataa kirja ilmaiseksi suomalainen Hoivasanat Lataa Luettu Kuunnella E-kirja Suomi epub, Pdf, ibook, Kindle, Txt, Doc, Mobi

3 PAIKKATIETOHARJOITUSTA

Matematiikan tukikurssi

Insinöörimatematiikka D

Johdatus tekoälyn taustalla olevaan matematiikkaan

Tilastomenetelmien lopputyö

Lataa Numeerisen kartoituksen maastomittausohjeet. Lataa

Tehtävään voi perinteisen arviointitavan tilalle ottaa käyttöön monipuolisemman matriisiarvioinnin tai arviointioppaan.

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Talousmatematiikan perusteet: Luento 11. Lineaarikuvaus Matriisin aste Käänteismatriisi

Lataa Onnellisuuden jooga - Kassila Taavi. Lataa

Johdatus L A TEXiin. 8. Taulukot ja kuvat. Matemaattisten tieteiden laitos

Lataa. Ajatusleikki on loistava. Millaisia kuluttajia me olemme vuonna 2023? Cilla Bhose, Kauppalehti

Asiakashallinta. TaikaTapahtumat -käyttöohje

Lataa Miksi hengästyn? - Anssi Sovijärvi. Lataa

Transkriptio:

CLT255: Tulosten esittäminen ja niiden arviointi tilastomenetelmillä Anssi Yli-Jyrä Syksy 2012

2. opetuskerta, 14.9.2012, luento ja harjoitukset Tämän opetuskerran ja siihen liittyvien harjoitusten jälkeen: ymmärrät R:n keskeisiä käsitteitä osaat luoda ja käsitellä havaintomatriiseja osaat alustavasti tulostaa ja visualisoida havaintomatriiseja

R Laskimena R osaa tavalliset laskukoneen toiminnot ja enemmänkin: 2 * 3 6 / 3 3 %% 2 (quotient) 2 ^ 3 (power; also 2 ** 3) 9 ^ 0.5 (square root) log(14) (also log(14,exp(1))) exp(2.639) sqrt(36) x <- 3 ^ 3 (assignment)

Vektorit ja niiden indeksointi 20:10 10:20 c(20,22) x <- 10:20 x <- c(1,2,3,5,7,11,13,17,19,23,29) x <- c(c(1,2,3,5,7,11),c(13,17,19,23,29)) x x[1] c(x[2],x[3]) c(x[2:4]) c(x[2:4])[2] head(x) tail(x) (same as x[2:4]) # 5 ensimmäistä elementtiä # 5 viimeistä elementtiä

Unaariset vektorien laskutoimitukset > x [1] 1 2 3 5 7 11 13 17 19 23 29 30 > rev(x) [1] 30 29 23 19 17 13 11 7 5 3 2 1 > sort(rev(x)) [1] 1 2 3 5 7 11 13 17 19 23 29 30 > trunc(3/x + 1) [1] 4 2 2 1 1 1 1 1 1 1 1 1

Vektorien keskiset laskutoimitukset > a <- c(100,200,300) > b <- c(1,2,3,4,5,6,7,8,9) > c <- c(100,200,-1) > a+b [1] 101 202 303 104 205 306 107 208 309 > pmin(b,c) [1] 1 2-1 4 5-1 7 8-1

Tunnuslukujen kysely > x <- c(1,2,3,5,7,11,13,17,19,23,29) > length(x) (vektoin pituus) > x[1] (ensimmäinen alkio) > x[length(x)] (viimeinen alkio) > min(x) (minimialkio) > max(x) (maksimialkio) > mean(x) (keskiarvo)

Mediaani > median(c(100,0,40,-100,50)) 40 > median(c(-100,0,40,50,100)) 40 > median(c(0,40,50)) 40 > median(c(40)) 40 > median(c(-100,0,40,50)) 20 > median(c(0,40)) 20 > mean(c(0,40)) 20

Kvantiilit > x <- c(1,2,3,5,7,11,13,17,19,23,29,30) > (i <- 1 + 0.5*(length(x)-1)) # mediaanin indeksi 6.5 > x[i] + (i-trunc(i)) * (x[i+.5]-x[i]) # mediaani 12 > median(x) 12 > (i <- 1 + 0.25*(length(x)-1)) # 1. kvantiilin indeksi 3.75 > x[i] + (i-trunc(i)) * (x[i+.5]-x[i]) # 1. kvantiili 4.5 > quantile(x) 0% 25% 50% 75% 100% 1.0 4.5 12.0 20.0 30.0 > summary(x) Min. 1st Qu. Median Mean 3rd Qu. Max. 1.00 4.50 12.00 13.33 20.00 30.00

Havaintomatriisi (data frame) Definition R:n havaintomatriisi muodostuu riveistä ja sarakkeista. Jokainen rivi ja sarake on itsessään vektori. Jokaisen rivin ensimmäinen elementti on rivin nimi. Jokaisen sarakkeen ensimmäinen elementti on sarakkeen nimi. Havaintomatriisi voidaan nähdä myös vektorina, joka muodostuu sarakkeista, kuten age ja height. Example > age=18:22 > height=c(76.1, 77, 78.1, 78.2, 78.8)) > village=data.frame(age=age,height=height)

Havaintomatriisin muoto > x <- matrix(1:10,ncol=5) > x # huomaa: [rivi,sarake] [,1] [,2] [,3] [,4] [,5] [1,] 1 3 5 7 9 [2,] 2 4 6 8 10 > t(x) # matriisin transpoosi [,1] [,2] [1,] 1 2 [2,] 3 4 [3,] 5 6 [4,] 7 8 [5,] 9 10

Havaintomatriisin indeksointi > village age height 1 18 76.1 2 19 77.0 3 20 78.1 4 21 78.2 5 22 78.8 > village[1] # tai village[,1] age 1 18 2 19 3 20 4 21 5 22 > village[1,] age height 1 18 76.1 > village[2,1] # [y,x], ei (x,y) kuten normaalisti [1] 19

Havaintomatriisin visualisointi ts(x) 0 5 10 15 20 25 30 Kuvateksti R: plot(ts(x)) title(main = Kuvateksti ) dev.print(pdf, file= p.pdf ) pdflatex: \usepackage{graphicx} \includegraphics{p.pdf} \scalebox{0.3}{\inc...} \raisebox{-1in}{\scal...} 2 4 6 8 10 12 Time Mahdollisia formaatteja: pdf, jpeg, pnf, tiff, bmp.

Havaintomatriisin lukeminen tiedostosta Tallenna tiedostoon esim-data.txt havaintomatriisi: Price Floor Area Rooms Age Cent.heat 01 52.00 111.0 830 5 6.2 no 02 54.75 128.0 710 5 7.5 no 03 57.50 101.0 1000 5 4.2 no 04 57.50 131.0 690 6 8.8 no 05 59.75 93.0 900 5 1.9 yes > HousePrice <- read.table("esim-data.txt") > HousePrice

Havaintomatriisin kirjoittaminen tiedostoon > write.table(houseprice) Price Floor Area Rooms Age Cent.heat 01 52 111 830 5 6.2 no... > write.csv(houseprice) # comma separated values (comma =,) ", Price, Floor, Area, Rooms, Age, Cent.heat 01,52,111,830,5,6.2, no... > write.csv2(houseprice) # comma separated values (comma = ;) "; Price ; Floor ; Area ; Rooms ; Age ; Cent.heat 01 ;52;111;830;5;6,2; no...

Havaintomatriisin tuonti Excelistä Tallenna Excelissä muodossa Tab delimited text (.txt) > e <- read.table( table.txt, header=true) > e <- read.table( /unixdir/table.txt, header=true) > e <- read.table( c:\\dosdir\table.txt, header=true) Tallenna Excelissä muodossa Comma separated values (.csv) > e <- read.csv("table.csv", header=true) > summary(e) Tarkista aina että tulos luettiin oikein: > summary(e[1]) # numeerinen kenttä Price Min. :52.00 # numeerisen arvon tunnusluvut 1st Qu.:54.75 Median :57.50 Mean :56.30 3rd Qu.:57.50 Max. :59.75

Valmiita havaintomatriiseja ja aineistoja https://kitwiki.csc.fi/twiki/pub/kitwiki/ HyClt255s2010L02/esim-data.txt Price Floor Area Rooms Age Cent.heat 01 52.00 111.0 830 5 6.2 no 02 54.75 128.0 710 5 7.5 no 03 57.50 101.0 1000 5 4.2 no 04 57.50 131.0 690 6 8.8 no 05 59.75 93.0 900 5 1.9 yes https://kitwiki.csc.fi/twiki/pub/kitwiki/ HyClt255s2011L03/hkv.txt HKV:n tekstitiedosto 00101010 Lev Semjonovits Vygotskin monisäikeinen tutkimustyö 00102010 Tietoisuutta koskevan tutkimuksen merkit...... https://kitwiki.csc.fi/twiki/pub/kitwiki/ HyClt255s2011L03/hkv-num.txt HKV-korpuksen lausekohtaiset luokitustiedot havaintomatriisina 001 01 01 1 0 1 0 1 1 0 1 1 0 1 1... 001 02 01 2 0 1 2 1 1 0 1 1 0 1 1......

2. kerran harjoitustehtävä 1 Keksi kaksi esimerkkiä yhdessä korpuksessa esiintyvästä ilmiöistä, joka saa korpuksen sisällä erilaisia arvoja. Käytä lähteenä: https: //kitwiki.csc.fi/twiki/bin/view/kitwiki/hyclt255s2011l01

2. kerran harjoitustehtävä 2 Määrittele, minkälaisen OMAn (pienehkön) havaintomatriisin haluat Määrittele, minkälaisia muuttujia tämän matriisin sarakkeet ovat Tuota ainakin muutama rivi tällaista havaintomatriisia Lue havaintomatriisi R:ään Tarkista havaintomatriisin oikeellisuus Jos ei onnistunut, opiskele ja korjaa mikä meni pieleen Kuvaile portfoliossasi, mitä halusit tehdä ja miten tämän teit. Käytä lähteenä: https: //kitwiki.csc.fi/twiki/bin/view/kitwiki/hyclt255s2010l02

2. kerran harjoitustehtävä 3 Kirjoita KitWikiin portfolioon hyväksi kokemasi neuvo (1-3 kappaletta) yhdestä seuraavista aiheista: Kuinka vien havaintomatriisini R:ään Millaisia havaintomuuttujien arvoja ja esitysmuotoja on olemassa Kuinka määrittelen havaintomuuttujien tyypin Miksi havaintomatriisin vienti R:ään on vaikeaa Kuinka muutan havaintomatriisin tietoja Miten konvertoin havaintomatriisien ja vektorien välillä Mitä tietoa saan summary()-komennon tuloksista oma aihe