R-KIELEN PERUSTEET JARNO TUIMALA Helsinki 2010

Koko: px
Aloita esitys sivulta:

Download "R-KIELEN PERUSTEET JARNO TUIMALA Helsinki 2010"

Transkriptio

1 R-KIELEN PERUSTEET

2

3 R-KIELEN PERUSTEET JARNO TUIMALA Helsinki 2010

4 2010 Jarno Tuimala ISBN (nid.) ISBN (PDF) Books on Demand GmbH Norderstedt, Saksa painos

5 Sisällysluettelo Esipuhe i Aineiston ja R-asennuksen valmistelu Aineiston valmistelu R:n asentaminen Aineiston lataaminen Aineiston tarkistaminen Aineiston mainipulointi Osa-aineiston poimiminen Aineiston lajittelu Puuttuvien arvojen käsittely Uusien muuttujien luominen Päivämäärien käsittely Aineiston tunnusluvut Aineiston taulukointi Tilastollinen grafiikka Histogrammi Laatikkokuvio Pylväskaavio Hajontakuvio Viivakaavio Tilastollinen testaus Korrelaatiotesti Homogeenisuus- ja riippuvuustestit Varianssitesti Keskiarvotestit Tapausesimerkki rairuoho 97 Hakemisto 103

6

7 ESIPUHE Esipuhe Tämä kirja lähestyy R-kielen käyttöä tilastollisiin analyyseihin aloittelevan käyttäjän näkökulmasta. R on ilmainen, avoimen lähdekoodin tilasto-ohjelmisto ja ohjelmointiympäristö. Kirjassa ei niinkään käydä läpi käytettyjen menetelmien teoriaa, vaan analyysien tekemistä käytännössä, ja niiden antamien tulosten tulkintaa. Kirjassa käytetään rinnakkain sekä R-kieltä että sen käyttöön kehitettyä graafista käyttöliittymä R Commander:ia. Kirja on koostettu siten, että asiat on helpointa omaksua lukemalla järjestyksessä kirja alusta loppuun. Kirja on tarkoitettu etupäässä aloitteleville käyttäjille. R on maailmalla varsin suosittu ohjelmisto, mutta sen leviämistä esimerkiksi perusopetusta antavien yksiköiden käyttöön on rajoittanut muun muassa suomalaisen kirjallisuuden niukkuus. Toivon, että tämä kirja osaltaan madaltaa kynnystä R:n käyttöön niin opetuksessa kuin ammattikäytössäkin. Kirja esittelee alle 50 komentoa, joilla pääsee kuitenkin jo varsin pitkälle. Esiteltävillä komennoilla voidaan lukea aineisto sisään, muuntaa se analyyseihin sopivaan muotoon, piirtää tilastollista grafiikkaa ja tehdä klassisia tilastollisia testejä. Varsinaista R-ohjelmointia tai edistyneempiä tilastollisia ominaisuuksia ei käsitellä. Niihin tutustutaan kirjan suunnitteilla olevissa jatko-osissa. Kirjassa on paljon R-kielistä koodia, joka on ladottu suhteuttamatonta kirjasintyyppiä käyttäen riveille, jotka alkavat R:n kehotteella eli suurempi kuin (>) merkillä. R:n ruudulle antama tuloste on niinikään ladottu samalla kirjasintyypillä, mutta rivien alussa ei ole suurempi kuin -merkkejä. Esimerkki tällaisesta muotoilusta on esitetty alla. >mean(1:9) [1] 5 Helsingissä Jarno Tuimala i

8

9 R- K I E L E N PERUSTEE T Aineiston valmistelu Tässä luvussa aineisto valmistellaan sellaiseen muotoon, että se voidaan helposti lukea R:ään. Luvussa oletetaan, että aineisto voidaan esittää jonkinlaisessa taulukkomuodossa. Muotoilemattomasta tekstistä koostuvien aineistojen valmistelua tai analysointia ei tässä kirjassa käsitellä. Aineiston perustaminen Taulukkomuotoinen aineisto lienee helpointa perustaa jossakin taulukkolaskentaohjelmistossa. Seuraavassa käytetään esimerkkinä OpenOffice.org:n Calc-ohjelmistoa, joka on ilmainen avoimen lähdekoodin taulukkolaskentaohjelmisto. Saman asian voi tehdä myös esimerkiksi Microsoft:in Excel-ohjelmistolla. Aineiston tallentamista kannattaa pohtia hyvissä ajoin ennen aineiston keräämistä. Samassa yhteydessä voidaan jo luoda taulukkolaskentaohjelmaan pohja, johon mittaustulokset kirjataan. Pääperiaatteena on, että kutakin mitattavaa tai havainnoitavaa muuttujaa kohden aineistoon luodaan yksi sarake. Aineisto kannattaa tallennettaessa mieluummin palastella liian pieniin osiin, siis liiankin moniksi muuttujiksi tai sarakkeiksi, sillä muuttujien yhdistäminen on myöhemmin helppoa, mutta niiden pilkkominen useammiksi uusiksi muuttujiksi ei välttämättä onnistukaan. Aineiston tallentaminen on helpointa aloittaa kirjaamalla vastemuuttujan tiedot yhteen sarakkeeseen. Jos vastemuuttujia on useita, kirjataan kukin niistä omaan sarakkeeseensa. Vastemuuttujan ollessa numeerinen, jatkuva muuttuja, kirjataan tulokset numeroina. Jos vastemuuttuja on selvästi laatuasteikollinen eli se saa eri arvoja, mutta niillä ei ole selkeää järjestystä, on parasta kirjata vastemuuttuja luokkien nimiä käyttäen. Järjestysasteikollinen muuttuja on mahdollista kirjata numeroin tai luokkien nimiä käyttäen. Esimerkiksi henkilön pituus sentin tarkkuudella mitattuna voidaan kirjata jatkuvana muuttujana. Laatuasteikollinen muuttuja, kuten sukupuoli kannattaa kirjata tekstinä käyttäen esimerkiksi termejä mies ja nainen. Usein sukupuolen tosin näkee kirjattavan numeroilla, jolloin 1

10 AI NE IS TO N VALM ISTELU jokseenkin vakiintuneena käytäntönä on merkitä miestä ykkösellä ja naista kakkosella. Järjestysasteikollinen muuttuja, kuten lapsen kehitysvaihe, kannattanee kirjata tekstinä, esimerkiksi käyttäen termejä vauva, taapero, leikkiikäinen, koululainen, teini-ikäinen. Jos kyseessä on kyselytutkimus, vaikkapa viisiportaisella Likert-asteikolla saatu mittaustulos, lienee parempi kirjata tieto numeerisena. Jos noudattaa muuttujien arvojen kirjaamisessa sen mitta-asteikon ominaisuuksia, välttyy tyypillisesti esimerkiksi kiusaukselta laskea sukupuolesta keskiarvo, mikä onnistuu jos sukupuoli on kirjattu numeerisesti. Aineiston analysointia ajatellen tämä on yleensä ainoastaan positiivista. Kun vastemuuttujan tai -muuttujien arvot on kirjattu, siirrytään täyttämään muiden aineistosta mitattujen, tyypillisesti selittävien, muuttujien arvot muihin sarakkeisiin. Niiden arvot kannattaa kirjata samaan tapaan kuin vastemuuttujankin arvot, muuttujan mitta-asteikon tyyppi huomioiden. Entäpä jos esimerkiksi samasta henkilöstä on tehty useampia mittauksia eri päivinä? Tällöinkin pätee jo edellä mainittu sääntö: kaikki vastemuuttujan arvot kirjataan samaan sarakkeeseen. Jos mittauksia on esimerkiksi kahdelta eri päivältä, kirjataan vastemuuttujaan ylimmäksi ensimmäisen päivän mittaukset ja sen jälkeen toisen päivän mittaukset. Tämän jälkeen aineistoon pitää lisätä ainakin yksi uusi muuttuja, joka kertoo minä päivänä mittaukset on tehty. Perinteinen tapa kirjata kunkin henkilön mittaustulokset aina yhdelle riville, ja eri päivien mittaustulokset kukin omaksi sarakkeekseen, on usein hieman hankala. Aineiston muotoa on toki helppo tietoteknisesti muunnella, mutta kirjaamalla kunkin muuttujan tietoja vain yhteen sarakkeeseen välttyy usein monimutkaisilta aineiston muokkailuilta myöhemmin. Esimerkki aineiston kirjaamisesta Esimerkkiä varten kerättiin pieni aineisto R-kurssille osallistuneista henkilöistä. Kustakin osallistujasta mitattiin pituus ja kengännumero. Lisäksi kukin osallistuja sai ilmoittaa sukupuolensa ja kaupungin, jossa osallistui kurssille. Kukin osallistuja mitattiin kahdesti, peräkkäisinä päivinä. Tällaiset mittaukset on suoraviivaista kirjata aineistoksi. Kustakin henkilöstä on mitattu neljä eri muuttujaa (pituus, kengännumero, sukupuoli ja kaupunki), jotka kukin kirjataan omaan sarakkeeseensa. Lisäksi 2

11 R- K I E L E N PERUSTEE T kustakin henkilöstä on kaksi eri mittauskertaa, joten tarvitaan myös sarake, joka kertoo, milloin mittaus on tehty. Taulukkolaskennassa luotu tyhjä aineistopohja näyttää seuraavalta: Ensisijainen aineisto on koottu työkirjaan, joka näyttää seuraavalta: Siirretään mittaustulokset muuttuja kerrallaan taulukkolaskentaohjelman kenttiin. Lopullinen aineisto näyttää seuraavalta: 3

12 AI NE IS TO N VALM ISTELU Pituus ja kengännumero on kirjattu jatkuvina muuttujina numeroita käyttäen, sukupuoli ja kaupunki tekstimuodossa, koska ne ovat luokittelevia muuttujia. Päiväys on kirjattu Open Office Writer:in oletusarvoisessa päivämäärän esitysmuodossa. Jos aineistossa olisi ollut puuttuvia havaintoja, siis sellaisia, joita ei mitattu lainkaan, jätettäisiin niitä vastaavat taulukon solut tyhjiksi. Aineiston kirjaaminen on nyt viimeistä silausta vaille valmis. Sarakkeiden otsikoista kannattaa jättää ääkköset ja muut erikoismerkit pois, ja mahdollisuuksien mukaan käyttää otsikkona vain yhtä sanaa. Muutetaan siis kengännumero muotoon kengannumero ja päiväys muotoon paivays. Aineiston tallentaminen Kun aineisto on luotu, se pitää tallentaa sopivassa muodossa tiedostoksi. Tällainen sopiva muoto on esimerkiksi sarkaineroteltu teksti. Sarkainerotellussa tekstissä kutakin saraketta erottaa sitä edeltävästä ja seuraavasta sarakkeesta sarkain eli tabulaattori. Open Officella tässä muodossa tallentaminen tapahtuu valitsemalla valikosta File toiminto Save As... Tämän jälkeen avautuu uusi ikkuna, jonka kentässä Tiedostonimi annetaan tiedostolle nimi. Sen alapuolella olevasta pudotusvalikosta valitaan tiedostomuodoksi Text CSV (.csv). Lisäksi merkitään laatikko Edit Filter Settings: 4

13 R- K I E L E N PERUSTEE T Kun valinnat on vahvistettu valinnalla Tallenna, Open Office varoittaa: mutta kysymykseen tulee vastata Keep Current Format. Tämän jälkeen aukeaa jälleen uusi ikkuna, jossa tallennettavan tiedoston asetuksia voidaan muuttaa: Laatikossa on muutettava kentän Field delimiter arvoksi {Tab}, kuten ylläolevassa kuvassa. Tämän jälkeen tiedosto tallennetaan vahvistamalla asetukset OK-painikkeella. Microsoft Excel -ohjelmassa tiedosto tallennetaan valitsemalla tiedostomuodoksi sarkaineroteltu teksti (tab-delimited text). Jos tiedoston avaa jossakin tekstieditorissa, esimerkiksi Windows:n Notepadissa, se näyttää seuraavalta: 5

14 AI NE IS TO N VALM ISTELU Vaikuttaa siltä kuin tallennus olisi sotkenut tiedoston sarakkeet, mutta näin todellakin vain vaikuttaa olevan. Koska taulukon soluihin kirjoitetut tiedot ovat hieman eri mittaisia kuin sarakkeiden otsikot, eivät mittaustulokset enää ryhmitykään kauniisti niitä vastaavan sarakkeen otsikon alle. Kaikki on kuitenkin kunnossa, sillä eri sarakkeiden arvoja erottelee aina sarkain, minkä perusteella R osaa lukea tiedoston oikein. Huomioitavaa aineiston kirjaamisesta ja tallentamisesta Aineiston analysointi ja lukeminen R:ään onnistuu helpoimmin, jos aineiston valmistelussa noudatetaan muutamia yksinkertaisia periaatteita. 1. Kukin muuttuja kirjataan omaksi sarakkeekseen, ja kuhunkin sarakkeeseen kirjataan vain yhden muuttujan tietoja. Aineiston saattaminen tällaiseen muotoon voi vaatia esivalmisteluina hieman ylimääräistä pohdintaa siitä, mitä muuttujia ja missä muodossa ne tallennetaan. 2. Kukin muuttuja kirjataan sen mittausasteikon määräämällä tavalla. Jatkuvat muuttujat kirjataan numeroilla, ja luokittelumuuttujat mieluiten luokkien nimiä käyttäen. 3. Kullakin muuttujalla, siis sarakkeella, tulee olla otsikko. Tiedostossa saa olla vain yksi otsikkorivi. Otsikot eivät saa alkaa numerolla, eikä niissä ei saa olla erikoismerkkejä, kuten skandeja (ääkkösiä). Lisäksi välilyöntejä on parasta välttää otsikoiden nimissä. 4. Desimaalierotin, jota luvuissa käytetään, määräytyy usein tietokoneen maa-asetusten mukaan. Aineistossa voidaan käyttää kumpaa tahansa erotinta, pistettä tai pilkkua, kunhan sitä käytetään aina samalla tavalla. 6

15 R- K I E L E N PERUSTEE T R:n asentaminen Tässä luvussa saatetaan R käyttökuntoon, jotta sillä voidaan tehdä kirjassa esitetyt analyysit. R:n asentaminen ei vaadi järjestelmän ylläpitäjän oikeuksia, mutta joidenkin erikoisempien laajennusten tai laajennuspakettien asentamiseen ylläpitäjän oikeuksia voidaan tarvita. Tällaisia laajennuksia ei kuitenkaan tässä kirjassa käsitellä. Asennusohjelman hankkiminen R:n asennusohjelma ladataan Comprehensive R Archiving Network:n (CRAN) palvelimelta. CRAN:iin pääsee R:n kotisivuilta osoitteesta R:n kotisivujen vasemmasta laidasta löytyy CRAN-linkki, joka on alla olevassa kuvassa ympyröity punaisella: 7

16 ASE NTAMINE N CRAN-linkin takaa löytyy pitkä lista palvelimia, joilta R:n voi noutaa. Itävallan palvelin päivittyy aina ensimmäisenä, ja sieltä mahdolliset päivitykset siirtyvät myös muille palvelimille, mutta pienellä viiveellä. Suomea lähin palvelin on Ruotsissa. Seuraavassa on valittu käyttöön oheisessa kuvassa punaisella korotettu itävältalainen palvelin: Palvelimen valinnan jälkeen päästään sivulle, jossa pitää valita käyttöjärjestelmä, johon R asennetaan. Kullekin käyttöjärjestelmälle on oma asennusohjelmansa, eikä esimerkiksi Windows-järjestelmään voi asentaa Mac OS X:ään tarkoitettua R:ää. Useimmat tämän kirjan lukijat käyttänevät Windows-järjestelmää pyörittävää tietokonetta, joten seuraavassa ladataan Windows:iin sopiva asennusohjelma. Sivulla on myös mainittu uusimman R-asennusohjelman versio, joka tätä kirjoitettaessa on R:stä ilmestyy nykyisin uusi versio noin puolen vuoden välein. Edellinen versio oli ja nykyisestä seuraava on todennäköisesti Näiden puolivuosittaisten suurempien julkaisuiden välillä voi tulla myös pienempiä virhepäivityksiä. Edellinen tällainen päivitys oli versioon , jolloin versionumeroksi muutettiin Jatketaan asennusta lataamalla alla olevassa kuvassa korostetusta linkistä asennusohjelma Windows-järjestelmään: 8

17 R- K I E L E N PERUSTEE T Itse asennusohjelman lataussivu löytyy seuraavan sivun kohdasta base, joka on korostettu alla olevassa kuvassa: 9

18 ASE NTAMINE N R koostuu ydinkehitystiimin tuottamasta base:sta, joka toimii samalla asennusohjelmana. Tämän lisäksi maailmanlaajuinen käyttäjäkunta tuottaa laajennuspaketteja, jotka lisäävät R:ään uutta toiminnallisuutta. Nämä löytyvät palvelimelta kohdasta contrib. Lataussivun yläreunassa on linkki, josta asennusohjelman voi ladata. Linkki on korotettu alla olevassa kuvassa: Oletusarvoisesti ladataan 32-bittinen asennusohjelma, joka soveltuu useimmille käyttäjille. Asennusohjelman 64-bittisen version voi ladata erilliseltä sivulta, jolle löytyy linkki lataussivun alaosasta. Versioiden erona on lähinnä, että 32-bittinen versio voi Windows-järjestelmässä käyttää korkeintaan noin 3 GB:iä muistia, mutta 64-bittisessä versiossa tällaista rajoitusta ei ole. Asennusohjelman ajaminen Kun asennusohjelma on ladattu ja tallennettu edeltävien ohjeiden mukaan, vaikkapa työpöydälle, se ajetaan kuten mikä tahansa Windows-ohjelma eli kaksois-näpäyttämällä sitä hiirellä. Asentamiseen ei tarvita järjestelmänvalvojan tunnuksia, jos noudatetaan seuraavia asennusohjeita. 10

19 R- K I E L E N PERUSTEE T Itse asennus on suoraviivainen, mutta asennuksen aikana kannattaa valita asennettavaksi käsikirjat (Manuals). Lisäksi Tcl/Tk -tiedostot pitää asentaa. Tehtävät valinnat on esitetty alla olevassa kuvassa: Jos asennus tehdään ilman järjestelmänvalvojan tunnuksia, pitää asennuksen aikana valita, ettei versionumeroa tallenneta Windows:in rekisteriin: 11

20 ASE NTAMINE N Asennuksen valmistuttua työpöydälle ilmestyy R:n käynnistysikoni, josta ohjelma voidaan ajaa. Laajennuspakettien asentaminen Seuraavassa asennetaan graafinen käyttöliittymä R Commander ja sen vaatimat muut laajennuspaketit. Kirjan analyysiominaisuuksia esittelevissä luvuissa käytetään rinnakkain sekä R Commander:ia että komentoriviä. Laajennuspakettien asentamiseksi R pitää ensin käynnistää. Avautuessaan R näyttää seuraavalta: Laajennuspakettien asentamiseksi valitaan ensin yläreunan valikkorivin valikoista Packages. Sen alta löytyvällä toiminnolla Install Package(s)... asennetaan laajennuspaketteja. Aluksi pitää valita miltä CRAN-palvelimelta laajennuspaketit ladataan. Seuraavassa on käytetty Itävällan palvelinta. Palvelimen valinnan jälkeen avautuu uusi ikkuna, jossa on pitkä lista saatavilla olevia laajennuspaketteja. Pakettien joukosta valitaan Rcmdr. CRAN-palvelimen (CRAN mirror) ja laajennuspaketin (Packages) valinta on esitetty alla olevassa kuvassa. 12

21 R- K I E L E N PERUSTEE T Tämän jälkeen R ottaa automaattisesti Internetin välityksellä yhteyden CRAN-palvelimeen ja lataa valitut laajennuspaketit sekä niiden mahdollisesti vaatimat muut laajennuspaketit, jos pakettien välillä on riippuvuuksia. Kun paketit on ladattu, R myös asentaa ne automaattisesti. Lopuksi R tulostaa ruudulle pienen yhteenvedon asennuksen onnistumisesta, joka on esitetty alla. Kullekin laajennuspaketille kerrotaan suora Internet-osoite, josta se ladattiin, sekä ladatun paketin koko. Tämän jälkeen kutakin asennettua pakettia kohden tulee yksi rivi, jolla kerrotaan, että asennus on onnistunut: Package 'car' successfully unpacked. Jos asennus on epäonnistunut, siitäkin ilmoitetaan. Viimeiseksi tulostuu sen hakemiston nimi, johon ladatut laajennuspaketit on väliaikaisesti tallennettu: --- Please select a CRAN mirror for use in this session --also installing the dependency car 13

22 ASE NTAMINE N trying URL 'http://cran.at.r-project.org/bin/windows/contrib/2.11/car_ zip' Content type 'application/zip' length bytes (483 Kb) opened URL downloaded 483 Kb trying URL 'http://cran.at.r-project.org/bin/windows/contrib/2.11/rcmdr_1.5-4.zip' Content type 'application/zip' length bytes (2.2 Mb) opened URL downloaded 2.2 Mb package 'car' successfully unpacked and MD5 sums checked package 'Rcmdr' successfully unpacked and MD5 sums checked The downloaded packages are in C:\Documents and Settings\tuimaja\Local Settings\Temp\RtmpsZHmw5 \downloaded_packages Kun laajennuspaketti on asennettu, sen sisältämät toiminnot eivät ole vielä käytettävissä. Laajennuspaketin toimintojen käyttöön ottamiseksi paketti on ladattava muistiin aina, kun R on käynnistetty uudelleen. Tämä tapahtuu valikon Packages valinnalla Load Package... Avautuva lista sisältää kaikki sillä hetkellä R:ään asennetut paketit. Valitaan paketti Rcmdr ladattavaksi muistiin. Ensimmäisen R Commander:in käynnistyskerran yhteydessä se esittää seuraavan kysymyksen: Kysymykseen pitää vastata myöntävästi, sillä R Commander:in käyttö vaatii mainittujen lisäpakettien asentamisen. Tämä vaihe myös viimeistelee R Commander:in asennuksen käyttökuntoon. Tämän jälkeen avautuvasta ikkunasta pitää valita pakettien latauspaikaksi CRAN: 14

23 R- K I E L E N PERUSTEE T Kun vaaditut laajennuspaketit on asennettu, R Commander aukeaa: Nyt R ja sen graafinen käyttöliittymä R Commander on asennettu, ja ne ovat valmiina käyttöön. Kun suljet R:n ja avaat sen uudelleen, muista ladata R Commander eli paketti Rcmdr uudelleen muistiin! Seuraavassa luvussa käydään läpi aineiston lataaminen R:ään. 15

24

25 R- K I E L E N PERUSTEE T Aineiston lataaminen Tässä luvussa ladataan aineisto R:ään sellaiseen muotoon, että sillä voidaan tehdä analyysejä. Aineiston lataamisessa oletetaan, että aineisto on jonkinlaisessa taulukkomuodossa. Toisin sanoen, oletetaan että kussakin sarakkeessa on yhtä monta havaintoa ja kullakin rivillä havainto kustakin sarakkeesta. Osa taulukon soluista voi luonnollisesti olla tyhjiäkin, jos aineistossa on puuttuvia havaintoja. Jos aineisto on luotu, kuten ensimmäisessä luvussa on kuvattu, sen lukemisessa R:ään ei pitäisi olla mitään ongelmia. Esimerkkinä käytetään juuri ensimmäisessä luvussa luotua tiedostoa opiskelijat.csv. Työhakemiston vaihtaminen Käyttöä helpottaa, jos kaikki yhteen projektiin liittyvät tiedostot, esimerkiksi mittausaineistot, on tallennettu yhteen kansioon. Ennen työskentelyn aloittamista on R:lle osoitettava tämän työhakemiston sijaintipaikka. Tämä tapahtuu valikon File valinnalla Change dir..., joka avaa tiedostoselainikkunan. Ikkunaa käyttäen valitaan kansio, jossa aineisto sijaitsee. Työhakemiston vaihtamisesta on se hyöty, ettei aineistoa komentoriviltä ladattaessa tarvitse määritellä aineiston koko sijaintipolkua, vaan aineiston nimen käyttö riittää. Lisäksi R:stä tallennetut tiedostot sijoittuvat automaattisesti työhakemistoon. Oletusarvoisesti ne nimittäin tallentuvat siihen kansioon, johon R-ohjelma (Rgui.exe) on asennettu. Kansio voi ohjelmiston asennuspaikasta riippuen sijaita missä vain, vaikka tyypillisesti se löytyykin kansion C:\Program Files alta. Aineiston lataaminen R Commander:lla R Commander:in valikosta Data löytyy toimintoja aineiston lataamiseen. Valinnan Import Data takaa löytyy vaihtoehto from text file, clipboard or URL..., jolla ladataan aineistoja, jotka ovat tekstitiedostoissa, kopioitu Windowsin leikepöydälle tai sijaitsevat Internetissä: 17

26 AINEISTON LATAAMINE N Samaisesta valikon kohdasta löytyy myös mahdollisuus ladata toisissa tilasto-ohjelmistoissa, kuten SPSS, Minitab ja STATA, luotuja aineistoja. Lisäksi R Commander tarjoaa mahdollisuuden ladata aineistoa suoraan Microsoft Excel tai Access -ohjelmistoista, mutta tällä hetkellä kumpikaan ei toimi luotettavasti Microsoft Office 2007:llä tai 2010:llä luoduilla tiedostoilla. Kaikkein varmin toimintatapa onkin aina tallentaa aineisto sarkaineroteltuun tekstitiedostoon, sillä R:n lisäksi käytännössä kaikki muutkin ohjelmat osaavat sitä lukea. Tekstitiedostoa ladattaessa aukeaa uusi ikkuna, jossa muutetaan tiedoston muotoon liittyviä asetuksia: 18

27 R- K I E L E N PERUSTEE T Seuraavassa käydään kentät yksitellen läpi, jotta työvaiheet varmasti hahmottuvat. Enter name for data set: Tähän kenttään tulee kirjoittaa nimi, jolla aineistoa halutaan R:ssä kutsua. Nimi ei saa alkaa numeroilla eikä siinä kannata käyttää muita merkkejä kuin numeroita ja kirjaimia väliltä a-z. Esimerkiksi aineistolle sopiva nimi voisi olla opiskelijat, sillä olemme lataamassa opiskelijoista koottua aineistoa, joka luotiin kirjan ensimmäisessä luvussa. Variable names in file: Jos aineiston kullakin sarakkeella on nimi, tulee laatikon olla merkittynä. Jos sarakkeilla ei ole nimiä, poistetaan merkki. Missing data indicator: Jos aineistossa on puuttuvia arvoja eli tyhjäksi jätettyjä soluja, ne korvataan tällä merkinnällä. Oletusarvoisesti R korvaa puuttuvat arvot merkinnällä NA (Not Available), eikä sitä yleensä kannata muuttaa. Location of Data File: Missä aineisto sijaitsee? Vaihtoehtoja ovat tietokoneen kiintolevyllä (Local file system), Windows:in leikepöydällä (Clipboard) tai Internetissä (Internet URL). Esimerkkiaineisto sijaitsee tietokoneen levyllä (jonne se ladattu kirjan Internet-sivuilta). Field Separator: Mikä on sarakkeita erottava merkki? Oletusarvona on mikä tahansa tyhjä väli (white space). Jos erottimena on sarkain eli tabulaattori kuten esimerkkiaineistossa, kannattaa valinnaksi muuttaa Tabs. Toisinaan aineisto on talletettu comma-separated -muodossa, mikä yleensä tarkoittaa pilkulla eroteltuja sarakkeita, mutta jos aineisto on tallennettu tähän muotoon esimerkiksi suomalaisia maa-asetuksia käyttävällä Microsoft Excel -ohjelmalla, tulee valita kenttä Other, ja kirjoittaa Specify-laatikkoon erottimeksi puolipiste (;). Decimal-Point Character: Millä merkillä desimaaliluvun desimaaliosa on erotettu kokonaisluvuista? R käyttää sisäisesti aina erottimena pistettä, mutta Suomessa erottimena on yleensä pilkku, jos tietokoneen maaasetuksista on valittu maaksi Suomi. Tällöin valitaan erottimeksi pilkku. Aineistoa ladattaessa R sitten automaattisesti muuttaa desimaalipilkut pisteiksi, joten desimaalierotinta ei tarvitse erikseen käydä muuttamassa joksikin toiseksi R:n ulkopuolella. Aineiston opiskelijat.csv lataamiseksi tehdyt valinnat on esitetty seuraavassa kuvassa: 19

28 AINEISTON LATAAMINE N Jos aineiston lataaminen onnistuu, R ei erikseen raportoi sitä. Vain jos jotakin menee pieleen, ruudulle tulostuu virheilmoitus. Jos siis R pysyy hiljaa, on kaikki kohdallaan. R Commander -ikkunaan sen sijaan tulostuu R-kielinen komento, jolla aineisto on luettu sisään: >opiskelijat <- read.table("c:/documents and Settings/ tuimaja/desktop/r-data/opiskelijat.csv", header=true, sep="\t", na.strings="na", dec=",", strip.white=true) Aina kun R Commanderilla ajetaan jokin komento, sitä vastaava komento tulostuu R Commander:in ikkunaan. Näin on mahdollista opiskella erilaisten asioiden tekemiseen tarvittavia R-kielisiä komentoja. Seuraavassa kappaleessa tutustutaankin aineiston lataamiseen R-kielen komentoja käyttäen. Aineiston laataminen R-kielellä R-kielisiä komentoja annetaan R:n komentoikkunassa, joka on kuvattu alla. Rivi, jolle komentoja kirjoitetaan, alkaa aina niin sanotulla kehotteella, jona R:ssä toimii suurempi kuin (>) -merkki. 20

29 R- K I E L E N PERUSTEE T Kun työhakemisto on muutettu siihen kansioon, jossa tiedosto opiskelijat.csv sijaitsee, tapahtuu sen lataaminen komennolla read.table(). Edellä on esitetty R Commander:in käyttämä R-kielinen latauskomento, joka on melko monimutkainen, sillä yksinkertaisemmallakin komennolla pärjää. Ensimmäisessä luvussa kuvatulla tavalla taulukkomuotoon syötetyn aineiston lukeminen on yksinkertaista. Seuraavassa ladataan esimerkkiaineisto R:n muistiin nimellä opiskelijat. Aineisto on tallennettu tiedostoon opiskelijat.csv. Jos desimaalierottimena on piste, käytetään komentoa: >opiskelijat<-read.table( opiskelijat.csv, header=true, sep= \t, dec=. ) Jos desimaalierottimena on pilkku, käytetään komentoa: >opiskelijat<-read.table( opiskelijat.csv, header=true, sep= \t, dec=, ) Kummassakin komennossa on ensimmäisenä nimi, jolla aineistoa halutaan jatkossa kutsua R:ssä. Tässä siis aineiston nimeksi on valittu opiskelijat. Nimi voi olla mikä tahansa, joten sitä saa vaihtaa esimerkiksi kuvaamaan ladattavaa aineistoa. Aineiston nimi ei kuitenkaan saa sisältää erikoismerkkejä, kuten skandinaavisia kirjaimia tai alkaa numerolla. Aineiston nimen jälkeen tulee sijoitusoperaattori (<-), joka tarkoittaa sitä, että sen vasemmalla puolella olevaan R:n muistissa sijaitsevaan aineistoon luetaan merkin oikealla puolella luetun tiedoston sisältö. 21

30 AINEISTON LATAAMINE N Sijoitusoperaattorin jälkeen tulee itse aineiston lataamiseen tarkoitettu komento, read.table(). Komentoon liittyvät aina kaarisulut, joiden välissä voi olla argumentteja. Aineiston lataamiseen tarvitaan neljä argumenttia. Ensimmäinen on ladattavan tiedoston nimi, joka on tässä siis opiskelijat.csv, mutta sitä luonnollisesti vaihdetaan sen mukaan, minkä niminen tiedosto halutaan ladata. Tiedoston nimessä on oltava mukana tiedoston tarkennin (.csv), muutoin R ei löydä oikeaa tiedostoa. Argumentti header=true määrää, että luettavassa tiedostossa kullakin sarakkeella on otsikko. Jos sarakkeilla ei ole otsikkoja, käytetään argumenttia header=false. Argumentti sep= \t määrittää, että ladattavan tiedoston sarakkeita erottaa sarkain. Tarvittaessa se voidaan vaihtaa joksikin muuksi. Esimerkiksi puolipisteellä eroteltua aineisto ladattaessa käytetään argumenttia sep= ;. Argumentti dec=, määrittää lukujen desimaalierottimeksi pilkun. Jos erottimena on käytetty anglokaaniseen tyyliin pistettä, muutetaan argumentti muotoon dec=.. Yhteenveto Aineiston lataamiseen edellä esitettyjä komentoja ei yleensä tarvitse muokata muutoin kuin aineiston nimen ja ladattavan tiedoston nimen osalta, jos aineisto on luotu ensimmäisen luvun esimerkkiä seuraten. Toisinaan käytön aloittaminen kilpistyy aineiston lataamiseen, joka voi tuntua aluksi hankalalta. Jos kuitenkin opettelee ensimmäisessä luvussa esitetyn aineiston syöttötavan ja siihen sopivan, tässä luvussa esitetyn aineiston lataamistavan, ei yleensä törmää vaikeuksiin. Mitä seuraavaksi? Kun aineisto on ladattu, on hyvä tarkistaa, tapahtuiko lataus oletetulla tavalla, onko aineisto siinä muodossa missä sen pitäisi olla, ja luoda yleissilmäys aineistoon. Seuraavassa luvussa käsitellään näitä työvaiheita tarkemmin. 22

31 R- K I E L E N PERUSTEE T Aineiston tarkistaminen Aineiston lataamisen jälkeen on usein syytä tarkistaa, että aineisto todella on latautunut siinä muodossa kuin sen olisi pitänyt. Tässä luvussa käsitellään aineiston tarkistamiseen liittyviä seikkoja. Aineiston käsittely R Commander:lla R Commander -ikkunan yläreunassa on kolme painiketta, Data Set, Edit data set ja View data set: Jos aineisto on ladattu R Commander:n kautta, se on jo valmiiksi aktiivisena, ja tekstin Data Set perässä lukee ladatun aineiston nimi. Aineiston nimi toimii myös painikkeena, ja sitä kautta pääsee selaamaan muistissa olevia aineistoja. Jos aineisto on luettu R:n komentoriviltä, pitää se ensin aktivoida, jotta sitä voidaan käyttää R Commander:ssa. Tämä tapahtuu näpäyttämällä hiirellä Data Set -painiketta, ja valitsemalla avautuvasta ikkunasta aktivoitavan aineiston nimi. Kun aineisto on aktiivinen, sitä voidaan muokata painikkeella Edit data set. Se avaa uuden ikkunan, jossa ladattu aineisto näytetään siinä muodossa kuin se on R:n muistissa. Aineiston pienimuotoinen korjailu on tätä kautta mahdollista, mutta suurempia muutoksia varten lienee tarpeen korjata myös alkuperäisaineistoa siinä ohjelmistossa, jolla se alunperin luotiin. Muokkausikkunassa liikutaan solusta toiseen nuolinäppäimillä: 23

32 AINEISTON TAR KAS TAM INE N Jonkin sarakkeen otsikon näpäyttäminen hiirellä avaa uuden ikkunan, jossa sarake on mahdollista nimetä uudelleen. Samassa yhteydessä myös sarakkeen tietotyyppi on mahdollista määritellä tai vaihtaa: R Commander:in painikkeella View data set aineistoa voi tarkastella uudessa ikkunassa, mutta siihen ei voi tehdä muutoksia: Aineistosta on hyvä tehdä myös nopea yhteenveto, joka antaa lyhyen raportin kustakin muuttujasta. Yhteenveto lasketaan R Commander:in valikon Statistics valinnalla Summaries->Active data set. Yhteenveto tulostuu R Commander -ikkunaan: pituus kengannumero sukupuoli Min. :167.0 Min. :39.00 mies :2 1st Qu.: st Qu.:39.75 nainen:2 Median :174.0 Median :42.00 Mean :174.5 Mean : rd Qu.: rd Qu.:44.00 Max. :183.0 Max. : kaupunki Espoo :2 Helsinki:2 paivays : :2

33 R- K I E L E N PERUSTEE T Yhteenvedossa on numeeristen muuttujien, pituuden ja kengännumeron osalta raportoitu niiden keskiarvo, minimi ja maksimi, sekä ensimmäinen, toinen ja kolmas kvartiili. Luokittelumuuttujien, jotka on koodattu tekstinä, suhteen on raportoitu kunkin luokan esiintymisten määrä. Jos mukana olisi puuttuvia havaintoja, niiden lukumäärä olisi myös ilmoitettu. Aineiston käsittely komentoriviltä Jo edellä esitelty aineiston muokkaamiseen soveltuva ikkuna on mahdollista avata myös komentoriviltä komennolla fix(). Komennolle annetaan argumentiksi sen aineiston nimi, joka halutaan esittää ikkunassa. Esimerkiksi aineisto opiskelijat voidaan esittää taulukkona komennolla: >fix(opiskelijat) Toinen vaihtoehto on tulostaa aineisto suoraan komentorivi-ikkunaan kirjoittamalla aineiston nimi komentoriville. Aineisto opiskelijat voidaan siis tulostaa ruudulle seuraavasti: >opiskelijat pituus kengannumero sukupuoli kaupunki paivays mies Espoo mies Espoo nainen Helsinki nainen Helsinki Myös yhteenvetotiedot voi laskea ja tulostaa ruudulle komentoriviltä käsin komennolla summary(). Tällekin komennolle annetaan argumentiksi R:n muistissa olevan aineisto nimi: >summary(opiskelijat) Miten tulkita tuloksia? Jos aineisto näyttää esimerkiksi muokkausikkunassa oikeanlaiselta, ja yhteenvetotiedot tuntuvat järkeviltä, voidaan olettaa, että aineisto on saatu ladattua oikein. Yleisimpiä virheitä, joka näillä tarkastuksilla on helppo huomata, on väärin määritelty sarakkeiden erotin, jolloin taulukkomuodossa tarkastellussa aineistossa on tyypillisesti vain yksi sarake. 25

34 AINEISTON TAR KAS TAM INE N Toinen varsin yleinen virhe on väärin määritelty desimaalierotin, mikä näkyy tarkasteluissa siten, että desimaalilukuja sisältävät sarakkeet esitetään tekstinä, ei numeroina. Toisinaan myös sarakkeiden otsikointi aiheuttaa ongelmia. Jos sarakkeilla on otsikot, mutta aineistoa luettaessa tätä valintaa ei ole tehty, R tulkitsee otsikkorivinkin aineistoon kuuluvaksi. Tästä on yleensä se seuraus, että kaikki aineiston sarakkeet tulkitaan tekstimuotoisiksi, olivat ne sitä todellisuudessa tai eivät. Päinvastainen tapauskin on mahdollinen. Jos aineistossa ei ole otsikkotietoja, mutta aineistoa luettaessa on valittu, että otsikot ovat ensimmäisellä rivillä, jää ensimmäinen rivi puuttumaan aineistosta. Tämä on usein vaikeampi huomata, ellei tule tarkistaneeksi, että taulukkomuotoisessa esityksessä näytetään yhtä monta riviä kuin aineistossa todellisuudessa on. Mitä seuraavaksi? Kun aineisto on ladattu, ja on todettu latauksen onnistuneen halutulla tavalla, on aineisto valmis käsiteltäväksi. Seuraavissa luvuissa esitellään aineiston käsittelyä ja analysointia tarkemmin. Myös R Commander:in ja komentorivin käyttöä tarkastellaan lähemmin. 26

35 R- K I E L E N PERUSTEE T Osa-aineiston poimiminen Osa-aineiston poimiminen R Commander:lla Eräs tavanomaisimmista aineistoon kohdistuvista käsittelyistä on sen pilkkominen pienemmiksi osa-aineistoiksi. Esimerkiksi opiskelijataineistossa on kahdesta eri sukupuolta olevasta henkilöstä tehtyjä mittauksia, kaksi kummastakin henkilöstä. Henkilöiden havainnot voitaisiin erottaa aineistosta omiksi osa-aineistoikseen. Osa-aineiston poimiminen tapahtuu R Commander:ssa valikon Data valinnalla Active data set Subset active data set.... Tämä avaa uuden ikkunan: Ikkunassa ylinnä on oletusarvoisesti rastitettu laatikko, joka tarkoittaa, että osa-aineistoon otetaan mukaan kaikki aineistossa olevat muuttujat. Jos näin ei haluta menetellä, valitaan Variables-laatikosta vain ne muuttujat, joiden halutaan esiintyvän uudessa aineistossa. Toisin sanoen, valitsemalla vain osa muuttujista voidaan muodostaa osa-aineisto, josta osa muuttujista on poistettu, mutta jäljelle jääneistä muuttujista on kustakin säilytetty kaikki havainnot. Jos halutaan osa-aineisto, jossa on mukana alkuperäistä pienempi joukko havaintoja, siis taulukon rivejä, käytetään laatikkoa Subset 27

36 OSA -AI NE IS TO N POIM IM INE N expression. Toisin sanoen, käyttämällä laatikossa sopivaa määrittelyä, saadaan alkuperäisestä aineistosta erotettua vain ne rivit, jotka halutaan mukaan uuteen osa-aineistoon. Laatikkoon pitää kirjoittaa jonkinlainen vertailu. Esimerkiksi vertailu sukupuoli== mies ottaisi osa-aineistoon kaikki rivit, joilla muuttuja sukupuoli saa arvon mies. Vertailu koostuu kolmesta eri osasta. Keskimmäisenä on jonkinlainen vertailuoperaattori, kuten tässä kahdesta yhtäsuuruusmerkistä koostuva yhtäsuuruuden havaitsemiseen tarkoitettu operaattori. Operaattorin vasemmalla puolella on aineiston sarakkeen nimi. Oikealla puolella on puolestaan se arvo tai arvot, joihin muuttujan arvoja verrataan. Vertailuoperaattoreita ovat: Operaattori ==!= >= <= > < Merkitys yhtä suuri kuin eri suuri kuin suurempi tai yhtä suuri kuin pienempi tai yhtä suuri kuin suurempi kuin pienempi kuin Vertailuoperaattorien käyttö saattaa selvitä parhaiten muutamien esimerkkien avulla: Vertailu sukupuoli== mies sukupuoli!= nainen pituus>=181 pituus>181 Merkitys Valitaan kaikki rivit, joilla sukupuoli on mies Valitaan kaikki rivit, joilla sukupuoli ei ole nainen (siis kaikki miehet) Valitaan kaikki rivit, joilla pituus on yhtäsuuri tai suurempi kuin 181 cm. Valitaan kaikki rivit, joilla pituus on suurempi kuin 181 cm. Mittaustulosta, joka on 181 cm ei siis valita mukaan. Osa-aineistolle kannattaa yleensä antaa uusi nimi, ja se kirjoitetaan laatikkoon Name for the new dataset. Jos uutta nimeä ei anneta, korvautuu alkuperäinen aineisto oletusarvoisesti osa-aineistolla. Kun tarvittavat valinnat on tehty, uusi osa-aineisto luodaan hyväksymällä ne painamalla OK-painiketta. Poimitaan esimerkinomaisesti miehet omaksi aineistoikseen. Tämä tapahtuu seuraavilla asetuksilla: 28

37 R- K I E L E N PERUSTEE T Osa-aineiston poiminnan jälkeen R Commander tunnistaa nyt kaksi erillistä aineistoa. Näistä uusi, vasta poimittu osa-aineisto on valittu aktiiviseksi. Tämän voi havaita R Commander -ikkunan yläpalkista, jonka kohdassa Data set aktiivisena on miehistä koostuva osa-aineisto. Alkuperäinen aineisto valitaan aktiiviseksi näpäyttämällä nappulaa, jossa nyt lukee miehet. Tämän jälkeen aukeavasta ikkunasta valitaan alkuperäinen aineisto eli opiskelijat: 29

38 OSA -AI NE IS TO N POIM IM INE N Edellä osa-aineisto poimittiin vain yhden muuttujan perusteella. Entä jos halutaan poimia osa-aineisto kahta muuttujaa käyttäen? Yksinkertaisinta lienee ensin poimia osa-aineisto yhden muuttujan perusteella, ja sen jälkeen näin muodostetusta osa-aineistosta edelleen uusi osa-aineiston jonkin toisen muuttujan arvojen perusteella. Jos esimerkiksi haluttaisiin poimia kaikki 181 cm pitkät miehet, poimittaisiin ensin miehistä koostuva osa-aineistoa, ja sen jälkeen jatkettaisiin poimimilla miesten joukosta ne miehet, jotka ovat 181 cm pitkiä. Toinen vaihtoehto on käyttää Boolen operaattoreita, joilla voidaan yhdistää useampia vertailuja. Tärkeimmät Boolen operaattorit lienevät ja sekä tai: Operaattori &! Merkitys ja tai ei Näppäinyhdistelmä shift + 6 Alt Gr + < Esimerkiksi yli 181 cm pitkien miesten poimiminen aineistosta tapahtuisi yhdistämällä vertailu sukupuoli== mies vertailun pituus>181 kanssa. Koska nyt molempien ehtojen tulee täyttyä yhtä aikaa, on niiden yhdistämiseen käytettävä ja-operaattoria. Osa-aineiston poiminta tapahtuisi siis vertailulla: sukupuoli== mies & pituus>181. Osa-aineiston poimiminen komentoriviltä Osa-aineistojen poiminta komentoriviltä perustuu samoihin vertailu- ja Boolen -operaattoreihin kuin R Commander:ssakin. Sarakkeiden ja rivien valinta tehdään käyttäen alaindeksiä, joka sijoitetaan hakasulkuihin aineiston nimen jälkeen. Jos riittää, että valitaan taulukosta vain yksi sarake, se voidaan erottaa käyttämällä dollari ($) -operaattoria. Ennen dollarimerkkiä tulee aineiston nimi, ja merkin jälkeen poimittavan sarakkeen nimi. Esimerkiksi pituudet sisältävä sarake voidaan erottaa opiskelijat-aineistosta seuraavasti: >opiskelijat$pituus [1] Tyypillisesti osa-aineisto, vaikkakin vain yhden sarakkeen kokoinen, on tarpeen tallentaa uudeksi aineistoksi. Kuten aineiston lukemisen yhteydessä selvitettiin, tämä tapahtuu sijoitusoperaattorilla <-. Talletetaan opiskelijoiden pituudet aineistoksi pituudet seuraavasti: 30

39 R- K I E L E N PERUSTEE T >pituudet<-opiskelijat$pituus Alaindeksiä käyttäen pituussarake poimittaisiin käyttämällä sarakkeen järjestysnumeroa, vasemmalta oikealle laskettuna. Pituussarake on ensimmäinen sarake. Alaindeksi koostuu aineiston nimestä, jota seuraavat hakasulut ja niiden välissä oleva pilkku. Pilkun jälkeen luetellaan ne sarakkeet, jotka halutaan poimia. Esimerkiksi alaindeksillä: >opiskelijat[,1] [1] poimittaisiin siis opiskelijoiden pituudet. Alaindeksillä poimittu aineisto voidaan myös tallentaa uudeksi aineistoksi, aivan kuten dollari-operaattorilla poimittu aineistokin: >pituudet<-opiskelijat[,1] Jos halutaan poimia useampia sarakkeita, lienee helpointa muodostaa ensin luettelo sarakkeiden numeroista. Tämä tapahtuu komennolla c(), joka on lyhennys englanninkielen sanasta combine eli yhdistä. Komennon kaarisulkujen välissä luetellaan poimittavien sarakkeiden järjestysnumerot pilkuilla erotettuna. Poimitaan esimerkiksi sarakkeet pituus, kengännumero ja päiväys, jotka ovat sarakkeet 1, 2 ja 5. Luodaan ensin luettelo nimeltä sarakkeet: >sarakkeet<-c(1, 2, 5) Nyt luettelon sarakkeet avulla voidaan poimia sarakkeet seuraavasti: >opiskelijat[,sarakkeet] pituus kengannumero paivays Samaa tyyliä voidaan käyttää myös rivien poiminnassa. Poimittavat rivit tulevat alaindeksissä ennen pilkkua. Poimitaan esimerkiksi rivit 1 ja 3: >rivit<-c(1, 3) >opiskelijat[rivit,] pituus kengannumero sukupuoli kaupunki paivays mies Espoo nainen Helsinki

40 OSA -AI NE IS TO N POIM IM INE N Saman aikaisesti voidaan tietysti poimia sekä rivejä että sarakkeita: >opiskelijat[rivit, sarakkeet] pituus kengannumero paivays Poimittavien rivien tai sarakkeiden listaa luotaessa käytetään useimmiten jonkinlaista vertailuoperaattoria. Jos halutaan poimia kaikki miehistä tehtyjä havaintoja sisältävät rivit, muodostetaan ensin luettelo valituista riveistä: >rivit<-opiskelijat$sukupuoli== mies >rivit [1] TRUE TRUE FALSE FALSE Huomaa, että ensin aineistosta opiskelijat on valittu sarake sukupuoli käyttäen dollari-operaattoria. Tämän jälkeen kyseisen sarakkeen arvoja on verrattu sanaan mies, ja tulokset on talletettu rivien numeroiden luetteloksi nimeltä rivit. Luettelossa rivit kullekin riville on annettu arvoksi TRUE tai FALSE. TRUE-arvon saavat rivit, joille vertailu oli tosi, siis ne rivit, joilla on miehistä tehtyjä havaintoja. Arvon FALSE saavat kaikki rivit, joilla vertailu oli epätosi. Tällaisia ovat naisista tehtyjä havaintoja sisältävät rivit. Tämän jälkeen rivit poimitaan aineistosta alaindeksiä käyttäen: >miehet<-opiskelijat[rivit,] >miehet 1 2 pituus kengannumero sukupuoli kaupunki paivays mies Espoo mies Espoo Ne rivit, jotka luettelossa rivit saivat arvon TRUE, on nyt poimittu mukaan. Jos alaindeksillä poimitaan vain tietyt rivit, mutta mukaan halutaan kaikki sarakkeet, voidaan sarakkeiden määritys jättää tyhjäksi. Tällöin pilkun jälkeen ei luetella yhtäkään poimittavaa saraketta, vaan kaikki otetaan mukaan uuteen aineistoon. Riviluetteloa luotaessa on mahdollista yhdistellä useampia vertailuja samaan tapaan Boolen-operaattoreilla kuin R Commander:in yhteydessä jo esitettiin. Esimerkiksi yli 181 cm pitkät miehet poimittaisiin aineistosta seuraavasti: 32

41 R- K I E L E N PERUSTEE T >rivit<-opiskelijat$sukupuoli== mies & opiskelijat$pituus>181 >opiskelijat[rivit,] pituus kengannumero sukupuoli kaupunki paivays mies Espoo Tulos kannattaa tallentaa uudeksi aineistoksi: >miehet.pitkat<-opiskelijat[rivit,] 33

42

43 R- K I E L E N PERUSTEE T Aineiston lajittelu R Commander ei tarjoa mahdollisuutta lajitella aineistoa, joten jos lajittelu on tarpeen, se on pakko tehdä komentoriviä käyttäen. Lajittelua varten luodaan riveille järjestys, jossa ne on poimittava, jotta taulukko saadaan järjestettyä tietyn sarakkeen mukaan. Esimerkiksi aineisto opiskelijat voidaan järjestää kengännumeron mukaan seuraavasti. Luodaan ensin luettelo rivit, joka kertoo missä järjestyksessä rivit on valittava, jotta taulukko saadaan järjestettyä. Tämä tapahtuu komennolla order(): >rivit<-order(opiskelijat$kengannumero) >rivit [1] Alkuperäinen aineisto on: > opiskelijat pituus kengannumero sukupuoli kaupunki paivays mies Espoo mies Espoo nainen Helsinki nainen Helsinki Lajittelujärjestyksen mukaan poimitaan siis ensin rivi 3, jolla kengännumeroksi on havaittu 39. Tämän jälkeen poimitaan rivi 4, sitten rivi 1 ja lopuksi rivi 2. Kun lajittelujärjestys on selvitetty, saadaan taulukko järjestettyä käyttämällä lajittelujärjestystä alaindeksissä: >opiskelijat[rivit,] pituus kengannumero sukupuoli kaupunki paivays nainen Helsinki nainen Helsinki mies Espoo mies Espoo Lajiteltu aineisto kannattaa luonnollisesti tallentaa uudeksi aineistoksi: >opiskelijat.sorted<-opiskelijat[rivit,] 35

44 AINEISTON LAJITTELU Aineiston lajitteluun voidaan käyttää myös useampia sarakkeita. Tällöin ne luetellaan kaikki komennon order() argumentteina. Esimerkiksi opiskelijat-aineiston lajittelu sekä kengännumeron että pituuden mukaan tapahtuisi seuraavasti: >rivit<-order(opiskelijat$kengannumero, opiskelijat$pituus) >opiskelijat[rivit,] pituus kengannumero sukupuoli kaupunki nainen Helsinki nainen Helsinki mies Espoo mies Espoo 36 paivays

45 R- K I E L E N PERUSTEE T Puuttuvien arvojen käsittely Puuttuvat arvot aiheuttavat monissa analyyseissä ongelmia. Periaatteellisia lähestymistapoja puuttuvien arvojen kanssa työskentelyyn on kaksi: puuttuvat arvot voidaan korvata jollakin tavalla arvioiduilla arvoilla (imputointi) tai ne voidaan poistaa aineistosta. Jos päädytään poistamaan puuttuvat arvot, on tyypillisenä menettelytapana poistaa kaikki sellaiset taulukon rivit, joilla esiintyy ainakin yksi puuttuvat havainto jossakin muuttujassa. Puuttuvien arvojen käsittely R Commander:lla Puuttuvia havaintoja sisältävien rivien poistaminen tapahtuu R Commander:ssa valikon Data toiminnolla Active data set->remove cases with missing data... Tämä avaa uuden ikkunan: Ikkunassa on lähinnä tarpeen muuttaa aineiston nimeä kentässä Name for new data set. Jos aineiston nimen jättää oletusarvoonsa, aineisto josta puuttuvat arvot on poistettu korvaa alkuperäisen aineiston. Uudessa 37

46 PUUTTUVIE N ARVOJE N KÄSITTELY aineistossa ovat tämän jälkeen ainoastaan rivit, joilla ei esiintynyt yhtäkään puuttuvaa arvoa. Puuttuvien arvojen käsittely komentoriviltä Puuttuvien arvojen poistaminen aineistosta tapahtuu komentoriviltä käsin komennolla na.omit(). Kun komennolle annetaan argumentiksi sen taulukon nimi, josta puuttuvat arvot halutaan poistaa, se palauttaa taulukon ilman puuttuvia arvoja sisältäviä rivejä. Tämä taulukko kannattaa tietenkin tallentaa uudeksi aineistoksi. Esimerkiksi, puuttuvien arvojen poistaminen opiskelijat-aineistosta, jos sellaisia olisi, tapahtuisi komennolla: >opiskelijat.na<-na.omit(opiskelijat) Puuttuvien arvojen korvaaminen muuttujan keskiarvolla tai mediaanilla tapahtuu laajennuspaketin e1071 komennolla impute(). Komennolle annetaan syötteeksi vain numeroarvoista koostuva aineisto, ja se palauttaa samaisen aineiston siten, että puuttuvat arvot on korvattu sen muuttujan keskiarvolla, jossa puuttuva havainto esiintyi. Esimerkiksi komennoilla >library(e1071) >opiskelijat.impute<-impute(opiskelijat$pituus) ladataan ensin laajennuspaketti e1071 muistiin, ja korvataan sitten opiskelija-aineiston pituus-muuttujassa esiintyvät puuttuvat havainnot keskiarvolla. Tulos tallennetaan uudeksi aineistoksi nimellä opiskelijat.impute. 38

47 R- K I E L E N PERUSTEE T Uusien muuttujien luominen Uusien muuttujien luominen olemassa olevien muuttujien perusteella tapahtuu joko koodaamalla muuttujan arvot uudelleen tai muuntamalla muuttujaa jotenkin. Muuttujan muuntamisella tarkoitetaan jonkinlaisen matemaattisen operaation tekemistä. Yksinkertainen muunnos on esimerkiksi henkilöiden sentteinä ilmoitetun pituuden muuntaminen tuumiksi. Tämähän tapahtuu jakamalla sentit 2.54:llä. Muita yksinkertaisia muunnoksia ovat esimerkiksi muuttujan logaritmointi jakauman normalisoimiseksi analyyseja varten. Uusien muuttujien luominen R Commander:lla R Commander:ssa muunnoksen tekeminen tapahtuu valikon Data valinnalla Manage variables in active data set->compute new variable... Tämä avaa uuden ikkunan: Muuttujan muuntamista varten on laatikosta Current variables valittava yksi muuttuja. Kaksoisnäpäyttämällä muuttujaa, sen nimi siirtyy tekstikenttään Expression to compute, johon muunnoskaava on kirjoitettava. 39

48 UUSIE N M UU TTU JIE N LUOM INE N Lisäksi muunnetulle muuttujalle kannattaa antaa uusi nimi, joka kirjoitetaan tekstikenttään New variable name. Muunnoskaavakenttään on mahdollista kirjoittaa laskukaava, jossa voidaan käyttää esimerkiksi seuraavia matemaattisia operaattoreita: Operaattori + * / ^ Merkitys Summa Erotus Tulo Osamäärä Potenssi Kaavassa voidaan käyttää myös matemaattisia komentoja, kuten: Komento log() exp() sqrt() sum() mean() median() min() max() sd() Merkitys Luonnollinen logaritmi Käänteislogaritmi Neliöjuuri Summa Keskiarvo Mediaani Minimi Maksimi Keskihajonta Muunnetaanpa pituus-muuttujaa hieman eri tavoilla. Seuraavissa muunnoksissa on käytetty edellä mainittuja operaattoreita ja komentoja. Muunnos pituus/2.54 Merkitys Jakaa pituusmuuttujan arvot 2.54 eli muuttaa pituuden tuumiksi log(pituus) Pituuden logaritmimuunnos (pituusmean(pituus))/ sd(pituus) Standardoi pituus-muuttujan arvot normitetun normaalijakauman mukaisiksi Muuttujien uudelleen koodaaminen tapahtuu korvaamalla muuttujan aiemmat arvot joillakin uusilla arvoilla. Esimerkiksi muuttujan sukupuoli arvot voitaisiin uudelleen koodata arvoilla M ja N. Tällainen uudelleen koodaaminen tapahtuu R Commander:in valikon Data valinnalla 40

49 R- K I E L E N PERUSTEE T Manage variables in active data set->recode variables... Tämä avaa uuden ikkunan: Kohdasta Variables to recode on ensin valittava uudelleen koodattava muuttuja. Tämän jälkeen uudelleen koodatun muuttujan nimi kirjoitetaan kohtaan New variable name. Alimpaan kenttään Enter recode directives kirjoitetaan uudelleenkoodaussäännöt. Sääntöjen muoto riippuu hieman siitä, koodataanko uudelleen jatkuvaa vai luokittelumuuttujaa. Alla on muutamia esimerkkejä molemmista tapauksista. Kutakin sääntöä kohden tulee laatikkoon kirjoittaa yksi rivi, joten jos ollaan tekemässä kaksiarvoista eli binääristä uutta muuttujaa, tulee laatikkoon kaksi riviä. Sääntö mies = M nainen= N Merkitys Korvataan muuttujan arvo mies arvolla arvolla M ja arvo nainen arvolla N c(39, 40) = "normaali" c(44) = "kanootti" Korvataan muuttujan kengänkoko arvot 39 ja 40 arvolla normaali, ja arvo 44 arvolla kanootti 41

50 UUSIE N M UU TTU JIE N LUOM INE N Muuttujien uudelleenkoodaukseen R Commander:ssa ei voi käyttää vertailuoperaattoreita, vaan useampia numeerisia arvoja koodattaessa on kaikki korvattavat arvot lueteltava erikseen. Seuraavassa kappaleessa nähdään, miten sama operaatio tehdään R:n komentoriviltä joustavammin. Uusien muuttujien luominen komentoriviltä Muuttujien muuntaminen komentoriviltä tapahtuu pitkälti samoja operaattoreita ja komentoja käyttäen kuin R Commander:ssakin. Erona on, että muunnetut muuttujat pitää itse lisätä aineistoon, jos ne haluaa samaan taulukkoon jo olemassa olevien muuttujien kanssa. Esimerkiksi opiskelijat-aineiston pituusmittausten muuntaminen senteistä tuumiksi tapahtuu seuraavasti: >pit.muunnos<-opiskelijat$pituus/2.54 >pit.muunnos [1] Opiskelijoiden pituusmittaukset on ensin erotettu taulukosta omaksi aineistokseen dollari-operaattorilla, ja tämän jälkeen kukin muuttujan arvo on jaettu 2.54:llä. Lopuksi muunnetut arvot on tallennettu uuteen muuttujaan pit.muunnos. Muunnettujen arvojen talletus alkuperäisen aineiston uudeksi sarakkeeksi tapahtuu dollari-operaattoria käyttäen. Jos tuumina esitetyt pituudet sisältävää saraketta (muuttujaa) kutsutaan nimellä pituus.tuumina, voidaan uusi sarake lisätä aineistoon seuraavasti: >opiskelijat$pituus.tuumina<-pit.muunnos Taulukko-muotoiseen aineistoon lisättävä sarake ilmoitetaan siis muodossa aineiston nimi, dollari-merkki, sarakkeen nimi eli kuten yllä olevassa esimerkissä opiskelijat$pituus.tuumina. Kun aineistoon lisätään uusi sarake, on siihen samanaikaisesti myös tallennettava jotakin tietoa, ja tässä sarakkeeseen tallennetaan pituuden muunnetut arvot, jotka alunperin tallennettiin aineistoksi pit.muunnos. Muuttujien uudelleen koodaaminen komentoriviltä tarjoaa enemmän mahdollisuuksia kuin R Commander:in käyttö. Kaksiarvoisen muuttujan luominen onnistuu helpoiten komennolla ifelse(). Komennolle annetaan kolme argumenttia, joista ensimmäinen on jonkinlainen vertailu. Vertailu voi koostua vain yhdestä vertailusta, mutta aivan yhtä hyvin useammasta Boolen-operaattoreilla yhdistetystä vertailusta. Vertailun 42

51 R- K I E L E N PERUSTEE T jälkeen määritetään arvo, jonka uudelleenkoodattu muuttuja saa, jos vertailu on tosi. Viimeiseksi määritetään arvo, jonka uudelleenkoodattu muuttuja saa, jos vertailu on epätosi. Esimerkiksi, opiskelijat-aineiston sukupuoli koodattaisiin uudelleen komennolla: >ifelse(opiskelijat$sukupuoli== mies, M, N ) [1] "M" "M" "N" "N" Nyt kaikki mies-arvot on korvattu arvoilla M ja nainen-arvot vastaavasti arvoilla N. Uudelleenkoodatut arvot voitaisiin jälleen lisätä aineistoon uudeksi muuttujaksi nimeltä sp esimerkiksi seuraavasti: >opiskelijat$sp<-ifelse(opiskelijat$sukupuoli== mies, M, N ) Edellä esitettyyn tapaan lisätä taulukkoon uusi sarake on ainoana erona se, ettei uudelleenkoodattua muuttujaa ensin tallennettu uudeksi aineistoksi, vaan se lisättiin suoraan aineistoon. Koska komennossa ifelse() voidaan käyttää vertailuoperaattoreita, on kengänkoon uudelleenkoodaaminen komentoriviltä helpompaa kuin R Commander:lla. Suurimpien kengännumeroiden korvaaminen termillä kanootti ja pienimpien termillä normaali, aivan kuten edellä esitettiin R Commander:llä tehtynä, tapahtuisi komentoriviltä seuraavasti: >opiskelijat$kk<-ifelse(opiskelijat$kengannumero>41, kanootti, normaali ) 43

52

53 R- K I E L E N PERUSTEE T Päivämäärien käsittely R osaa käsitellä päivämääriä automaattisesti oikein, kunhan ne on ensin muutettu R:n ymmärtämään päivämäärämuotoon. Päivämäärien käsittelyyn ei R Commander:ssa ole erillistä työkalua, vaan päivämäärät on muunnettava oikeaan muotoon komentoriviltä. Oletusarvoisesti R uskoo päivämäärien olevan muodossa, jossa ensin mainitaan vuosi, sitten kuukausi ja viimeisenä päivä. Esimerkiksi merkintä tarkoittaisi R:ssä vuoden 2010 toukokuun 20. päivää. Jos aineisto on luotu Excelissä, lienee melko tavanomaista esittää päivämäärä muodossa tai vieläkin lyhyemmin Tällaisten päivämäärämuotojen muuntaminen R:n ymmärtämään muotoon tapahtuu komennolla as.date(). Komento vaatii kaksi argumenttia. Ensimmäisenä argumenttina annetaan päivämäärä(t), jota tai joita ollaan muuntamassa. Toisena argumenttina annetaan niiden alkuperäinen esitysmuoto (format). Esimerkiksi muodossa esitetty päivämäärä muutettaisiin R:n ymmärtämään muotoon komennolla > as.date(" ", format="%d.%m.%y") [1] " " Vastaavasti muodossa esitetty päivämäärä muutetaan sopivaan muotoon komennolla > as.date(" ", format="%d.%m.%y") [1] " " Argumentilla format määritellään päivämäärän muoto. Määrittelyssä päivä osoitetaan merkinnällä %d ja kuukausi merkinnällä %m. Vuosi määritellään joko merkinnällä %y, jos vuotta merkitään kahdella numerolla tai merkinnällä %Y, jos vuotta merkitään neljällä numerolla. Lisäksi esimerkkipäivämäärien merkitsemisessä on käytetty pisteitä päivien ja kuukausien sekä kuukausien ja vuosien erottamiseen. Määriteltäessä R:lle päivämäärien esitysmuotoa on nämä pisteetkin muistettava merkitä oikeille paikoilleen, kuten ylläolevissa esimerkeissäkin on tehty. 45

54 PÄIVÄMÄÄRIE N KÄSITTE LY Samalla komennolla as.date() voidaan muuntaa päivämääriksi kokonaisia taulukon sarakkeita. Esimerkiksi aineiston opiskelijat sisältämät päivämäärät sarakkeessa paivays voidaan kaikki kerralla muuntaa R:n ymmärtämiksi päivämääriksi antamalla koko sarake syötteeksi: > as.date(opiskelijat$paivays, format="%d.%m.%y") [1] " " " " " " " " 46

55 R- K I E L E N PERUSTEE T Aineiston tunnusluvut Aineiston tunnusluvuilla tarkoitetaan tässä erilaisten tilastollisten yhteenvetotietojen tai kuvailevien suureiden laskemista. Tällaisia ovat esimerkiksi keskiarvo, keskihajonta, mediaani ja vaihteluväli. Aineiston tunnuslukujen laskeminen R Commander:lla Koko aineistosta saa nopean yleiskuvauksen valikon Statistics valinnalla Summaries->Active Data Set. Tämä antaa hieman erityyppistä tietoa kustakin muuttujasta (sarakkeesta) riippuen kunkin muuttujan sisältämistä arvoista. Jatkuville tai muutoin numeerisille muuttujille, kuten pituus ja kengännumero, ilmoitetaan minimi ja maksimi, kvartiilit ja keskiarvo. Luokittelumuuttujille kerrotaan kunkin luokan havaintojen lukumäärä: pituus Min. : st Qu.:167.0 Median :174.0 Mean : rd Qu.:181.5 Max. :183.0 kengannumero Min. : st Qu.:39.75 Median :42.00 Mean : rd Qu.:44.00 Max. :44.00 sukupuoli mies :2 nainen:2 kaupunki Espoo :2 Helsinki:2 paivays : :2 Valikon Statistics valinnalla Summaries->Numerical summaries lasketaan muuttujakohtaisia tunnuslukuja. Valinta avaa uuden ikkunan: 47

56 AINEISTON TUNNUSLUVUT Avautuvan ikkunan yläreunassa, kohdassa Variables, on luettelo niistä aktiivisen aineiston muuttujista, joille tunnuslukuja on mahdollista laskea. Luettelosta valitaan ne muuttujat, joille tunnusluvut halutaan laskea. Oletusarvoisesti kullekin muuttujalle lasketaan keskiarvo, keskihajonta sekä viisi kvantiilia, jotka vastaavat aineiston minimiä, maksimia ja kolmea kvartiilia. Painikkeella Summarize by groups voidaan määritellä jokin luokitteleva muuttuja, jonka kullekin tasolle tunnusluvut lasketaan erikseen. Esimerkiksi pituuden ja kengänkoon keskiarvo, keskihajonta ja kvantillit voitaisiin laskea erikseen eri sukupuolille valitsemalla luokittelumuuttuja sukupuoli ryhmät määritteleväksi muuttujaksi. Seuraavilla valinnoilla: saadaan seuraavat tulokset: Variable: kengannumero mean sd 0% 25% 50% 75% 100% n mies nainen Variable: pituus mean sd 0% 25% 50% 75% 100% n mies nainen Aineiston tunnuslukujen laskeminen komentoriviltä Jo aineiston tarkistamisen yhteydessä tutustuttiin komentoon summary(), joka tuotti aineiston nopean yleiskuvauksen. Siihen sisälletyt tunnusluvut ovat kuitenkin vain pieni joukko mahdollisesti kiinnostavista tunnusluvuista. Luvussa uusien muuttujien luominen esiteltyjä matemaattisia komentoja voi käyttää puuttuvien tunnuslukujen laske- 48

57 R- K I E L E N PERUSTEE T miseen, mutta helpoimmalla pääsee, jos käyttää laajennuspaketin psych komentoa describe(). Komennolle annetaan syötteeksi aineiston nimi: >library(psych) >describe(opiskelijat) var n mean sd median trimmed mad min max range skew kurtosis se pituus kengannumero sukupuoli* kaupunki* paivays* pituus kengannumero sukupuoli* kaupunki* paivays* Ennen tunnuslukujen laskemista luokittelumuuttujat on muutettu numeerisiksi muuttujiksi. Tulosteessa tällaiset muuttujat on merkitty tähdellä (*). Kukin muuttuja on tulosteessa vaakarivillä, ja siitä lasketut tunnusluvut on kukin esitelty omassa sarakkeessaan. 49

58

59 R- K I E L E N PERUSTEE T Aineiston taulukointi Jos aineistossa on luokittelevia muuttujia, niitä voidaan käyttää erilaisten ristiintaulukointien muodostamiseen. Tyypillisesti taulukoinneissa lasketaan eri luokkiin kuuluvien havaintojen lukumääriä tai prosenttiosuuksia. Taulukointi R Commander:lla Yhdestä muuttujasta muodostetaan taulukko valikon Statistics valinnalla Summaries->Frequency distributions. Tämä avaa uuden ikkunan: Ikkunassa on laatikko Variables, josta valitaan ne muuttujat, joista halutaan laskea eri luokkien lukumäärät. Seuraavassa lasketaan opiskelijataineistolle muuttujan kaupunki eri luokkien lukumäärät absoluuttisina arvoina sekä prosenttiosuuksina. Tuloste näyttää seuraavalta: Espoo Helsinki 2 2 Espoo Helsinki Ylemmästä taulukosta nähdään, että kummastakin kaupungista on kaksi havaintoa. Alemmasta taulukosta nähdään prosentteina kummankin 51

60 AINEISTON TAULUKOINTI kaupungin havaintojen osuus kaikista havainnoista. Koska havaintoja on yhteensä neljä, ja kummastakin kaupungista on kaksi havaintoja, on kummastakin kaupungista saatu 50% kokonaishavaintomäärästä. Kahden tai useamman muuttujan ristiintaulukointi muodostetaan valikon Statistics valinnalla Contingency tables->two-way table tai Contingency tables->multi-way table. Kaksisuuntaisen taulukon muodostamiseen tarkoitettu työkalu näyttää seuraavalta: Ylimpänä on kaksi laatikkoa, joissa on lueteltu aineiston luokittelumuuttujat. Kummastakin laatikosta tulee valita yksi muuttuja. Taulukossa esitetään valittujen muuttujien ristiintaulukointi lukumäärinä. Kohdasta Computer Percentages on mahdollista valita prosenttiosuuksien laskutapa. Oletusarvoisesti prosenttiosuuksia ei lasketa. Lisäksi taulukolle lasketaan oletusarvoisesti Khiin neliötesti. Sitä ei kuitenkaan käydä tässä yhteydessä sen tarkemmin läpi, vaan tyydytään poistamaan merkki ruudusta Chi-Square test of independence, jolloin testiä ei lasketa. Opiskelija-aineistosta muodostettu kaupungin ja päiväyksen ristiintaulukointi näyttää seuraavalta: 52

61 R- K I E L E N PERUSTEE T paivays kaupunki Espoo 1 1 Helsinki 1 1 Päiväys on esitetty sarakkeissa, ja kaupunki riveillä. Kustakin kaupunkipäivä -yhdistelmästä näyttää esiintyvän yksi havainto. Multi-way table -työkalulla muodostettu taulukko opiskelija-aineistosta näyttää vastaavasti seuraavalta:,, sukupuoli = mies paivays kaupunki Espoo 1 1 Helsinki 0 0,, sukupuoli = nainen paivays kaupunki Espoo 0 0 Helsinki 1 1 Taulukko koostuu kahdesta pienemmästä, eri sukupuolille laaditusta taulukosta, joissa on esitetty eri kaupunki-päiväys -yhdistelmille havaintojen lukumäärät. Taulukointi komentoriviltä Komentoriviltä taulukoiden muodostaminen tapahtuu pääasiassa komennolla table(). Komennolle annetaan pilkuilla eroteltuna kaikki ne muuttujat, joista taulukko halutaan muodostaa. Aiemman esimerkin tapaan taulukko opiskelijoiden jakautumisesta eri kaupunkeihin voidaan muodostaa komennolla: >table(opiskelijat$kaupunki) Espoo Helsinki 2 2 Kaksisuuntainen taulukko muodostetaan antamalla komennolle kaksi muuttujaa. Esimerkiksi: 53

62 AINEISTON TAULUKOINTI >table(opiskelijat$kaupunki, opiskelijat$paivays) Espoo 1 1 Helsinki 1 1 Muodostetut taulukot sisältävät vain havaintojen lukumääriä. Prosenttiosuuksien saamiseksi tulee jo muodostettu lukumäärätaulukko muuttaa prosenttitaulukoksi. Tämä tapahtuu komennolla prop.table(). Komennolle annetaan lukumäärätaulukko, esimerkiksi: >prop.table(table(opiskelijat$kaupunki)) Espoo Helsinki Useampisuuntaisista taulukoista saa kauniimpia komennolla ftable(), joka litistää moniulotteisen taulukon kahteen ulottuvuuteen. Komennolle annetaan jo muodostettu lukumäärä- tai prosenttiosuustaulukko. Esimerkiksi kolmiulotteinen taulukko, joka alunperin näyttää seuraavalta: >table(opiskelijat$kaupunki, opiskelijat$paivays, opiskelijat$sukupuoli),, = mies Espoo 1 1 Helsinki 0 0,, = nainen Espoo 0 0 Helsinki 1 1 saadaan muutettua komennolla ftable() luettavampaan muotoon: > ftable(table(opiskelijat$kaupunki, opiskelijat$paivays, opiskelijat$sukupuoli)) mies nainen Espoo Helsinki Ryhmäkohtaisten tunnuslukujen laskeminen on myös tapa taulukoida aineistoa. R Commander:in tapa laskea ryhmäkohtaisia tunnuslukuja on jo esitetty luvussa Aineiston tunnusluvut, mutta niiden laskemista komentoriviltä ei ole vielä käsitelty. Yksinkertaisin tapa laskea ryhmäkohtaisia tunnuslukuja on muodostaa ryhmistä erillisiä aineistoja, ja laskea 54

63 R- K I E L E N PERUSTEE T sitten kaikille näistä erillisistä aineistoista tunnusluvut esimerkiksi laajennuspaketin psych komennolla describe(). Opiskelija-aineiston miehille tämä tapahtuisi alaindeksien avulla esimerkiksi seuraavasti: >mies<-opiskelijat[opiskelijat$sukupuoli== mies,] >library(psych) >describe(mies) Toinen vaihtoehto olisi laskea yksittäiset tunnusluvut komennolla aggregate(). Esimerkiksi eri sukupuolten keskimääräinen pituus voidaan laskea seuraavalla komennolla: > aggregate(opiskelijat$pituus, list(opiskelijat$sukupuoli), mean) Group.1 x 1 mies nainen 167 Komennolle on annettava kolme argumenttia. Ensimmäinen argumentti, tässä opiskelijat$pituus, kertoo sen taulukon sarakkeen, josta tunnuslukuja laaditaan. Toinen argumentti, tässä lista-muodossa esitettynä list(opiskelijat$sukupuoli), kertoo, mikä on luokitteleva muuttujan, jonka eri tasoille tunnusluvut lasketaan. Kolmantena argumenttina, tässä mean, on sen funktion nimi, jolla tunnusluvut lasketaan. 55

64

65 R- K I E L E N PERUSTEE T Tilastollinen grafiikka Tilastollista grafiikkaa käytetään tilastoaineistojen kuvaamiseen. Seuraavassa esitellään viisi tavanomaisinta kuviota: histogrammi, laatikkokuvio, pylväskaavio, hajontakuvio ja viivakuvio. Histogrammia käytetään yhden jatkuvan muuttujan jakauman esittämiseen. Laatikkokuviota voidaan niinikään käyttää yhden jatkuvan muuttujan jakauman esittämiseen, tai jos toinen muuttuja on jatkuva, ja toinen luokitteluasteikollinen, kahden muuttujan jakauman esittämiseen. Pylväskaaviolla esitetään yhden luokitteluasteikollisen tai jatkuvan ja yhden luokitteluasteikollisen muuttujan yhteisvaihtelua. Viivakuviolla esitetään kahden jatkuvan muuttujan yhteisvaihtelua silloin, kun toinen muuttuja muodostaa esimerkiksi aikasarjan. Hajontakuviolla esitetään kahden jatkuvan muuttujan yhteisvaihtelua. Aineiston graafinen tarkastelu kannattaa yhdistää tilastollisten tunnuslukujen tarkasteluun, koska molempia käyttämällä saadaan aineistosta kattavampi ja tarkempi käsitys. Aineistoa kannattaa tarkastella molemmilla keinoilla myös ennen mahdollisten tilastollisten testien tekemistä. Tyypillinen esimerkki kuvailevasta suureesta, johon graafinen tarkastelu kannattaa yhdistää, on korrelaatiokerroin. Korrelaatiokerroin kuvaa kahden jatkuvan muuttujan yhteisvaihtelua hyvin vain, jos yhteisvaihtelu on suoraviivaista. Jos yhteisvaihtelu on esimerkiksi käyräviivaista, ei korrelaatiokerroin ole välttämättä hyvä tunnusluku. Käyräviivaisuuden selvittäminen vaatii kuitenkin aineiston tarkastelua hajontakuviota käyttäen jo ennen korrelaatiokertoimen laskemista. Seuraavissa kuvioesimerkeissä käytetään uutta aineistoa. Aineisto koostuu rairuohon pituusmittauksista kylvämisen jälkeisinä kuutena päivänä kolmannesta päivästä alkaen. Viljelmiä on viljelty neljällä eri kasvualustalla, ohuella ja paksulla talouspaperilla ja mullalla. Lisäksi kutakin viljelmää on kasteltu kahdella eri tavalla, joko pelkällä vedellä tai ravinneliuoksella. Kunkin viljelmän pituus on mitattu kuutena itämisen jälkeisenä päivänä, joten viljelmien mittauksista muodostuu lyhyt aikasarja. Aineisto voidaan ladata R:ään taulukoksi nimeltä rairuoho seuraavalla komennolla: 57

66 TILASTOLLINEN GRAFIIKKA >rairuoho<read.table("http://koti.mbnet.fi/tuimala/oppaat/r/data/rai ruoho.txt", header=true) Komento hakee aineiston suoraan Internetistä. Vaihtoehtoisesti aineiston voi ensin ladata paikalliselle koneelle Internet-osoitteesta: minkä jälkeen aineisto ladataan R:ään komennolla: >rairuoho<-read.table( rairuoho.txt, header=true) Nyt aineisto on ladattu R:ään, mutta se ei vielä näy R Commanderissa aktiivisena aineistona. Aineiston aktivointi tapahtuu näpäyttämällä Data set -painiketta, ja valitsemalla avautuvasta listasta rairuoho-aineisto. 58

67 R- K I E L E N PERUSTEE T Histogrammi Histogrammissa aineisto jaetaan luokkiin, ja kuvaan piirrettyjen palkkien pinta-aloilla esitetään kunkin luokan havaintojen lukumääriä. Hyvin usein luokkien muodostaminen tapahtuu tasavälisesti, jolloin kahden peräkkäisen luokan väli on aina yhtä suuri. Tässä tapauksessa histogrammi muistuttaa ulkonäöltään pylväskaaviota. Histogrammi R Commander:ssa R Commanderissa histogrammi piirretään valikon Graphs valinnalla Histogram. Tämä avaa uuden ikkunan: Ikkunassa ylimpänä olevasta Variable-laatikosta valitaan yksi aineiston sarake, jonka arvoista histogrammi piirretään. Histogrammissa voidaan esittää kunkin luokan havaintojen lukumäärät, prosenttiosuudet tai tiheydet. Esitettävä suure vaihdetaan tarvittaessa kohdasta Axis Scaling. Kun tarvittavat valinnat on tehty, painetaan OK-painiketta. Tämän 59

68 H I S T O G R AM M I jälkeen R-ohjelman ikkunaan aukeaa kuva, joka rairuohoaineiston seitsemännen päivän pituusmittauksista piirrettynä näyttää seuraavalta: Histogrammi komentoriviltä Histogrammi piirretään komennolla hist(). Komennolle annetaan argumentiksi se taulukon sarake, josta histogrammi halutaan piirtää. Rairuohoaineiston seitsemännen päivän pituusmittauksista histogrammi piirrettäisiin siis komennolla: >hist(rairuoho$day7) Komento tuottaa muutoin yllä olevan kaltaisen kuvion, mutta palkkeja ei ole väritetty harmaiksi. Kuvion ulkoasun muokkaaminen Oletusarvoilla tuotettu histogrammi on joiltakin osin vaikeasti tulkittava. Esimerkiksi vaaka-akselin otsikkona on taulukon ja siitä erotetun sa- 60

69 R- K I E L E N PERUSTEE T rakkeen nimi (rairuoho$day7). Jos kuvan tuottaa omaan käyttöön aineiston tarkastelua varten, tällaisillä yksityiskohdilla tuskin on paljoakaan väliä, mutta jos kuvia esittelee muillekin, voi niitä olla tarpeen muuttaa. Komennolle hist() voidaan antaa lisäargumentteja, joilla määritetään kuvion vaaka- ja pystyakselien otsikot, koko kuvion otsikko ja pylväiden väri. Argumentit xlab ja ylab määrittävät vaaka- ja pystyakselien otsikot. Argumentti main määrittää koko kuvion otsikon. Pylväiden värin muuttaa argumentti col. Seuraava komento tuottaa alla olevan kuvan: >hist(rairuoho$day7, col="grey", xlab="pituus (mm)", ylab="lukumäärä", main="rairuohoviljelmien pituus 7. päivänä") Yllä esitellyt argumentit ovat yleisiä graafisia parametreja, joita voidaan käyttää monien muidenkin kuvioiden yhteydessä. Niiden käyttö esitellään kuitenkin uudelleen jokaisen kuvion yhteydessä, jotta ne varmasti tulevat tutuiksi. Huomaa, että argumenteille annettavien arvojen tulee olla lainausmerkeissä. Jos lainausmerkit unohtuvat, on tuloksena virheilmoitus. 61

70

71 R- K I E L E N PERUSTEE T Laatikkokuvio Laatikkokuvio kuvaa aineiston jakaumaa epäparametristen tunnuslukujen, kuten kvartiilien avulla. Laatikkokuvio koostuu laatikosta ja siitä ulospäin jatkuvista janoista, viiksistä. Laatikon yläreunan yläpuolella sijaitsee 25% aineistosta, ja alareunan alapuolella 25% aineistosta. Laatikon sisällä sijaitsee siis 50% aineistosta. Laatikon sisällä oleva poikkiviiva merkitsee aineiston mediaania. Laatikkokuvio R Commander:lla Laatikkokuvio piirretään valikon Graph valinnalla Boxplot. Tämä avaa ikkunan, jonka laatikosta Variable valitaan se taulukon sarake, josta laatikkokuvio piirretään: Kun valinta on tehty, painetaan OK-painiketta, ja R-ohjelman ikkunaan piirtyy uusi kuva, jossa on esitetty rairuohoaineiston seitsemännen päivän pituusmittausten jakauma: 63

72 LAATIKKOKUVIO Nyt laatikkokuvio kuvaa kaikkien seitsemännen päivän pituusmittausten jakaumaa. On myös mahdollista piirtää oma laatikko esimerkiksi kullekin viljelyalustalle. Kun ensin on valittu kuvattava muuttuja: painetaan painiketta Plot by groups..., minkä jälkeen uudesta aukeavasta ikkunasta valitaan muuttuja, joka määrittelee ryhmät. Tässä tapauksessa muuttuja bed kertoo millä alustalla kukin viljelmä on kasvatettu, joten sitä käytetään myös laatikkokuvioiden muodostamiseen: 64

73 R- K I E L E N PERUSTEE T Tuloksena on kuvio, jossa on yksi laatikko kutakin viljelyalustaa kohden: Laatikkokuvio komentoriviltä Laatikkokuvio muodostetaan komennolla boxplot(). Komennolle annetaan argumentiksi se taulukon sarake, josta laatikkokuvio halutaan piirtää: >boxplot(rairuoho$day7) 65

74 LAATIKKOKUVIO Jos laatikkokuvio halutaan jakaa useammaksi laatikoksi jonkin luokittelevan muuttujan perusteella, kuten yllä on tehty R Commader:ia käyttäen, pitää kuvio piirtää käyttäen argumenttina yhtälöä. R:ssä yhtälö koostuu selitettävästä muuttujasta, tilde-merkistä (~) sekä selittävästä muuttujasta. Laatikkokuvion tapauksessa selitettäväksi muuttujaksi tilde-merkin vasemmalle puolelle tulee jatkuva muuttuja, ja selittäväksi muuttujaksi tilde-merkin oikealle puolelle luokitteleva muuttuja. Jos siis rairuohon pituusmittaukset halutaan jakaa kasvatusalustan mukaan luokkiin, ja kullekin luokalle esittää oma laatikkokuvionsa, käytetään komentoa: >boxplot(rairuoho$day7 ~ rairuoho$bed) Komento piirtää tismalleen samanlaisen kuvion kuin R Commander aiemmin. Kuvan muokkaaminen Laatikkokuvion otsikkoa ja akselien otsikoita voidaan muokata samaan tapaan kuin histogrammin yhteydessä on selvitetty. Argumentit xlab ja ylab määrittävät vaaka- ja pystyakselien otsikot. Argumentti main määrittää koko kuvion otsikon. Pylväiden värin muuttaa argumentti col. Seuraava komento tuottaa alla olevan kuvan: >boxplot(rairuoho$day7 ~ rairuoho$bed, main="rairuohon pituus kasvatusalustoittain", ylab="pituus (mm)", xlab="kasvatusalusta", col="grey") 66

75 R- K I E L E N PERUSTEE T 67

76

77 R- K I E L E N PERUSTEE T Pylväskaavio Pylväskaaviota käytetään esittämään eri luokissa olevien havaintojen lukumääriä pylväiden pituuksien tai korkeuksien avulla. Pylväskaavio R Commander:lla Pylväskaavio piirretään valikon Graphs valinnalla Bar graph. Avautuvasta ikkunasta valitaan muuttuja, josta pylväskaavio piirretään. Tässä on valittu kasvatusalusta: Kun valinta on tehty, painetaan OK-painiketta. Pylväskaaviokuva avautuu R-ohjelman ikkunaan, ja näyttää tässä tapauksessa seuraavalta: 69

78 PYLVÄSKAAVIO Pylväskaavio komentoriviltä Ennen pylväskaavion piirtämistä pitää halutun muuttujan eri arvojen lukumääristä muodostaa taulukko. Kuten aiemmissa luvuissa on jo tarkemmin selitetty tämä tapahtuu komennolla table(), esimerkiksi seuraavasti: >table(rairuoho$bed) mould1 mould2 paper4 paper Näin taulukoiduista arvoista piirretään pylväskaavio komennolla barplot(): >barplot(table(rairuoho$bed)) Tuloksena on oleellisesti samanlainen pylväskaavio kuin yllä on esitetty, mutta vaaka- ja pystyakselien otsikot puuttuvat. Nämä saadaan kuitenkin lisättyä helposti seuraavien ohjeiden avulla. 70

79 R- K I E L E N PERUSTEE T Kuvan muokkaaminen Pylväskaavion otsikkoa ja akselien otsikoita voidaan muokata samaan tapaan kuin histogrammin yhteydessä on selvitetty. Argumentit xlab ja ylab määrittävät vaaka- ja pystyakselien otsikot. Argumentti main määrittää koko kuvion otsikon. Pylväiden värin muuttaa argumentti col. Seuraava komento tuottaa alla olevan kuvan: >barplot(table(rairuoho$bed), main="rairuohoviljelmien kasvatusalustat", ylab="lukumäärä", xlab="kasvatusalusta", col="grey") Tuloksena on seuraava kuva: Virhepalkit pylväskaavioon komentoriviltä Edellä on esitetty, miten lukumäärät esitetään pylväskaaviona. Entä jos haluaisimme esittää pylväskaaviossa rairuohon pituuden eri kasvatusalustoilla seurannan seitsemäntenä päivänä? Usein tällaisissa esityksissä näkee myös kuhunkin pylvääseen yhdistettävän virhepalkin, joten seuraavassa esitellään tällaisen pylväskaavion muodostaminen komentoriviltä. 71

80 PYLVÄSKAAVIO Pylväskaavio virhepalkkeineen piirretään laajennuspaketin epicalc komennolla aggregate.plot(). Ennen seuraavien komentojen käyttöä on siis asennettava mainittu laajennuspaketti. Ohjeet laajennuspakettien asentamiseen löytyvät tämän kirjan luvusta R:n asentaminen. Asennuksen jälkeen laajennuspaketti on vielä otettava käyttöön komennolla >library(epicalc) Piirtokomento aggregate.plot() muistuttaa luvussa Aineiston taulukointi esiteltyä komentoa aggregate(). Piirtokomennolle annetaan argumentilla x yksi taulukon sarake, jonka arvoista kuva piirretään. Argumentilla by määritellään taulukon sarake, joka sisältää luokittelumuuttujan, jonka eri arvoille laskettavat tunnusluvut pylväskaaviossa esitetään. Argumentilla error määritellään virhepalkeissa käytettävä tunnusluku, seuraavassa siis keskiarvon keskivirhe (se). Argumentit legend ja return saavat tässä arvoksi FALSE, mikä estää selitteen automaattisen lisäämisen kuvaan sekä tunnuslukujen arvojen tulostumisen R:n komentorivi-ikkunaan. Seuraava komento piirtää alla olevan kuvan: >aggregate.plot(x=rairuoho$day7, by=list(rairuoho$bed), error="se", legend=false, return=false) Kuvaa voidaan kaunistaa lisäämällä vaaka- ja pystyakseleille otsikot käyttäen aiemmin esiteltyjä argumentteja xlab ja ylab: 72

81 R- K I E L E N PERUSTEE T >aggregate.plot(x=rairuoho$day7, by=list(rairuoho$bed), error="se", legend=false, return=false, xlab="kasvatusalusta", ylab="pituus (mm)") Tuloksena muodostuvassa kuvassa on esitetty kunkin kasvatusalustan keskimääräinen pituus seitsemäntenä päivänä sekä virhepalkkeina kunkin kasvatusalustatyypin pituuksien keskiarvon keskivirhe: 73

82

83 R- K I E L E N PERUSTEE T Hajontakuvio Hajontakuviossa kuvataan kahden, tyypillisesti jatkuvan muuttujan välistä yhteisvaihtelua. Kuvioon merkitään pisteellä tai jollakin muulla soveliaalla merkillä ne kohdat, joissa havainnot vaaka- ja pystyakselien rajaamassa tilassa esiintyvät. Hajontakuvio R Commander:lla Hajontakuvio piirretään valikon Graphs valinnalla Scatterplot. Avautuva ikkuna tarjoaa suuren määrän erilaisia asetuksia, mutta oletusasetuksillakin aineistosta saa hyvän kuvan. 75

84 HAJONTAKUVIO Asetusikkunan yläreunan kahdesta laatikosta tulee valita ne kaksi muuttujaa, joista hajontakuvio piirretään. Seuraavassa on valittu vaaka-akselille rairuohon seitsemännen ja pystyakselille kahdeksannen päivän pituusmittaukset. Muodostuvassa kuviossa on kutakin havaintoa kuvattu yhdellä punaisella ympyrällä. Kuvioon on lisäksi piirretty katkoviivalla lineaarinen regressiosuora ja yhtenäisellä viivalla siloitekäyrä. Pysty- ja vaaka-akseleitten viereen on lisätty laatikkokuviot, jotka kuvaavat muuttujien jakaumia: Yksinkertaisen hajontakuvion lisäksi on mahdollista tarkastella useampien muuttujien vaihtelua yhtä aikaa käyttämällä hajontakuviomatriisia. Hajontakuviomatriisissa esitetään yhtä aikaa useita kahden muuttujan välisiä hajontakuvioita. Jos aineistossa on useampia muuttujia, on hajontakuviomatriisin avulla mahdollista saada aineistosta nopea yleissilmäys. Hajontakuviomatriisi piirretään valikon Graphs valinnalla Scatterplot matrix. Hajontakuviomatriisia varten asetusikkunan yläreunan laatikosta valitaan useampia muuttujia, tässä rairuohon seurantapäivien 3-8 pituusmittaukset: 76

85 R- K I E L E N PERUSTEE T Oletusarvoisesti kuhunkin hajontakuvioon piirretään lineaarinen regressiosuora ja siloitekäyrä. Lisäksi matriisin halkaisijalla esitetään kunkin muuttujan jakauma. Hajontakuviomatriisi on kuin taulukko. Matriisin halkaisijalla on kerrottu kyseisen sarakkeen tai rivin kuvioihin piirretty muuttuja. Esimerkiksi matriisin ensimmäisessä sarakkeessa ja ensimmäisellä rivillä olevissa kuvissa ovat kolmannen päivän pituusmittaukset. Kolmannen ja neljännen päivän pituusmittausten hajontakuvio löytyy sekä ensimmäisen sarakkeen että ensimmäisen rivin ensimmäisestä kuvasta. Hajontakuviomatriisi näyttää kokonaisuudessaan seuraavalta: 77

86 HAJONTAKUVIO Hajontakuvio komentoriviltä Hajontakuvio piirretään komennolla plot(). Se vaati argumenteiksi kahden taulukon sarakkeen sisältämät havainnot: >plot(rairuoho$day7, rairuoho$day8) Tuloksena on seuraava kuva: 78

87 R- K I E L E N PERUSTEE T Hajontakuviomatriisi muodostetaan komennolla pairs(). Komennolle annetaan argumentiksi osa-aineisto. Rairuohoaineistossa pituusmittaukset sijaitsevat sarakkeissa 1-6, jotka poimitaan erilleen alkuperäisestä aineistosta alaindeksiä käyttäen, ja annetaan argumentiksi piirtokomennolle: >pairs(rairuoho[,1:6]) Tuloksena on seuraava kuva: 79

88 HAJONTAKUVIO Komentoriviltä piirretyt hajontakuviot eroavat ulkoasultaan R Commander:lla piirretyistä siksi, että niiden piirtämiseen on käytetty eri komentoja. R Commander käyttää laajennuspaketin car piirtokomentoja scatterplot() ja scatterplot.matrix(). R Commander:n tuottamien kuvioiden kanssa identtiset kuvat on mahdollista tuottaa komennoilla: >library(car) >scatterplot(day7~day8, data=rairuoho) >scatterplot.matrix(~day3+day4+day5+day6+day7+day8, data=rairuoho) Kuvioiden muokkaaminen Hajontakuvion otsikoita voi muokata samaan tapaan kuin aiemmin muidenkin kuvien yhteydessä on tehty, esimerkiksi seuraavasti: >plot(rairuoho$day7, rairuoho$day8, xlab= Pituus 7. päivänä, ylab= Pituus 8. päivänä, main= Rairuohon pituus ) 80

89 R- K I E L E N PERUSTEE T Viivakaavio Viivakaaviossa esitetään kahden muuttujan arvot hieman samaan tapaan kuin hajontakuviossa, mutta pisteet on yhdistetty viivalla. Lisäksi vaaka-akselin tyypillisesti muodostaa jonkinlainen aikamuuttuja. Viivakaavio R Commander:lla Viivakaavion piirtämistä varten vaaka-akselille tulevien arvojen tulee olla suuruusjärjestyksessä. Koska R Commander:lla taulukon arvojen järjestäminen ei onnistu, kannattaa viivakaavio piirtää komentoriviltä. Viivakaavio komentoriviltä Viivakaavion piirtäminen tapahtuu jo hajontakuvion yhteydessä esitellyllä komennolla plot(). Komennolle voi antaa joko pelkät pystyakselille sijoitettavat arvot tai sekä vaaka- että pystyakseleille sijoitettavat arvot. Tämän lisäksi määritetään argumentilla type kuvion tyypiksi viivakaavio. Seuraavassa piirretään yhden viljelmän (aineistossa ensimmäisellä rivillä olevan viljelmän) päivien 3-8 pituudet viivakaavioon. Erotetaan ensin pituusmittaukset uudeksi muuttujaksi nimeltä pituus. Tässä yhteydessä havainnot muunnetaan varmasti numeerisiksi komennolla as.numeric(). Päivien 3-8 havainnot sijaitsevat ensimmäisen rivin sarakkeissa 1-6, jotka saadaan eroteltua alaindeksiä käyttäen: >pituudet<-as.numeric(rairuoho[1,1:6]) Tämän jälkeen piirretään itse kuvio komennolla: >plot(3:8, pituudet, type="l") Nyt vaaka-akselille merkitään arvot 3-8 eli mittauspäivien arvot. Pystyakselille tulevat pituusmittausten arvot, ja tyypiksi on siis valittu viiva (line). 81

90 VIIVAKAAVIO Kuvion ilmettä voidaan vielä parantaa lisäämällä otsikot aiempien kuvien yhteydessä esiteltyyn tapaan: >plot(3:8, pituudet, type="l", main="rairuohon kasvukäyrä", xlab="päivä", ylab="pituus (mm)") Tuloksena on oheinen kuva: 82

91 R- K I E L E N PERUSTEE T Tilastollinen testaus Seuraavissa luvuissa esitellään tilastollisia testejä, joilla voidaan tutkia kahden muuttujan välistä korrelaatiota ja sen tilastollisesta merkitsevyyttä, tutkia ovatko kahden muuttujan jakaumat samanlaisia ja ovatko kahden muuttujan varianssit tai keskiarvot yhtä suuria. Käytettävät testit ovat kaikki epäparametrisiä, eivätkä oleta, että testattavat muuttujat olisivat normaalisti jakautuneita. Korrelaatiotesti perustuu Spearmanin järjestyskorrelaatiokertoimeen. Jakaumien vertaamiseen käytetään Barnardin testiä sekä Anderson-Darlingin testiä. Varianssien vertaamiseen käytetään Flignerin testiä, ja keskiarvojen vertaamiseen Wilcoxonin testiä. Useimpien testien esittelyyn käytetään rairuohoaineistoa. Tämän lisäksi tarvitaan hiusten väri -aineisto, joka voidaan ladata suoraan Internetistä komennolla: >hiukset<read.table("http://koti.mbnet.fi/tuimala/oppaat/r/data/hai rcolor.txt", header=true) Aineisto koostuu viidensadan naisen hiusten pituus ja värihavainnoista. Havainnot, jotka on merkitty nollalla merkitsevät vaaleita tai lyhyitä hiuksia. Ykkösellä koodatut havainnot puolestaan tarkoittavat joko tummia tai pitkiä hiuksia. 83

92

93 R- K I E L E N PERUSTEE T Korrelaatiotesti Korrelaatio mittaa kahden muuttujan lineaarisen riippuvuuden voimakkuutta. Tässä luvussa esitellään Spearmanin järjestyskorrelaatiokerroin ja sen merkitsevyyden testaaminen. Korrelaatiokertoimen laskeminen R Commander:lla Korrelaatiokerroin lasketaan valikon Statistics valinnalla Summaries-> Correlation test. Avautuvan ikkunan yläreunasta valitaan ne taulukon sarakkeet, joiden välille korrelaatiokerroin halutaan laskea. Lisäksi valitaan korrelaatiotyypiksi Spearman rank-order. Tässä laskemme Spearmanin korrelaatiokertoimen päivien 6 ja 7 pituusmittausten välille: Tulokset tulostuvat R Commander:in tulostekenttään: 85

94 KORRELAATIO Spearman's rank correlation rho data: rairuoho$day6 and rairuoho$day7 S = , p-value = 1.363e-12 alternative hypothesis: true rho is not equal to 0 sample estimates: rho Tulosten tulkinta on tässä tapauksessa melko helppoa. Testi testaa hypoteesia, että korrelaatiokerroin eroaa nollasta. Testisuureen arvo löytyy tulosteesta kohdasta S = , ja sitä vastaava p-arvo kohdasta pvalue = 1.363e-12. Koska p-arvo on varsin pieni, eroaa korrelaatiokerroin siis nollasta. Korrelaatiokertoimen arvo löytyy tulosteen kohdasta rho ja on eli varsin korkea. Korrelaatiokertoimen laskeminen komentoriviltä Korrelaatiokertoimen laskeminen ja testaaminen tapahtuu komennolla cor.test(). Komennolle tulee antaa kolme argumenttia, kaksi taulukon saraketta, jotka sisältävät havainnot sekä kolmas argumentti method, joka määrittelee, mikä korrelaatiokerroin lasketaan. Tässä argumentti method saa siis arvon spearman, koska sillä saadaan laskettua juuri haluamamme epäparametrinen korrelaatiokerroin. >cor.test(rairuoho$day7, rairuoho$day6, method="spearman") Komennon tuloste on identtinen jo yllä esitellyn R Commander:lla tuotetun tulosteen kanssa. 86

95 R- K I E L E N PERUSTEE T Homogeenisuus- ja riippuvuustestit Homogeenisuustesteillä tutkitaan ovatko kahdesta eri populaatiosta kerätyt havainnot peräisin samasta jakaumasta. Riippuvuustesteillä tutkitaan, riippuvatko esimerkiksi kahden muuttujan arvot jollakin tavalla toisistaan. Kahden jatkuvan muuttujan homogeenisuutta voidaan tutkia Anderson-Darlingin testillä. Testi vertaa muuttujien jakaumien muotoa toisiinsa. Useimmiten jakaumien yhteensopivuuden testaamiseen on käytetty Kolmogorov-Smirnovin testiä, mutta siihen liittyy joitakin hankalia rajoittavia oletuksia, jotka harvoin käytännössä toteutuvat. Anderson-Darlingin testi soveltuu löyhempien oletustensa vuoksi kokeelliseen tutkimukseen Kolmogorov-Smirnovin testiä paremmin. Riippuvuutta voidaan testata Barnardin testillä. Barnardin testi soveltuu parhaiten taulukoille, joissa on kaksi saraketta ja kaksi riviä. Perinteisesti tällaisten taulukoiden analysointiin on käytetty Fisherin eksaktia testiä, mutta se olettaa, että sekä rivi- että sarakesummat on kiinnitetty ennen tukimusta, mikä ei käytännössä juuri koskaan toteudu edes kokeellisessa tutkimuksessa. Anderson-Darlingin testi komentoriviltä R Commander ei tarjoa Anderson-Darlingin testiä, joten se on laskettava komentoriviltä. Seuraavassa verrataan rairuohon seitsemännen päivän pituusmittauksia vesi- ja ravinnekäsittelyissä. Poimitaan aluksi uusiksi muuttujiksi vesi- ja ravinneviljelmien havainnot: >ravinne<-rairuoho$day7[rairuoho$treatment=="nutrient"] >vesi<-rairuoho$day7[rairuoho$treatment=="water"] Anderson-Darlingin testi tehdään tämän jälkeen komennolla adk.test(), joka löytyy laajennuspaketista adk. Jos pakettia ei ole aiemmin asennettu, se tulee ennen testin tekemistä asentaa, kuten luvussa R:n asentaminen on kuvattu. Aluksi ladataan kyseinen laajennuspaketti muistiin, minkä jälkeen komennolle annetaan argumenteiksi eri käsittelyiden havaintoarvot: 87

96 RIIPPUVUUSTESTIT >library(adk) >adk.test(ravinne, vesi) Komento tulostaa testin tuloksen ruudulle: Anderson-Darling k-sample test. Number of samples: 2 Sample sizes: Total number of values: 48 Number of unique values: 35 Mean of Anderson Darling Criterion: 1 Standard deviation of Anderson Darling Criterion: T = (Anderson Darling Criterion - mean)/sigma Null Hypothesis: All samples come from a common population. t.obs P-value extrapolation not adj. for ties adj. for ties Tulosteessa on ylimpänä kerrottu, että testissä verrattiin kahta populaatiota, joissa kummassakin oli 24 havaintoa. Yhteensä havaintoja oli 48, joista keskenään erilaisia oli 35. Alimpana on raportoitu testisuureen arvot (t.obs) ja niitä vastaavat p-arvot taulukossa. Testisuure ja sitä vastaava p-arvo on laskettu erikseen tapaukselle, jossa aineistossa ei esiinny samoja arvoja useampaan kertaan, ja tapaukselle, jossa samoja arvoja esiintyy useampia kertoja. Rairuohoaineiston tapauksessa tulkitaan siis alempaa taulukon riviä, koska muutamat arvot esiintyivät aineistossa useampaan kertaan. Riviltä nähdään, että testin p-arvo on , mistä voidaan vetää johtopäätös, että ravinne- ja vesipopulaatioiden havainnot eivät ole peräisin samasta jakaumasta. Barnardin testi komentoriviltä R Commander ei tarjoa Barnardin testiä, joten seuravassa testi lasketaan komentoriviltä. Barnardin testiä ei löydy tällä hetkellä mistään laajennuspaketista, mutta seuraavassa käytetään Peter Calhounin ohjelmoimaa komentoa, joka ladataan R:ään suoraan Internetistä komennolla: >source("http://koti.mbnet.fi/tuimala/oppaat/r/koodit/barn ardtest.r") 88

97 R- K I E L E N PERUSTEE T Seuraavassa testataan, liittyvätkö naisilla hiusten pituus ja väri toisiinsa. Ennen testin tekemistä on aineisto ristiintaulukoitava komennolla table(). Tämän jälkeen testi ajetaan taulukolle komennolla Barnardextest(): >Barnardextest(table(hiukset$len, hiukset$color), to.plot=false) Komennon ajaminen kestää pitkään, mutta tulosten valmistuttua ruudulle tulostuu seuraava tulos: $contingency.table A B A B $Wald.Statistic [1] $Nuisance.parameter numeric(0) $p.value.one.tailed numeric(0) Tulosteen kohdassa contingency.table on syötteenä käytetty taulukko. Testisuure on tulosteen kohdassa Wald.Statistic, ja sitä vastaava p-arvo kohdassa p.value.one.tailed. Koska p-arvo on hyvin pieni, voidaan tulkita, että naisilla hiusten pituus ja väri riippuvat toisistaan. 89

98

99 R- K I E L E N PERUSTEE T Varianssitesti Varianssitestillä voidaan selvittää, ovatko kahden otoksen varianssit yhtä suuret. Seuraavassa esimerkissä käytetään Flignerin testiä, joka on varsin hyvä varianssitesti, sillä se antaa luotettavia tuloksia, vaikkei testattava muuttuja olisikaan normaalisti jakautunut. Flignerin testi komentoriviltä R Commander ei tarjoa Flignerin testiä, joten testi ajetaan komentoriviltä. Seuraavassa verrataan ravinne- ja vesikäsiteltyjen rairuohoviljelmien pituuksien varianssia seitsemäntenä päivänä. Ennen testin tekemistä eri käsittelyiden havainnot poimitaan erikseen: >ravinne<-rairuoho$day7[rairuoho$treatment=="nutrient"] >vesi<-rairuoho$day7[rairuoho$treatment=="water"] Flignerin testi tehdään komennolla fligner.test(). Sille annetaan parametreiksi eri käsittelyiden pituusmittaukset: >fligner.test(ravinne, vesi) Testin antama tuloste on lyhyt: Fligner-Killeen test of homogeneity of variances data: ravinne and vesi Fligner-Killeen:med chi-squared = , df = 18, pvalue = Testisuureen arvo on , vapausasteiden määrä on 18, ja näitä vastaava p-arvo on Koska p-arvo on melko korkea, jää nollahypoteesi voimaan, mikä tarkoittaa että ravinne- ja vesikäsiteltyjen viljelmien pituusmittausten varianssien voidaan katsoa olevan yhtä suuria. 91

100

101 R- K I E L E N PERUSTEE T Keskiarvotestit Keskiarvotesteillä voidaan selvittää, ovatko kahden otoksen keskiarvot yhtäsuuret. Tässä esimerkissä käytetään Wilcoxonin testiä kahden riippumattoman otoksen keskiarvojen vertaamiseen. Wilcoxonin testi tunnetaan myös nimellä Mann-Whitneyn U-testi. Wilcoxonin testiä käytetään seuraavissa esimerkeissä myös parittaisten mittausten tapauksessa. Testin huonona puolena on, että jos verrattavien ryhmien varianssit poikkeavat toisistaan, on testin voima heikko, eikä mahdollista keskiarvojen eroa saadakaan selville, vaikka eroa todella olisi. Ennen testin soveltamista onkin syytä selvittää, ovatko verrattavien ryhmien varianssit yhtä suuret. Tähän voidaan käyttää esimerkiksi edellisessä luvussa esiteltyä Flignerin testiä. Kahden otoksen Wilcoxonin testi R Commander:lla Wilcoxonin testi lasketaan R Commanderin valikon Statistics valinnalla Non-parametric tests->two-sample Wilcoxon test. Avautuvan ikkunan vasemmanpuoleisesta valintalaatikosta valitaan muuttuja, joka määrittelee mihin ryhmiin havainnot kuuluvat. Tässä tapauksessa verrataan ravinne- ja vesikäsittelyryhmiä toisiinsa. Oikeanpuoleisesta valintalaatikosta valitaan vastemuuttuja, jonka havaintoarvojen keskiarvoa eri ryhmissä verrataan toisiinsa. Tässä tapauksessa verrataan rairuohon seitsemännen päivän pituusmittauksia ravinne- ja vesikäsitellyillä viljelmissä toisiinsa. Kun tarvittavat valinnat on tehty, ja painetaan valintaikkunan alareunassa sijaitsevaa OK-painiketta: 93

102 KESKIARVOTE STIT Testin tulos ilmestyy R Commander:in tulosikkunaan: Wilcoxon rank sum test with continuity correction data: day7 by treatment W = 433.5, p-value = alternative hypothesis: true location shift is not equal to 0 Tulosteen alimmilla riveillä kerrotaan, että testin vaihtoehtoinen hypoteesi on, ettei eri ryhmien keskiarvojen ero ole nolla. Testisuureen arvo on 433.5, ja sitä vastaava p-arvo Koska p-arvo on varsin pieni, vaihtoehtoinen hypoteesi astuu voimaan eli ryhmien keskiarvoissa voidaan sanoa olevan eroa. Kahden otoksen Wilcoxonin testi komentoriviltä Poimitaan eri käsittelyiden havainnot erikseen ennen testin tekemistä: >ravinne<-rairuoho$day7[rairuoho$treatment=="nutrient"] >vesi<-rairuoho$day7[rairuoho$treatment=="water"] Tämän jälkeen testi tehdään komennolla wilcox.test(): 94

103 R- K I E L E N PERUSTEE T > wilcox.test(ravinne, vesi) Testin tuloste on identtinen yllä esitetyn R Commander:lla lasketun tuloksen kanssa. Riippuvien otosten Wilcoxonin testi R Commander:lla Riippuvien otosten testi lasketaan R Commader:in valikon Statistics valinnalla Non-parametric tests->paired Wilcoxon test. Valintalaatikoista valitaan ne muuttujat, joita halutaan verrata. Rairuohoaineiston tapauksessa eri päivinä tehdyt mittaukset muodostavat riippuvat otokset. Seuraavassa verrataan päivien 6 ja 7 pituusmittauksia toisiinsa. Kun halutut muuttujat on valittu, ajetaan testi painamalla OK-painiketta. Tuloste löytyy R Commander:in tulosteikkunasta: Wilcoxon signed rank test with continuity correction data: rairuoho$day6 and rairuoho$day7 V = 4.5, p-value = 3.261e-09 alternative hypothesis: true location shift is not equal to 0 95

Muuttujien määrittely

Muuttujien määrittely Tarja Heikkilä Muuttujien määrittely Määrittele muuttujat SPSS-ohjelmaan lomakkeen kysymyksistä. Harjoitusta varten lomakkeeseen on muokattu kysymyksiä kahdesta opiskelijoiden tekemästä Joupiskan rinneravintolaa

Lisätiedot

Tilastolliset ohjelmistot 805340A. Pinja Pikkuhookana

Tilastolliset ohjelmistot 805340A. Pinja Pikkuhookana Tilastolliset ohjelmistot 805340A Pinja Pikkuhookana Sisältö 1 SPSS 1.1 Yleistä 1.2 Aineiston syöttäminen 1.3 Aineistoon tutustuminen 1.4 Kuvien piirtäminen 1.5 Kuvien muokkaaminen 1.6 Aineistojen muokkaaminen

Lisätiedot

Ryhmäkirjeen hyödyntäminen

Ryhmäkirjeen hyödyntäminen Ryhmäkirjeen hyödyntäminen hannele.rajaniemi@jyu.fi konkkola@cc.jyu.fi Sisältö Joukkokirje-toiminnon (Wordin ja Excelin yhteiskäytön) periaatteet Excel tietolähteenä tutuksi (valmis harjoitustiedosto)

Lisätiedot

Tarkista vielä ennen analysoinnin aloittamista seuraavat seikat:

Tarkista vielä ennen analysoinnin aloittamista seuraavat seikat: Yleistä Tilastoapu on Excelin sisällä toimiva apuohjelma, jonka avulla voit analysoida tilastoaineistoja. Tilastoapu toimii Excelin Windows-versioissa Excel 2007, Excel 2010 ja Excel 2013. Kun avaat Tilastoavun,

Lisätiedot

TUTKIMUSOPAS. SPSS-opas

TUTKIMUSOPAS. SPSS-opas TUTKIMUSOPAS SPSS-opas Johdanto Tässä oppaassa esitetään SPSS-tilasto-ohjelman alkeita, kuten Excel-tiedoston avaaminen, tunnuslukujen laskeminen ja uusien muuttujien muodostaminen. Lisäksi esitetään esimerkkien

Lisätiedot

KÄYTTÖOHJE. Servia. S solutions

KÄYTTÖOHJE. Servia. S solutions KÄYTTÖOHJE Servia S solutions Versio 1.0 Servia S solutions Servia Finland Oy PL 1188 (Microkatu 1) 70211 KUOPIO puh. (017) 441 2780 info@servia.fi www.servia.fi 2001 2004 Servia Finland Oy. Kaikki oikeudet

Lisätiedot

KAAVAT. Sisällysluettelo

KAAVAT. Sisällysluettelo Excel 2013 Kaavat Sisällysluettelo KAAVAT KAAVAT... 1 Kaavan tekeminen... 2 Kaavan tekeminen osoittamalla... 2 Kaavan kopioiminen... 3 Kaavan kirjoittaminen... 3 Summa-funktion lisääminen... 4 Suorat eli

Lisätiedot

Kaakkois-Suomen Ammattikorkeakoulu Oy Mikkelin Ammattikorkeakoulu Oy Kymenlaakson Ammattikorkeakoulu Oy

Kaakkois-Suomen Ammattikorkeakoulu Oy Mikkelin Ammattikorkeakoulu Oy Kymenlaakson Ammattikorkeakoulu Oy Opiskelijoiden OneDriveohje Kaakkois-Suomen Ammattikorkeakoulu Oy Mikkelin Ammattikorkeakoulu Oy Kymenlaakson Ammattikorkeakoulu Oy Ohjeen nimi Opiskelijoiden OneDrive-ohje Vastuuhenkilö Mari Jokiniemi

Lisätiedot

Excel-taulukkoon X- ja Y-sarakkeisiin tallennettujen koordinaattien muuntaminen paikkatietokohteiksi

Excel-taulukkoon X- ja Y-sarakkeisiin tallennettujen koordinaattien muuntaminen paikkatietokohteiksi Excel-taulukkoon X- ja Y-sarakkeisiin tallennettujen koordinaattien muuntaminen paikkatietokohteiksi Esimerkkinä Excel-taulukkona ladattavat Helsingin pysäköintilippuautomaatit Viimeksi muokattu 27. huhtikuuta

Lisätiedot

Coolselector Asennusohje

Coolselector Asennusohje MAKING MODERN LIVING POSSIBLE Coolselector Asennusohje Täydellinen valinta on vain muutaman klikkauksen päässä www.danfoss.fi/kylma Yleiset vaatimukset Windows XP asennus Windows 7 asennus Asennuksen poisto

Lisätiedot

Valitse aineisto otsikoineen maalaamalla se hiirella ja kopioimalla (Esim. ctrl-c). Vaihtoehtoisesti, Lataa CSV-tiedosto

Valitse aineisto otsikoineen maalaamalla se hiirella ja kopioimalla (Esim. ctrl-c). Vaihtoehtoisesti, Lataa CSV-tiedosto Versio k15 Näin laadit ilmastodiagrammin Libre Officen taulukkolaskentaohjelmalla. Ohje on laadittu käyttäen Libre Officen versiota 4.2.2.1. Voit ladata ohjelmiston omalle koneellesi osoitteesta fi.libreoffice.org.

Lisätiedot

Valitse ruudun yläosassa oleva painike Download Scilab.

Valitse ruudun yläosassa oleva painike Download Scilab. Luku 1 Ohjeita ohjelmiston Scilab käyttöön 1.1 Ohjelmiston lataaminen Ohjeet ohjelmiston lataamiseen Windows-koneelle. Mene verkko-osoitteeseen www.scilab.org. Valitse ruudun yläosassa oleva painike Download

Lisätiedot

Tiedostojen lataaminen netistä ja asentaminen

Tiedostojen lataaminen netistä ja asentaminen s. 1/5 Tiedostojen lataaminen netistä ja asentaminen Yleistä Internetissä on paljon hyödyllisiä ilmaisohjelmia, jotka voi ladata ja asentaa omalle koneelle. Osa ohjelmista löytyy suomenkielisiltä sivuilta,

Lisätiedot

PÄIVITÄ TIETOKONEESI

PÄIVITÄ TIETOKONEESI PÄIVITÄ TIETOKONEESI SAMPOLAN KIRJASTO TIETOTORI Sammonkatu 2 33540 Tampere 040 800 7816 tietotori.sampola@tampere.fi PÄIVITÄ TIETOKONEESI 2(16) Sisällys 1. Mihin päivityksiä tarvitaan?... 3 1.1. Windowsin

Lisätiedot

ASENNUS- JA KÄYTTÖOHJE

ASENNUS- JA KÄYTTÖOHJE ASENNUS- JA KÄYTTÖOHJE YKSIKKÖHINTA SOPIMUKSEN TOTEUTUNEET MÄÄRÄT-SOVELLUS CMPRO5 VERSIO 2.8 PÄIVITETTY HEINÄKUU 2010 COPYRIGHT 2010 ARTEMIS FINLAND OY. ALL RIGHTS RESERVED. KÄYTTÖOHJE SIVU 2 (12) SISÄLLYSLUETTELO

Lisätiedot

Nero 7:n Windows Vista TM -tuki

Nero 7:n Windows Vista TM -tuki Nero 7:n Windows Vista TM -tuki Nero AG Sivu 1 Tietoja tekijänoikeudesta ja tavaramerkistä Tämä opaskirjanen ja sen sisältö on Nero AG:n omaisuutta ja suojattu tekijänoikeudella. Kaikki oikeudet pidätetään.

Lisätiedot

Vedä ja pudota Maamittauslaitoksen JPEG2000-ortoilmakuva GeoTIFF-muotoon

Vedä ja pudota Maamittauslaitoksen JPEG2000-ortoilmakuva GeoTIFF-muotoon Vedä ja pudota Maamittauslaitoksen JPEG2000-ortoilmakuva GeoTIFF-muotoon Jukka Rahkonen http://latuviitta.org Viimeksi muutettu 16. lokakuuta 2012 Tiivistelmä Latuviitta.ogr -sivuston palautteessa kaivattiin

Lisätiedot

MultiSave - käyttö ja käyttöönotto

MultiSave - käyttö ja käyttöönotto Tämä ohje on otos oikeusministeriön julkaisusta OpenOffice.org versio 2. Asennuskäsikirja. Se on ilmestynyt sarjassa Oikeusministeriön toiminta ja hallinto numerolla 2006:27. Koko julkaisun verkkoversio

Lisätiedot

Ohjeet asiakirjan lisäämiseen arkistoon

Ohjeet asiakirjan lisäämiseen arkistoon Ohjeet asiakirjan lisäämiseen arkistoon 1. Jos koneellesi ei vielä ole asennettu Open Office ohjelmaa, voit ladata sen linkistä joka löytyy Arkisto => Asiakirjapohjat sivulta seuran kotisivuilta. Jos ohjelma

Lisätiedot

PIKAOHJE USEIDEN VASTAANOTTAJIEN LISÄÄMISEEN YHTIÖN JAKELULISTOILLE

PIKAOHJE USEIDEN VASTAANOTTAJIEN LISÄÄMISEEN YHTIÖN JAKELULISTOILLE PIKAOHJE USEIDEN VASTAANOTTAJIEN LISÄÄMISEEN YHTIÖN JAKELULISTOILLE JOHDANTO Tämä pikaohje on suunniteltu auttamaan useiden vastaanottajien lisäämisessä yhtiön jakelulistoille GlobeNewswire-järjestelmässä

Lisätiedot

Ohjelmoinnin perusteet Y Python

Ohjelmoinnin perusteet Y Python Ohjelmoinnin perusteet Y Python T-106.1208 2.3.2011 T-106.1208 Ohjelmoinnin perusteet Y 2.3.2011 1 / 39 Kertausta: tiedoston avaaminen Kun ohjelma haluaa lukea tai kirjoittaa tekstitiedostoon, on ohjelmalle

Lisätiedot

Office 2013 - ohjelmiston asennusohje

Office 2013 - ohjelmiston asennusohje Office 2013 - ohjelmiston asennusohje Tämän ohjeen kuvakaappaukset on otettu asentaessa ohjelmistoa Windows 7 käyttöjärjestelmää käyttävään koneeseen. Näkymät voivat hieman poiketa, jos sinulla on Windows

Lisätiedot

ASENNUS JA KÄYTTÖOHJE

ASENNUS JA KÄYTTÖOHJE ASENNUS JA KÄYTTÖOHJE YKSIKKÖHINTALUETTELON HINNOITTELU SOVELLUS CMPRO5 VERSIO 2.8 PÄIVITETTY HEINÄKUU 2010 COPYRIGHT 2010 ARTEMIS FINLAND OY. ALL RIGHTS RESERVED. YH-LUETTELON HINNOITTELU SISÄLLYSLUETTELO

Lisätiedot

1 Tivax siirto uuteen koneeseen

1 Tivax siirto uuteen koneeseen Tivax siirto uuteen koneeseen 1 1 Tivax siirto uuteen koneeseen 1.1 Tivax ohjelman asentaminen Huom. Siirrossa mahdollisesti esiintyvien ongelmien ratkaisu on veloituksetonta ainoastaan asiakkaille, joilla

Lisätiedot

Asiointipalvelun ohje

Asiointipalvelun ohje Asiointipalvelun ohje Yleistä 1. Kirjautuminen 2. Yhteystiedot 3. Vastaustavan valinta 1. Yleistä 2. Palkkatietojen lataaminen tiedostosta 4. Lomake 1. Yleistä 2. Linkit ja vastaajan tiedot 3. Lomakekäsittely

Lisätiedot

Microsoft Security Essentials (MSE) asennuspaketin lataaminen verkosta

Microsoft Security Essentials (MSE) asennuspaketin lataaminen verkosta Etusivu > Tietohallintokeskus > Ohjeet > Tutoriaalit > Virustorjunta (Microsoft Security Essentials) Virustorjunta (Microsoft Security Essentials) Ohjeet Microsoft Security Essentials -virustorjuntaohjelman

Lisätiedot

Excel syventävät harjoitukset 31.8.2015

Excel syventävät harjoitukset 31.8.2015 Yleistä Excel on taulukkolaskentaohjelma. Tämä tarkoittaa sitä että sillä voi laskea laajoja, paljon laskentatehoa vaativia asioita, esimerkiksi fysiikan laboratoriotöiden koetuloksia. Excel-ohjelmalla

Lisätiedot

4.1 Frekvenssijakauman muodostaminen tietokoneohjelmilla

4.1 Frekvenssijakauman muodostaminen tietokoneohjelmilla 4 Aineiston kuvaaminen numeerisesti 1 4.1 Frekvenssijakauman muodostaminen tietokoneohjelmilla Tarkastellaan lasten syntymäpainon frekvenssijakauman (kuva 1, oikea sarake) muodostamista Excel- ja SPSS-ohjelmalla.

Lisätiedot

ASENNUSOHJEET INTERNET-ASENNUS. Navita Yritysmalli. YHTEYSTIEDOT Visma Solutions Oy Mannerheiminkatu 5 53900 LAPPEENRANTA Puh.

ASENNUSOHJEET INTERNET-ASENNUS. Navita Yritysmalli. YHTEYSTIEDOT Visma Solutions Oy Mannerheiminkatu 5 53900 LAPPEENRANTA Puh. 1/5 ASENNUSOHJEET INTERNET-ASENNUS Navita Yritysmalli YHTEYSTIEDOT Visma Solutions Oy Mannerheiminkatu 5 53900 LAPPEENRANTA Puh. 010 7564 986 Käyttöönotto Matti Sihvo Koulutus Jan-Markus Viikari LAITEVAATIMUKSET

Lisätiedot

Henkilö- ja koulutusrekisterin asennusohje

Henkilö- ja koulutusrekisterin asennusohje Henkilö- ja koulutusrekisterin asennusohje Ohjelmaversio 1.0 Dokumenttiversio 1.0 2 Ohjelman lataaminen Voit ladata henkilöstö- ja koulutusrekisteriohjelman asennuspaketin EduSetup.exe sivustolta valitsemalla

Lisätiedot

Sisällys Clerica Web-sovellusten käytön aloittaminen 2

Sisällys Clerica Web-sovellusten käytön aloittaminen 2 Sisällys Clerica Web-sovellusten käytön aloittaminen 2 Kirjautuminen järjestelmään 2 Myyntilaskut 2 Ostolaskujen käsittely 4 Uuden laskun syöttö 6 Palkkailmoituslomake 8 Palkkailmoituksesta kopio 9 Henkilötietojen

Lisätiedot

SPSS-pikaohje. Jukka Jauhiainen OAMK / Tekniikan yksikkö

SPSS-pikaohje. Jukka Jauhiainen OAMK / Tekniikan yksikkö SPSS-pikaohje Jukka Jauhiainen OAMK / Tekniikan yksikkö SPSS on ohjelmisto tilastollisten aineistojen analysointiin. Hyvinvointiteknologian ATK-luokassa on asennettuna SPSS versio 13.. Huom! Ainakin joissakin

Lisätiedot

Luku 7 Uusien Mallien Tiedostot

Luku 7 Uusien Mallien Tiedostot Luku 7 Uusien Mallien Tiedostot Kaikki ZoomTextin asetukset voidaan tallentaa ja palauttaa käyttämällä mallitiedostoja. Mallitiedostot kontrolloivat kaikkia ZoomTextin toimintoja mukaan lukien suurennustasot,

Lisätiedot

KIITOS RICA OPTIMOINTIOHJELMAN VALITSEMISESTA

KIITOS RICA OPTIMOINTIOHJELMAN VALITSEMISESTA KIITOS RICA OPTIMOINTIOHJELMAN VALITSEMISESTA Asennusohjeiden sisältö 1. RICA optimointiohjelmoinnin periaate isoftloaderilla... 2 2. RICA isoftloader toimituspaketin sisältö... 3 3. isoftloader Sync-ohjelmiston

Lisätiedot

Tikon Ostolaskujenkäsittely/Web-myyntilaskutus versio 6.4.0

Tikon Ostolaskujenkäsittely/Web-myyntilaskutus versio 6.4.0 Toukokuu 2014 1 (11) Tikon Ostolaskujenkäsittely/Web-myyntilaskutus versio 6.4.0 Päivitysohje Toukokuu 2014 2 (11) Sisällysluettelo 1. Tehtävät ennen versiopäivitystä... 3 1.1. Ohjelmistomuutosten luku...

Lisätiedot

MEM-O-MATIC. 6800 järjestelmä

MEM-O-MATIC. 6800 järjestelmä MEM-O-MATIC 6800 järjestelmä Ohjeet Windows yhdysohjelmalle / 6800 yhdysohjelman käyttöohje זתתתתת Windows yhdysohjelman asennus tietokoneelle Tee uusi kansio esimerkiksi nimellä MEMO kovalevyllesi. Kopio

Lisätiedot

VERKKOVELHO-YLLÄPITOTYÖKALUN KÄYTTÖOHJE

VERKKOVELHO-YLLÄPITOTYÖKALUN KÄYTTÖOHJE VERKKOVELHO-YLLÄPITOTYÖKALUN KÄYTTÖOHJE 1. SISÄÄN KIRJAUTUMINEN Sisään kirjautuminen VerkkoVelho-ylläpitotyökaluun tapahtuu yrityksesi osoitteessa www.omaosoitteesi.fi/yllapito, esim. www.verkkovelho.fi/yllapito.

Lisätiedot

Epooqin perusominaisuudet

Epooqin perusominaisuudet Epooqin perusominaisuudet Huom! Epooqia käytettäessä on suositeltavaa käyttää Firefox -selainta. Chrome toimii myös, mutta eräissä asioissa, kuten äänittämisessä, voi esiintyä ongelmia. Internet Exploreria

Lisätiedot

FTP -AINEISTOSIIRRON OHJE PC / MAC Ympäristö

FTP -AINEISTOSIIRRON OHJE PC / MAC Ympäristö FTP -AINEISTOSIIRRON OHJE PC / MAC Ympäristö Versio 1.0 Tiedostonsiirto FTP -menetelmällä Lahden Väriasemoinnilla on käytössä suurempien tiedostojen siirtoa varten oma FTP -yhteys. Tällä menetelmällä saadaan

Lisätiedot

Enigmail-opas. Asennus. Avainten hallinta. Avainparin luominen

Enigmail-opas. Asennus. Avainten hallinta. Avainparin luominen Enigmail-opas Enigmail on Mozilla Thunderbird ja Mozilla Seamonkey -ohjelmille tehty liitännäinen GPG-salausohjelmiston käyttöä varten. Sitä käytetään etenkin Thunderbirdin kanssa sähköpostin salaamiseen

Lisätiedot

Uuden työtilan luonti

Uuden työtilan luonti Uuden työtilan luonti 1. Valitaan Uusi työtila vasemmanpuoleisesta valikosta 2. Valitaan Tyhjä työtila aukeavasta valikosta. Tämä toiminto luo uuden tyhjän työtilan. 3. Kun uusi työtila on luotu, aukeaa

Lisätiedot

Lyseopaneeli 2.0. Käyttäjän opas

Lyseopaneeli 2.0. Käyttäjän opas Lyseopaneeli 2.0 Käyttäjän opas 1. Esittely Lyseopaneeli on Oulun Lyseon lukion käyttäjätietojen hallintapalvelu jonka tarkoitus on niputtaa yhteen muutamia oleellisia toimintoja. 2. Yleistä paneelin käytöstä

Lisätiedot

Sonera Viestintäpalvelu VIP VIP Laajennettu raportointi Ohje

Sonera Viestintäpalvelu VIP VIP Laajennettu raportointi Ohje Sonera Viestintäpalvelu VIP VIP Laajennettu raportointi Ohje Sisällysluettelo VIP Laajennettu raportointi... 3 Luo raportti Laajennetun raportoinnin työkaluilla... 4 Avaa Laajennettu raportointi... 4 Valitse

Lisätiedot

Mikäli olet saanut e-kirjan latauslinkin sähköpostilla, seuraa näitä ohjeita e-kirjan lataamisessa.

Mikäli olet saanut e-kirjan latauslinkin sähköpostilla, seuraa näitä ohjeita e-kirjan lataamisessa. E-kirjan latausohje Mikäli olet saanut e-kirjan latauslinkin sähköpostilla, seuraa näitä ohjeita e-kirjan lataamisessa. Pikaohjeet 1. Varmista että tietokoneellesi on asennettu Adobe Digital Editions ohjelma.

Lisätiedot

Aditro Tikon ostolaskujen käsittely versio 6.2.0 SP1

Aditro Tikon ostolaskujen käsittely versio 6.2.0 SP1 Tammikuu 2013 1 (7) Aditro versio 6.2.0 SP1 Päivitysohje Tammikuu 2013 2 (7) Sisällysluettelo 1. Tehtävät ennen versiopäivitystä... 3 1.1. Ohjelmistomuutosten luku... 3 1.2. Aditro Pankkipalvelut yhteensopiva

Lisätiedot

SeaMonkey pikaopas - 1

SeaMonkey pikaopas - 1 SeaMonkey pikaopas SeaMonkey on ilmainen ja yksinkertainen www-sivujen teko-ohjelma. Sillä on kätevää koostaa yksinkertaisia sivuja ilman, että täytyy tietää jotain HTML-koodista. Tämä opas esittelee sivuston

Lisätiedot

Octave-opas. Mikä on Octave ja miksi? Asennus

Octave-opas. Mikä on Octave ja miksi? Asennus Octave-opas Mikä on Octave ja miksi? Asennus Käynnistys ja käyttöliittymä Komennot tiedostojen hallintaan SciTE-editor.m-tiedostot Ohjeita muualla Mikä on Octave ja miksi? Octave on numeeriseen laskentaan

Lisätiedot

Aditro Tikon ostolaskujen käsittely versio 6.2.0

Aditro Tikon ostolaskujen käsittely versio 6.2.0 Lokakuu 2012 1 (9) Aditro versio 6.2.0 Päivitysohje Lokakuu 2012 2 (9) Sisällysluettelo 1. Tehtävät ennen versiopäivitystä... 3 1.1. Ohjelmistomuutosten luku... 3 1.2. Aditro Pankkipalvelut yhteensopiva

Lisätiedot

Tikon Ostolaskujenkäsittely/Web-myyntilaskutus versio 6.3.0

Tikon Ostolaskujenkäsittely/Web-myyntilaskutus versio 6.3.0 Toukokuu 2013 1 (10) Tikon Ostolaskujenkäsittely/Web-myyntilaskutus versio 6.3.0 Päivitysohje Copyright Aditro 2013 Toukokuu 2013 2 (10) Sisällysluettelo 1. Tehtävät ennen versiopäivitystä... 3 1.1. Ohjelmistomuutosten

Lisätiedot

Ohjelmistopäivitykset

Ohjelmistopäivitykset Ohjelmistopäivitykset Käyttöopas Copyright 2007 Hewlett-Packard Development Company, L.P. Windows on Microsoft Corporationin Yhdysvalloissa rekisteröimä tavaramerkki. Tässä olevat tiedot voivat muuttua

Lisätiedot

Maastotietokannan torrent-jakelun shapefile-tiedostojen purkaminen zip-arkistoista Windows-komentojonoilla

Maastotietokannan torrent-jakelun shapefile-tiedostojen purkaminen zip-arkistoista Windows-komentojonoilla Maastotietokannan torrent-jakelun shapefile-tiedostojen purkaminen zip-arkistoista Windows-komentojonoilla Viimeksi muokattu 5. toukokuuta 2012 Maastotietokannan torrent-jakeluun sisältyy yli 5000 zip-arkistoa,

Lisätiedot

MICROSOFT EXCEL 2010

MICROSOFT EXCEL 2010 1 MICROSOFT EXCEL 2010 Taulukkolaskentaohjelman jatkokurssin tärkeitä asioita 2 Taulukkolaskentaohjelmalla voit Käyttää tietokonetta ruutupaperin ja taskulaskimen korvaajana Laatia helposti ylläpidettäviä

Lisätiedot

AutoFutur / KoneFutur verkkojärjestelmän päivitysohje

AutoFutur / KoneFutur verkkojärjestelmän päivitysohje AutoFutur / KoneFutur verkkojärjestelmän päivitysohje Yleistä Tämä ohje on tarkoitettu käytettäväksi kun käytössäsi on AutoFutur- tai KoneFutur- verkkojärjestelmä. Yhden koneen järjestelmää varten on oma

Lisätiedot

DOORSin Spreadsheet export/import

DOORSin Spreadsheet export/import DOORSin Spreadsheet export/import 17.10.2006 SoftQA Oy http/www.softqa.fi/ Pekka Mäkinen Pekka.Makinen@softqa.fi Tietojen siirto DOORSista ja DOORSiin Yhteistyökumppaneilla ei välttämättä ole käytössä

Lisätiedot

KESKUSTANUORTEN NETTISIVUT- OHJEITA PIIRIYLLÄPITÄJÄLLE 1. KIRJAUTUMINEN

KESKUSTANUORTEN NETTISIVUT- OHJEITA PIIRIYLLÄPITÄJÄLLE 1. KIRJAUTUMINEN KESKUSTANUORTEN NETTISIVUT- OHJEITA PIIRIYLLÄPITÄJÄLLE 1. KIRJAUTUMINEN -Mene osoitteeseen keskustanuoret.fi/user - Kirjoita saamasi käyttäjätunnus ja salasana - Klikkaa yllä olevaa piirisi logoa niin

Lisätiedot

Tilastolliset toiminnot

Tilastolliset toiminnot -59- Tilastolliset toiminnot 6.1 Aineiston esittäminen graafisesti Tilastollisen aineiston tallentamisvälineiksi TI-84 Plus tarjoaa erityiset listamuuttujat L1,, L6, jotka löytyvät 2nd -toimintoina vastaavilta

Lisätiedot

CLOUDBACKUP TSM varmistusohjelmiston asennus

CLOUDBACKUP TSM varmistusohjelmiston asennus Luottamuksellinen JAVERDEL OY CLOUDBACKUP TSM varmistusohjelmiston asennus Copyright 2 (9) SISÄLLYSLUETTELO 1 ASENNUSOHJE WINDOWS KÄYTTÖJÄRJESTELMÄLLÄ VARUSTETTUIHIN LAITTEISIIN... 3 1.1 Yleistä... 3 1.2

Lisätiedot

A-Tiilikate objektikirjasto

A-Tiilikate objektikirjasto A-Tiilikate objektikirjasto 15.1.2014 A-Tiilikate-objektikirjasto toimii ArchiCAD 14, 15, 16 ja 17 -versioissa. Kirjaston käyttöön tarvitaan Graphisoftin Tarvikkeet-laajennus. Tarvikkeet-laajennuksen käyttöönotto

Lisätiedot

Käyttöohje. Versiohistoria: 1.0 7.5.2003 1. versio Mari 1.1 9.5.2003 Kommenttien perusteella korjattu versio

Käyttöohje. Versiohistoria: 1.0 7.5.2003 1. versio Mari 1.1 9.5.2003 Kommenttien perusteella korjattu versio Otus- projektinhallintatyökalu Käyttöohje Versiohistoria: 1.0 7.5.2003 1. versio Mari 1.1 9.5.2003 Kommenttien perusteella korjattu versio Mari Tampere 9. toukokuuta 2003 Kimmo Airamaa, Andreas Asuja,

Lisätiedot

ARKIPÄIVÄN SUOMEA-ohjelma vaatii toimiakseen multimedia-pc:n, jossa on seuraavat tekniset ominaisuudet ja ohjelmat asennettuna.

ARKIPÄIVÄN SUOMEA-ohjelma vaatii toimiakseen multimedia-pc:n, jossa on seuraavat tekniset ominaisuudet ja ohjelmat asennettuna. ASENNUS Ennen ARKIPÄIVÄN SUOMEA-ohjelman käytön aloittamista se on asennettava tietokoneeseen. Asentaminen suoritetaan alla esitettävien ohjeiden mukaisesti. Huom: ARKIPÄIVÄN SUOMEA-ohjelmasta on saatavana

Lisätiedot

POP-UP -IKKUNOIDEN SALLIMINEN

POP-UP -IKKUNOIDEN SALLIMINEN Sivu 1(5) Windows XP SP2 www.procountor.com Windows XP:n Service Pack 2:n (SP2) mukana tulee Internet Explorer 6:een mukaan pop-up ikkunoiden esto toiminto. ProCountor -Taloushallinto-ohjelmistossa voidaan

Lisätiedot

Joonas Ruotsalainen GIT PIKAOPAS. Tutkielma 2011

Joonas Ruotsalainen GIT PIKAOPAS. Tutkielma 2011 1 Joonas Ruotsalainen GIT PIKAOPAS Tutkielma 2011 2 SISÄLTÖ 1. JOHDANTO... 3 2. ASENTAMINEN... 4 3. KÄYTTÖ... 4 3.1 Perusasetukset... 4 3.2 Git:n ottaminen käyttöön projektissa... 5 3.3 Tiedostojen lisääminen

Lisätiedot

8. Väliajat... 14 8.1 Väliaikapisteen lukitus... 15 9. SkyDrive lähtölistat... 16 9.1 SkyDrive kirjautuminen... 16 9.2 Microsoft-tilin varmistus

8. Väliajat... 14 8.1 Väliaikapisteen lukitus... 15 9. SkyDrive lähtölistat... 16 9.1 SkyDrive kirjautuminen... 16 9.2 Microsoft-tilin varmistus SplitTimes Sisällys 1. Yleistä... 3 2. Kilpailut... 3 3. Kilpailun tiedot... 3 3.1 Sarjat-valintanäyttö... 4 3.2 Sarja-näyttö... 5 3.3 Lähtöväli-valintanäyttö... 5 3.4 Kilpailupäivä-valintanäyttö... 6

Lisätiedot

Sähköposti ja uutisryhmät 4.5.2005

Sähköposti ja uutisryhmät 4.5.2005 Outlook Express Käyttöliittymä Outlook Express on windows käyttöön tarkoitettu sähköpostin ja uutisryhmien luku- ja kirjoitussovellus. Se käynnistyy joko omasta kuvakkeestaan työpöydältä tai Internet Explorer

Lisätiedot

MASSER Loader V2.00. käyttö- ja asennusohje 5.5.2014

MASSER Loader V2.00. käyttö- ja asennusohje 5.5.2014 MASSER Loader V2.00 käyttö- ja asennusohje 5.5.2014 Masser Oy Tel. +358 400 904 500 BID No 0665142-9 Jämytie 1 Fax. +358 16 282 554 VAT No. FI06651429 FI-96910 Rovaniemi, Finland Domicile Rovaniemi OHJELMAN

Lisätiedot

SEM1, työpaja 2 (12.10.2011)

SEM1, työpaja 2 (12.10.2011) SEM1, työpaja 2 (12.10.2011) Rakenneyhtälömallitus Mplus-ohjelmalla POLKUMALLIT Tarvittavat tiedostot voit ladata osoitteesta: http://users.utu.fi/eerlaa/mplus Esimerkki: Planned behavior Ajzen, I. (1985):

Lisätiedot

Ohjelmassa henkilön etunimi ja sukunimi luetaan kahteen muuttujaan seuraavasti:

Ohjelmassa henkilön etunimi ja sukunimi luetaan kahteen muuttujaan seuraavasti: 1 (7) Tiedon lukeminen näppäimistöltä Scanner-luokan avulla Miten ohjelma saa käyttöönsä käyttäjän kirjoittamaa tekstiä? Järjestelmässä on olemassa ns. syöttöpuskuri näppäimistöä varten. Syöttöpuskuri

Lisätiedot

Internet Explorer 7 & 8 pop-up asetukset

Internet Explorer 7 & 8 pop-up asetukset Sivu 1(8) Internet Explorer 7 & 8 pop-up asetukset www.procountor.com Internet Explorer 7 ja 8 sisältää pop-up ikkunoiden esto toiminnon. ProCountor -Taloushallintoohjelmistossa voidaan raportit tulostaa

Lisätiedot

17 BUDJETOINTI. Asiakaskohtainen Budjetti. 17.1 Ylläpito-ohjelma. Dafo Versio 10 BUDJETOINTI. Käyttöohje. BudgCust. 17.1.1 Yleistä

17 BUDJETOINTI. Asiakaskohtainen Budjetti. 17.1 Ylläpito-ohjelma. Dafo Versio 10 BUDJETOINTI. Käyttöohje. BudgCust. 17.1.1 Yleistä 17 Asiakaskohtainen Budjetti 17.1 Ylläpito-ohjelma 17.1.1 Yleistä BudgCust Ohjelmalla avataan järjestelmään asiakaskohtaisia budjetteja, jotka annetaan kuukausitasolla (oletus). 17.1.2 Parametrit Ohjelmaa

Lisätiedot

Autentikoivan lähtevän postin palvelimen asetukset

Autentikoivan lähtevän postin palvelimen asetukset Autentikoivan lähtevän postin palvelimen asetukset - Avaa Työkalut valikko ja valitse Tilien asetukset - Valitse vasemman reunan lokerosta Lähtevän postin palvelin (SM - Valitse listasta palvelin, jonka

Lisätiedot

Pikanäppäin Yhdistelmiä. Luku 6 Pikanäppäimet

Pikanäppäin Yhdistelmiä. Luku 6 Pikanäppäimet Luku 6 Pikanäppäimet Pikanäppäimet ovat näppäinyhdistelmiä, jotka mahdollistavt ZoomTextin komennot ilman ZoomTextin käyttäjäliittymän aktivointia. Pikanäppäin komentoja on melkein jokaisella ZoomTextin

Lisätiedot

NETIKKA PCTV KÄYTTÖOHJE

NETIKKA PCTV KÄYTTÖOHJE 1 (20) NETIKKA PCTV 2 (20) 1 YLEISTÄ...3 1.1 MIKÄ ON PCTV?...3 2 PCTV:N KÄYTÖN ALOITTAMINEN...4 2.1 VAATIMUKSET PALOMUURILTA...4 2.1.1 IGMP-palvelun käytön salliminen F-Securessa...4 2.2 VAATIMUKSET TIETOKONEELTA...8

Lisätiedot

Send-It ilmoittautumisjärjestelmä (judotapahtumat Suomessa)

Send-It ilmoittautumisjärjestelmä (judotapahtumat Suomessa) Ilmoittautumis järjestelmän otsikko alue Jokaisella tapahtumalla on otsikko-osa joka on samanlainen joka puolella sovellusta. Tämä Judokilpailuissa käytetty otsikko-osa koostuu viidestä linkistä, joita

Lisätiedot

SQL Server 2008 asennus

SQL Server 2008 asennus SQL Server 2008 asennus 1. Yleistä... 3 2. Edellytykset... 3 3. SQL Server 2008 Express asennus... 4 4. Yhteystiedot... 6 2/6 1. YLEISTÄ Tässä ohjeessa käydään vaiheittain Microsoft SQL Server 2008 tietokantaohjelmiston

Lisätiedot

Sen jälkeen Microsoft Office ja sen alta löytyy ohjelmat. Ensin käynnistä-valikosta kaikki ohjelmat

Sen jälkeen Microsoft Office ja sen alta löytyy ohjelmat. Ensin käynnistä-valikosta kaikki ohjelmat Microsoft Office 2010 löytyy tietokoneen käynnistävalikosta aivan kuin kaikki muutkin tietokoneelle asennetut ohjelmat. Microsoft kansion sisältä löytyy toimisto-ohjelmistopakettiin kuuluvat eri ohjelmat,

Lisätiedot

Luentaohjelma M-Bus mittareille Versio 1.77 ja uudemmat

Luentaohjelma M-Bus mittareille Versio 1.77 ja uudemmat 1(8) Sisältö 1 M-Bus -luenta M-Bus Arkin avulla...2 1.0 Mikä on?...2 1.1 Asennus...2 1.2 Käyttö...2 1.3 Yleisimmät kentät ja painikkeet...4 Muita painikkeita:...7 1.4 Modeemi...7 2 M-Bus Arkin käyttö esimerkki...8

Lisätiedot

CAMI Havaintotaidot -harjoitusohjelman asennus- ja käyttöönotto-ohje ei verkkoasennus

CAMI Havaintotaidot -harjoitusohjelman asennus- ja käyttöönotto-ohje ei verkkoasennus CAMI Havaintotaidot -ohjelmiston asennus 1 CognAid Oy CAMI Havaintotaidot -harjoitusohjelman asennus- ja käyttöönotto-ohje ei verkkoasennus CAMI Havaintotaidot -harjoitusohjelma toimii kaikissa ajanmukaisissa

Lisätiedot

18 LIITTYMÄT MUIHIN JÄRJESTELMIIN

18 LIITTYMÄT MUIHIN JÄRJESTELMIIN 18 MUIHIN JÄRJESTELMIIN Prospekti DAFOon rakennettu liittymiä muiden ohjelmiston toimittajien järjestelmiin. Tässä yhteydessä ei tarkoiteta siirtotiedoston muodostamista, kuten reskontraan siirto tai lappujen

Lisätiedot

Asennuksessa kannattaa käyttää asennusohjelman tarjoamia oletusarvoja.

Asennuksessa kannattaa käyttää asennusohjelman tarjoamia oletusarvoja. 1 1 Tivax Laskutus 4.5 1.1 Tivax ohjelman asentaminen TivaxLaskutus version 4.5 asentamiseksi on oltava asennus CD. Asennusohjelma käynnistetään tuplaklikkamalla asennus CD:llä olevaa Tivax45LaskuSetup.exe

Lisätiedot

Ohjeistus opiskelijalle opinnäytetyön tallentamiseksi Theseus-verkkokirjastoon.

Ohjeistus opiskelijalle opinnäytetyön tallentamiseksi Theseus-verkkokirjastoon. Kirjasto- ja tietopalvelut Theseus opas Ohjeistus opiskelijalle opinnäytetyön tallentamiseksi Theseus-verkkokirjastoon. Pikaohje: 2 1. Aloita tallennus kun työsi on valmis ja ohjaava opettajasi on hyväksynyt

Lisätiedot

Lumon tuotekirjaston asennusohje. Asennus- ja rekisteröintiohje

Lumon tuotekirjaston asennusohje. Asennus- ja rekisteröintiohje Lumon tuotekirjaston asennusohje Asennus- ja rekisteröintiohje 1. Sisältö 1. Asennuspaketin lataaminen 4 2. Zip-tiedoston purkaminen ja sovelluksen asentaminen 4 3. Sovelluksen rekisteröiminen 7 4. Sisällön

Lisätiedot

Excel-harjoitus 1. Tietojen syöttö työkirjaan. Taulukon muotoilu

Excel-harjoitus 1. Tietojen syöttö työkirjaan. Taulukon muotoilu Excel-harjoitus 1 Tietojen syöttö työkirjaan Kuvitteellinen yritys käyttää Excel-ohjelmaa kirjanpidon laskentaan. He merkitsevät taulukkoon päivittäiset ostot, kunnostuskulut, tilapäistilojen vuokramenot,

Lisätiedot

Pauliina Munter / Suvi Junes Tampereen yliopisto/tietohallinto 2013

Pauliina Munter / Suvi Junes Tampereen yliopisto/tietohallinto 2013 Tehtävä 2.2. Tehtävä-työkalun avulla opiskelijat voivat palauttaa tehtäviä Moodleen opettajan arvioitaviksi. Palautettu tehtävä näkyy ainoastaan opettajalle, ei toisille opiskelijoille. Tehtävä-työkalun

Lisätiedot

Pedacode Pikaopas. Java-kehitysympäristön pystyttäminen

Pedacode Pikaopas. Java-kehitysympäristön pystyttäminen Pedacode Pikaopas Java-kehitysympäristön pystyttäminen Pikaoppaan sisältö Pikaoppaassa kuvataan, miten Windowstyöasemalle asennetaan Java-ohjelmoinnissa tarvittavat työkalut, minkälaisia konfigurointeja

Lisätiedot

Harjoitus 1 -- Ratkaisut

Harjoitus 1 -- Ratkaisut Kun teet harjoitustyöselostuksia Mathematicalla, voit luoda selkkariin otsikon (ja mahdollisia alaotsikoita...) määräämällä soluille erilaisia tyylejä. Uuden solun tyyli määrätään painamalla ALT ja jokin

Lisätiedot

1. Uuden Ilmon käytön eroavaisuudet vanhasta Ilmosta lyhyesti

1. Uuden Ilmon käytön eroavaisuudet vanhasta Ilmosta lyhyesti Sisällysluettelo 1. Uuden Ilmon käytön eroavaisuudet vanhasta Ilmosta lyhyesti... 2 Huomattavaa kurssin tietojen täyttämisessä!... 2 2. Kurssikuvauksen ja muiden opiskelijoille näkyvien kurssitietojen

Lisätiedot

Valintanauhan komennot Valintanauhan kussakin välilehdessä on ryhmiä ja kussakin ryhmässä on toisiinsa liittyviä komentoja.

Valintanauhan komennot Valintanauhan kussakin välilehdessä on ryhmiä ja kussakin ryhmässä on toisiinsa liittyviä komentoja. Pikaopas Microsoft Excel 2013 näyttää erilaiselta kuin aiemmat versiot. Tämän oppaan avulla pääset alkuun nopeasti ja saat yleiskuvan uusista ominaisuuksista. Komentojen lisääminen pikatyökaluriville Pidä

Lisätiedot

SQL Buddy JAMK Labranet Wiki

SQL Buddy JAMK Labranet Wiki Page 1 of 9 SQL Buddy JAMK Labranet Wiki Sisällysluettelo Yleistä SQL Buddy:sta kotisivu :http://sqlbuddy.com/ SQL Buddy on kevyt hallintatyökalu MySQL-tietokannalle. Järjestelmävaatimukset Serverin vaatimukset

Lisätiedot

RATKI 1.0 Käyttäjän ohje

RATKI 1.0 Käyttäjän ohje RATKI RATKI 1.0 Käyttäjän ohje Ohje 0.5 Luottamuksellinen Vastuuhenkilö Petri Ahola Sisällysluettelo 1. Yleistä... 3 1.1. Kuvaus... 3 1.2. Esitiedot... 3 1.3. RATKIn käyttöoikeuksien hankinta... 3 1.4.

Lisätiedot

Asteri Ostoreskontra (Dos)

Asteri Ostoreskontra (Dos) Asteri Ostoreskontra (Dos) Vuosipäivitys 14.10.2002 Päivityksen asentaminen... 4 Asennus uudelle koneelle (Ensiasennus)... 6 Asteri valikon täydellinen asennus... 6 Ostoreskontran nettisivut... 7 Atsoft

Lisätiedot

ohjeita kirjautumiseen ja käyttöön

ohjeita kirjautumiseen ja käyttöön ohjeita kirjautumiseen ja käyttöön Kirjautumisesta Opiskelijat: kirjaudu aina tietokoneelle wilmatunnuksella etunimi.sukunimi@edu.ekami.fi + wilman salasana Opettajat: kirjaudu luokan opekoneelle @edu.ekami.fi

Lisätiedot

Taulukkolaskentaa selkokielellä EXCEL

Taulukkolaskentaa selkokielellä EXCEL Taso 1 1 MICROSOFT Taulukkolaskentaa selkokielellä EXCEL Tuomas Seitsemän veljeksen Tuomas on vakaa ja vahva kuin tammi. Hänellä ei ole juuri mielikuvitusta, hän ei keksi mitään itse, vaan ideat tulevat

Lisätiedot

Mathcad Flexnet lisenssipalvelimen asennus

Mathcad Flexnet lisenssipalvelimen asennus Mathcad Flexnet lisenssipalvelimen asennus Korjattu 13.01.01 Tärkeää: Ennen lisenssin hakemista tulee luoda PTC tili. Tästä on erillinen ohje, jonka on joko tullut tämän dokumentin yhteydessä tai sen saa

Lisätiedot

SUDOKU - ratkaisuohjeet. Jarno Tuimala 18.9.2005

SUDOKU - ratkaisuohjeet. Jarno Tuimala 18.9.2005 SUDOKU - ratkaisuohjeet Jarno Tuimala 18.9.2005 Japanilainen sudoku Seuraavassa on esitetty ohjeet japanilaistyyppisten sudoku-ristikoiden ratkontaan. Japanilaisia ristikoita luonnehtivat seuraavat piirteet:

Lisätiedot

Opiskelun ja työelämän tietotekniikka (DTEK1043)

Opiskelun ja työelämän tietotekniikka (DTEK1043) Opiskelun ja työelämän tietotekniikka (DTEK1043) pääaine- ja sivuaineopiskelijat Taulukkolaskennan perusteet Yleistä Tämä harjoitus käsittelee taulukkolaskentaohjelman perustoimintoja. Harjoituksissa opetellaan

Lisätiedot

Sähköpostitilin käyttöönotto. Versio 2.0

Sähköpostitilin käyttöönotto. Versio 2.0 Sähköpostitilin käyttöönotto Versio 2.0 Sivu 1 / 10 Jarno Parkkinen jarno@atflow.fi 1 Johdanto... 2 2 Thunderbird ohjelman lataus ja asennus... 3 3 Sähköpostitilin lisääminen ja käyttöönotto... 4 3.1 Tietojen

Lisätiedot