Johdatus Stata-ohjelmistoon



Samankaltaiset tiedostot
Network Video Recorder. Pika-asennusohje

ATH-koulutus: Stata 11 THL ATH-koulutus / Tommi Härkänen 1

SSH Secure Shell & SSH File Transfer

SPSS ohje. Metropolia Business School/ Pepe Vilpas

Tilastolliset toiminnot

Ennen varmenteen asennusta varmista seuraavat asiat:

Täysautomatisoitu raportointiympäristö. Joni-Petteri Paavilainen Jani Alatalo

Joomla pikaopas. Yksinkertainen opas, jossa neuvotaan esimerkkisivuston teko Joomla julkaisujärjestelmällä vaihe vaiheelta.

SEM1, työpaja 2 ( )

ASCII-taidetta. Intro: Python

BlueJ ohjelman pitäisi löytyä Development valikon alta mikroluokkien koneista. Muissa koneissa BlueJ voi löytyä esim. omana ikonina työpöydältä

Muuttujien määrittely

Kuinka ladata tulostusprofiilit Antalis ICC Profile Centrestä

SMART Board harjoituksia 14 - Notebook 10 Gallerian käyttäminen Notebookissa Yritä tehdä tehtävät sivulta 1 ilman että katsot vastauksia.

EASY Tiedostopalvelin - mobiilin käyttöopas

HARJOITUSKERTA 1: SPSS-OHJELMAN PERUSKÄYTTÖ JA MUUTTUJAMUUNNOKSET

Älä vielä sulje vanhoja

CLOUDBACKUP TSM varmistusohjelmiston asennus

ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON... 5 SISÄLLYSLUETTELO... 6

Suvi Junes/Pauliina Munter Tampereen yliopisto / tietohallinto 2014

Harjoitus 7 : Aikasarja-analyysi (Palautus )

OTTELUN TILASTOINTI AIKUISTEN VALTAKUNNALLISET SARJAT (LIVE)

Johdatus ohjelmointiin

Ohjeet vastaamiseen SFTP:llä. Yleistä Kirjautuminen Varmistus/sormenjälki Tiedostojen kopiointi Yhteystietojen antaminen

Octave-opas. Mikä on Octave ja miksi? Asennus

SPSS-pikaohje. Jukka Jauhiainen OAMK / Tekniikan yksikkö

OTTELUN TILASTOINTI NUORTEN VALTAKUNNALLISET SARJAT

SPSS OPAS. Metropolia Liiketalous

Tilastolliset ohjelmistot A. Pinja Pikkuhookana

IRC ja etäyhteydet IRC JA ETÄYHTEYDET

DL SOFTWARE Uumajankatu 2 Umeågatan FIN VAASA/VASA FINLAND +358-(0) Fax +358-(0)

Opiskelun ja työelämän tietotekniikka (DTEK1043)

FinFamily PostgreSQL installation ( ) FinFamily PostgreSQL

Digikoulu Pilviteknologiat - Tunti 1001: Tiedon varastointi Amazon Simple Storage Service (Amazon S3) palveluun

Keskustelualue. Tampereen yliopisto/ tietohallinto 2017 Suvi Junes/Pauliina Munter

SoleMOVE lähtevän harjoittelijan ohje

Julkaiseminen verkossa

Alustavia käyttökokemuksia SAS Studiosta. Timo Hurme Maa- ja elintarviketalouden tutkimuskeskus MTT (v alusta Luonnonvarakeskus / Luke)

Trust Gamer Kit PCI TRUST GAMER KIT PCI. Pika-asennusohje. Versio 1.0

EASY Tiedostopalvelin - mobiilin käyttöopas

Matemaattinen optimointi I, demo

Tutkimusaineiston hallinta. Annaleena Okuloff Terveystieteiden tieteenala-asiantuntija

MASSER Loader V2.00. käyttö- ja asennusohje

Tiedonsiirto helposti navetta-automaation ja tuotosseurannan välillä

Suvi Junes Tampereen yliopisto / tietohallinto 2013

Sonera Yrityssähköposti. Outlook 2013 lataus ja asennus

Jypelin käyttöohjeet» Ruutukentän luominen

H5P-työkalut Moodlessa

Webropol-kyselyt. Tarja Heikkilä

Asiakastukiryhmä Kesä- ja talviaika

Microsoft Projectin mukauttaminen

NAVIGAATTORIN ASENNUS JA MUOKKAUS

Määrittelydokumentti

Excel-lomakkeen (syöttötaulukko) käyttäminen talousarvio- ja suunnitelmatietojen toimittamisen testaamisessa Kuntatalouden tietopalvelussa

Eclipse 3.2 pikku opas versio 1.0. Esittely Uuden projektin perustaminen Sovelluksen luominen Koodin siistiminen Vinkkejä

Tiedonsiirto helposti navetta-automaation ja tuotosseurannan välillä

Windows Vistan varmuuskopiointi

StatCrunch -laskentasovellus

SuomiCom-sähköpostiasetukset Microsoft Outlook 2016

LP-levyn digitointi Audacity-ohjelmalla

Transkribuksen pikaopas

GIS-perusteet ja kartografia -tehtävät

Dynaamista ja joustavaa ohjelmointia - maukasta makrokielellä

Sähköpostilla tulevien hinnastojen tallentaminen

Tilastollinen vastepintamallinnus: kokeiden suunnittelu, regressiomallin analyysi, ja vasteen optimointi. Esimerkit laskettu JMP:llä

Pedacode Pikaopas. Java-kehitysympäristön pystyttäminen

Määrittelydokumentti. Olutkortisto

Ohjeita LINDOn ja LINGOn käyttöön

RATKI 1.0 Käyttäjän ohje

HAMINETTI WLAN LIITTYMÄN KÄYTTÖÖNOTTO-OHJE

T&M Autori Versio Series 60 -puhelimiin

Coolselector Asennusohje

jos haluatte säilyttää ja jatkaa vanhan OneNote-muistion sisällön kanssa.

Facebook-sivun luominen

Ajokorttimoduuli Moduuli 2. - Laitteenkäyttö ja tiedonhallinta. Harjoitus 1

Versionhallintaa. Versionhallinnan käyttöönotto SAS ympäristössä

Suunnitelmien nimeäminen sähköisissä palveluissa (eservice ja Lupapiste)

Option GlobeSurfer III pikakäyttöopas

SAS/IML käyttö ekonometristen mallien tilastollisessa päättelyssä. Antti Suoperä

CUDA. Moniydinohjelmointi Mikko Honkonen

Harjoituksen aiheena on tietokantapalvelimen asentaminen ja testaaminen. Asennetaan MySQL-tietokanta. Hieman linkkejä:

HAME-maakuntakaavatyökalun ohjeet SYKE/VSL

Haka-palveluiden valvonta ja tilastointi AAIEye -työkalun avulla. Mika Suvanto, CSC

Käyttöjärjestelmämme on Windows XP, kaikki tietokoneemme ovat kytketty lähiverkkoon ja Internettiin.

Suvi Junes Tietohallinto / Opetusteknologiapalvelut 2013

CLT255: Tulosten esittäminen ja niiden arviointi tilastomenetelmillä

Tärkeimmät toiminnot. Kertausta ja uusia toimintoja Wordistä sekä tiedostonhallinnasta. Tärkeimmät toiminnot jatkuu...

JY / METODIFESTIVAALI 2013 PRE-KURSSI: KYSELYTUTKIMUS DEMOT

Ruokahalu kasvaa syödessä lisää makrokielen herkkuja

TI TestGuard. Pikaopas

qwertyuiopasdfghjklzxcvbnm qwertyuiopasdfghjklzxcvbnm qwertyuiopasdfghjklzxcvbnm qwertyuiopasdfghjklzxcvbnm qwertyuiopasdfghjklzxcvbnm

Itseasennusohje. Elisa ADSL. M1122-verkkopääte ADSL

Kappale 18: Teksti-editori

Mendeleyn käyttö viittamisessa

Otanta-aineistojen analyysi

Written by Administrator Monday, 05 September :14 - Last Updated Thursday, 23 February :36

BaseMidlet. KÄYTTÖOHJE v. 1.00

Suvi Junes/Pauliina Munter Tampereen yliopisto / tietohallinto 2014

Kun valitset Raportit, Lisää uusi, voit ryhtyä rakentamaan uutta raporttia alusta alkaen itse.

Transkriptio:

Johdatus Stata-ohjelmistoon Jani Erola Turun yliopisto, sosiaalitieteiden laitos 8.11.2010 Jani Erola (Turun yliopisto) Stata 2010 8.11.2010 1 / 27

Sisällys 1 Miksi Stata? 2 Aloitus 3 Aineiston manipulointi 4 Analyysit Jani Erola (Turun yliopisto) Stata 2010 8.11.2010 2 / 27

Miksi Stata? Kv. standardi sosiologeilla, sosiaalipoliitikoilla ja taloustieteilijöillä, jotka työskentelevät yksilödatan kanssa Monipuolisempi, avoimenpi ja halvempi kuin SPSS Kaikki menetelmät kaikkien käytettävissä Käyttäjien kirjoittamat paketit Jani Erola (Turun yliopisto) Stata 2010 8.11.2010 3 / 27

Miksi Stata? Helpompi kuin R tai SAS Kieli helpompi Dokumentointi erinomainen Datan manipuloinnissa ylivoimainen Jani Erola (Turun yliopisto) Stata 2010 8.11.2010 4 / 27

Hyviä käytäntöjä Projektin aluksi hyvä tehdä sille oma kansio, jossa tarkoituksenmukaisia alikansioita sekä lokikirja Suositeltavat kansiot ainakin: Work/Työ: kaikki työn alla/kesken olevat tiedostot Posted/Lähetetty: kaikki muille lähetettävät tiedostoversiot Delete/Poistettavat: projektin lopuksi siivottavat tiedostot Lisäksi tarvittaessa mahdolliset alakansiot ajotiedostoille, datoille, teksteille jne.. Lokikirjaan kirjataan päivän päätteeksi mitä on tehty Jani Erola (Turun yliopisto) Stata 2010 8.11.2010 5 / 27

Statan avaaminen Kaksoisklikkaus ikonia! Command-ikkuna: kirjoita käsky, aja painamalla enter Review-ikkuna: listaa kaikki session aikana ajetut käskyt (onnistuneet ja epäonnistuneet Variables-ikkuna: kun data auki, aineistossa olevat muuttujat Avaa auto.dta-esimerkkiaineisto; File > datasets... Tarkastele aineistoa describe, summarize ja tabulate-käskyillä. Jani Erola (Turun yliopisto) Stata 2010 8.11.2010 6 / 27

Keskeisiä käskyjä ndit - avaa haun help-tiedostoihin ja verkosta saataviin ohjelmiin (myös Help-valikon Search) query mem - käytetyn muistin määrä; set mem - käytetyn muistin määritteleminen doedit - vaikka pääosa käskyistä on ajettavissa valikoiden kautta, paras tapa käyttää Stataa on käyttää do-editoria (Window-valikon Do-le Editor) Määritä käytettävissä oleva muistiin 700 megaan. Avaa sen jälkeen do-editori. Jani Erola (Turun yliopisto) Stata 2010 8.11.2010 7 / 27

Do-tiedoston aloittaminen, I Do-len alkuun on hyvä tehdä lyhyt kuvaus määritellään muisti set mem -käskyllä set mem 750m mikä käytät Stataa mikroluokissa, määritä ohjelmalle kansiot hankilökohtaisia ado-tiedostoja (PERSONAL) ja lisäosien (STBPLUS) esennusta varten sysdir set PERSONAL "\\utuhome.utu.\japeer\ado\personal" sysdir set STBPLUS "\\utuhome.utu.\japeer\ado\stbplus" Jani Erola (Turun yliopisto) Stata 2010 8.11.2010 8 / 27

Do-tiedoston aloittaminen, II Tämän jälkeen määritellään työskentelykansio:, esim. cd c:\...\kansio cd "\\utuhome.utu.\japeer\kurssi\work" Seuraavaksi määritellään Statalle log-tiedosto: s capture log close log using harkka, text replace Jani Erola (Turun yliopisto) Stata 2010 8.11.2010 9 / 27

Aineiston avaaminen Kun työskentelykansio on määritetty aluksi, aineiston ottaminen käyttöön on yksinkertaista use-käskyä käyttäen use ESS3e03.2_F1.dta, clear Huom! Ilman clear-asetusta virheilmoitus, jos jokin aineisto jo käytössä Jani Erola (Turun yliopisto) Stata 2010 8.11.2010 10 / 27

Osa-aineiston määritteleminen, I drop-käskyllä kerrotaan, mitää muuttujia aineistosta pudetetaan keep-käskyllä kerrotaan, mitä muuttujia aineistossa pidetään drop name essrou regionat-supqyr keep ppltrs cntry pdwrkcr gndr age /* */ edulvl edulvlf edulvlm ipcrtiv-impfun Jani Erola (Turun yliopisto) Stata 2010 8.11.2010 11 / 27

Osa-aineiston määritteleminen, II vastaavasti keep/drop if -käskyillä määritetään minkä kriteerien mukaan tapaukset pidetään aineistossa mikä tahansa analyysi voidaan rajoittaa vain osaan tapauksista pudottamatta tapauksia keep if age>20&age<=60 keep if cntry=="de" cntry=="fi" cntry=="gb" cntry=="se" mean ppltrs, over(gndr) mean ppltrs if age>40 & age<=50, over(gndr) Jani Erola (Turun yliopisto) Stata 2010 8.11.2010 12 / 27

Muuttujien uudelleen nimeäminen rename (lyh. ren) vanhamuuttuja uusimuuttuja ren ppltrs trust ren pdwrkcr work Jani Erola (Turun yliopisto) Stata 2010 8.11.2010 13 / 27

Muuttujan uudelleen koodaaminen luodaan ensin uusi tyhjä muuttuja gen-käskyllä sitten korvataan puuttuvat tiedot ehdollisesti sarjalla replace-käskyjä gen agegr=. replace agegr=1 if age>21&age<=30 replace agegr=2 if age>31&age<=40 replace agegr=3 if age>41&age<=50 replace agegr=4 if age>51&age<=60 Jani Erola (Turun yliopisto) Stata 2010 8.11.2010 14 / 27

Muuttujien koodaaminen luupissa useita samankaltaisia muuttujia on helppo koodata luupissa foreach-käskyn avulla gen edu=. replace edu=0 if edulvl<=1 replace edu=1 if edulvl>=2 & edulvl<=4 replace edu=2 if edulvl>=5 & edulvl<=6 ta edu edulvl foreach t in f m { gen edu`t'=. replace edu`t'=0 if edulvl`t'<=1 replace edu`t'=1 if edulvl`t'>=2 & edulvl`t'<=4 replace edu`t'=2 if edulvl`t'>=5 & edulvl`t'<=6 ta edu`t' edulvl`t' } Jani Erola (Turun yliopisto) Stata 2010 8.11.2010 15 / 27

Muuta kirjaimia sisältävät muuttujat numeerisiksi natiiveilla aineistoilla harvemmin tarvittu, käännetyissä useammin encode cntry, gen(cn) numlabel cn, add ta cn Jani Erola (Turun yliopisto) Stata 2010 8.11.2010 16 / 27

Keskiarvot alaryhmissä Yhdistämällä mean-käsky over-option kanssa saadaan ryhmäkohtaiset keskiarvot mean trust age, over(cn) Jani Erola (Turun yliopisto) Stata 2010 8.11.2010 17 / 27

Ristiintaulukointi 2-suuntainen ristiintaukointi tehdään ta-käskyllä (tabulate) ta eduf edu ta eduf edu, col nofreq ta eduf edu, row nofreq Jani Erola (Turun yliopisto) Stata 2010 8.11.2010 18 / 27

Regressiomalli perusregressio tehdään Statalla regress-käskyllä 10-versiossa kategoriset muuttujien käyttö edellyttää xi-etuliitettä mallikäskyyn ja i.-etuliitettä itse kategoriselle muuttujalla regress trust gndr cn xi: regress trust gndr i.cn Jani Erola (Turun yliopisto) Stata 2010 8.11.2010 19 / 27

Mallien tallentaminen Mallien estimaatit tallennetaan myöhempää käyttöä varten estimates store -käskyllä Toimii kaikissa malleissa estimates store regres1 xi: regress trust gndr i.cn i.edu estimates store regres2 xi: regress trust gndr i.cn*i.edu estimates store regres3 Jani Erola (Turun yliopisto) Stata 2010 8.11.2010 20 / 27

Mallien vertailu Yksi Statan parhaita puolia on mahdollisuudet mallien vertailuun estimates stats mallien tunnuslukujen vertailuun, esttab, estout ja outreg estimaattien vertailuun estimates stats regres1 regres2 regres3 estimates table regres1 regres2 regres3, star(.05.01.001) style(oneline) estout regres1 regres2 regres3, /* */cells(b(star fmt(2)) se(fmt(2))) style(smcl) label stats(r2 bic N) Jani Erola (Turun yliopisto) Stata 2010 8.11.2010 21 / 27

Logit-mallit yksinkertaisimmin logit-käskyä käyttäen replace work=0 if work==2 replace work=1 if work==1 xi: logit work i.cn gndr i.agegr estimates store logit1 xi: logit work i.cn gndr i.agegr i.edu estimates store logit2 xi: logit work i.cn gndr i.agegr i.edu i.eduf estimates store logit3 Jani Erola (Turun yliopisto) Stata 2010 8.11.2010 22 / 27

Mallien vertailu estout-käskyn eform-optio antaa estimaatit vedonlyöntisuhteina estimates stats logit1 logit2 logit3 estout logit1 logit2 logit3, /* */cells(b(star fmt(2)) se(fmt(2))) eform style(smcl) label stats(chi2 bic N) Jani Erola (Turun yliopisto) Stata 2010 8.11.2010 23 / 27

Multinomial logit mlogit käskyllä voidaan ajaa moniluokkaisia logit-malleja base-optiolla määritellään referenssikategoria xi: mlogit edu gndr i.agegr i.cn, base(0) estimates store mlogit1 xi: mlogit edu gndr i.agegr i.cn i.edum, base(0) estimates store mlogit2 xi: mlogit edu gndr i.agegr i.cn i.edum i.eduf, base(0) estimates store mlogit3 Jani Erola (Turun yliopisto) Stata 2010 8.11.2010 24 / 27

Mallien vertailu Kuten edellä, unstack-optio jakaa saman mallin useaan sarakkeeseen estimates stats mlogit1 mlogit2 mlogit3 estout mlogit1 mlogit2 mlogit3, /* */cells(b(star fmt(2)) se(fmt(2))) eform style(smcl) label stats(chi2 bic N) unstack Jani Erola (Turun yliopisto) Stata 2010 8.11.2010 25 / 27

Faktorointi & doktorointi faktorointi ja rotatointi tehdään Statalla eri käskyllä factor ipcrtiv imprich ipeqopt ipshabt impsafe impdi ipfrule, ml blanks(.3) rotate, kaiser blanks(.3) Jani Erola (Turun yliopisto) Stata 2010 8.11.2010 26 / 27

Lopuksi Lisää vinkkejä http://data.princeton.edu/stata/ http://www.cpc.unc.edu/research/tools/data_analysis/ statatutorial/index.html http://www.ats.ucla.edu/stat/stata/ Jani Erola (Turun yliopisto) Stata 2010 8.11.2010 27 / 27