4.2 Useampi selittävä muuttuja (kertausta)

Samankaltaiset tiedostot
MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Matematiikka ja tilastotiede. Orientoivat opinnot /

&idx=1&uilang=fi&lang=fi&lvv=2017

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

MTTTP1 Tilastotieteen johdantokurssi Luento JOHDANTO

Taloustieteen opinnot Tampereen yliopistossa


Matematiikka ja tilastotiede. Orientoivat opinnot /

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Esim Brand lkm keskiarvo keskihajonta A ,28 5,977 B ,06 3,866 C ,95 4,501

Yleistetyistä lineaarisista malleista

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Harjoitus 9: Excel - Tilastollinen analyysi

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

Regressioanalyysi. Kuusinen/Heliövaara 1

OPS-MUUTOSINFO

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Taloustieteen opintosuunta JKK, Tampereen yliopisto

VARIANSSIANALYYSI ANALYSIS OF VARIANCE

Valitaan testisuure, jonka jakauma tunnetaan H 0 :n ollessa tosi.

dx=5&uilang=fi&lang=fi&lvv=2014

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Tilastollisten menetelmien perusteet II TILTP3 Luentorunko, kevät 2004

HOPS Henkilökohtainen opintosuunnitelma LuK -tutkintoon

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Harjoitus 7: NCSS - Tilastollinen analyysi

Tilastollisten menetelmien perusteet II TILTP3 Luentorunko

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo

Tilastollisen analyysin perusteet Luento 7: Lineaarinen regressio

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Usean selittävän muuttujan regressioanalyysi

MTTTP1, luento KERTAUSTA

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

MTTTP1, luento KERTAUSTA

Mat Tilastollisen analyysin perusteet, kevät 2007

Matematiikka tai tilastotiede sivuaineena

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

Tilastotieteen aihehakemisto

H0: otos peräisin normaalijakaumasta H0: otos peräisin tasajakaumasta

Tutkimusongelmia ja tilastollisia hypoteeseja: Perunalastupussien keskimääräinen paino? Nollahypoteesi Vaihtoehtoinen hypoteesi (yksisuuntainen)

dx=2&uilang=fi&lang=fi&lvv=2015

Tampereen yliopisto Matematiikan, tilastotieteen ja filosofian laitos Raija Leppälä puh , sähköposti

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

Johdatus regressioanalyysiin. Heliövaara 1

Sovellettu todennäköisyyslaskenta B

6.1.2 Yhdessä populaatiossa tietyn tyyppisten alkioiden prosentuaalista osuutta koskeva päättely

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

&idx=2&uilang=fi&lang=fi&lvv=2015

MTTTP1, luento KERTAUSTA

Opintojakson nimi ja laajuus. Suositeltu suoritusajankohta. 1. vuosi 2. vuosi 3. vuosi. 1. syksy 1. kevät 2. syksy 2. kevät 3. syksy 3.

&idx=2&uilang=fi&lang=fi&lvv=2015

Kvantitatiiviset menetelmät

Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt. Latinalaiset neliöt: Mitä opimme? Latinalaiset neliöt

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

Johdatus regressioanalyysiin

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

TUTKINTO-OHJELMAINFO Sivuainemahdollisuudet Kesäopinnot KV-vaihtomahdollisuus

Mat Tilastollisen analyysin perusteet, kevät 2007

Kandidaatintutkielman aineistonhankinta ja analyysi

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

voidaan hylätä, pienempi vai suurempi kuin 1 %?

Koesuunnittelu 2 k -faktorikokeet. TKK (c) Ilkka Mellin (2005) 1

Korvataan uuden ohjelman opintojaksolla. Suorittamatta jäänyt YPATperuskurssi. tutkinto-ohjelman peruskurssilla, á 5 op

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

805306A Johdatus monimuuttujamenetelmiin, 5 op

OPETUSSUUNNITELMALOMAKE

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

OPETUSSUUNNITELMALOMAKE

Teema 9: Tilastollinen merkitsevyystestaus

Opiskelija viipymisaika pistemäärä

Juha Tervala Materiaali:

Johdatus tilastotieteeseen Johdatus regressioanalyysiin. TKK (c) Ilkka Mellin (2005) 1

Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

Luento KERTAUSTA Kaksiulotteinen jakauma Pisteparvi, Toyota Avensis -farmariautoja

Harjoituksessa tarkastellaan miten vapaa-ajan liikunta on yhteydessä..

Mallilukujärjestys Teknistieteellinen kandidaattiohjelma Tietotekniikka, 2. vuosikurssi

SIIRTYMÄSÄÄNNÖKSET OPINTO-OPPAIDEN ja VÄLILLÄ VAKUUTUKSEN JA RISKIENHALLINNAN OPINTOSUUNTA

TA7, Ekonometrian johdantokurssi HARJOITUS 4 1 RATKAISUEHDOTUKSET

Mat Tilastollisen analyysin perusteet, kevät 2007

Luonnontieteellinen tiedekunta Sivuaineinfo. Katri Suorsa

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

voidaan hylätä, pienempi vai suurempi kuin 1 %?

Harjoitukset 4 : Paneelidata (Palautus )

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

, Määrälliset tutkimusmenetelmät 2 4 op

ABHELSINKI UNIVERSITY OF TECHNOLOGY

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

Yhden selittäjän lineaarinen regressiomalli (jatkoa) Ensi viikolla ei pidetä luentoa eikä harjoituksia. Heliövaara 1

MTTTP1, luento KERTAUSTA JA TÄYDENNYSTÄ. Tunnusluvut. 1) Sijainnin tunnuslukuja. Keskilukuja moodi (Mo) mediaani (Md) keskiarvo, kaava (1)

Transkriptio:

14.2.2019/1 MTTTA1 Tilastomenetelmien perusteet Luento 14.2.2019 4.2 Useampi selittävä muuttuja (kertausta) Selittäjien lukumäärä k (k-ra) = + + + + Malliin liittyvät oletukset i ~ N(0, 2 ) ja i:t ovat riippumattomia

14.2.2019/2 Regressioanalyysin taulukko R 2 = SSR/SST SSR k MSR F=MSR/MSE SSE n-k-1 MSE ~F(k, n-k-1), kun H0 tosi SST n-1 H0: 1 = = k =0 ( ) = ( ) = ( ) = ~, : = 0 ~, : = 0 ~, : = 0

14.2.2019/3 Esim. Ilmansaasteille altistumisen vaikutus kuolleisuuteen suurkaupungeissa (Devore&Peck) y = total mortality rate (deaths per 10000) x1 = mean suspended particle reading (µg/m 3 ) x2 = smallest sulfate reading ((µg/m 3 )x10) x3 = population density (people/mi 2 ) x4 = (percent nonwhite)x10 x5 = (percent over 65)x10

14.2.2019/4 Regressiomalli = + + + + + + Estimoinnin tuloksia (kertoimet, kertoimien estimoituja hajontoja) = 19,607 + 0,041x1 + 0,071x 2 + 0,001x 3 + 0,014 x 4 + 0,687x 5 (0,016) (0,007) R 2 = 0,827, n = 117, k = 5 H0: 1 = 0

14.2.2019/5 H1: 1 > 0 t = 0,041/0,016 = 2,5625 t0,01,111 = 2,358, t0,005,111 = 2,617 Siis 0,005 < p-arvo < 0,01 H0: 4 = 0 H1: 4 > 0 t = 0,041/0,007 = 5,86 > t0,005,111 = 2,617 H0 hylätään, p-arvo < 0,005

14.2.2019/6 H0: 1 = = 5 =0 H1: ainakin jokin i 0 = 1 ~F k,n 1, kun tosi = 0,827 5 0,827 117 1 = 106,124 >, ;, = 3,02 H0 hylätään

14.2.2019/7 4.3 Selittävien muuttujien valinnasta ja mallin oletuksista (jatkoa) Esim. Polynomiregressio, y = viinin hinta, x = viinin ikä

14.2.2019/8 Malli Y = 0 + 1 x + 2 x 2 + Malli Y = 0 + 1 x 2 + R 2 = 0,974

14.2.2019/9 Esim. Autoregressio Tutkitaan vaikuttaako TV-mainonta tavaratalon myyntiin. Tarkastellaan viikoittaista myyntiä 20 viikon ajan, aineisto myynti_mainonta.sav sivulla https://coursepages.uta.fi/mttta1/esimerkkiai neistoja/ y = myynti x = mainonta

Malli I: Yt = 0 + 1 xt+ t 14.2.2019/10

Autokorreloituneet residuaalit 14.2.2019/11

14.2.2019/12 Malli II Yt = 0 + 1 xt+ 2 yt-1+ t Autoregressio

14.2.2019/13 Esim. 4.3.3 Dummy-muuttuja selittäjänä mallissa y = Salary x = Years z = Sex (0 = nainen, 1 = mies)

Malli Y = 0 + 1 x + 2 z + E(Y) = 0 + 1 x, kun Sex=0 (naiset) E(Y) = 0 + 1 x + 2, kun Sex = 1 (miehet) 14.2.2019/14 Naisilla Salary = 13,970+0,765 Years Miehillä Salary = 13,970+0,765 Years+9,418 = 23,388+0,765 Years

4.4 Varianssianalyysimalli 14.2.2019/15

14.2.2019/16 Luku 5 Epäparametrisista menetelmistä (ei tenttiin) Ei oletuksia populaatiosta, esim. normaalijakaumaoletusta. Mann-Witneyn testi Kahden riippumattoman otoksen t-testin epäparametrinen vastine (normaalijakaumaoletus ei voimassa) Kruskal-Wallisin testi Epäparametrinen vastine yksisuuntaiselle varianssianalyysille (normaalijakaumaoletusta ei

tehdä, selitettävä muuttuja voi olla järjestysasteikollinen) Welchin tai Brown-Forsythen testi Yksisuuntainen varianssianalyysi, kun oletus varianssien yhtäsuuruudesta ei voimassa 14.2.2019/17 Ks. luentorunko s. 51, http://www.sis.uta.fi/tilasto/mttta1/kevat2019/luentorun ko.pdf#page=52

14.2.2019/18 Tentit ti 26.2.2019 klo 12.15-15.00 ls. A1, voi osallistua, jos on tehnyt vähintään 30 % harjoituksista, ilmoittaudu viimeistään 24.2. pe 5.4.2019 pe 3.5.2019 to 6.6.2019 Osaamistavoitteet http://www.sis.uta.fi/tilasto/mttta1/kevat2019/luento_10 _1_2019.pdf

14.2.2019/19 Mitä jatkoksi? Matematiikan ja tilastotieteen tutkinto-ohjelman opiskelijat Matematiikan ja tilastotieteen perusopinnot (tilastotieteen opintopolku) https://www10.uta.fi/opas/opintokokonaisuus.htm? rid=14974&lang=fi&uilang=fi&lvv=2018 MTTTP4 Todennäköisyyslaskenta (S2019)

14.2.2019/20 Tilastotieteen aineopinnot (pakolliset) https://www10.uta.fi/opas/opintokokonaisuus.htm? rid=14600&lang=fi&uilang=fi&lvv=2018 MTTTA2 MTTTA4 MTTTA14 Matemaattisen tilastotieteen perusteet, (S2019) Tilastollinen päättely 1, (K2020) Tilastotieteen matriisilaskenta ja laskennalliset menetelmät, (S2019) Tilastotieteen aineopinnot (muut) https://www10.uta.fi/opas/opintokokonaisuus.htm? rid=14611&lang=fi&uilang=fi&lvv=2018 MTTTA13 Empiirinen projekti

14.2.2019/21 Tilastotieteen perusopintokokonaisuus valinnaisina opintoina https://www10.uta.fi/opas/opintokokonaisuus.htm?rid=1 4644&lang=fi&uiLang=fi&lvv=2018 MTTTA13 Empiirinen projekti

Tilastotieteen aineopintokokonaisuus valinnaisina opintoina 14.2.2019/22 https://www10.uta.fi/opas/opintokokonaisuus.htm?rid=1 4909&lang=fi&uiLang=fi&lvv=2018 Pakolliset MTTTP4 Todennäköisyyslaskenta, (S2019) MTTTA2 Matemaattisen tilastotieteen perusteet (S2019) MTTTA4 Tilastollinen päättely 1, (K2020) MTTTA14 Tilastotieteen matriisilaskenta ja laskennalliset menetelmät, (S2019)

Muut (valitaan 3) MTTTA5 Monimuuttujamenetelmät MTTTA6 Regressioanalyysi MTTTA7 Yleistetyt lineaariset mallit 1 MTTTA9 Tilastollinen ennustaminen MTTTA10 Sekamallit MTTTA11 Tilastolliset ohjelmistot (esitietona MTTTA1) MTTA2 Muu erikseen sovittava opintojakso 14.2.2019/23