Samankaltaiset tiedostot
Esim Brand lkm keskiarvo keskihajonta A ,28 5,977 B ,06 3,866 C ,95 4,501

Frequencies. Frequency Table

voidaan hylätä, pienempi vai suurempi kuin 1 %?

voidaan hylätä, pienempi vai suurempi kuin 1 %?

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

VARIANSSIANALYYSI ANALYSIS OF VARIANCE

Kvantitatiivinen genetiikka moniste s. 56

Data-analyysi II. Sisällysluettelo. Simo Kolppo [Type the document subtitle]

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

(d) Laske selittäjään paino liittyvälle regressiokertoimelle 95 %:n luottamusväli ja tulkitse tulos lyhyesti.

Teema 10: Regressio- ja varianssianalyysi

Tilastollisten menetelmien perusteet II TILTP3 Luentorunko

Pylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 2003 LKM 14.8% 11.2% 19.7% 4.9% 3.6% 45.

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

4.2 Useampi selittävä muuttuja (kertausta)

Ilmoittaudu Weboodissa klo (sali L4) pidettävään 1. välikokeeseen!

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Perusnäkymä yksisuuntaiseen ANOVAaan

1. REGRESSIOMALLIN SYSTEMAATTISEN OSAN MUOTO

A250A0050 Ekonometrian perusteet Tentti

3. Useamman selittäajäan regressiomalli. p-selittäaväaäa muuttujaa. Y i = + 1 X i p X ip + u i

Opiskelija viipymisaika pistemäärä

MTTTP1, luento KERTAUSTA

Ohjeita tilastollisen tutkimuksen toteuttamiseksi SPSS for Windows -ohjelmiston avulla

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

MTTTP1, luento KERTAUSTA

Sisällysluettelo 6 REGRESSIOANALYYSI. Metsämuuronen: Monimuuttujamenetelmien perusteet SPSS-ympäristössä ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON...

ATH-koulutus: R ja survey-kirjasto THL ATH-koulutus / Tommi Härkänen 1

SPSS-perusteet. Sisältö

MTTTP1, luento KERTAUSTA

Sisällysluettelo 6 VARIANSSIANALYYSI. Metsämuuronen: Monimuuttujamenetelmien perusteet SPSS-ympäristössä ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON...

Suhtautuminen Sukupuoli uudistukseen Mies Nainen Yhteensä Kannattaa Ei kannata Yhteensä

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

Kaksisuuntaisen varianssianalyysin tilastollisessa malli voidaan esittää seuraavassa muodossa:

Opetus talteen ja jakoon oppilaille. Kokemuksia Aurajoen lukion tuotantoluokan toiminnasta Anna Saivosalmi

1. USEAN SELITTÄJÄN LINEAARINEN REGRESSIOMALLI JA OSITTAISKORRELAATIO

Kvantitatiiviset menetelmät

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

Toimittaja Erä

RISTIINTAULUKOINTI JA Χ 2 -TESTI

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)

Luottamisvälin avulla voidaan arvioida populaation tuntematonta parametria.

MS-C2{04 Tilastollisen analyysin perusteet

Ohjeita kvantitatiiviseen tutkimukseen

&idx=1&uilang=fi&lang=fi&lvv=2017

MTTTP5, luento Luottamusväli, määritelmä

vkp 4*(1+0)/(32-3)-1= vkp 2*(1+0)/(32-3)=

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking)

Mat Tilastollisen analyysin perusteet. Painotettu PNS-menetelmä. Avainsanat:

MTTTP5, luento Kahden jakauman sijainnin vertailu (jatkoa) Tutkimustilanteita y = neliöhinta x = sijainti (2 aluetta)

Raija Leppälä. Ohjeita tilastollisen tutkimuksen toteuttamiseksi IBM SPSS Statistics -ohjelmiston avulla

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

Mat Tilastollisen analyysin perusteet

Kynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto

Estimointi populaation tuntemattoman parametrin arviointia otossuureen avulla Otossuure satunnaisotoksen avulla määritelty funktio

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)

Harjoittele tulkintoja

Lumipallo regressioanalyysista. Logistinen regressioanalyysi. Soveltuvan menetelmän valinta. Regressioanalyysi. Logistinen regressioanalyysi I

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

proc glm data = ex61; Title2 "Aliasing Structure of the 2_IV^(5-1) design"; model y = A B C D E /Aliasing; run; quit;

Viherseinien efekti Tilastoanalyysi

3. Useamman selittäajäan regressiomalli. p-selittäaväaäa muuttujaa

Harjoitus 7 : Aikasarja-analyysi (Palautus )

KURSSIKYSELYAINEISTO: HUOM! Aineiston tilastoyksikkömäärä 11 on kovin pieni oikean tilastotieteen tekemiseen, mutta Harjoitteluun se kelpaa kyllä!

USEAN MUUTTUJAN REGRESSIOMALLIT JA NIIDEN ANA- LYYSI

SAS-ohjelmiston perusteet 2010

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo

Residuaalit. Residuaalit. UK Ger Fra US Austria. Maat

A B DIFFERENCE

Harjoitus 6 -- Ratkaisut

b1) harhattomuutta, b2) helppoutta, b3) herkkyyttä, b4) mitta-asteikkoa, b5) standardointia, b6) tarkkuutta.

3. Useamman selittäajäan regressiomalli

(b) Vedonlyöntikertoimet syytetyn ihonvärin eri luokissa

Jakaumien merkitys biologisissa havaintoaineistoissa: Löytyykö ratkaisu Yleistetyistä Lineaarisista (Seka)Malleista?

TKMS7a-f/LRS20a-f/MAS2/KVS2/TMS82a-f/JOM/TJM/YRM Monimuuttujamenetelmien soveltaminen taloustieteissä. Tentti

Health 2000/2011 Surveys. Statistical Analysis using SAS and SAS-Callable SUDAAN Packages Esa Virtala.

Terra Preta kasvatuskoe Pilkon pellolla

SPSS-pikaohje. Jukka Jauhiainen OAMK / Tekniikan yksikkö

MONIMUUTTUJAMENETELMISTÄ RAKENNEYHTÄLÖMALLINNUKSEEN MUUTTUJIEN NORMAALISUUS. Statistics

2. Yhden selittäajäan lineaarinen regressiomalli. 2.1 Malli ja parametrien estimointi. Malli:

E80. Data Uncertainty, Data Fitting, Error Propagation. Jan. 23, 2014 Jon Roberts. Experimental Engineering

Aalto-yliopisto, Matematiikan ja systeemianalyysin laitos /Malmivuori MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi,

Menestyminen valintakokeissa ja todennäköisyyslaskussa

Lohkotekijät muodostuvat faktoreista, joiden suhteen ei voida tehdä (täydellistä) satunnaistamista.

Estimointi. Luottamusvälin laskeminen keskiarvolle α/2 α/2 0.1

Yleistetyistä lineaarisista malleista

¼ ¼ joten tulokset ovat muuttuneet ja nimenomaan huontontuneet eivätkä tulleet paremmiksi.

2. Tietokoneharjoitukset

ATH-koulutus: Stata 11 THL ATH-koulutus / Tommi Härkänen 1

Kandidaatintutkielman aineistonhankinta ja analyysi

MS-C2103 Koesuunnittelu ja tilastolliset mallit (5 op)


Transkriptio:

[MTTTA] TILASTOMENETELMIEN PERUSTEET, KEVÄT 209 https://coursepages.uta.fi/mttta/kevat-209/ HARJOITUS 5 viikko 8 RYHMÄT: ke 2.5 3.45 ls. C6 Leppälä to 08.30 0.00 ls. C6 Korhonen to 2.5 3.45 ls. C6 Korhonen to 4.5 5.45 ls. C8 Leppälä Nämä ovat kurssin viimeiset laskuharjoitukset. Tentti ti 26.2.209 klo 2.5-5.00 ls. A, ilmoittaudu NettiOpsussa viimeistään 24.2. Tähän tenttiin saa osallistua, jos on tehnyt kurssin aikana vähintään 30 % harjoituksista. ----------------------------------------------------------------------------------------------------------------------- Aihe: Regressioanalyysi, kertausta. Ohessa SPSS -harjoitusten 3 tehtävän analyysin liittyviä tuloksia Myynti-aineistosta. Esitä käytetty regressiomalli. Ilmoita estimoinnin tulos. Suorita tarpeelliset testaukset. Määritä selitysprosentti. Regression Residual Total ANOVA b Sum of Squares df Mean Square F Sig. 5780,440 2 2890,220 80,355,000 a 44,227 9 6,025 5924,667 a. Predictors: (Constant), Salesmen, Advertising b. Dependent Variable: Sale (Constant) Advertising Salesmen a. Dependent Variable: Sale Unstandardized a Standardized B Std. Error Beta t Sig. 32,277 6,253 5,62,00 2,506,329,452 7,626,000 4,759,40,688,596,000

2. Tutkitaan koululaispojilla, miten pojan ikä (vuosina), paino (kg) ja ponnistusvoima (cm) vaikuttavat Cooperin testin tulokseen. Analysointitulokset ohessa. Esitä käytetty regressiomalli. Ilmoita estimoinnin tulos. Suorita tarpeelliset testaukset. Paljonko keskimäärin juoksee poika, jonka ikä on 5 vuotta, paino 50 kg ja joka ponnistaa 47 cm? Summary Adjusted Std. Error of R R Square R Square the Estimate,58 a,338,325 284,520 a. Predictors: (Constant), PONNVOIM, PAINO, IKA Regression Residual Total ANOVA b Sum of Squares df Mean Square F Sig. 69720 3 2039906,707 25,99,000 a 980877 48 8095,872 800597 5 a. Predictors: (Constant), PONNVOIM, PAINO, IKA b. Dependent Variable: COOPER (Constant) IKA PAINO PONNVOIM Unstandardized a. Dependent Variable: COOPER a Standardized B Std. Error Beta t Sig. 642,73 32,788 2,37,000 68,24 6,554,50 4,2,000-3,64 2,633 -,542-5,70,000 4,422 3,500,43 4,2,000 3. Ohessa on histogrammi ja pisteparvi tehtävän 2 regressioanalyysiin liittyen. Mitä näissä on? Miten niitä käytetään hyväksi regressioanalyysissä? Tulkitse.

4. Tutkitaan liikennemäärien (Määrä) vaikutusta liikenteen sujuvuuteen (Nopeus). Saadaan oheiset analysointitulokset. Esitä käytetty regressiomalli. Ilmoita estimoinnin tulos. Estimoi nopeus, kun liikennemäärä on 7000.

5. Tutkitaan auton moottorin tehon vaikutusta kiihtyvyyteen. Saadaan oheiset analysointitulokset. Esitä käytetty regressiomalli. Mitkä ovat malliin liittyvät opetukset. Laske F-testisuure. Suorita tarpeelliset testaukset. Voitko olettaa malliin liittyvien oletusten olevan voimassa?

6. Täytä puuttuvat kohdat a) - d) oheisesta regressioanalyysiin liittyvistä estimointituloksista. Suorita testaukset. Response: y Parameter Estimates Term Estimate Std Error t Ratio Prob> t Intercept 30,736373 3,6088 8,52 0,0000 x 0,4345565 0,53 3,90 0,006 x2-0,8 0,07286-2,49 a) (arvioi) x4-0,40229 0,09925-4,04 0,002 Analysis of Variance Source DF Sum of Squares Mean Square F Ratio 3 97,85622 65,952 b) Error 4 03,25489 7,3753 Prob>F C Total 7 30, c) (arvioi) R 2 = d) 7. Tutki, miten kudostiheys muuttuu iän myötä. Käytä varianssianalyysiä ja sivulla https://coursepages.uta.fi/mtttp/esimerkkiaineistoja/ olevaa Rasvaprosentti-aineistoa http://www.sis.uta.fi/tilasto/tiltp_aineistoja/rasvaprosentti.sav (ks. muuttujien kuvaus http://www.sis.uta.fi/tilasto/tiltp_aineistoja/rasvaprosentti.pdf ). palautettavat tehtävät Harjoitus 5, tehtävä 7 (https://learning2.uta.fi/mod/assign/view.php?id=666475 ). Tee tehtävä viimeistään to 2.2. klo 6. 8. Tarkastellaan edellisen tehtävän rasvaprosenttiaineistoa. Muuta pituuden mittayksikkö metreiksi ja painon kilogrammoiksi. Muodosta näiden uusien muuttujien avulla muuttuja painoindeksi = paino/(pituus pituus). Piirrä painoindeksin histogrammi. Muodosta painon ja pituuden pisteparvi. Huomaat yhden virheellisen havainnon. Jätä se pois jatkotarkasteluista. Tutki, onko painoindeksin ja iän välillä riippuvuutta. Käytä ristiintaulukkoa ja 2 -testiä. palautettavat tehtävät Harjoitus 5, tehtävä 8 (https://learning2.uta.fi/mod/assign/view.php?id=666476 ). Tee tehtävä viimeistään to 2.2. klo 6. 9. Tarkastellaan sivulla https://coursepages.uta.fi/mtttp/esimerkkiaineistoja/ olevaa Audi_A6 aineistoa. Rakenna hinnalle regressiomalli. Huomioi mallin valinnassa myös residuaalitarkastelut. palautettavat tehtävät Harjoitus 5, tehtävä 9 (https://learning2.uta.fi/mod/quiz/view.php?id=666477). Tee tehtävä viimeistään to 2.2. klo 6.