Pylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 2003 LKM 14.8% 11.2% 19.7% 4.9% 3.6% 45.

Samankaltaiset tiedostot
vkp 4*(1+0)/(32-3)-1= vkp 2*(1+0)/(32-3)=

Teema 3: Tilastollisia kuvia ja tunnuslukuja

Käytetään satunnaismuuttujaa samoin kuin tilastotieteen puolella:

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

Harjoittele tulkintoja


Til.yks. x y z

Mat Tilastollisen analyysin perusteet. Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen Väliestimointi

805306A Johdatus monimuuttujamenetelmiin, 5 op

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE Ratkaisut ja arvostelu < X 170

Tilastollinen aineisto Luottamusväli

riippumattomia ja noudattavat samaa jakaumaa.

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

Lisätehtäviä ratkaisuineen luentomonisteen lukuihin 2-4 liittyen

/1. MTTTP5, luento Normaalijakauma (jatkuu) Binomijakaumaa voidaan approksimoida normaalijakaumalla

Esimerkki 1: auringonkukan kasvun kuvailu

Normaalijakaumasta johdettuja jakaumia

Sovellettu todennäköisyyslaskenta B

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

Miten voidaan arvioida virheellisten komponenttien osuutta tuotannossa? Miten voidaan arvioida valmistajan kynttilöiden keskimääräistä palamisaikaa?

Matematiikan kotitehtävä 2, MAA 10 Todennäköisyys ja tilastot

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia

MTTTP1, luento KERTAUSTA

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

pisteet Frekvenssi frekvenssi Yhteensä

Jatkuvat satunnaismuuttujat

SEPPO MUSTONEN

Moniulotteisia todennäköisyysjakaumia

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia

Esim. Pulssi-muuttujan frekvenssijakauma, aineisto luentomoniste liite 4

Tilastollisen analyysin perusteet Luento 1: Lokaatio ja hajonta

Juuri 10 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

MTTTP1, luento KERTAUSTA JA TÄYDENNYSTÄ. Tunnusluvut. 1) Sijainnin tunnuslukuja. Keskilukuja moodi (Mo) mediaani (Md) keskiarvo, kaava (1)

Hannu mies LTK 180 Johanna nainen HuTK 168 Laura nainen LuTK 173 Jere mies NA 173 Riitta nainen LTK 164

tilastotieteen kertaus

TUTKIMUSOPAS. SPSS-opas

6. laskuharjoitusten vastaukset (viikot 10 11)

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

Teema 8: Parametrien estimointi ja luottamusvälit

Harjoitus 2: Matlab - Statistical Toolbox

1.Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

Todennäköisyysjakaumia

Sovellettu todennäköisyyslaskenta B

2. Jatkoa HT 4.5:teen ja edelliseen tehtavään: Määrää X:n kertymäfunktio F (x) ja laske sen avulla todennäköisyydet

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

806109P TILASTOTIETEEN PERUSMENETELMÄT I Hanna Heikkinen Esimerkkejä estimoinnista ja merkitsevyystestauksesta, syksy (1 α) = 99 1 α = 0.

Lauri Tarkkonen: Erottelu analyysi

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Mat Tilastollisen analyysin perusteet, kevät 2007

4. Seuraavaan ristiintaulukkoon on kerätty tehtaassa valmistettujen toimivien ja ei-toimivien leikkijunien lukumäärät eri työvuoroissa:

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

1. Normaalisuuden tutkiminen, Bowmanin ja Shentonin testi, Rankit Plot, Wilkin ja Shapiron testi

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Diskreetin satunnaismuuttujan odotusarvo, keskihajonta ja varianssi

MTTTP1, luento KERTAUSTA

MTTTP1, luento KERTAUSTA

Til.yks. x y z

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Estimointi. Vilkkumaa / Kuusinen 1

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

dx=5&uilang=fi&lang=fi&lvv=2014

Mat Sovellettu todennäköisyyslasku 5. harjoitukset/ratkaisut. Jatkuvat jakaumat

Tehtävät. 1. Ratkaistava epäyhtälöt. a) 2(4 x) < 12, b) 5(x 2 4x + 3) < 0, c) 3 2x 4 > 6. 1/10. Sukunimi (painokirjaimin)

Kandidaatintutkielman aineistonhankinta ja analyysi

Diskreetit todennäköisyysjakaumat. Kertymäfunktio Odotusarvo Binomijakauma Poisson-jakauma

Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia: Mitä opimme?

Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia. TKK (c) Ilkka Mellin (2005) 1

MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

Mat Tilastollisen analyysin perusteet, kevät 2007

A130A0650-K Tilastollisen tutkimuksen perusteet 6 op Tentti / Anssi Tarkiainen & Maija Hujala

Laskari 1 P I T U U S

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tilastolliset toiminnot

MTTTP5, luento Otossuureita ja niiden jakaumia (jatkuu)

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

1. Nollahypoteesi on, että teksti on kirjoitettu lyhyemmällä murteella. Mahdollisiavaihtoehtojaonvainyksieliettäteksti

Teema 7: Todennäköisyyksien laskentaa

Johdatus todennäköisyyslaskentaan Jatkuvia jakaumia. TKK (c) Ilkka Mellin (2005) 1

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset.

Johdatus tilastotieteeseen Väliestimointi. TKK (c) Ilkka Mellin (2005) 1

7.4 Normaalijakauma (kertausta ja täydennystä) Taulukosta P(Z 1,6449) = 0,05, P(Z -1,6449) = 0,05 P(Z 1,96) = 0,025, P(Z -1,96) = 0,025

Mat Sovellettu todennäköisyyslasku A

Suotuisien tapahtumien lukumäärä Kaikki alkeistapahtumien lukumäärä

Leikkijunan kunto toimiva ei-toimiva Työvuoro aamuvuoro päivävuoro iltavuoro

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

3.7 Todennäköisyysjakaumia

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo

Sovellettu todennäköisyyslaskenta B

(b) Tarkista integroimalla, että kyseessä on todella tiheysfunktio.

2. Aineiston kuvailua

SISÄLTÖ 1 TILASTOJEN KÄYTTÖ...7 MITÄ TILASTOTIEDE ON?

Transkriptio:

Pylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 8.8% 8.9%.%.% 9.7%.7% Etelä Länsi Itä Oulu Lappi Ahvenanmaa Länsi Etelä Itä Oulu Lappi Ahvenanmaa Läänien kuntamäärät vuosina ja 9 Suomen kunnat lääneittäin vuosina ja 9 8.%.9%.%.8% 9.7%.%.%.%.%.7% 8.7%.8% Etelä Länsi Itä Oulu Lappi Ahvenanmaa 9 9 Länsi Etelä Itä Oulu Lappi Ahvenanmaa

Pylväsdiagrammi Tenttipisteet Box-plot-kuvio Pituuksien jana-laatikko-diagrammi 8 7 7 8 9 Vastaava kertymäfunktion kuvaaja Kertymäfunktion kuvaaja 8 8 Yllä oleva box-plot-kuvio on piirretty luentokalvojen pituusaineistosta oheisten tunnuslukujen mukaisesti: Min Q Md Q Max Mean.. 7. 8.. 7.8 Saman muuttujan perustunnusluvut ovat alla: Basic statistics: O N= Variable: min= in obs.# () max= in obs.# () mean=7.8 stddev=.77 skewness=. kurtosis=-.97 autocorrelation=.99 lower_q= median=7 upper_q=8 PISTEET

Histogrammi Pituusjakauma (varsinaiset luokkarajat) 7 Samasta aineistosta normitavalla väärin piirretty kuva. Pituusjakauma (alaraja ei kuulu luokkaan) 7 7 8 9 7 8 9 Varsinaiset luokkarajat Pyöristetyt luokkarajat Lukumäärä 9.-9. -9 9.-9. -9 9.-79. 7-79 79.-89. 8-89 89.-99. 9-99 99.-9. -9 Samasta aineistosta histogrammi, jossa on epätasavälinen luokitus. Pituusjakauma (epätasavälinen luokitus) 7 Yllä oikea luokitus ja kuva. Alla puolestaan väärä luokitus. Virheelliseen luokitukseen perustuva kuva löytyy viereiseltä palstalta. Varsinaiset luokkarajat Lukumäärä epätasavälinen luokitus -9-9 -9-9 7-79 7-79 8-89 8-89 9-99 9-9 -9 7 8 9

Frekvenssimonikulmio Frekvenssimonikulmio 7 Mallinne siitä kuinka viereinen frekvenssimonikulmio piirretään. Frekvenssimonikulmio 7 8 7 8 9 Janadiagrammi kahden nopan summista Kahden nopan summajakauma Ikäpyramidi Esimerkkiaineistojen ikäjakauma sukupuolittain Ikä Miehet Naiset 9 8 7 7 8 9

Ikäpyramidit miesten ja naisten pituuksista, painoista ja painoindeksistä. BMI Pituus Mies Nainen Paino Mies Nainen BMI Mies Nainen 8 7 8 8 7 8 7 8 8 7 8 9 8 8 9 9 8 Miehet Naiset 8 7 7 8 Miehet Naiset PAINO Miehet Naiset 9 9 8 8 7 7 9 8 7

RIIPPUVUUS Kahvin hyvyys suhteessa teehen ja kaakaoon 8 TEM EM EiM SM TSM Kaakao on hyvempää kuin kahvi. Tee on hyvempää kuin kahvi: TEM EM EiM SM TSM Ensimmäisestä kuvaajasta nähdään, että muuttujien välillä on selkeä riippuvuus. K\T TEM EM EiM SM TSM TSM SM 9 EiM 8 EM 7 TEM Toisessa kuvaajassa sen ei sijaan ole havaittavissa riippuvuutta. S\K TEM EM EiM SM TSM TSM 9 8 7 SM EiM EM 7 7 7 TEM 8 Karkeista pitäminen suhteessa suklaatyyppiin 8 TEM EM EiM SM TSM Salmiakki on hyvempää kuin hedelmäkarkki Tumma hyvempää kuin vaalea TEM EM EiM SM TSM Iän ja pituuden välinen riippuvuus (r=-.). Pituuden ja painon välinen riippuvuus (r=.99) Pituuden ja painon välinen riippuvuus (r=.99) 9 8 7 7 7 8 8 9 IKÄ PAINO 9 8 7 7 8 9 PAINO 9 8 7 7 8 9 Muuttujat ovat lähes riippumattomia. Muuttujien välillä selkeä positiivinen riippuvuus 9 % n tasa-arvokäyrä osoittaa riippuvuutta.

LINEAARINEN REGRESSIOANALYYSI Pistediagrammi PAINE 7 Aineisto: Henkilö 7 8 Ikä 7 Verenpaine 8 9 7 PNS-suoran yhtälö: PAINE=8.+.7*IKÄ PNS-suora PAINE 7 7 IKÄ Means, std.devs and correlations of VERENPAINE N=8 Variable Mean Std.dev. IKÄ..777 PAINE..97 Correlations: IKÄ PAINE IKÄ..99 PAINE.99. Linear regression analysis: Data VERENPAINE, Regressand PAINE N=8 Variable Regr.coeff. Std.dev. t beta IKÄ.7.978.7.99 constant 8.78 9.87 9. Variance of regressand PAINE=7.78 df=7 Residual variance=.888 df= R=.99 R^=.8 Linear regression analysis: Data VERENPAINE, Regressand IKÄ N=8 Variable Regr.coeff. Std.dev. t beta PAINE.7..7.99 constant -. 7. -. Variance of regressand IKÄ=.87 df=7 Residual variance=.8 df= R=.99 R^=.8 7 Käänteisen mallin PNS-suoran yhtälö: IKÄ=-.+.7*PAINE PNS-suorat PAINE 7 7 IKÄ IKÄ 7

BINOMIJAKAUMA Parametrin p vaikutus binomijakauman muotoon. Bin(,.) Bin(,.9) Bin(,.) Kertymäfunktion kuvaaja Bin(,.) 9 8 7 8

Parillisten saantitodennäköisyys heitettäessä noppaa kertaa Kuutosten saantitodennäköisyys heitettäessä noppaa kertaa 7 8 9 7 8 9 Binomijakauman normaaliapproksimaatio Parillisten saantitodennäköisyys heitettäessä noppaa kertaa X~N(np, np(-p)) Binomijakauman normaaliapproksimaatio 7 8 9 7 89 7 8 9 7 89 9

NORMAALIJAKAUMAN STANDARDOINTI odotusarvo= ja varianssi= odotusarvo= ja varianssi=. P. P.................. - - - - - - 7 8-8 -7 - - - - - - 7 8 X Z Alkuperäinen normaalijakauma X~N(, ) odotusarvo= ja varianssi= Havainnot jaettu keskihajonnalla X~N(,) odotusarvo= ja varianssi=. P. P.................. - - - - - - 7 8-8 -7 - - - - - - 7 8 X Z Havainnoista vähennetty keskiarvo X~N(,) Standardoitu normaalijakauma Z~N(,)

TODENNÄKÖISYYSJAKAUMIA odotusarvo=7, varianssi=,otoskoot:,,, t-jakauma lähestyy normaalijakaumaa (df=,,,8,,,,8).................... 7 8 9 - - -8 - - - 8 X Muuttujan X jakauma suhteessa otoskeskiarvon jakaumaan :lla otoskoolla khi-jakauman tiheysfunktion kuvaaja vapausasteilla -9. Musta viiva on N(,) F-jakauman tiheysfunktion kuvaaja (df:,,8,,,,8, ja df:)...........9.8.7.......9.8.7......