Pylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 8.8% 8.9%.%.% 9.7%.7% Etelä Länsi Itä Oulu Lappi Ahvenanmaa Länsi Etelä Itä Oulu Lappi Ahvenanmaa Läänien kuntamäärät vuosina ja 9 Suomen kunnat lääneittäin vuosina ja 9 8.%.9%.%.8% 9.7%.%.%.%.%.7% 8.7%.8% Etelä Länsi Itä Oulu Lappi Ahvenanmaa 9 9 Länsi Etelä Itä Oulu Lappi Ahvenanmaa
Pylväsdiagrammi Tenttipisteet Box-plot-kuvio Pituuksien jana-laatikko-diagrammi 8 7 7 8 9 Vastaava kertymäfunktion kuvaaja Kertymäfunktion kuvaaja 8 8 Yllä oleva box-plot-kuvio on piirretty luentokalvojen pituusaineistosta oheisten tunnuslukujen mukaisesti: Min Q Md Q Max Mean.. 7. 8.. 7.8 Saman muuttujan perustunnusluvut ovat alla: Basic statistics: O N= Variable: min= in obs.# () max= in obs.# () mean=7.8 stddev=.77 skewness=. kurtosis=-.97 autocorrelation=.99 lower_q= median=7 upper_q=8 PISTEET
Histogrammi Pituusjakauma (varsinaiset luokkarajat) 7 Samasta aineistosta normitavalla väärin piirretty kuva. Pituusjakauma (alaraja ei kuulu luokkaan) 7 7 8 9 7 8 9 Varsinaiset luokkarajat Pyöristetyt luokkarajat Lukumäärä 9.-9. -9 9.-9. -9 9.-79. 7-79 79.-89. 8-89 89.-99. 9-99 99.-9. -9 Samasta aineistosta histogrammi, jossa on epätasavälinen luokitus. Pituusjakauma (epätasavälinen luokitus) 7 Yllä oikea luokitus ja kuva. Alla puolestaan väärä luokitus. Virheelliseen luokitukseen perustuva kuva löytyy viereiseltä palstalta. Varsinaiset luokkarajat Lukumäärä epätasavälinen luokitus -9-9 -9-9 7-79 7-79 8-89 8-89 9-99 9-9 -9 7 8 9
Frekvenssimonikulmio Frekvenssimonikulmio 7 Mallinne siitä kuinka viereinen frekvenssimonikulmio piirretään. Frekvenssimonikulmio 7 8 7 8 9 Janadiagrammi kahden nopan summista Kahden nopan summajakauma Ikäpyramidi Esimerkkiaineistojen ikäjakauma sukupuolittain Ikä Miehet Naiset 9 8 7 7 8 9
Ikäpyramidit miesten ja naisten pituuksista, painoista ja painoindeksistä. BMI Pituus Mies Nainen Paino Mies Nainen BMI Mies Nainen 8 7 8 8 7 8 7 8 8 7 8 9 8 8 9 9 8 Miehet Naiset 8 7 7 8 Miehet Naiset PAINO Miehet Naiset 9 9 8 8 7 7 9 8 7
RIIPPUVUUS Kahvin hyvyys suhteessa teehen ja kaakaoon 8 TEM EM EiM SM TSM Kaakao on hyvempää kuin kahvi. Tee on hyvempää kuin kahvi: TEM EM EiM SM TSM Ensimmäisestä kuvaajasta nähdään, että muuttujien välillä on selkeä riippuvuus. K\T TEM EM EiM SM TSM TSM SM 9 EiM 8 EM 7 TEM Toisessa kuvaajassa sen ei sijaan ole havaittavissa riippuvuutta. S\K TEM EM EiM SM TSM TSM 9 8 7 SM EiM EM 7 7 7 TEM 8 Karkeista pitäminen suhteessa suklaatyyppiin 8 TEM EM EiM SM TSM Salmiakki on hyvempää kuin hedelmäkarkki Tumma hyvempää kuin vaalea TEM EM EiM SM TSM Iän ja pituuden välinen riippuvuus (r=-.). Pituuden ja painon välinen riippuvuus (r=.99) Pituuden ja painon välinen riippuvuus (r=.99) 9 8 7 7 7 8 8 9 IKÄ PAINO 9 8 7 7 8 9 PAINO 9 8 7 7 8 9 Muuttujat ovat lähes riippumattomia. Muuttujien välillä selkeä positiivinen riippuvuus 9 % n tasa-arvokäyrä osoittaa riippuvuutta.
LINEAARINEN REGRESSIOANALYYSI Pistediagrammi PAINE 7 Aineisto: Henkilö 7 8 Ikä 7 Verenpaine 8 9 7 PNS-suoran yhtälö: PAINE=8.+.7*IKÄ PNS-suora PAINE 7 7 IKÄ Means, std.devs and correlations of VERENPAINE N=8 Variable Mean Std.dev. IKÄ..777 PAINE..97 Correlations: IKÄ PAINE IKÄ..99 PAINE.99. Linear regression analysis: Data VERENPAINE, Regressand PAINE N=8 Variable Regr.coeff. Std.dev. t beta IKÄ.7.978.7.99 constant 8.78 9.87 9. Variance of regressand PAINE=7.78 df=7 Residual variance=.888 df= R=.99 R^=.8 Linear regression analysis: Data VERENPAINE, Regressand IKÄ N=8 Variable Regr.coeff. Std.dev. t beta PAINE.7..7.99 constant -. 7. -. Variance of regressand IKÄ=.87 df=7 Residual variance=.8 df= R=.99 R^=.8 7 Käänteisen mallin PNS-suoran yhtälö: IKÄ=-.+.7*PAINE PNS-suorat PAINE 7 7 IKÄ IKÄ 7
BINOMIJAKAUMA Parametrin p vaikutus binomijakauman muotoon. Bin(,.) Bin(,.9) Bin(,.) Kertymäfunktion kuvaaja Bin(,.) 9 8 7 8
Parillisten saantitodennäköisyys heitettäessä noppaa kertaa Kuutosten saantitodennäköisyys heitettäessä noppaa kertaa 7 8 9 7 8 9 Binomijakauman normaaliapproksimaatio Parillisten saantitodennäköisyys heitettäessä noppaa kertaa X~N(np, np(-p)) Binomijakauman normaaliapproksimaatio 7 8 9 7 89 7 8 9 7 89 9
NORMAALIJAKAUMAN STANDARDOINTI odotusarvo= ja varianssi= odotusarvo= ja varianssi=. P. P.................. - - - - - - 7 8-8 -7 - - - - - - 7 8 X Z Alkuperäinen normaalijakauma X~N(, ) odotusarvo= ja varianssi= Havainnot jaettu keskihajonnalla X~N(,) odotusarvo= ja varianssi=. P. P.................. - - - - - - 7 8-8 -7 - - - - - - 7 8 X Z Havainnoista vähennetty keskiarvo X~N(,) Standardoitu normaalijakauma Z~N(,)
TODENNÄKÖISYYSJAKAUMIA odotusarvo=7, varianssi=,otoskoot:,,, t-jakauma lähestyy normaalijakaumaa (df=,,,8,,,,8).................... 7 8 9 - - -8 - - - 8 X Muuttujan X jakauma suhteessa otoskeskiarvon jakaumaan :lla otoskoolla khi-jakauman tiheysfunktion kuvaaja vapausasteilla -9. Musta viiva on N(,) F-jakauman tiheysfunktion kuvaaja (df:,,8,,,,8, ja df:)...........9.8.7.......9.8.7......