MATRIISILASKENTAA MATRIX ESIM1 /// PITUUS PAINO IKA SP X X X

Samankaltaiset tiedostot
Ennakkoväkiluku Lapin kunnissa ja seutukunnissa kuukausittain vuonna 2014

Ennakkoväkiluku Lapin kunnissa ja seutukunnissa kuukausittain vuonna 2014

Pylväsdiagrammi Suomen kunnat lääneittäin vuonna Piirakkadiagrammi Suomen kunnat lääneittäin vuonna 2003 LKM 14.8% 11.2% 19.7% 4.9% 3.6% 45.

V u o s i k u u k a u s i t t a i s e t e n n a k k o t i e d o t

Ennakkoväkiluku Lapin kunnissa ja seutukunnissa kuukausittain vuonna 2010

Väkilukuindeksin kehitys Lapin seutukunnissa (e)

Ennakkoväkiluku Lapin kunnissa ja seutukunnissa kuukausittain vuonna 2013

Ennakkoväkiluku Lapin kunnissa ja seutukunnissa kuukausittain vuonna 2013

Laskuharjoitus 3. Pääkomponenttianalyysin tulokset olivat seuraavat:

Ennakkoväkiluku Lapin kunnissa ja seutukunnissa kuukausittain vuonna 2015

Työpaikat (alueella työssäkäyvät työlliset) työnantajasektorin ja toimialan (TOL 2008) mukaan

MAATALOUSYRITTÄJIEN OPINTORAHA

Ennakkoväkiluku Lapin kunnissa ja seutukunnissa kuukausittain vuonna 2010

Ennakkoväkiluku Lapin kunnissa ja seutukunnissa kuukausittain vuonna 2016

Ennakkoväkiluku Lapin kunnissa ja seutukunnissa kuukausittain vuonna 2016

Ennakkoväkiluku Lapin kunnissa ja seutukunnissa kuukausittain vuonna 2016

KUNTIEN TALOUSARVIOT V. 2011

V u o s i k u u k a u s i t t a i s e t e n n a k k o t i e d o t

Ennakkoväkiluku Lapin kunnissa ja seutukunnissa kuukausittain vuonna 2016

Ennakkoväkiluku Lapin kunnissa ja seutukunnissa kuukausittain vuonna 2016

Ennakkoväkiluku Lapin kunnissa ja seutukunnissa kuukausittain vuonna 2015

1. YKSISUUNTAINEN VARIANSSIANALYYSI: AINEISTON ESITYSMUODOT

LAPIN KUNTIEN PALVELUTUOTANNON NETTOKUSTANNUKSIA VUODELTA 2006 euroa / asukas

Esim Brand lkm keskiarvo keskihajonta A ,28 5,977 B ,06 3,866 C ,95 4,501

Tässä harjoituksessa käydään läpi R-ohjelman käyttöä esimerkkidatan avulla. eli matriisissa on 200 riviä (havainnot) ja 7 saraketta (mittaus-arvot)

Lauri Tarkkonen: Erottelu analyysi

Tuulivoimarakentamisen vaikutukset


vkp 4*(1+0)/(32-3)-1= vkp 2*(1+0)/(32-3)=

Perusnäkymä yksisuuntaiseen ANOVAaan

Enontekiö. Kittilä. Muonio. Kolari. Pello Rovaniemi. Ylitornio. Tornio. Kemi

VARIANSSIANALYYSI ANALYSIS OF VARIANCE

voidaan hylätä, pienempi vai suurempi kuin 1 %?

Tilastollisen analyysin perusteet Luento 10: Johdatus varianssianalyysiin

LAPIN KUNTIEN NETTOKUSTANNUKSET 2005 EUROA / ASUKAS (pois lukien liiketoiminta) Lähde: Tilastokeskus

TKMS7a-f/LRS20a-f/MAS2/KVS2/TMS82a-f/JOM/TJM/YRM Monimuuttujamenetelmien soveltaminen taloustieteissä. Tentti

OHJ-7600 Ihminen ja tekniikka -seminaari, 4 op Käyttäjäkokemuksen kvantitatiivinen analyysi. Luento 3

Lapin liitto Kuntakohtainen katsaus talousarvioihin. Henkilöstömenojen osalta huomioitava lomituspalvelujen hoito:

Omaishoitajaliitto Lähellä ja tukena

pisteet Frekvenssi frekvenssi Yhteensä

Data-analyysi II. Sisällysluettelo. Simo Kolppo [Type the document subtitle]

Lisätehtäviä ratkaisuineen luentomonisteen lukuun 6 liittyen., jos otoskeskiarvo on suurempi kuin 13,96. Mikä on testissä käytetty α:n arvo?

Yleistetyistä lineaarisista malleista

Kvantitatiiviset menetelmät

Kunnan perusturvalautakunta/ sosiaali- ja terveyspalveluista vastaava toimielin

Tavanomaisten otostunnuslukujen, odotusarvon luottamusvälin ja Box ja Whisker -kuvion määritelmät: ks. 1. harjoitukset.

Kehitetään ikäihmisten kotihoitoa ja vahvistetaan kaikenikäisten omaishoitoa

Hirvikolariseuranta. Lappi Lapin ELY, Ramboll Finland Oy

Odotusarvoparien vertailu. Vilkkumaa / Kuusinen 1

Yksisuuntainen varianssianalyysi (jatkoa) Heliövaara 1

1. PÄÄTTELY YHDEN SELITTÄJÄN LINEAARISESTA REGRESSIOMALLISTA

KUNTIEN MAKSAMAT MAATALOUSTUET

xi = yi = 586 Korrelaatiokerroin r: SS xy = x i y i ( x i ) ( y i )/n = SS xx = x 2 i ( x i ) 2 /n =

Yksisuuntainen varianssianalyysi (jatkoa) Kuusinen/Heliövaara 1

54. Tehdään yhden selittäjän lineaarinen regressioanalyysi, kun selittäjänä on määrällinen muuttuja (ja selitettävä myös):

11 Lappi Kuntatyypit ja kulttuuripalvelujen sijainti

Ongelma: Poikkeaako perusjoukon suhteellinen osuus vertailuarvosta?

Lapin maahanmuuttotilastoja. Lapin ELY-keskus

MAAOMAISUUS Vuosittain:

Jukka Hakola ja Päivi Alaraudanjoki

MTTTP5, luento Luottamusväli, määritelmä

Lastensuojelun tilastotietoon liittyvää pohdintaa

Tilastollinen testaus. Vilkkumaa / Kuusinen 1

HIRVIKOLARISEURANTA LAPPI Lapin ELY, Ramboll Finland Oy

Mediaanikorko on kiinteäkorkoiselle lainalle korkeampi. Tämä hypoteesi vastaa taloustieteen käsitystä korkojen määräytymismekanismista.

Sovellettu todennäköisyyslaskenta B

Hyvinvointikertomukset Lapin kunnissa

Frequencies. Frequency Table

Lapin maahanmuuttotilastoja Anne-Mari Suopajärvi Lapin ELY-keskus

Alueelliset vastuumuseot 2020

Tilastollisen analyysin perusteet Luento 8: Lineaarinen regressio, testejä ja luottamusvälejä

Lapin maahanmuuttotilastoja

Lapin kuntatalous Lapin liiton kuntataloustyöryhmä Tapani Melaluoto Puheenjohtaja

Tilastollisen analyysin perusteet Luento 11: Epäparametrinen vastine ANOVAlle

Toimiva kotihoito Lappiin -monipuoliset tuen muodot kotona asumiseen

Tehtävä 1. (a) JYVÄSKYLÄN YLIOPISTO Matematiikan ja tilastotieteen laitos Parametrittomat ja robustit menetelmät Harjoitukset 7, vastaukset

Julkaistu Helsingissä 30 päivänä syyskuuta /2014 Valtioneuvoston asetus

Kaksisuuntaisen varianssianalyysin tilastollisessa malli voidaan esittää seuraavassa muodossa:

Valtioneuvoston asetus

Tilastollisen analyysin perusteet Luento 9: Moniulotteinen lineaarinen. regressio

Regressioanalyysi. Vilkkumaa / Kuusinen 1

Marika Silvenius Vanhustyön johtamisen kehittämisrakenne

Sanna Hiltunen, Itä-Lapin MAKO-verkosto , Kemijärvi

INHIMILLISESTI AMMATILLISESTI LUOTETTAVASTI. Lapin pelastuslaitos

Opiskeluterveydenhuollon valvonta

Kuntien maaseutuviranomaisten yhteystiedot

LUOTTAMUSELINTEN PUHEENJOHTAJUUDET SUKUPUOLEN MUKAAN LAPISSA

805306A Johdatus monimuuttujamenetelmiin, 5 op

Riittääkö puu VMI-tulokset

Mat Tilastollisen analyysin perusteet. Testit suhdeasteikollisille muuttujille. Avainsanat:

Sisällysluettelo 6 VARIANSSIANALYYSI. Metsämuuronen: Monimuuttujamenetelmien perusteet SPSS-ympäristössä ALKUSANAT... 4 ALKUSANAT E-KIRJA VERSIOON...

Maa- ja metsätalouden keskeisiä indikaattoreita. Posio ELY-keskus: Lappi. Suomen Gallup Elintarviketieto Oy 1. Suomen Gallup Elintarviketieto Oy

Johdatus varianssianalyysiin. Vilkkumaa / Kuusinen 1

Jukka Hakola ja Päivi Alaraudanjoki

Väliestimointi (jatkoa) Heliövaara 1

Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 4: Asetelmaperusteinen monimuuttuja-analyysi

Leader Tunturi-Lappi ry (LTL) Enontekiö, Kittilä, Kolari, Muonio. Leader Outokaira tuottamhan (Outokaira) Tornio, Pello, Ylitornio

A250A0050 Ekonometrian perusteet Tentti

PANEELI: LIIKENNESTRATEGIAT JA KÄYTÄNTÖ MITÄ POHJOISESSA PITÄISI TEHDÄ? L M. Hanne Junnilainen Liikenne- ja maankäyttöasiantuntija Kiila Consulting

Transkriptio:

MATRIISILASKENTAA MATRIX ESIM1 X1 167 77 36 0 X2 187 71 24 1 X3 164 58 32 0 MAT DIM ESIM1 /* rowesim1=3 colesim1=4 / selvitetään matriisin dimensiot MAT YKS=CON(3,1) / muodostetaan pystyvektori, jossa on havaintojen lukumäärä ykkösiä MATRIX YKS /// YKS 1 1 2 1 3 1 MAT SUMMA=YKS'*ESIM1 / lasketaan muuttujasummat MATRIX SUMMA 1 518 206 92 1 MAT YKS2=INV(YKS'*YKS) / lasketaan ykkösten summa ja muodostetaan siitä käänteisluku MATRIX YKS2 /// 1 1 0.333333 MAT KESKIARVOVEKTORI=SUMMA*YKS2 / jaetaan muuttujasumma havaintojen määrällä MATRIX KESKIARVOVEKTORI 1 172.6667 68.6667 30.6667 0.3333 MAT KESKIARVOMATRIISI=YKS*KESKIARVOVEKTORI MATRIX KESKIARVOMATRIISI 1 172.6667 68.6667 30.6667 0.3333 2 172.6667 68.6667 30.6667 0.3333 3 172.6667 68.6667 30.6667 0.3333 MAT POIKKEAMAMATRIISI=ESIM1-KESKIARVOMATRIISI / lasketaan havaintojen poikkeama keskiarvosta MATRIX POIKKEAMAMATRIISI X1-5.6667 8.3333 5.3333-0.3333 X2 14.3333 2.3333-6.6667 0.6667 X3-8.6667-10.6667 1.3333-0.3333 1

MAT NELIOSUMMAMATRIISI=POIKKEAMAMATRIISI'*POIKKEAMAMATRIISI / poikkeamien neliösummat MATRIX NELIOSUMMAMATRIISI PITUUS 312.667 78.667-137.333 14.333 PAINO 78.667 188.667 14.667 2.333 IKA -137.333 14.667 74.667-6.667 SP 14.333 2.333-6.667 0.667 MAT KOVARIANSSIMATRIISI=NELIOSUMMAMATRIISI/(n-1) / jaetaan neliösummat vapausasteillaan MATRIX KOVARIANSSIMATRIISI PITUUS 156.333 39.333-68.667 7.167 PAINO 39.333 94.333 7.333 1.167 IKA -68.667 7.333 37.333-3.333 SP 7.167 1.167-3.333 0.333 MAT DIAGONAALI=DIAG(KOVARIANSSIMATRIISI) MAT TRANSFORM DIAGONAALI BY SQRT(X#) / muodostetaan diagonaalimatriisi variansseista / otetaan variansseista neliöjuuri MATRIX DIAGONAALI PITUUS 12.50333 0.00000 0.00000 0.00000 PAINO 0.00000 9.71253 0.00000 0.00000 IKA 0.00000 0.00000 6.11010 0.00000 SP 0.00000 0.00000 0.00000 0.57735 MAT KORRELAATIOMATRIISI=INV(DIAGONAALI)*KOVARIANSSIMATRIISI*INV(DIAGONAALI) MATRIX KORRELAATIOMATRIISI PITUUS 1.00000 0.32389-0.89882 0.99278 PAINO 0.32389 1.00000 0.12357 0.20805 IKA -0.89882 0.12357 1.00000-0.94491 SP 0.99278 0.20805-0.94491 1.00000... CORR AINEISTOO*,CUR+1 Means, std.devs and correlations of AINEISTOO* N=3 Variable Mean Std.dev. Pituus 172.6667 12.50333 Paino 68.66667 9.712535 Ikä 30.66667 6.110101 SP 0.333333 0.577350 Correlations: Pituus Paino Ikä SP Pituus 1.0000 0.3239-0.8988 0.9928 Paino 0.3239 1.0000 0.1236 0.2081 Ikä -0.8988 0.1236 1.0000-0.9449 SP 0.9928 0.2081-0.9449 1.0000 2

REGRESSIOANALYYSI MATRIX Y MATRIX X /// Paino /// Vakio Pituus Ikä SP 1 70 1 1 160 75 0 2 77 2 1 167 36 0 3 71 3 1 187 24 1 4 106 4 1 194 26 1 5 72 5 1 179 42 1 6 63 6 1 164 46 0 7 58 7 1 164 32 0 MAT B=INV(X'*X)*X'*Y MATRIX B /// Paino Vakio -471.388 Pituus 3.115 Ikä 0.601 SP -45.417... Linear regression analysis: Data AINE2, Regressand Paino N=7 Variable Regr.coeff. Std.dev. t beta Pituus 3.114578 0.876703 3.553 2.645 Ikä 0.600541 0.282290 2.127 0.671 SP -45.41678 18.56626-2.446-1.568 constant -471.3877 152.3452-3.094 Variance of regressand Paino=239.8095238 df=6 Residual variance=63.94293378 df=3 R=0.9310 R^2=0.8667 Mallin yhtälö on: Paino=3.115*Pituus+0.601*Ikä-45.42*SP-471.4 Malli selittää 86.67% Painon vaihtelusta. Nyrkkisäännön mukaan kaikki selittäjät ovat merkitseviä, koska kaikkien t >2. Eksaktimmin testattaessa, verrattaisiin saatuja t-testisuureita vapausastetta (n-k-1) ja valittua merkitsevyystasoa vastaavaan t-jakauman arvoon. 3

FAKTORIANALYYSI (eksploratiivinen) Aineistona on kymmenottelutulokset vuoden 2008 olympialaisista ja vuoden 2011 yleisurheilun mm-kisoista. Kisan keskeyttäneet on poistettu. Kolmelta ottelijalta puuttuu seiväshyppytulos, joten he eivät ole mallinnuksessa mukana. Means, std.devs and correlations of DECA0811 N=48 # of missing observations =3 Variable Mean Std.dev. 100ma 10.99089 0.255297 pituus 7.253111 0.260540 kuula 14.54533 1.119983 korkeus 1.994000 0.071966 400ma 49.43133 1.310339 110m_aid 14.54778 0.423583 kiekko 44.77422 4.043349 seiväs 4.731111 0.299865 keihäs 60.15822 7.596065 1500ma 4.456667 0.239450 100ma pituus kuula korkeus 400ma 110m_ai kiekko seiväs keihäs 1500ma 100ma 1.0000-0.3584-0.0927 0.1902 0.6023 0.6097-0.0480 0.0715 0.1497-0.1836 pituus -0.3584 1.0000-0.1384 0.5055-0.3968-0.0787-0.0794 0.2603 0.1637-0.0653 kuula -0.0927-0.1384 1.0000 0.0412 0.3050-0.1494 0.6618 0.1366 0.2875 0.4500 korkeus 0.1902 0.5055 0.0412 1.0000 0.1979 0.1061 0.1614 0.2753 0.3546-0.1096 400ma 0.6023-0.3968 0.3050 0.1979 1.0000 0.5542 0.2088-0.1346 0.0527 0.3227 110m_aid 0.6097-0.0787-0.1494 0.1061 0.5542 1.0000-0.1133-0.1589-0.1634-0.1414 kiekko -0.0480-0.0794 0.6618 0.1614 0.2088-0.1133 1.0000 0.0495 0.2490 0.2052 seiväs 0.0715 0.2603 0.1366 0.2753-0.1346-0.1589 0.0495 1.0000 0.4823-0.2698 keihäs 0.1497 0.1637 0.2875 0.3546 0.0527-0.1634 0.2490 0.4823 1.0000-0.0134 1500ma -0.1836-0.0653 0.4500-0.1096 0.3227-0.1414 0.2052-0.2698-0.0134 1.0000 Alkuperäinen maximum-likelihood menetelmällä saatu faktorilatausmatriisi: F1 F2 F3 F4 h^2 100ma -0.373 0.616-0.434 0.287 0.789 pituus 0.997 0.024-0.000-0.005 0.995 kuula -0.144 0.256 0.797 0.129 0.738 korkeus 0.496 0.489-0.001 0.276 0.561 400ma -0.418 0.845 0.067-0.125 0.910 110m_aid -0.096 0.622-0.451-0.153 0.622 kiekko -0.083 0.206 0.613 0.188 0.461 seiväs 0.262 0.041 0.072 0.630 0.473 keihäs 0.162 0.206 0.255 0.605 0.500 1500ma -0.073 0.215 0.553-0.421 0.535 Varimax-rotatoitu ja latausten mukaan järjestetty lopullinen faktorilatausmatriisi: F2 F3 F4 F1 Sumsq 400ma 0.839 0.430-0.097-0.103 0.910 100ma 0.815-0.162 0.243-0.199 0.789 110m_aid 0.744-0.166-0.150 0.133 0.622 kuula -0.037 0.829 0.209-0.076 0.738 1500ma 0.001 0.639-0.349 0.068 0.535 kiekko -0.028 0.628 0.253-0.044 0.461 seiväs -0.070-0.023 0.666 0.156 0.473 keihäs 0.034 0.220 0.660 0.118 0.500 pituus -0.276-0.128 0.137 0.940 0.995 korkeus 0.281 0.074 0.385 0.574 0.561 Sumsqr 2.085 1.800 1.366 1.331 Ensimmäinen faktori voitaneen latausten perusteella nimetä nopeudeksi. Toinen faktori voidaan nimetä voimaksi. Kolmas faktori on hieman epäselvä, mutta kyseeseen voisi tulla jonkinmoinen suoritustekniikka. Viimeinen faktori olkoon ponnistusvoima. 4

PÄÄKOMPONENTTIANALYYSI Alla on pääkomponenttianalyysi ajettuna yllä olevalle kymmenotteluaineistolle. Principal_components /// PCOMP1 PCOMP2 PCOMP3 PCOMP4 PCOMP5 PCOMP6 PCOMP7 PCOMP8 PCOMP9 PCOMP10 100ma 0.74009 0.18869 0.49074-0.20681-0.07073 0.09686 0.02872 0.19320-0.27756-0.05900 pituus -0.53915-0.30803 0.40850 0.58941 0.01043-0.17560-0.17751 0.07067-0.07023-0.16669 kuula 0.35203-0.71560-0.42840-0.06056 0.09315-0.22724-0.01611-0.26551-0.21360-0.01012 korkeus 0.08488-0.46132 0.61947 0.46788 0.08641 0.24120 0.29668-0.08778-0.02057 0.12466 400ma 0.92160-0.04686 0.03175 0.15031-0.13499-0.02320 0.14666-0.08951 0.21568-0.17336 110m_aid 0.63944 0.38150 0.39621 0.24285 0.14531-0.29839-0.30842-0.03894 0.05738 0.13977 kiekko 0.30266-0.66803-0.29203-0.03070 0.54483 0.07308-0.06073 0.24998 0.08687-0.00135 seiväs -0.18924-0.50675 0.51255-0.41250-0.15564-0.43756 0.19777 0.10812 0.08188 0.03665 keihäs 0.05515-0.68776 0.35662-0.27661-0.30449 0.29169-0.36500-0.06167 0.07275 0.01199 1500ma 0.25815-0.27580-0.62612 0.40719-0.49672-0.06067 0.00585 0.19996-0.02238 0.09238 Variances_of_principal_components /// PCOMP1 PCOMP2 PCOMP3 PCOMP4 PCOMP5 PCOMP6 PCOMP7 PCOMP8 PCOMP9 PCOMP10 Variance 2.424882 2.255262 2.000150 1.107727 0.721095 0.525165 0.413307 0.248018 0.197876 0.106518 Variances_of_pr.components_(in_percentages) /// PCOMP1 PCOMP2 PCOMP3 PCOMP4 PCOMP5 PCOMP6 PCOMP7 PCOMP8 PCOMP9 PCOMP10 Per_cent 24.2488 22.5526 20.0015 11.0773 7.2110 5.2516 4.1331 2.4802 1.9788 1.0652 Cumulat. 24.2488 46.8014 66.8029 77.8802 85.0912 90.3428 94.4759 96.9561 98.9348 100.0000 Pääkomponenttien varianssit kertovat kuinka monen muuttujan vaihtelun kyseiset pääkomponentit pystyvät tiivistämään. Ensimmäinen tiivistää 2.4 muuttujan vaihtelun. Tässä prosenttiluvut osuvat yksiin varianssien kanssa, koska muuttujia on kymmenen. Kumulatiivisestä kertymästä nähdään, kuinka suuren osuuden vaihtelusta pääkomponentit pystyvät selittämään. Jos halutaan selittää 80%, niin valitaan 5 pääkomponenttia. Suuren pudotuksen käyttö johtaisi kolmeen pääkomponenttiin ja 66.8% selitysasteeseen. 3 Varianss 2.5 2 1.5 1 0.5 0 0 1 2 3 4 5 6 7 8 9 10 11 Komponen Alla vielä pääkomponenttimatriisi järjestettynä latausten mukaiseen suuruusjärjestykseen. /// PCOMP1 PCOMP2 PCOMP3 PCOMP4 PCOMP5 PCOMP6 PCOMP7 PCOMP8 PCOMP9 PCOMP10 400ma 0.92160-0.04686 0.03175 0.15031-0.13499-0.02320 0.14666-0.08951 0.21568-0.17336 100ma 0.74009 0.18869 0.49074-0.20681-0.07073 0.09686 0.02872 0.19320-0.27756-0.05900 110m_aid 0.63944 0.38150 0.39621 0.24285 0.14531-0.29839-0.30842-0.03894 0.05738 0.13977 kuula 0.35203-0.71560-0.42840-0.06056 0.09315-0.22724-0.01611-0.26551-0.21360-0.01012 keihäs 0.05515-0.68776 0.35662-0.27661-0.30449 0.29169-0.36500-0.06167 0.07275 0.01199 kiekko 0.30266-0.66803-0.29203-0.03070 0.54483 0.07308-0.06073 0.24998 0.08687-0.00135 1500ma 0.25815-0.27580-0.62612 0.40719-0.49672-0.06067 0.00585 0.19996-0.02238 0.09238 korkeus 0.08488-0.46132 0.61947 0.46788 0.08641 0.24120 0.29668-0.08778-0.02057 0.12466 seiväs -0.18924-0.50675 0.51255-0.41250-0.15564-0.43756 0.19777 0.10812 0.08188 0.03665 pituus -0.53915-0.30803 0.40850 0.58941 0.01043-0.17560-0.17751 0.07067-0.07023-0.16669 5

KORRESPONDENSSIANALYYSI Alla on tehty korrespondenssianalyysi itsemurhatavoista Englannissa. Aineisto on luokiteltu iän, sukupuolen ja tekotapojen mukaan. ages pois gas hang guns jump other C1 C2 m10 3983 1218 4555 1550 550 1248-0.149 0.299 m40 3996 826 7971 1689 517 828-0.220-0.053 m70 938 45 3160 334 268 147-0.199-0.408 w10 2593 153 956 141 407 383 0.529 0.238 w40 4507 136 4528 264 715 601 0.268-0.113 w70 1548 29 1856 77 383 106 0.267-0.242 C1 C2 pois 0.292 0.084 gas -0.393 0.586 hang -0.141-0.211 guns -0.476 0.245 jump 0.352-0.077 other -0.005 0.360 C2-akselin suunnassa näyttäisi ikä vähenevän ja vastaavasti sukupuoli jakaa aineiston vaakasuunnassa. 0.6 C2 0.4 0.2 0-0.2-0.4-0.6-0.6-0.4-0.2 0 0.2 0.4 0.6-1.2 guns Moniulotteinen korrespondenssianalyysi aineistosta muodostetun Burtin matriisin avulla. male female pois gas hang guns jump other age10 age40 age70 male 33823 0 8917 2089 15686 3573 1335 2223 13104 15827 4892 female 0 19383 8648 318 7340 482 1505 1090 4633 2040 1888 pois 8917 8648 17565 0 0 0 0 0 6576 8503 2486 gas 2089 318 0 2407 0 0 0 0 1371 962 74 hang 15686 7340 0 0 23026 0 0 0 5511 12499 5016 guns 3573 482 0 0 0 4055 0 0 1691 1953 411 jump 1335 1505 0 0 0 0 2840 0 933 1232 651 other 2223 1090 0 0 0 0 0 3313 1631 1429 253 age10 13104 4633 6576 1371 5511 1691 933 1631 17737 0 0 age40 15827 2040 8503 962 12499 1953 1232 1429 0 26578 0 age70 4892 1888 2486 74 5016 411 651 253 0 0 8891 Akselit näyttävät käännähtäneen ympäri. Naisille ja miehille tyypilliset tavat ovat pysyneet samoina. C1 C2 male 0.368-0.047 1.2 C2 female -1.041-0.027 1 age70 pois -0.460-0.181 0.8 gas 0.657-1.160 0.6 0.4 hang hang 0.141 0.463 0.2 jump age40 guns 0.765-0.464 0 female male jump -0.673 0.220-0.2 pois other 0.036-0.763-0.4 guns age10-0.082-0.625-0.6 age10 age40 0.393 0.196-0.8 other age70-0.235 0.924-1 gas m40 m70 m10 hang other pois gas -1.2-1 -0.8-0.6-0.4-0.2 0 0.2 0.4 0.6 0.8 1 1.2 w40 w70 jump w10 C1 6 C1

MULTIDIMENSIONAALINEN SKAALAUS MATRIX CSEIGEN.M Eigenvalues /// DIM1 DIM2 DIM3 DIM4 DIM5 DIM6 DIM7 DIM8 DIM9 DIM10 Eigenval 705.95 491.70 428.44 363.25 266.27 259.27 212.64 189.69 92.90 0.00 MATRIX CSCENT.M Eigenvalues_(in_percentages) /// DIM1 DIM2 DIM3 DIM4 DIM5 DIM6 DIM7 DIM8 DIM9 DIM10 Per_cent 23.453 16.334 14.233 12.068 8.846 8.613 7.064 6.302 3.086 0.000 Cumulat. 23.453 39.788 54.021 66.089 74.93 83.548 90.612 96.914 100.0 100.0 MATRIX LSCAL.M LS_scales /// DIM1 DIM2 tvl 16.3420-2.1239 shk 12.6365 2.0503 tvs 11.8636-12.8738 teco -8.2509 7.6337 kate -3.7094-11.3338 kaco -11.7620-0.7353 siol -7.6180-11.6467 mks -15.4053 2.3957 tvo 6.9103 18.7974 vpv -1.0068 7.8366 20 DIM2 10 0-10 mks kaco teco siol kate vpv tvo tvs shk tvl -20 MATRIX LSDIST.M -20-10 0 10 20 LS_distances DIM1 /// tvl shk tvs teco kate kaco siol mks tvo vpv tvl 0.000 24.992 16.237 32.283 30.198 34.693 25.783 32.233 25.396 20.036 shk 24.992 0.000 19.838 22.402 21.456 24.892 34.493 35.091 22.250 29.481 tvs 16.237 19.838 0.000 29.610 18.205 28.038 22.546 32.272 32.059 27.373 teco 32.283 22.402 29.610 0.000 19.618 9.252 26.704 17.624 20.312 20.917 kate 30.198 21.456 18.205 19.618 0.000 13.315 20.955 25.026 33.400 29.111 kaco 34.693 24.892 28.038 9.252 13.315 0.000 23.383 17.691 28.616 25.453 siol 25.783 34.493 22.546 26.704 20.955 23.383 0.000 16.380 35.433 20.607 mks 32.233 35.091 32.272 17.624 25.026 17.691 16.380 0.000 28.721 16.006 tvo 25.396 22.250 32.060 20.312 33.400 28.616 35.433 28.721 0.000 18.079 vpv 20.036 29.481 27.373 20.917 29.111 25.453 20.607 16.006 18.079 0.000 Muuttujat: Pidän enemmän... tvl tummasta kuin vaaleasta leivästä. shk salmiakista kuin hedelmäkarkeista. tvs tummasta kuin vaaleasta suklaasta. teco teestä kuin kahvista. kate kaakaosta kuin teestä. kaco kaakaosta kuin kahvista. siol siideristä kuin oluesta. mks makeasta kuin kuivasta siideristä. tvo tummasta kuin vaaleasta oluesta. vpv valkoviinistä kuin punaviinistä. Mitään mullistavia johtopäätöksiä ei päästä tekemään. Kun on molemmilla dimensioilla pieni arvo, niin maku näyttäisi olevan makeaan taipuvainen. 7

RYHMITTELYANALYYSI Single linkage, Input: KUNNAT2003 Group average, Input: KUNNAT2003 Complete linkage, Input: KUNNAT2003 Ranua Rovaniemenmlk Kemijärvi Simo Muonio Utsjoki Inari Kemi Tornio Rovaniemi Keminmaa Sodankylä Kittilä Kolari Pello Tervola Pelkosenniemi Posio Enontekiö Ylitornio Savukoski Salla Rovaniemenmlk Kemijärvi Simo Muonio Utsjoki Inari Kemi Tornio Rovaniemi Keminmaa Ranua Sodankylä Pello Kolari Kittilä Tervola Pelkosenniemi Posio Enontekiö Ylitornio Savukoski Salla Sodankylä Pello Kolari Kittilä Tervola Pelkosenniemi Rovaniemenmlk Kemijärvi Simo Muonio Utsjoki Inari Kemi Tornio Rovaniemi Keminmaa Ranua Posio Enontekiö Ylitornio Savukoski Salla 8

Unweighted centroid, Input: KUNNAT2003 Rovaniemenmlk Kemijärvi Simo Muonio Utsjoki Inari Kemi Tornio Rovaniemi Keminmaa Ranua Sodankylä Pello Kolari Kittilä Tervola Pelkosenniemi Posio Enontekiö Ylitornio Savukoski Salla Minimum variance (Wards method), Input: KUNNAT2003 Nimi G2 G3 G4 Kemi 1.000 1.000 1.000 Kemijärvi 1.000 1.000 1.000 Keminmaa 1.000 1.000 1.000 Rovaniemi 1.000 1.000 1.000 Tornio 1.000 1.000 1.000 Inari 1.000 3.000 2.000 Muonio 1.000 3.000 2.000 Rovaniemenmlk 1.000 3.000 2.000 Simo 1.000 3.000 2.000 Utsjoki 1.000 3.000 2.000 Kittilä 2.000 2.000 3.000 Kolari 2.000 2.000 3.000 Pelkosenniemi 2.000 2.000 3.000 Pello 2.000 2.000 3.000 Tervola 2.000 2.000 3.000 Enontekiö 2.000 2.000 4.000 Posio 2.000 2.000 4.000 Ranua 2.000 2.000 4.000 Salla 2.000 2.000 4.000 Savukoski 2.000 2.000 4.000 Ylitornio 2.000 2.000 4.000 Sodankylä 2.000 3.000 3.000 Rovaniemenmlk Kemijärvi Simo Muonio Utsjoki Inari Kemi Tornio Rovaniemi Keminmaa Sodankylä Pello Kolari Kittilä Tervola Pelkosenniemi Ranua Posio Enontekiö Ylitornio Savukoski Salla 9

LOGISTINEN REGRESSIOANALYYSI Alla yritetään binäärisen logisteisen regressioanalyysi avulla mallintaa onko kunta kaupunki vai ei. Logistic regression analysis: Data KUNNAT2003, Yvariate=Kaupun Deviance=233.4434 df=436 Log-likelihood=-116.7217 Parameter Estimate s.e. Wald X^2 Wald p Asukaslu 0.000203 0.000042 23.948637 0.000001 Asukasmu -0.863467 0.213917 16.293037 0.000054 Tulotaso 0.000318 0.000203 2.452196 0.117361 Veropros 0.653731 0.316724 4.260258 0.039014 Korkeako -0.106019 0.085603 1.533858 0.215534 Naisteno 1.148616 0.216491 28.149386 0.000000 Lastenos -0.314424 0.143563 4.796749 0.028513 Seniorei -0.214774 0.098944 4.711749 0.029957 Ulkomaal 0.020157 0.239785 0.007067 0.933007 Constat -64.577308 12.862232 25.207349 0.000001 MAT LOAD OR.M / Odds Ratios and 95% confidence intervals MATRIX OR.M Odds_Ratios_and_95%_confidence_intervals_from_/LOGREG /// OR lower upper Asukaslu 1.000203 1.000122 1.000285 Asukasmu 0.421698 0.277278 0.641339 Tulotaso 1.000318 0.999920 1.000717 Veropros 1.922701 1.033512 3.576909 Korkeako 0.899408 0.760486 1.063708 Naisteno 3.153825 2.063288 4.820757 Lastenos 0.730209 0.551120 0.967494 Seniorei 0.806724 0.664512 0.979369 Ulkomaal 1.020361 0.637747 1.632524 Constat 0.000000 0.000000 0.000000 Mallissa on 3 ei-merkitsevää selittäjää: Tulotaso, Korkeakoulutettujen osuus ja Ulkomaalaisten osuus. Nämä voidaan päätellä joko p-arvoista (>0.05 ) tai siitä, että ykkönen mahtuu riskisuhteiden (Odds ratio) luottamusväleille. Malin yhtälö on: ln(p/(1-p))=0.000203* Asukaslu-0.863467*Asukasmu+0.000318*Tulotaso+0.653731*Veropros-0.106019 *Korkeako+1.148616*Naisteno-0.314424*Lastenos-0.214774*Seniorei+0.020157*Ulkomaal-64.577308 Sipoon todennäköisyys olla kaupunki: Asukaslu=18177, Asukasmu=2.4, Tulotaso=13474, Veropro=18.75, Korkeako=29.3, Naisteno=50.4, Lastenos=23.4, Seniorei=12.2, Ulkomaal=1.3 ln(p/(1-p)=0.000203*18177-0.863467*2.4+0.000318*13474+0.653731*18.750.106019*29.3 +1.148616*50.4-0.314424*23.4-0.214774*12.2+0.020157*1.3-64.5773080=-1.58518015 => p/(1-p)=exp(-1.58518015)=0.20491087509736 => p=(1-p)*0.20491087509736 => p(1+0.204910875097)=0.204910875097=> p=0.204910875097/(1+0.204910875097)=0.17006309705729 Sipoon todennäköisyys olla kaupunki on siis mallimme mukaan n. 17%. 10

JÄRJESTYSASTEIKOLLINEN LOGISTINEN REGRESSIOANALYYSI (POISSON REGR.) Käytetään samaa aineistoa ja samoja selittäviä muuttujia, mutta nyt pyritään ennustamaan kunnan tyyppi: 1. kaupunkimaiset, 2 taajaan asutut vai 3. maaseutumaiset kunnat. Data KUNNAT2003: Deviance=70.944970 df=436 Yvariate=Tyyppi ERROR=Normal LINK=LOG Parameter Estimate s.e. z Asukaslu -0.0000266 0.0000019 14.?? Asukasmu 0.0051152 0.0064238 0.796 Tulotaso -0.0000407 0.0000106 3.840 Veropros -0.0320371 0.0129943 2.465 Korkeako -0.0015702 0.0033565 0.468 Naisteno -0.0096616 0.0068950 1.401 Lastenos 0.0023969 0.0043482 0.551 Seniorei 0.0012854 0.0037942 0.339 Ulkomaal -0.0052684 0.0083653 0.630 I 2.5326400 0.4347004 5.826 Malin yhtälö on: Y=-0.0000266*Asukaslu+0.0051152*Asukasmu-0.0000407*Tulotaso-0.0320371*Veropros-0.0015702 *Korkeako-0.0096616*Naisteno+0.0023969*Lastenos+0.0012854*Seniorei-0.0052684*Ulkomaal+2.5326400 Sipoon tyypin ennuste: Y=-0.0000266*18177+0.0051152*2.4-0.0000407*13474-0.0320371*18.75-0.0015702*29.3-0.0096616*50.4+0.0023969*23.4+0.0012854*12.2-0.0052684*1.3+2.5326400= 0.44428978 e Y =2.718282 0.44428978 =1.5593823338823 -> 2 Malli siis ennustaa Sipoon olevan taajaan asuttu kunta, eli ennustus osuu oikeaan. MONIULOTTEINEN LOGISTINEN REGRESSIOANALYYSI (POISSON REGRESSIO) Alla on Helsingin taloja käsittelevälle aineistolle ajettu moniulotteinen logistinen regressioanalyysi, jossa selitettävänä muuttujana on MP= maan päällisten kerrosten lukumäärä. Selittävät muuttujat ovat: käyttöönottovuosi, tilavuus, kerrospinta-ala, asuinpinta-ala, asuntojen lukumäärä ja asukkaiden lukumäärä. Mallissa on yksi ei-merkitsevä selittäjä, ASYHT=asukkaiden yhteislukumäärä. Data HESA: Deviance=1473.9880 df=1222 Yvariate=MP ERROR=Normal LINK=LOG Parameter Estimate s.e. z KAVU -0.0043495 0.0004840 8.9865702479339 TILAV -0.0000063 0.0000026 2.4230769230769 KERALA 0.0001017 0.0000134 7.589552238806 ASHALA 0.0001029 0.0000194 5.3041237113402 ASLKM 0.0023157 0.0006036 3.8364811133201 ASYHT 0.0011311 0.0006342 1.7835067801955 I 9.2100111 0.9477429 9.7178370842979 Mallin yhtälö on: Y=-0.0043495*KAVU-0.0000063*TILAV+0.0001017*KERALA+0.0001029*ASHALA+0.0023157*ASLKM +0.0011311*ASYHT+9.2100111 Vanhimman talon ennuste on: Y=-0.0043495*1815-0.0000063*10675+0.0001017*2238 +0.0001029*172+0.0023157*2+0.0011311*6+9.2100111=1.5051375 e Y =2.718282 1.5051375 =4.5047734218734 -> 5 Malli siis ennustaa talossa olevan 5 maanpäällistä kerrosta. Todellisuudessa niitä on 3. 11

EROTTELUANALYYSI Halutaan erotella Tyyppiarvot neljään taittajakauteen: alkuajat (musta), Kallen kausi (punainen), Hessun kausi (vihreä) ja nykyaika (sininen). Tyyppiarvot eroteltuna taittajien suhteen -370-372 -374-376 -378-380 -382 D2 V&L MV KK KK MV KK TLKK P&N KK KK MV L&M L&M PT JL HR HR PP P&T PT M&T M&S KT L&M&S P&T PT M&B PP L&M H&H 1145 1150 1155 1160 1165 1170 Oheisessa kuvaajassa erottelu onnistuu täydellisesti, koska yhtenä luokittelijana on lehden ilmestymisvuosi. D Eig.val. % Can.corr Chi^2 df P 1 24.2857 79.39 0.980027 445.481 45 1 2 5.8400 19.09 0.924014 185.447 28 1 3 0.4636 1.52 0.562810 30.663 13 0.996 D1 Discriminator_loadings /// %1 %2 %3 KORK 0.420375 0.173165-0.246910 LEV -0.533616-0.430749 0.336753 PAINO 0.024838 0.280543-0.057553 SIVUT -0.026312-0.586251 0.150286 ARTIK 0.110976-0.133920 0.316653 TOIM 0.014254 0.144304 0.276997 JUTUT -0.068548-0.057884-0.461102 KIRJ -0.005922-0.166415-0.158028 NAIS -0.115804 0.369726 0.216381 PIIR 0.019296 0.049417-0.045844 VALO 0.027056-0.043349 0.038520 TAUL -0.129204 0.027980-0.067024 GRAF 0.012856-0.141715 0.200537 KAAV -0.006207-0.068146 0.070916 VUOSI 0.573250-0.168906 0.031041 MATRIX DISCRXR.M Correlations_variables_and_discriminators /// Discr1 Discr2 Discr3 KORK -0.054451-0.593258-0.421963 LEV -0.117536-0.615064-0.378101 PAINO 0.745481-0.058288-0.146450 SIVUT 0.703942-0.023707 0.117953 ARTIK 0.408092-0.708249-0.041795 TOIM 0.359814-0.209283 0.297003 JUTUT 0.472306-0.637753-0.166821 KIRJ 0.532050-0.068186 0.190753 NAIS 0.523750 0.100765 0.335231 PIIR 0.135207 0.294447-0.096132 VALO 0.633152-0.188926 0.294089 TAUL -0.067425-0.214876-0.263550 GRAF 0.372640 0.098307 0.167989 KAAV -0.021896-0.179494 0.231471 VUOSI 0.965328 0.057454 0.126435 Tyyppiarvot eroteltuna taittajien suhteen D2 20 18 16 14 12 MV H&H K TL KK P&N KK KK KK KK V&L MV MV M&B M&S PP L&M M&T KT PP PT HR M&S M&S PT P&T P&T HR L&M PT JL L&M L&M KK MV 10-36 -34-32 -30-28 -26-24 -22 Tässä aidompi tilanne, kun ilmestymisvuosi ei ole selittäjänä. Nykyaika on helposti eroteltavissa ja alkuaikakin saadaan eroteltua varsin hyvin. D Eig.val. % Can.corr Chi^2 df P 1 8.2670 71.15 0.944505 320.956 42 0.999 2 2.8957 24.92 0.862151 140.613 26 1 3 0.4566 3.93 0.559877 30.464 12 0.998 MATRIX DISCRL.M D1 MATRIX DISCRL.M Discriminator_loadings /// %1 %2 %3 KORK 0.412187 0.213692 0.215874 LEV -0.737208-0.251758-0.284982 PAINO 0.296114-0.017477 0.040803 SIVUT -0.586167 0.089110-0.123151 ARTIK -0.004672 0.216187-0.340657 TOIM 0.190996 0.069298-0.301001 JUTUT -0.060076 0.054144 0.458867 KIRJ -0.109280 0.149465 0.147798 NAIS 0.233763-0.263482-0.207578 PIIR 0.022335-0.076692 0.055507 VALO -0.017488 0.042388-0.041557 TAUL -0.017737-0.014421 0.063657 GRAF -0.071662 0.157091-0.216607 KAAV -0.037346 0.077949-0.079193 MATRIX DISCRXR.M Correlations_variables_and_discriminators /// Discr1 Discr2 Discr3 KORK -0.438608 0.429726 0.402833 LEV -0.500988 0.395920 0.362226 PAINO 0.521367 0.633428 0.093318 SIVUT 0.511773 0.566259-0.167885 ARTIK -0.171455 0.869907-0.015525 TOIM 0.126912 0.435273-0.331690 JUTUT -0.074819 0.869257 0.108525 KIRJ 0.352196 0.463946-0.231000 NAIS 0.459069 0.322201-0.368492 PIIR 0.300943-0.119504 0.099446 VALO 0.345911 0.633674-0.346735 TAUL -0.193947 0.121558 0.260363 GRAF 0.345054 0.210697-0.190256 KAAV -0.139152 0.115140-0.238373 12

MONIULOTTEINEN VARIANSSIANALYYSI (MANOVA) ANOVA Normaali yksisuuntainen varianssianalyysi, kun halutaan selvittää poikkeavatko eri taittajaaikakausien lehdet toisistaan tilastollisen sisällön osalta: (TIL=kuvaajat+taulukot+kaavat) ANALYSIS OF VARIANCE Results for dependent variable TIL: Means and deviations 1.00000 2.00000 3.00000 4.00000 Total Means 2.50000 2.70588 5.12500 3.55000 3.92308 Deviations 3.71587 1.99263 6.42187 3.42552 4.93115 N of obs. 14 17 40 20 91 One-way fixed effects analysis of variance Source sum of squares df mean squares Between groups 114.107126697 3 38.0357088989 Within groups 2074.35441176 87 23.8431541582 Total 2188.46153846 90 F test for equality of means: F-value = 1.59525 It equals the 80.37% point of the F(3, 87) distribution. Risk of rejecting the nullhypothesis, when true, is 0.196348 Test for equality of means without assuming equal group variances: Brown-Forsythe statistic = 2.41853 with df 3 and 76.07 Appr. risk of rejecting the null hypothesis, when true, is 0.072704 H 0 : µ A =µ K =µ H =µ N H 1 : µ i µ j, kun i j,eli odotusarvot ovat ryhmissä samat,eli ainakin yksi odotusarvo poikkeaa Koska p-arvo 0.196>0.05, niin H 0 jää voimaan, eli taittajakaudet eivät poikkea toisistaan. MANOVA Moniulotteinen varianssianalyysi, kun testataan poikkeavatko taittajakausien odotusarvovektorit toisistaan. Vektorin komponentit ovat kaavojen, taulukoiden ja kuvaajien lukumäärät. MULTIVARIATE ANALYSIS OF VARIANCE TESTS FOR THE L EFFECTS: Criterion test value parameters p-value Wilk's lambda 0.73003 3, 3, 87 Rao's f-appr. 3.17485 9, 207 0.001290 Barlett's chi-square appr. 27.2188 9 0.001287 Lawley-Hotelling T0**2 30.1372 3-0.5 41.5 Barlett-Nanda-Pillai trace 0.28734 3-0.5 41.5 Roy's largest root 0.20974 3-0.5 41.5 0.002656 H 0 : µ A =µ K =µ H =µ N H 1 : µ i µ j, kun i j,eli odotusarvovektorit ovat ryhmissä samat,eli ainakin yksi odotusarvovektori poikkeaa Käytetään testauksessa Wilksin λ n F-jakauma-approksimaatiota. Koska p-arvo 0.00129<0.05, niin H 0 kaatuu, eli ainakin joku taittajakausista poikkeaa. 13

Mahdollisia jatkotoimenpiteitä, kun nollahypoteesit kaatuvat: Normaalien yksiulotteisten varianssianalyyisen tulokset edellisessä tilanteessa ovat: Univariate tests Variable F-statistics df p-value KAAV 1.36457 3 87 0.258980 TAUL 2.04224 3 87 0.113856 GRAF 5.14009 3 87 0.002552 Näistä testeistä näemme, että kuvaajien määrät poikkeavat (0.0025<0.05), mutta kaavojen (0.2590>0.05) ja taulukoiden (0.1139>0.05) määrät eivät poikkea taittajakausien välillä. HOTELLINGIN T 2 -testi Toinen asia mitä voidaan testata on, mitkä taittajakaudet poikkeava toisistaan. Siihen voi käyttää Hotellingin T 2 -testiä. Verrataan odotusarvovektoreita toisiinsa pareittain. H 0 : µ A =µ K H 1 : µ A µ K Hotelling's two-sample test for equality of mean vectors: T2=5.24556 p=3 n1=14 n2=17 P1=0.206151 Koska havaittu p-arvo 0.206>0.05, niin H 0 jää voimaan. H 0 : µ A =µ H H 1 : µ A µ H Hotelling's two-sample test for equality of mean vectors: T2=4.15098 p=3 n1=14 n2=40 P1=0.274959 Koska havaittu p-arvo 0.275>0.05, niin H 0 jää voimaan. H 0 : µ A =µ N H 1 : µ A µ N Hotelling's two-sample test for equality of mean vectors: T2=13.0251 p=3 n1=14 n2=20 P1=0.0153974 Koska havaittu p-arvo 0.0154<0.05, niin H 0 kaatuu. H 0 : µ K =µ H H 1 : µ K µ H Hotelling's two-sample test for equality of mean vectors: T2=7.57804 p=3 n1=17 n2=40 P1=0.0749998 Koska havaittu p-arvo 0.0750>0.05, niin H 0 jää voimaan. H 0 : µ K =µ N H 1 : µ K µ N Hotelling's two-sample test for equality of mean vectors: T2=23.9345 p=3 n1=17 n2=20 P1=0.000573292 Koska havaittu p-arvo 0.000573<0.05, niin H 0 kaatuu. H 0 : µ H =µ N H 1 : µ H µ N Hotelling's two-sample test for equality of mean vectors: T2=9.98873 p=3 n1=40 n2=20 P1=0.0296097 Koska havaittu p-arvo 0.0296<0.05, niin H 0 kaatuu. Näemme siis, että taittajakausista nykyaika poikkeaa kaikista muista. Muut taittajakaudet eivät poikkea näiden muuttujien lineaarikombinaatioiden suhteen. Koska tässä testattiin useita hypoteesejä samoista muuttujista, niin tulisi käyttää jotain korjausmenetelmää vertailuarvoja valittaessa. Esimerkiksi voisi käyttä Bonferronikorjausta, jolloin havaittu merkitsevyystaso olisi 0.05/6=0.00833. Tällöin kaatuisi vain Kalle vs. Nykyaika. Bonferroni-korjausta parempia korjausmenetelmiä on olemassa. 14