Tilastolliset monimuuttujamenetelmät. Seppo Mustonen Helsingin yliopisto Tilastotieteen laitos 1995



Samankaltaiset tiedostot
2. Multinormaalijakauma

Moniulotteisia todennäköisyysjakaumia

Ilkka Mellin Todennäköisyyslaskenta Osa 3: Todennäköisyysjakaumia Moniulotteisia todennäköisyysjakaumia

Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia. Moniulotteisia todennäköisyysjakaumia: Mitä opimme?

Johdatus todennäköisyyslaskentaan Moniulotteisia todennäköisyysjakaumia. TKK (c) Ilkka Mellin (2005) 1

Alkava ARA-tuotanto kunnittain

Poliisilaitosalueet ja toimipisteet lukien

Indeksitalon kiinteistöverot ja maksut 2015 / yli asukkaan kaupungit

Julkaistu Helsingissä 12 päivänä lokakuuta /2011 Liikenne- ja viestintäministeriön asetus

Julkaistu Helsingissä 13 päivänä kesäkuuta /2012 Liikenne- ja viestintäministeriön asetus

Liikenne- ja viestintäministeriön asetus

Julkaistu Helsingissä 19 päivänä elokuuta /2013 Liikenne- ja viestintäministeriön asetus. radiotaajuuksien käyttösuunnitelmasta

Radio 2020-toimilupakierros. Taajuuskokonaisuudet

N:o Televisio- ja radiotoiminnasta annetun lain mukainen televisiotoiminta. Aseman nimi Kanava MAX ERP Nippu A Nippu B Nippu C (kw)

Julkaistu Helsingissä 31 päivänä joulukuuta /2012 Liikenne- ja viestintäministeriön asetus

2.2 Analoginen radiotoiminta: valtakunnallinen toimiluvanvarainen käyttö

Todennäköisyyslaskennan ja tilastotieteen peruskurssi Esimerkkikokoelma 3

7. laskuharjoituskierros, vko 10, ratkaisut

Kuntien välinen muuttoliike Hyvinkäällä KAIKKI IKÄRYHMÄT

Julkaistu Helsingissä 3 päivänä heinäkuuta /2014 Liikenne- ja viestintäministeriön asetus

805306A Johdatus monimuuttujamenetelmiin, 5 op

Liite IV: Toimitetun talousveden laatu (aritmeettinen keskiarvo). Keskiarvo on nolla, jos kaikki tulokset ovat olleet alle määritysrajan.

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi. Viikko 3. Kaksiulotteiset satunnaismuuttujat

Julkaistu Helsingissä 13 päivänä toukokuuta /2011 Liikenne- ja viestintäministeriön asetus

MÄÄRÄYS Valtuutussäännös Liikennevakuutuslain 16 22/002/2001. Voimassaoloaika toistaiseksi

2 Televisio- ja radiotoiminnasta annetun lain mukainen radiotoiminta

Moniulotteiset satunnaismuuttujat ja jakaumat

Asemakaavalla suojeltujen rakennusten määrä ja kerrosala sekä niiden muutokset ELY-keskuksittain vuosina

Mat Sovellettu todennäköisyyslasku A. Moniulotteiset jakaumat. Avainsanat:

Regressioanalyysi. Kuusinen/Heliövaara 1

Julkaistu Helsingissä 5 päivänä joulukuuta /2014 Liikenne- ja viestintäministeriön asetus

Matematiikan tukikurssi

Osoita, että kaikki paraabelit ovat yhdenmuotoisia etsimällä skaalauskuvaus, joka vie paraabelin y = ax 2 paraabelille y = bx 2. VASTAUS: , b = 2 2

Regressioanalyysi. Vilkkumaa / Kuusinen 1

10 Moniulotteinen normaalijakauma

Sallitut apuvälineet: MAOL-taulukot, kirjoitusvälineet, laskin sekä itse laadittu, A4-kokoinen lunttilappu. f(x, y) = k x y, kun 0 < y < x < 1,

1.3 Tontin lohkomistoimituksen kesto keskimäärin (vrk)

Vektorien pistetulo on aina reaaliluku. Esimerkiksi vektorien v = (3, 2, 0) ja w = (1, 2, 3) pistetulo on

1. Jatketaan luentojen esimerkkiä 8.3. Oletetaan kuten esimerkissä X Y Bin(Y, θ) Y Poi(λ) λ y. f X (x) (λθ)x

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

Julkaistu Helsingissä 22 päivänä joulukuuta /2014 Maa- ja metsätalousministeriön asetus. kiinteistötietojärjestelmän tulojen jakamisesta

KUNTARATING TOP 20 EPSI RATING FINLAND 2016 Indeksi 0-100

ABB-tuotteiden myynnistä vastaavat henkilöt paikkakunnittain

Määräys toimiluvanvaraiseen radiotoimintaan tarkoitettujen taajuuksien käytöstä

Testejä suhdeasteikollisille muuttujille

Estimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?

LUONNOS. Valtioneuvoston asetus

Indeksitalo tutkimus

Johdatus todennäköisyyslaskentaan Momenttiemäfunktio ja karakteristinen funktio. TKK (c) Ilkka Mellin (2005) 1

1 Televisio- ja radiotoiminnasta annetun lain mukainen televisiotoiminta. Paikkakunta Kanavanippu ERP

Johdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1

KRUUNUPYY SVT

Olkoon R S otosavaruuksien R ja S karteesinen tulo: Satunnaismuuttujien X ja Y järjestetty pari (X, Y) määrittelee kaksiulotteisen satunnaismuuttujan:

2 Televisio- ja radiotoiminnasta annetun lain mukainen radiotoiminta. Taajuus (MHz) ERP (kw)

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

Matematiikan tukikurssi

Jakelun mukaan. Sisäministeriön asetus pysäköintivirhemaksusta; voimaan tuleva asetus ja pysäköintivirhemaksun korottaminen vuonna 2019

Koska ovat negatiiviset. Keskihajontoja ei pystytä laskemaan mutta pätee ¾.

Yleistä tietoa kokeesta

A = a b B = c d. d e f. g h i determinantti on det(c) = a(ei fh) b(di fg) + c(dh eg). Matriisin determinanttia voi merkitä myös pystyviivojen avulla:

Matemaattinen tilastotiede. Erkki Liski Matematiikan, Tilastotieteen ja Filosofian Laitos Tampereen Yliopisto

3 Suorat ja tasot. 3.1 Suora. Tässä luvussa käsitellään avaruuksien R 2 ja R 3 suoria ja tasoja vektoreiden näkökulmasta.

Ilkka Mellin (2008) 1/5

3 Lineaariset yhtälöryhmät ja Gaussin eliminointimenetelmä

AJONEUVOJEN YKSITTÄISHYVÄKSYNTÖJEN MYÖNTÄJÄT LÄHTIEN

VIHDIN KASVIHUONEKAASUPÄÄSTÖT ENNAKKOTIETO VUODELTA 2012

Inversio-ongelmien laskennallinen peruskurssi Luento 2

Harjoitus 7: NCSS - Tilastollinen analyysi

ULOSOTTOPIIRIEN TULOSTAVOITTEIDEN TOTEUTUMINEN VUONNA 2005 (numeeriset)

SELVITYKSIÄ VALTION ASUNTORAHASTO ISSN

Jatkuvat satunnaismuuttujat

Kempele kaupungiksi? Selvitys aloitteeseen

Palvelurakenneuudistuksesta & sosiaalihuoltoa koskevan lainsäädännön uudistuksesta

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Ilkka Mellin Todennäköisyyslaskenta. Osa 2: Satunnaismuuttujat ja todennäköisyysjakaumat. Momenttiemäfunktio ja karakteristinen funktio

KARKKILAN KASVIHUONEKAASUPÄÄSTÖT ENNAKKOTIETO VUODELTA 2012

SISÄLLYS. N:o 341. Valtioneuvoston asetus

Osa 2: Otokset, otosjakaumat ja estimointi

VIHDIN KASVIHUONEKAASUPÄÄSTÖT ENNAKKOTIETO VUODELTA 2013

Lineaarikuvauksen R n R m matriisi

1 Televisio- ja radiotoiminnasta annetun lain mukainen televisiotoiminta

Johdatus regressioanalyysiin

P (X B) = f X (x)dx. xf X (x)dx. g(x)f X (x)dx.

Kuntien yritysilmasto Helsinki Asiantuntija Jari Huovinen

2 exp( 2u), kun u > 0 f U (u) = v = 3 + u 3v + uv = u. f V (v) dv = f U (u) du du f V (v) = f U (u) dv = f U (h(v)) h (v) = f U 1 v (1 v) 2

Talousmatematiikan perusteet: Luento 10. Lineaarikuvaus Matriisin aste Determinantti Käänteismatriisi

Loviisanseudun Jyty ry, Lovisanejdens Jyty rf 1,26% JYTY Naantalin seutu ry 1,35% Jyty Nurmes ry 1,2% Jyty Sakky ry

Sosiaali- ja terveysalan lupa- ja valvontavirasto/suomen Terveystalo Oy

9 Matriisit. 9.1 Matriisien laskutoimituksia

Kuntien yritysilmasto Lappeenrannan seutukunta

Kuntien yritysilmasto Jyväskylän seutukunta

Ominaisarvoon 4 liittyvät ominaisvektorit ovat yhtälön Ax = 4x eli yhtälöryhmän x 1 + 2x 2 + x 3 = 4x 1 3x 2 + x 3 = 4x 2 5x 2 x 3 = 4x 3.

Lineaarikombinaatio, lineaarinen riippuvuus/riippumattomuus

KAARINAN KASVIHUONEKAASUPÄÄSTÖT 2004, ENNAKKOTIETO VUODELTA 2011

Liittotunnus. yhdistysnumero yhdistyksen nimi

KARKKILAN KASVIHUONEKAASUPÄÄSTÖT ENNAKKOTIETO VUODELTA 2013

Kuntien yritysilmasto Helsingin seutukunta

Liite TAAJUUKSIEN KÄYTTÖSUUNNITELMA. 1 Televisio- ja radiotoiminnasta annetun lain mukainen televisiotoiminta

KÄRÄJÄOIKEUKSIIN SAAPUNEET ASIAT

Harjoitus 9: Excel - Tilastollinen analyysi

Transkriptio:

Tilastolliset monimuuttujamenetelmät Seppo Mustonen Helsingin yliopisto Tilastotieteen laitos 995

Tämä on verkkoversio kirjasta Seppo Mustonen: Tilastolliset monimuuttujamenetelmät, Survo Systems Oy (995). Copyright 995 by Seppo Mustonen Kirja on suunniteltu, kirjoitettu ja tulostettu PostScript-tiedostoiksi Survo-ohjelmiston avulla. Myös kaikki laskelmat ja analyysit on tehty Survolla. PostScript-tiedostot on yhdistetty ja muunnettu PDF-tiedostoksi www.survo.fi/mustonen/monim.pdf Ghostscript- ja Adobe Acrobat- ohjelmilla.

Monimuuttujamenetelmät 3..994/S.Mustonen iii Esipuhe Tilastollisilla monimuuttujamenetelmillä käsitellään nimensä mukaisesti usean satunnaismuuttujan aineistoja. Koska muuttujia voi olla kymmeniä - jopa satoja, yleisenä pyrkimyksenä on vähentää muuttujien määrää tai yhdistellä muuttujia sopivien sääntöjen mukaan. Koko aineistoon liittyvästä vaihtelusta yritetään siis karsia puhtaasti satunnainen osuus tiivistämällä tietoa ja näin ehkä saadaan paljastetuksi tutkittavan ilmiön taustalla olevat rakenteet. Edellä sanottu koskee erilaisia kuvausmenetelmiä, joita ovat esim. pääkomponenttianalyysi, faktorianalyysi, kanoniset korrelaatiot, erotteluanalyysi ja ryhmittelyanalyysi. Monimuuttujamenetelmien piiriin voi lukea myös suorat yhden muuttujan menetelmien yleistykset. Näin on mm. eräiden keskeisten tilastollisten testien laita. Esim. tavallinen t-testi yleistyy usean muuttujan tapauksessa Hotellingin T -testiksi. Monimuuttujamenetelmäksi ei sen sijaan katsota esim. usean selittävän muuttujan regressioanalyysia, koska tässä tapauksessa satunnaisena muuttujana käsitellään vain selitettävää muuttujaa; selittäjät voivat olla esim. koesuunnittelun määräämiä systemaattisia tekijöitä. Luonnollisesti regressioanalyysia sovelletaan kuitenkin usein rinnan monimuuttuja-analyysien kanssa. Tyypillinen toimintatapa saattaa olla se, että aluksi jollakin monimuuttujamenetelmällä "puhdistetaan" selittävien muuttujien joukkoa vähentämällä muuttujien määrää ja/tai tekemällä ne vähemmän toisistaan riippuviksi. Lopullinen tarkastelu tapahtuu regressioanalyysilla tämän puhdistuksen jälkeen. Monimuuttujamenetelmien suosio on vaihdellut niiden koko olemassaoloajan aina 930-luvulta lähtien. Laskennallisten hankaluuksien vuoksi soveltaminen tositilanteissa saattoi alkaa vasta 950-luvulla tietokoneiden ansiosta. Tästä seurannut käytön helpottuminen ja eräiden menetelmien, ennen muuta faktorianalyysin, houkuttelevuus mekaanisiin soveltamisyrityksiin johti Suomessakin 960-luvulla etenkin yhteiskunta- ja käyttäytymistieteiden piirissä laajamittaiseen ja joskus varsin perustelemattomaan käyttöön. Tämän ylimitoitetun suosion romahdukseen vaikutti osaltaan 960-970-lukujen vaihteessa vallinnut "positivistisen tieteen kritiikki". Tuntuu siltä, että olisi taas aika tuon menetetyn maineen palautua kohtuullisiin mittoihin. Monimuuttujamenetelmien niin kuin monien muidenkin teknisesti vaativien tilastollisten keinojen opettamisen ongelmana on se, että, ne jotka näitä menetelmiä tarvitsevat, eivät yleensä pysty kunnolla omaksumaan menetelmien taustalla olevaa matemaattispitoista teoriaa. Tämän taustan ymmärtäminen on tärkeää ainakin siltä osin, mikä liittyy menetelmien käytön ehtoihin ja rajoituksiin. Sen sijaan esim. joidenkin otos- tai testisuureiden jakaumien johtaminen, mikä vaatii enemmän matemaattisen analyysin tuntemista, ei ole yhtä tärkeää, koska tällaiset tulokset on hyödynnettävissä ilman, että osaisi ne itse päätellä.

iv Monimuuttujamenetelmät 3..994/S.Mustonen Useat etupäässä tilastotieteen puolella kirjoitetut oppikirjat ovat turhan teknisiä ja vailla yhteyksiä todellisiin sovelluksiin. Soveltajille tarkoitetuissa esityksissä taas teoreettinen puoli saatetaan jopa sivuuttaa tai tarjota enemmälti ilman perusteluja. Omaksumassani lähestymistavassa olen pyrkinyt välttämään liikaa matematiikkaa. Opettaessani aihetta yli 30 vuoden ajan olen päätynyt ratkaisuun, jossa perusteoria eli multinormaalijakauman ominaisuudet saatetaan johtaa hyvin vähin eväin lähtemällä liikkeelle ko. jakauman konstruktiivisesta määritelmästä. Tällöin matematiikan osalta tärkeimmäksi perusvaatimukseksi nousee vain matriisilaskennan hallinta. Erityisen suuri merkitys on matriisin singulaariarvohajotelmalla ja eräillä siihen liittyvillä tuloksilla, joiden avulla useat monimuuttujamallit ovat helpoiten johdettavissa. Tätä keinoa ei jostain syystä ole mainittavasti käytetty alan oppikirjoissa. Vaikka matriisilaskennan merkintöjä ja perusteita ei tässä yhteydessä kerrata, liitteessä on käyty läpi tarvittavat singulaariarvohajotelmaan liittyvät tarkastelut. Asioiden geometrinen hahmottaminen on monille tärkeää. On mielenkiintoista mutta samalla valitettavaa, että kykymme osoittautuvat vajavaisiksi yleistäessämme - tai 3-ulotteisia mielikuviamme useampiulotteisiin avaruuksiin, joissa monimuuttujamenetelmiä koskevat tarkastelut yleensä liikkuvat. Esim. on vaikea tajuta intuitiivisesti jo sitä, että yleisissä peräkkäisissä koordinaatiston kierroissa vain kaksiulotteisessa tapauksessa ei ole väliä sillä missä järjestyksessä kierrot tehdään. Liite sisältää esimerkkejä moniulotteisuuteen liittyvistä ongelmista ja samalla näytteitä siitä miten geometrinen ajattelutapa korvataan analyyttisella. Tämä esitys tukeutuu monella tavalla ATK-tekniikan suomiin mahdollisuuksiin. Kaikki numeeriset esimerkit on kuvattu Survo-järjestelmän avulla valmiina kaavioina. Itse asiassa on kysymys hypertekstistä, jonka eräs esitysmuoto on tässä paperilla. Koko esimerkkimateriaali on koottu levykkeelle, jolloin esimerkit, sovellukset ja simulointikokeet on toistettavissa Survon avulla joutumatta uudelleen kirjoittamaan ja kopioimaan aineistoa käsin. Liitteessä 3 kerrotaan esimerkkilevykkeestä hieman lisää. Myös varsinainen tekstiosa kaavoineen ja kuvineen on laadittu Survolla ja on jatkuvasti hallittavissa. Esim. pitäessäni kurssia voin helposti poimia minkä tahansa osan tästä aineistosta ja heijastaa sen luokassa kankaalle täsmälleen samassa ulkoasussa kuin se esiintyy tekstissä. Siis valmiiksi piirrettyjä kalvoja ei tarvita lainkaan, vaan ne syntyvät opetuksen aikana. Samalla tavalla otetaan käyttöön esimerkit, toistetaan niitä koskevat analyysit ja muunnellaan sekä aineistoja että analysointitapoja jopa hetken mielijohteesta. Hyvin paljon painoa on annettu simulointikokeille. Näissä kokeissa luodaan tiettyä monimuuttujamallia vastaavia satunnaisotoksia, joita sitten analysoidaan vastaavilla malleilla. Tarkoituksena on näyttää, miten menetelmät toimivat eri tilanteissa. Todellisilla aineistoilla on paljon hankalampi selvittää menetelmien kyvykkyyttä, koska tuloksen ollessa huono on mahdotonta tietää, liittyykö ongelma itse menetelmään vai sopimattomaan aineistoon.

Monimuuttujamenetelmät 3..994/S.Mustonen v Nykyiset PC-laitteistot ovat jo niin tehokkaita, että esim. Fisherin satunnaistamisperiaatetta, jota yleensä on käytetty pienten yhden muuttujan aineistojen tutkimisessa, voidaan soveltaa myös todellisiin usean muuttujan otoksiin ja johtaa aineistokohtaisia testisuureiden kriittisiä rajoja simuloimalla. Näin on tehty tässä esityksessä faktorianalyysiin liittyvän tulosten vertailumenetelmän, transformaatioanalyysin residuaalien tarkastelussa. Vaikka esitystapa edellä kuvatussa suhteessa on hyvin Survo-painotteinen, sen ei pitäisi olla esteenä tämän tekstin käytölle tavanomaisena oppikirjana, koska esimerkkikaaviot joko selittävät itsensä tai ne on varustettu asianmukaisilla kommenteilla. Survoa hallitseva lukija kuitenkin hyötyy lisää em. hypertekstiominaisuuksista. Monimuuttujamenetelmiin liittyvää tietoa on nykyisin suunnattomasti. On pakko rajoittua joihinkin keskeisiksi koettuihin asioihin. Tämän esityksen painopiste on ehdottomasti klassisissa perusmenetelmissä, joiden tunteminen kuuluu tilastotieteilijän yleissivistykseen. Aloitamme konkreettisesta päästä eli esittelemme keinoja, joilla moniulotteisia aineistoja kuvataan graafisesti. Sen jälkeen siirrytään suoraan multinormaalijakauman määritelmään ja sen perusominaisuuksiin. Tämä toimii välttämättömänä taustana itse menetelmien johtamiselle. Oman lukunsa muodostaa multinormaalijakauman otossuureiden, keskiarvojen, varianssien ja kovarianssien tarkastelu ja jakaumaan liittyvät testit. Lopuksi käydään läpi varsinaiset monimuuttujamallit. Olisi suotavaa, että lukija heti alusta pitäen myös omilla aineistoillaan kokeilisi esiteltyjä keinoja. Tähän esitykseen on ollut mahdoton liittää kovin monta todellista tutkimustilannetta, koska jokaisen sellaisen pohjustaminen kulloistakin sovellusalaa tuntemattomille veisi kohtuuttomasti tilaa. Tämä teksti pohjautuu puolittain aikaisempina vuosina pitämiini kursseihin. Nykyinen sisällys muotoutui kevätlukukauden 994 luentojen aikana ja olen sitä vielä jonkin verran laajentanut kesällä. Kiitän erityisesti Seppo Hassia ja Simo Puntasta monista arvokkaista parannuksista varsinkin liitteen osalta. Samoin esitän kiitokseni Jevgeni Koeville, Anna-Riitta Niskaselle, Marco Varjukselle ja Kimmo Vehkalahdelle kevään 994 kurssin aikana ja sen jälkeen saamastani palautteesta. Hituniemessä joulukuussa 994 S.M.

vi Monimuuttujamenetelmät 3..994/S.Mustonen Sisällysluettelo. Kuvallisia keinoja. Hajontakuvien yleistykset. Hajontakuvamatriisit 4.3 Havaintomatriisi rasterikuvana 6.4 Andrews-käyrät 7.5 Chernoff-naamat.6 Profiili- ja tähtikuvat. Multinormaalijakauma 5. Alustavaa johdattelua 5. Multinormaalijakauman määritelmä ja perusominaisuudet 6.. Reunajakaumat 0.. Muuttujien vaihto..3 Ehdolliset jakaumat..4 Muuttujaryhmien riippumattomuus 4..5 Muuttujaryhmien riippuvaisuus 5..6 Karakteristinen funktio 7..7 Reunajakaumat ja multinormaalisuus 8 3. Multinormaalinen otos 3 3. Parametrien estimointi 3 3. Otossuureiden jakaumista 33 3.3 Multinormaalisen otoksen simulointi 37 3.4 Multinormaalijakaumaan liittyviä testejä 40 3.4. Mahalanobis-etäisyydet 4 3.4. Hotellingin T -testi (yhden otoksen tapaus) 43 3.4.3 Hotellingin T -testi (kahden otoksen vertailu) 48 3.4.4 Kovarianssimatriisia koskevia testejä 5 3.4.5 Sama multinormaalijakauma 53 3.4.6 Yksittäisten korrelaatiokertoimien testaaminen 53 4. Pääkomponenttianalyysi 57 4. Pääkomponenttien määrääminen I 57 4. Pääkomponenttien määrääminen II 58 4.. Kahden muuttujan pääakselit ja hajontaellipsit 58 4.3 Pääkomponenttien ominaisuuksia 6 4.4 Pääkomponenttien määrääminen III 63 4.5 Pääkomponenttien estimointi ja laskeminen käytännössä 64 4.5. Simulointikoe 70

Monimuuttujamenetelmät 3..994/S.Mustonen vii 5. Faktorianalyysi 75 5. Faktorianalyysimalli 75 5. Pääakselifaktorointi 78 5.3 Suurimman uskottavuuden faktorointi 79 5.4 Rotaatiomenetelmät 80 5.4. Graafinen rotaatio 8 5.4. Analyyttiset rotaatiomentelmät 8 5.4.3 Vinot rotaatiot 83 5.4.4 Esimerkki 85 5.5 Faktoripistemäärät 90 5.5. Esimerkki 9 5.6 Transformaatioanalyysi 95 5.6. Ahmavaaran ratkaisu 95 5.6. Symmetrinen transformaatioanalyysi 97 5.6.3 Esimerkki 98 5.6.4 Esimerkki 99 5.6.5 Esimerkki 3 0 5.7 Faktorianalyysin kritiikistä 06 6. Kanoniset korrelaatiot 3 6. Määritelmä 3 6.. Esimerkki 5 6. Kanonisten korrelaatioiden estimointi 7 6.3 Informaatioteoreettinen tulkinta 9 7. Erotteluanalyysi 7. Määritelmä 7. Luokitteluongelma 6 7.. Esimerkki hahmontunnistuksesta 7 8. Ryhmittelyanalyysi 40 8. Tilastollinen ryhmittelyanalyysi 4 8.. Esimerkki 4 8.. Esimerkki 46 9. Moniulotteinen skaalaus 48 9. Klassinen skaalaus 49 9.. Esimerkki 50 9. Pienimmän neliösumman skaalaus 55 9.. Esimerkki (jatkoa) 57 9.. Esimerkki 6 9..3 Esimerkki 3 67

viii Monimuuttujamenetelmät 3..994/S.Mustonen 0. Korrespondenssianalyysi 7 0. Määritelmä 7 0.. Esimerkki 75 Liitteet. Moniulotteisista kuutioista ja palloista 8. Singulaariarvo- ja muita hajotelmia matriiseille 93 Kirjallisuutta 00

Kuvallisia keinoja. Kuvallisia keinoja Tilastollisen aineiston graafisen esittämisen ongelmat korostuvat moniulotteisissa aineistoissa, sillä esim. monikymmenulotteisen pisteparven litistäminen tasoon tarkkuudesta tinkimättä on täysi mahdottomuus. Kolmiulotteisuus esim. stereokuvapareina tai kuvaruudulla pyörivinä ns. spin-kuvina ei tuota juuri mitään lisähyötyä näissä tilanteissa. Parasta on tunnustaa tosiasiat ja esittää se, mikä esitettävissä on, tasossa. Kuten tulemme näkemään, eräät menetelmät tuottavat monen muuttujan aineistoista vähäulotteisia esityksiä esim. karsimalla tutkittavan ilmiön kannalta tarpeetonta satunnaisuutta. Tällöin menetelmien tuloksia tarkasteltaessa graafiset keinot tulevat paremmin ulottuvillemme. Sopii kysyä, onko moniulotteisen ilmiön graafisessa esittämisessä mitään mieltä, koska itse ilmiöllä on harvoin suoraa suhdetta fysikaaliseen, näkyvään todellisuuteen. Kaikki kuvalliset keinot ovat tällöin täysin sopimuksenvaraisia. On kuitenkin kiistatonta, että ihmisen on jopa huonostikin suunnitellusta kuvallisesta esityksestä helpompi nähdä asioiden välisiä yhteyksiä kuin katselemalla pelkkää lukujen muodostamaa havaintomatriisia. Kuvien hahmottamisessa ihminen on jatkuvasti ylivoimainen tehokkaimpiinkin tietokoneratkaisuihin verrattuna. Miltei kaikkien kuvallisten keinojen perustana ovat tavanomaiset kaksiulotteiset, suorakulmaiset koordinaattiesitykset, joissa havainnot näkyvät pisteinä tai pisteen laajennuksina. Laajennuksella tarkoitetaan sitä, että "pisteet" voivat olla erikokoisia, -muotoisia ja -värisiä. Niiden ympärille voi kasautua myös eri muuttujista riippuvaa tietoa erimittaisilla ja -suuntaisilla janoilla tai käyränpätkillä kuvattuina. Siis erilaisilla pisteen liitännäisillä saadaan kuvaan jollain tavoin mukaan hyvinkin monen muuttujan osuus. On voitu päätyä hyvinkin erikoistuneisiin ratkaisuihin, joista eksoottisimpia ovat ns. Chernoffin naamat. Niissä muuttujat asetetaan vastaamaan kasvon eri piirteitä. Menetelmän viehätys piilee siinä, että tukeudutaan suoraan ihmisen opittuun kykyyn tunnistaa lähimmäisensä kasvoista.. Hajontakuvien yleistykset Kahden muuttujan hajontakuvissa, joita myös kutsutaan korrelaatiodiagrammoiksi, tarkastellaan ko. muuttujien keskinäisiä riippuvuuksia. Kutakin havaintoa vastaa kaksiulotteisessa koordinaatistossa piste, jonka asema x-akselin suunnassa määräytyy ensimmäisen muuttujan arvon ja y-akselin suunnassa toisen muuttujan arvon mukaan. Tähän kuvaustapaan voi lisätä tietoa muista muuttujista laajentamalla eri tavoin "pisteen" ulkoista muotoa. Survon grafiikassa tämä käy helpoiten käyttämällä POINT-täsmennystä yleisimmässä muodossaan, kuten tapahtuu seu-

Monimuuttujamenetelmät 5.7.994/S.Mustonen. raavassa esimerkissä. Tällöin otetaan mukaan kolmas muuttuja, joka vaikuttaa pistettä vastaavan symbolin kokoon. Myös LINE-täsmennys, varsinkin LINE=6 (kts. Survo-kirjan ss. 6-3), eri laajennuksineen tarjoaa vielä monipuolisempia ja useammasta muuttujasta riippuvia tehostuksia. Seuraavassa diagrammassa on piirretty vastakkain Suomen kunnista (Survon esimerkkiaineisto KUNNAT) muuttujat Tulotaso ja SYNT (syntyneisyys 000 asukasta kohti) siten, että kuntaa vastaavan neliömäisen "pisteen" sivun pituus on verrannollinen muuttujaan Äyriero=Äyri-. Ko. muunnos veroäyri-muuttujassa tehdään, jotta ko. erot todella näkyisivät kuvassa. 7 SURVO 84C EDITOR Thu Jul 7:53:39 994 C:\M\MON\ 00 00 0 * *VAR SYNT=000*Synt./Väestö TO KUNNAT 3 *VAR Äyriero=Äyri- TO KUNNAT 4 *... 5 *GPLOT KUNNAT,Tulotaso,SYNT 6 *POINT=5,0,Äyriero,8 7 * Diagram of KUNNAT SYNT 30 5 0 5 0 5 0 5000 0000 5000 0000 5000 30000 Tulotaso Kuvasta ilmenee paitsi tulotason ja syntyneisyyden riippuvuus myös se, että veroäyri on odotetusti alhaisen tulotason kunnissa suurimmillaan ja korkean tulotason kunnissa pienimmillään. Rivin 6 POINT-täsmennys määrää, mitä kussakin tapauksessa tulee pisteen paikalle. Ensimmäinen parametri 5 valitsee symboliksi avoimen neliön. Toinen parametri 0 ilmoittaa neliön peruskoon ja kolmas parametri (Äyriero) kokoon vaikuttavan muuttujan. Peruskokoa käytetään, kun Äyriero on viimeisen parametrin (8) suuruinen. Yleisesti neliön koko (sivun pituus) on suhteessa muuttujan Äyriero arvoon.

. Kuvallisia keinoja 3 Neliön asemasta voidaan symboliksi valita suorakaide, jonka leveyttä ja korkeutta säädellään eri muuttujilla. Näin yhdessä kuvassa esitetään 4 eri muuttujan riippuvuutta samanaikaisesti. Survossa tällaisen kuvan laatiminen edellyttää yleisempää piirrostekniikkaa, jossa piirrettävä symboli määritellään erillisten, muuttujan arvoista riippuvien janojen yhdistelmänä. Piirroskaaviossa on erikseen annettu yleiset säädöt (rivit 3-9). Näillä kuvataan sellainen suorakaide, jonka keskipiste on (VX,VY), leveys vx ja korkeus vy. Suorakaide piirretään neljästä palasta (suorakaiteen sivut) koostuvana jatkuvana käyränä. Paloittelua säätelee parametri T, joka saa peräkkäin arvot 0,,,3,4. Nämä yleiset säädöt muodostavat "piirrosohjelman", jota soveltajan ei edes tarvitse yksityiskohtaisesti ymmärtää. Erikseen annetaan aineistokohtaiset säädöt (rivit -), joilla soveltaja määrittelee aineistonsa (tässä DATA:KUNNAT) neljän muuttujan ja piirrosparametrien VX,VY,vx,vy vastaavuudet. Näiden joukkoon voi kuulua piirrosta yleisesti ohjaavia täsmennyksiä kuten tässä kuvan otsikko (HEADER rivillä 3), asteikot (XSCALE ja YSCALE rivillä 6) sekä akselien nimet (XLABEL ja YLABEL rivillä 7). SURVO 84C EDITOR Sat Jul 3 09:59:09 994 C:\M\MON\ 00 00 0 * *AINEISTOSTA RIIPPUVAT SÄÄDÖT: 3 * HEADER=KUNNAT:_Suorakaiteen_leveys=_0-Äyri Korkeus=_Maamet+ 4 * X-Y-muuttujat: 5 * VX=DATA:KUNNAT,Tulotaso VY=DATA:KUNNAT,SYNT 6 * XSCALE=7000,0000,0000,30000 YSCALE=0(5)30 7 * XLABEL=Tulotaso YLABEL=Syntyneisyys 8 * Suorakaidemuuttujat: 9 * Vx=DATA:KUNNAT,Äyri Vy=DATA:KUNNAT,Maamet 0 * Muunnokset: * vx=00*(0-vx) vy=(vy+)/6 * 3 *YLEISET SÄÄDÖT: suorakaiteen leveys vx, korkeus vy, keskipiste (VX,VY) 4 * xx=vx-vx/ yy=vy-vy/ vasen alakulma 5 * T=0,4, 6 * X=if(T<=)then(xx+T*vx)else(X) Y=if(T<=)then(yy)else(Y) 7 * X=if(T<=)then(xx+vx)else(X3) Y=if(T<=)then(yy+(T-)*vy)else(Y3) 8 * X3=if(T<=3)then(xx+vx-(T-)*vx)else(X4) Y3=if(T<=3)then(yy+vy)else(Y4) 9 * X4=xx Y4=yy+vy-(T-3)*vy 0 * *GPLOT X(T)=X,Y(T)=Y *

4 Monimuuttujamenetelmät 5.7.994/S.Mustonen. KUNNAT: Suorakaiteen leveys= 0-Äyri Korkeus= Maamet+ Syntyneisyys 30 5 0 5 0 5 0 7000 0000 0000 30000 Tulotaso. Hajontakuvamatriisit Hajontakuvamatriisilla (Draftsman s display) tarkoitetaan kuvakoostetta, joka asettelultaan vastaa esim. korrelaatiomatriisia, mutta jonka "alkioina" ovat asianomaisten muuttujien korrelaatiodiagrammat. Englanninkielinen nimitys juontaa alkunsa teknisten laitteiden projektiopiirrostekniikasta. Tutkittavan aineiston kaikkien mahdollisten kaksiulotteisten hajontakuvien samanaikainen esittäminen antaa melko hyvän kokonaisnäkemyksen riippuvuuksien luonteesta. Se ei kuitenkaan voi tuottaa täydellistä kuvaa aineiston kokonaisvaihtelusta, koska minkäänulotteiset reunajakaumat eivät määrittele yhteisjakaumaa yksikäsitteisesti. Tästä huolimatta hajontakuvamatriisin piirtäminen on oivallinen keino tutustua uuden aineiston käyttäytymiseen ja auttaa esim. sopivien muuttujatransformaatioiden löytämisessä. Suomen suurimpien kuntien (asukasluku yli 0000) 0 valitusta muuttujasta tehty hajontakuvamatriisi näyttää seuraavalta. Kussakin korrelaatiodiagrammassa Helsinki erottuu suurempana pisteenä.

. Kuvallisia keinoja 5 Suomen suurimmat kunnat Helsinki Väestö Synt. Ala Maamet Teoll Palvelu Asuin Äyri Tulotaso SYNT Tällainen kuva syntyy Survon avulla vähimmillään PLOT- (kuvaruutuun GPLOT-) komennolla, joka on varustettu täsmennyksellä TYPE=DRAFTS. Hyvin vähäluokkaisten muuttujien osalta on hyötyä JITTER-täsmennyksestä, joka täristää muuten päällekkäin tulevat pisteet "oikean" paikan ympärille satunnaiseksi pisteparveksi. Ilman täristystä diskreettien muuttujien hajontakuvat surkastuvat usein mielenkiinnottomiksi hilapisteistöiksi eikä riippuvuuden luonteesta saa kunnon käsitystä. Tässä tapauksessa, koska yksi havainto halutaan erottaa muiden joukosta ja seurata sen asemaa kussakin osakuvassa erikseen, kuva rakennetaan kahdessa vaiheessa. Ensin piirretään koko aineisto (rivit -6) tallettaen sekä kuva (OUTFILE-täsmennys) että automaattisesti valitut piirrosasteikot (OUTSCALE- täsmennys). Tämän päälle saadaan sopeutettu kuva toisesta aineistosta (tai kuten tässä yhdestä havainnosta) eri värillä tai toisentyyppisinä pisteinä merkittynä muuten vastaavalla kaaviolla (rivit 8-4) käyttäen kohdistukseen INFILE- ja INSCALE-täsmennyksiä: 3 SURVO 84C EDITOR Sat Jul 3 5:45:38 994 C:\M\MON\ 00 00 0 * *Koko aineiston piirto (skaalausten valinta ja täristys): 3 *GPLOT KUNNAT / TYPE=DRAFTS OUTSCALE=SKAALAT.TXT JITTER=30 4 *IND=Väestö,0000,500000 5 *XDIV=0,,0 YDIV=0,0, HEADER=Suomen_suurimmat_kunnat 6 *MASK=--AAAAAAAAAA MODE=VGA OUTFILE=A 7 *... 8 *Yhden havainnon lisäys isommalla merkinnällä: 9 *GPLOT KUNNAT / TYPE=DRAFTS INSCALE=SKAALAT.TXT 0 * *XDIV=0,,0 YDIV=0,0, HEADER= *MASK=--AAAAAAAAAA MODE=VGA INFILE=A POINT=[RED],0,3 TEXTS=Kunta 3 *CASES=Kunta:Helsinki Helsinki voidaan vaihtaa 4 *Kunta=Helsinki,500,450 mihin tahansa muuhun kuntaan. 5 *

6 Monimuuttujamenetelmät 5.7.994/S.Mustonen.3.3 Havaintomatriisi rasterikuvana Toinen tapa yleiskuvan saamiseksi on piirtää koko havaintomatriisi matriisidiagrammana siten, että havaintoarvojen paikalla ovat niiden suuruuksia vastaavat tummuusasteeltaan vaihtelevat viivat tai laatikot. Esim. muuttujakohtaisesti säädetään, miten tummuusaste muuttuu mustasta valkoiseen arvon kasvaessa tai päinvastoin. Suomen suurimmat kunnat Helsinki Tampere Turku Espoo Vantaa Lahti Oulu Pori Kuopio Jyväskylä Kotka Vaasa Lappeenranta Joensuu Hämeenlinna Hyvinkää Imatra Kajaani Kokkola Kouvola Rauma Rovaniemi Mikkeli Savonlinna Kemi Varkaus Jyväskylän mlk Seinäjoki Riihimäki Nokia Kerava Järvenpää Valkeakoski Kuusankoski Iisalmi Tuusula Nurmijärvi Tornio Pietarsaari Anjalankoski Salo Kirkkonummi Forssa Lieksa Porvoon mlk Porvoo Kangasala Raahe Rovaniemen mlk Raisio Kuusamo Hollola Vihti Vammala Heinola Lohjan kunta Janakkala Siilinjärvi Kauhajoki Lapua Lohja Kuhmo Pieksämäki Nastola Laukaa Suomussalmi Mustasaari Kankaanpää Kaarina Orimattila Keuruu Sipoo Kemijärvi Uusikaupunki Ylöjärvi Lempäälä Äänekoski Vehkalahti Mikkelin mlk Hanko Kiuruvesi Joutseno Ilmajoki Pudasjärvi Haukipudas Leppävirta Nurmes Ylivieska Sotkamo Mäntsälä Kurikka Kitee Suolahti Tammisaari Parainen Närpiö Ulvila Liperi Valkeala Hamina Nivala Alavus Somero Saarijärvi Jalasjärvi Outokumpu Sodankylä Väestö Ala Synt. Teoll Asuin Tulotaso Maamet Palvelu Äyri SYNT Esimerkkinämme on jälleen Suomen suurimpia kuntia kuvaavat 0 muuttujaa. Kunnat on järjestetty asukasluvun mukaan suurimmasta pienimpään, jolloin kuvasta voi päätellä helpommin, mitkä tiedot korreloivat hyvin asukasluvun

.3 Kuvallisia keinoja 7 kanssa. Tässä esitystavassa kannattaa kiinnittää huomiota poikkeaviin tapauksiin, jotka näkyvät silmiinpistävinä "spektriviivoina". Kuva on saatu aikaan seuraavasti: 3 SURVO 84C EDITOR Sat Jul 3 7:40:34 994 C:\M\MON\ 00 00 0 5 *... 6 *IND=Väestö,0000,500000 7 *FILE SORT KUNNAT BY -Väestö TO KUNNAT 8 *... 9 *MASK=A-AAAAAAAAAA-- 0 *HEADER=Suomen_suurimmat_kunnat *PLOT KUNNAT / TYPE=MATRIX SCREEN=NEG DEVICE=PS,KUNNAT4.PS *SIZE=64,500 XDIV=60,54,30 YDIV=30,370,00 3 *ROWLABELS=[Swiss(6)],,4,0 COLUMNLABELS=[Swiss(7)],, 4 * Tiedoston KUNNAT mukaan otettavat havainnot on ensin lajiteltu väkiluvun mukaan laskevaan järjestykseen havaintotiedostoksi KUNNAT (rivit 6-7). Kuvan piirto tapahtuu riveillä 9-3 olevalla PLOT-kaaviolla, jossa kuvatyypin määrää täsmennys TYPE=MATRIX. Täsmennys SCREEN=NEG tarkoittaa, että muuttujanarvon vähetessä myös tummuusaste vähenee. Täsmennysten ROWLABELS ja COLUMNLABELS avulla rivi- ja sarakeotsikot saadaan lomittumaan niin, etteivät ne ahtaudu päällekkäin..4 Andrews-käyrät Kokonaan toisenlaisen näkökulman moniulotteisen aineiston graafiseen tarkasteluun tarjoaa D.F.Andrewsin (97) esittämä Fourier-käyrätekniikka. Kutakin p muuttujan X=(X,X,...,X p ) havaintoa vastaa funktion f X (t) = X / + X sin(t) + X 3 cos(t) + X 4 sin(t) + X 5 cos(t) + X 6 sin(3t) +... kuvaaja välillä -π < t < π. Kun havainnot esitetään samassa koordinaatistossa, toisiaan muistuttavia havaintoja edustavat luonnollisesti toisiaan muistuttavat käyrät. Käyrien etäisyys toisistaan vastaa jopa tarkkaan havaintojen euklidista etäisyyttä p-ulotteisessa avaruudessa siinä mielessä, että havainnoille X ja Y pätee π π π [f X (t) f Y (t)] dt = X Y = (X Y ) + (X Y ) +... + (X p Y p ). Andrews käytti eräänä esimerkkinään pientä ihmis- ja apinalajien sekä muinaisisten fossiilien leukaluista tehdyistä mittauksista koottua aineistoa. Alkuperäiset 8 muuttujaa on seuraavassa havaintotaulukossa korvattu erotteluanalyysin antamilla erottelumuuttujilla, jolloin eri lajien ja rotujen poikkeamat näkyvät muuttujissa X -X 8 voimakkuusjärjestyksessä. Yleensäkin muuttujat kannattaa asettaa tärkeysjärjestykseen, koska niiden vaikutukset itse käyrissä ilmenevät sitä paremmin. mitä alhaisemmasta "frekvenssistä" on kysymys. Erityisesti ensimmäinen muuttuja (X ) määrää yksinkertaisesti, millä perus-

8 Monimuuttujamenetelmät 5.7.994/S.Mustonen.4 tasolla havaintoa vastaava käyrä kulkee. Aineiston kolme ensimmäistä havaintoa vastaavat nykyisiä ihmisrotuja (länsi-afrikkalainen, britti, australialainen), 6 seuraavaa tunnettuja apinalajeja ja loput 6 muinaisia löydöksiä. Mielenkiintoista on tarkastella viimeistä (Proconsul Africanus), jota ainakin joskus on pidetty apinoiden ja ihmisten välisenä "puuttuvana renkaana". SURVO 84C EDITOR Sun Jul 4 4:4:08 994 C:\M\MON\ 50 00 0 * *DATA FOSSIILIT 3 * Laji X X X3 X4 X5 X6 X7 X8 Tunnus 4 * Westafr -8.09 0.49 0.8 0.75-0.06-0.04 0.04 0.03 H 5 * British -9.37-0.68-0.44-0.37 0.37 0.0-0.0 0.05 H 6 * Austral -8.87.44 0.36-0.34-0.9-0.0-0.0-0.05 H3 7 * Gorilla 6.8.89 0.43-0.03 0.0-0.4 0.07 0.08 A 8 * Gorilla 4.8.5 0.7-0.06 0.5 0.5-0.07-0.0 A 9 * Orang 5..6-0.7 0.04-0.7 0.3 0.03 0.05 A3 0 * Orang 3.60 0.8 -.05 0.0-0.03-0. -0. -0.08 A4 * Chimpan 3.46-3.37 0.33-0.3-0.9-0.04 0.09 0.09 A5 * Chimpan 3.05-4. 0.7 0.8 0.04 0.0-0.06-0.06 A6 3 * Pith.Pek -6.73 3.63.4. -.90 0.4.3-0.55 F 4 * Pith.P -5.90 3.95 0.89.58 -.56.0.53 0.58 F 5 * Par.Robu -7.56 6.34.66 0.0 -.3 -.0 0.68-0.3 F3 6 * Par.Cras -7.79 4.33.4 0.0 -.80-0.5 0.04-0.87 F4 7 * Megantro -8.3 5.03.3-0.0 -.4-0.3-0.8-0.3 F5 8 * Proc.Afr.86-4.8 -.4 -.73.06.80.6.48 F6 9 * Tämän aineiston Andrews-käyrät Andrews function plots: FOSSIILIT 0 - A 5 A 3 A 6 F 6 A 6 A F 6 A A A 3 A 4 A 5 F 3 A 3 A A 4 A A 4 F F A 5 A 6 F 4 F 5 F 5 F H H 3 H H F F 3 F 4 H H H 3 F H 3 F 4 F F 6 H F 5 F 3 A F 6 A 6 A 5 H H - -pi 0 pi syntyvät seuraavalla Survon piirroskaaviolla:

.4 Kuvallisia keinoja 9 4 SURVO 84C EDITOR Sun Jul 4 4:7:6 994 C:\M\MON\ 50 00 0 9 * 0 *GPLOT FOSSIILIT / TYPE=ANDREWS LABEL=[Small],Tunnus * YSCALE=-() * 3 *VARIABLES: A B Term 4 *X 0 /sqrt() 5 *X 0 sin(t) 6 *X3 0 cos(t) 7 *X4 0 sin(*t) 8 *X5 0 cos(*t) 9 *X6 0 sin(3*t) 30 *X7 0 cos(3*t) 3 *X8 0 sin(4*t) 3 *END of plotting specifications 33 * PLOT-komennossa täsmennys TYPE=ANDREWS tuottaa Andrews-käyrät. Se edellyttää erityistä VARIABLES-luetteloa, joka on tässä riveillä 3-3. Luettelossa kerrotaan muuttujat X (tärkeysjärjestyksessä). Jokaista on lupa skaalata muotoon (X A)/B antamalla parametrit A ja B. Tässä tapauksessa on A=0 ja B= kaikilla muuttujilla eli muuttujanarvoja käytetään sellaisenaan. Eri havaintoja vastaavien käyrien tunnistamiseksi annetaan LABEL-täsmennys. Se ilmoittaa muuttujan, jonka arvoilla jokainen käyristä merkitään sopivasti porrastetuin välein. Havaintotaulukon viimeisenä sarakkeena on muuttuja Tunnus tätä tarkoitusta varten. Ensimmäisen erottelumuuttujan X mukaisesti Andrews-käyrät jakautuvat kahteen ryhmään, joista ylemmässä ovat apinat, alemmassa ihmisrodut ja useimmat fossiilit. Mystinen Proconsul Africanus (F6) kulkee etupäässä apinoitten puolella poiketen kerran ihmisten seuraan. Kun havaintoja on runsaasti, kuvasta saattaa tulla melko sotkuinen. Jos käyrät piirtää eri kuvina, niitä taas on vaikea erottaa toisistaan. Eräs tapa saada ne helpommin hahmotettaviksi on siirtyä napakoordinaattiesitykseen, jolloin jokaisesta havainnosta muodostuu origon ympärillä kieppuva käyrä. Survossa tällaiset piirrokset syntyvät käyttämällä täsmennystä TYPE=ANDREWS,POLAR,C. Tässä C on ylimääräinen additiivinen vakio (minimisäde), joka etäännyttää käyrää origosta ja edelleen parantaa hahmottamista. Näin piirrettynä fossiiliaineisto näyttää seuraavalta:

0 Monimuuttujamenetelmät 5.7.994/S.Mustonen.4 Andrews function plots: FOSSIILIT Westafr British Austral Gorilla Gorilla Orang Orang Chimpan Chimpan Pith.Pek Pith.P Par.Robu Par.Cras Megantro Proc.Afr Kuva on saatu aikaan kaaviolla: 6 SURVO 84C EDITOR Sun Jul 4 8:06:46 994 C:\M\MON\ 50 00 0 50 *... 5 *GPLOT FOSSIILIT / TYPE=ANDREWS,POLAR,0. LABEL=Laji 5 * FSCALING=0,.5 53 * 54 *VARIABLES: A B Term 55 *X 0 /sqrt() 56 *X 0 sin(t) 57 *X3 0 cos(t) 58 *X4 0 sin(*t) 59 *X5 0 cos(*t) 60 *X6 0 sin(3*t) 6 *X7 0 cos(3*t) 6 *X8 0 sin(4*t) 63 *END of plotting specifications 64 * Periaatteessa jokainen Andrews-käyrä määrittelee oman aaltomuotonsa, joka on mahdollista realisoida myös äänenä tai sointivärinä. Ei ole tiedossa, onko tällaista koskaan kokeiltu. Huomautettakoon, että Survossa voi kyllä tunnistaa äänen avulla yksittäisen muuttujan havaintosarjasta jaksollisuuksia ja poikkeavia havaintoja. Tämä tapahtuu FILE SHOW-operaation yhteydessä.

.5 Kuvallisia keinoja.5 Chernoff-naamat Tässä piirrostavassa, jonka H.Chernoff on esittänyt vuonna 973, muuttujat asetetaan vastaamaan karkeasti piirrettyjen kasvojen eri piirteitä. Survossa on seurattu tarkasti Chernoffin alkuperäistä ehdotusta, jossa valittavia piirteitä oli kaikkiaan 8. Jos aktivoidaan PLOT-komento varustettuna pelkällä TYPE= FACES täsmennyksellä, toimituskenttään kopioituu mallikaavio, jota muokkaamalla soveltaja liittää muuttujat ja kasvojen piirteet toisiinsa. Tämän mallin keskeinen osa on VARIABLES-luettelo: SURVO 84C EDITOR Mon Jul 5 09::55 994 C:\M\MON\ 0 00 0 0 * *VARIABLES: xmin xmax Features fmin fmax *<X> <min X> <max X> Radius_to_corner_of_face_OP 0.6.0 3 *<X> <min X> <max X> Angle_of_OP_to_horizontal 0.0 0.6 4 *<X3> <min X3> <max X3> Vertical_size_of_face_OU 0.6.0 5 *<X4> <min X4> <max X4> Eccentricity_of_upper_face 0.5.5 6 *<X5> <min X5> <max X5> Eccentricity_of_lower_face 0.5.5 7 *<X6> <min X6> <max X6> Length_of_nose 0. 0.5 8 *<X7> <min X7> <max X7> Vertical_position_of_mouth 0. 0.8 9 *<X8> <min X8> <max X8> Curvature_of_mouth_/R -4.0 4.0 30 *<X9> <min X9> <max X9> Width_of_mouth 0..0 3 *<X0> <min X0> <max X0> Vertical_position_of_eyes 0.0 0.4 3 *<X> <min X> <max X> Separation_of_eyes 0.3 0.8 33 *<X> <min X> <max X> Slant_of_eyes -0.5 0.5 34 *<X3> <min X3> <max X3> Eccentricity_of_eyes 0.3.0 35 *<X4> <min X4> <max X4> Size_of_eyes 0. 0. 36 *<X5> <min X5> <max X5> Position_of_pupils -0. 0. 37 *<X6> <min X6> <max X6> Vertical_position_of_eyebrows 0. 0.4 38 *<X7> <min X7> <max X7> Slant_of_eyebrows -0.5 0.5 39 *<X8> <min X8> <max X8> Size_of_eyebrows 0. 0.5 40 *END of plotting specifications 4 * Mallitaulukon viimeisinä sarakkeina ovat kasvojen piirteiden selitykset (Features) ja niiden luonnolliset minimi- ja maksimiarvot. Soveltajan tehtävä on päivittää kolme ensimmäistä saraketta, joissa nimetään eri piirteisiin vaikuttavat muuttujat ja niiden minimi- ja maksimiarvot. Tällöin muuttujien arvot kuvautuvat piirteiksi lineaarisella muunnoksella, joka asettaa minimit minimejä vastaan ja maksimit maksimeja vastaan. Muuttujien minimejä ja maksimeja ei tarvitse erikseen laskea aineistosta, vaan minimin paikalle voi kirjoittaa merkinnän * ja maksimin paikalle **. Kuvauksen voi kääntää vastakkaiseen suuntaan asettamalla minimin paikalle ** ja maksimin *. Jokaisen aktivoinnin jälkeen pelkät * ja ** merkinnät korvautuvat todellisilla arvoilla, joiden perässä edelleen on * tai **. Poistamalla tähdet saadaan kyseinen raja aineistosta riippumattomaksi vakioksi. Erityisesti kun muuttujia on vähemmän kuin naaman piirteitä, tärkeinä pidettyjä muuttujia kannattaa käyttää useasti. Naaman piirteen voi vakioida (minimin ja maksimin keskiväliin) panemalla muuttujan paikalle merkinnän -. Fossiiliaineistoa piirrettäessä on houkutus yrittää valita vastaavuudet siten, että ihmisistä ja apinoista tulee jossain määrin itsensä näköisiä. On kuitenkin kohtuutonta kuvitella, että näin saataisiin fossiilit myös näyttämään "oikeilta". Voimme vain havaita, että Chernoffin naamoina useimmat fossiilit ovat

Monimuuttujamenetelmät 5.7.994/S.Mustonen.5 enemmän ihmisen kuin apinan kaltaisia ja että Proconsul Africanus on tässä seurassa tosi outo ilmestys. Ihmisten, apinoiden ja fossiilien leukaluumittaukset Westafr British Austral Gorilla Gorilla Orang Orang Chimpan Chimpan Pith.Pek Pith.P Par.Robu Par.Cras Megantro Proc.Afr Survon Chernoff-ohjelmassa kuvaruudulla on myös mahdollista käyttää värejä ja esim. "maalata" kasvot ja silmämunat. Tekniikasta on kehitetty myös muita variaatioita. Naamakuvien todellinen hyöty käytännön sovelluksissa on kuitenkin jäänyt vähäiseksi alkuperäisen idean hauskuudesta huolimatta..6 Profiili- ja tähtikuvat Moniulotteisen aineiston havaintokohtaisia profiileja piirretään Survossa PLOT-komennolla, jolla on täsmennys TYPE=PROFILES. Tällöin havaintoa X,X,...,X p vastaa pisteet (,Y ), (,Y ),... (p,y p ) yhdistävä murtoviiva. Tässä Y:t ovat skaalattuja havaintoarvoja Y i = X i /max( X i ), i =,,..., p. Fossiiliaineisto näyttää tällöin GPLOT-kaaviolla kuvaruutuun piirrettynä seuraavalta:

.6 Kuvallisia keinoja 3 Profiilikuva fossiiliaineistosta Westafr British Austral Gorilla Gorilla Orang Orang Chimpan Chimpan Pith.Pek Pith.P Par.Robu Par.Cras Megantro Proc.Afr Kuva on saatu aikaan GPLOT-kaaviolla: 6 SURVO 84C EDITOR Mon Jul 5 0:39:6 994 C:\M\MON\ 00 00 0 9 * 0 *HEADER=Profiilikuva_fossiiliaineistosta *GPLOT FOSSIILIT / TYPE=PROFILES LABEL=Laji * Tähtikuvissa kutakin havaintoa vastaa origoa kiertävä suljettu murtoviiva siten, että eri muuttujia vastaavat tasavälein suunnatut vektorit. Vierekkäisten vektoreiden kärkipisteet on yhdistetty. Muuttujaa X vastaavan vektorin pituus on ( C)(X min(x))/[max(x) min(x)]+c, missä C on vakio (oletusarvona 0.). Tähtikuva syntyy täsmennyksellä TYPE=STARS,C : 6 SURVO 84C EDITOR Mon Jul 5 0:5:37 994 C:\M\MON\ 00 00 0 9 * 0 *HEADER=Tähtikuva_fossiiliaineistosta *GPLOT FOSSIILIT / TYPE=STARS LABEL=Laji *

4 Monimuuttujamenetelmät 5.7.994/S.Mustonen.6 Tähtikuva fossiiliaineistosta Westafr British Austral Gorilla Gorilla Orang Orang Chimpan Chimpan Pith.Pek Pith.P Par.Robu Par.Cras Megantro Proc.Afr

Multinormaalijakauma 5. Multinormaalijakauma. Alustavaa johdattelua Monimuuttujamenetelmissä multinormaalijakaumalla on ehkä vielä keskeisempi asema kuin normaalijakaumalla yhden muuttujan tilastollisissa tarkasteluissa. Multinormaalijakauma on suora normaalijakauman yleistys. Se voidaan johtaa usealla tavalla. Havainnollisinta on määritellä se toisistaan riippumattomien, normaalijakaumaa noudattavien muuttujien erilaisten painotettujen summien yhteisjakaumana esim. seuraavasti: Olkoot Z,Z,...,Z p riippumattomia, standardoitua normaalijakaumaa N(0,) noudattavia muuttujia. Muodostetaan uudet muuttujat X,X,...,X p Z-muuttujien lineaarisina yhdistelminä X = c Z + c Z +... + c p Z p + µ X = c Z + c Z +... + c p Z p + µ... X p = c p Z + c p Z +... + c pp Z p + µ p eli matriisimuodossa X = CZ + µ missä X=(X,X,...,X p ) on X-muuttujien muodostama pystyvektori ja vastaavasti Z=(Z,Z,...,Z p ), µ=(µ,µ,...,µ p ) sekä C p p-kerroinmatriisi. Muuttujien X,X,...,X p yhteisjakaumaa sanotaan multinormaalijakaumaksi ja sen määrittelevät täydellisesti parametrit µ ja C. Itse asiassa tulemme näkemään, että jakauman määrittelemiseksi riittää tuntea odotusarvovektorin µ ohella kovarianssimatriisi Σ = CC. Multinormaalijakauman syntytapa tulee vielä havainnollisemmaksi käyttämällä hyväksi kerroinmatriisin C singulaariarvohajotelmaa C = UDV, missä U ja V ovat p p-ortogonaalisia matriiseja ja D (ei-negatiivisten) singulaariarvojen muodostama lävistäjämatriisi. Tällöin X = CZ + µ = UDV Z + µ. Tulemme osoittamaan, että Z-muuttujien ortogonaalinen muunnos (tässä V Z) säilyttää muuttujat riippumattomina (0,)-normaalisina. Näin ollen X-muuttujat voitaisiin määritellä suoraan muodossa X = UDZ + µ.

6 Monimuuttujamenetelmät 3..994/S.Mustonen. Tämä merkitsee, että multinormaalijakauman voi aina ajatella syntyvän (0,)-normaalisista muuttujista kolmessa vaiheessa. Ensin tehdään muuttujittain venytyksiä ja kutistuksia (DZ), sitten kierretään koordinaatistoa (UDZ) ja lopuksi siirretään jakauman keskipiste pois origosta (lisäämällä µ). Z DZ UDZ UDZ+µ Tulemme näkemään, että multinormaalijakauman kaikki eriulotteiset reunajakaumatkin ovat (multi)normaalisia. Tämä merkitsee mm. sitä, että multinormaalijakauman em. syntyhistoriassa Z-muuttujia voisi olla enemmän kuin lopullisia X-muuttujia. Vaikka Z-muuttujat eivät olisikaan normaalisia, mutta niitä on "paljon", on osoitettavissa keskeisen raja-arvolauseen tapaan, että X- muuttujien yhteisjakauma melko väljin ehdoin lähestyy multinormaalijakaumaa. Samoin tarkasteltaessa osaa X-muuttujista, näiden ehdollinen yhteisjakauma, kun muut X-muuttujat asetetaan vakioiksi, on multinormaalinen ja regressiofunktiot (ehdolliset odotusarvot) ovat vakioksi asetettujen X-muuttujien lineaarisia funktioita. Tämä viimeinen ominaisuus on myös po. jakauman määritelmän veroinen. Multinormaalijakauman syntyessä riippumattomien muuttujien lineaaristen yhdistelmien kautta on ilmeistä, että X-muuttujien välillä voi vallita vain lineaarisia riippuvuuksia eli korrelaatiokertoimet paljastavat kaiken, mikä koskee muuttujien välisiä riippuvuuksia. Tässä tapauksessa siis korreloimattomuus takaa myös muuttujien riippumattomuuden; seikka, mikä ei välttämättä päde yleisesti moniulotteisissa jakaumissa. Tämän pohjalta tulee ilmeiseksi, että kaikki multinormaalisuutta edellyttävät tarkastelut saatetaan tehdä muuttujien odotusarvojen, keskihajontojen ja korrelaatiokertoimien avulla. Näiden tunnuslukujen tavanomaiset empiiriset vastineet satunnaisotoksesta laskettuina ovat tyhjentäviä otossuureita eikä esim. korkeamman asteen momentteja tarvita muuta kuin eräissä multinormaalisuutta tutkivissa testeissä.. Multinormaalijakauman määritelmä ja perusominaisuudet Tarkennamme äskeistä kuvausta seuraavasti. Olkoot U,U,...,U k riippumattomia ja (0,)-normaalisia satunnaismuuttujia ja U=(U,U,...,U k ) niiden muodostama satunnaisvektori. Tällöin odotusarvovektori E(U)=0 ja kovarianssimatriisi cov(u)=i.

. Multinormaalijakauma 7 Jokaisen U i tiheysfunktio on muotoa φ(u i ) = (π) -/ exp( /u i ). Tällöin U-muuttujien riippumattomuuden perusteella satunnaisvektorin U tiheysfunktio voidaan kirjoittaa näiden komponenttimuuttujien tiheysfunktioiden tulona f(u) = f(u,u,...,u k ) = φ(u )φ(u )...φ(u k ) = (π) -k/ exp(-/(u + u +... + u k )) = (π) -k/ exp(-/u u). Määritellään uusi muuttujavektori X=(X,X,...,X p ) lineaarikuvauksella eli X = c U + c U +... + c k U k + µ X = c U + c U +... + c k U k + µ... X p = c p U + c p U +... + c pk U k + µ p () X = CU + µ. Oletetaan, että p k ja matriisin C aste r(c)=p. Muussa tapauksessa muuttujat X olisivat lineaarisesti toisistaan riippuvia eikä jakauma olisi aidosti p-ulotteinen. Muuttujien X odotusarvovektori on E(X) = CE(U) + µ = C 0 + µ = µ ja kovarianssimatriisi Σ = cov(x) = E(X-µ)(X-µ) = E(CUU C ) = C(EUU )C = CC. Koska r(c)=p, on Σ=CC > 0 (eli positiivisesti definiitti). Määrätään nyt X-muuttujien yhteisjakauman tiheysfunktio. Todistetaan ensin apulause: Olkoot U,U,...,U k riippumattomia ja N(0,). Tällöin myös muuttujat V=(V,V,...,V k )=QU, ovat riippumattomia ja N(0,), jos matriisi Q on ortogonaalinen (eli Q Q=QQ =I). Koska kääntäen U=Q V ja f U (u) = c exp(-/u u), tulee muuttujien V tiheysfunktioksi (sijoittamalla tähän tiheysfunktioon u=q v ja kertomalla vastaavalla funktionaalideterminantilla, joka kuvausmatriisin Q ortogonaalisuudesta johtuen on )

8 Monimuuttujamenetelmät 3..994/S.Mustonen. f V (v) = c exp[- (Q v) (Q v)] = c exp(- v v) = f U (v). Osoitetaan nyt, että jos () pätee, on olemassa satunnaisvektori V=(V,V,...,V p ), jonka komponentit ovat riippumattomia ja (0,)-normaalisia siten, että X voidaan lausua myös niiden avulla muodossa () X = AV + µ, missä A on p p-matriisi ja det(a) 0. Tämä todistetaan lähtemällä p k-matriisin C singulaariarvohajotelmasta C = SDT, missä D on singulaariarvojen d d... d p > 0 (r(c)=p) muodostama lävistäjämatriisi ja S p p-ortogonaalinen sekä T k p-pystyriveittäin ortogonaalinen eli T T=I. Valitsemalla nyt V=T U ja A=SD saadaan haluttu esitys X = CU + µ = SDT U + µ = AV + µ. Tässä muuttujat V ovat apulauseen perusteella riippumattomia ja N(0,), sillä matriisi T on aina täydennettävissä k k-ortogonaaliseksi matriisiksi. Huomattakoon lisäksi, että Σ = cov(x) = AA = CC ja det(σ)=det(a). Koska matriisi A on säännöllinen, saadaan kääntäen V = A - (X-µ) ja f X (x) = f V (v(x)) (v,v,...,v p ) / (x,x,...,x p ) = (π) -p/ exp(- v v) det(a- ) = (π) -p/ det(σ) -/ exp[- (x-µ) (A- ) A - (x-µ)] = (π) -p/ det(σ) -/ exp[- (x-µ) Σ- (x-µ)]. Siis E(X) = µ ja cov(x) = Σ > 0 määräävät X-muuttujien yhteisjakauman yksikäsitteisesti. Sanomme, että X noudattaa p-ulotteista normaalijakaumaa l. multinormaalijakaumaa N(µ,Σ). Merkitään X N(µ,Σ), f X (x)=n(x µ,σ), jolloin esim. V N(0,I p ). Kovarianssimatriisin lävistäjällä ovat muuttujien varianssit σ,σ,...,σ pp. Näille käytetään myös merkintöjä σ ii =σ i, i=,,...,p, eli σ,σ,...,σ p tarkoittavat muuttujien keskihajontoja. Keskihajontojen muodostamaa lävistäjämatriisia merkitään D σ = diag(σ,σ,...,σ p ), jolloin muuttujien X korrelaatiomatriisi P, iso kreikkalainen ρ (rho), saadaan

. Multinormaalijakauma 9 kaavasta - - P = D σ ΣD σ. Multinormaalisen satunnaisvektorin X tiheysfunktiota hallitsee positiivisesti definiitti neliömuoto (x-µ) Σ - (x-µ). Tiheysfunktio on suurimmillaan, kun x=µ ja sen arvot vähenevät tästä pisteestä etäännyttäessä siten, että (hyper)- ellipsit eli hajontaellipsit (x-µ) Σ - (x-µ) = vakio toimivat tasa-arvokäyrinä. 0 0-0 -0 0 0 Kuvassa on sellaisen -ulotteisen normaalijakauman tasa-arvokäyriä, jossa muuttujien hajonnat ovat 5 ja 3 sekä korrelaatiokerroin 0.7. Käyrät vastaavat todennäköisyystasoja 0.,0.,...,0.9 eli todennäköisyysmassasta 90% on uloimman hajontaellipsin sisällä. Edelläkäyty tarkastelu osoittaa, että p-ulotteinen satunnaisvektori X voidaan aina määritellä p riippumattoman (0,)-normaalisen muuttujan avulla. Annetulla multinormaalisella X-vektorilla parametrit µ ja Σ ovat yksikäsitteiset, mutta V ja A voidaan ajatella valittavaksi useilla tavoilla. Olettaessamme, että satunnaisvektori X noudattaa multinormaalijakaumaa N(µ,Σ), emme siis voi tuntea tästä jakaumasta saatujen havaintojen täsmällistä syntytapaa, mutta kaikissa jakauman ominaisuuksia koskevissa tarkasteluissa on lupa käyttää konstruktiota (), kun vain A täyttää ehdon Σ=AA. Kun siis X N(µ,Σ), A-kuvaus voidaan saada esim. matriisin Σ Choleskyhajotelmasta Σ=AA, missä A on yläkolmiomatriisi tai spektraalihajotelmasta Σ=SΛS, missä S on ortogonaalinen ja Λ ominaisarvojen muodostama lävistäjämatriisi, jolloin A=SΛ /.

0 Monimuuttujamenetelmät 3..994/S.Mustonen. Edellä on oletettu matriisi A täysiasteiseksi, jolloin sillä ja kovarianssimatriisilla Σ on käänteismatriisi. Tällöin jakauma on aidosti p-ulotteinen ja sille voidaan kirjoittaa edellä todettu tiheysfunktion lauseke. Voimme jo johdannossa mainitulla tavalla vielä yksinkertaistaa määritelmää () matriisin A singulaariarvohajotelman A=SDT avulla. Tällöin X = AV + µ = SDT V + µ = SDW + µ eli (3) X = SDW + µ, missä W N(0,I) edellä olevan apulauseen nojalla, D on positiivisten singulaariarvojen d d... d p > 0 muodostama lävistäjämatriisi ja S p portogonaalinen matriisi. Kuten myöhemmin tulemme näkemään, muuttujat DW=(d W,...,d p W p ) ovat muuttujien X pääkomponentteja, joiden voimakkuuksia (itse asiassa keskihajontoja ja geometrisesti hajontaellipsoidien pääakseleiden pituuksia) vastaavat singulaariarvot. Esittämämme konstruktiivinen määritelmä antaisi mahdollisuuden käsitellä vaivatta myös vajaa-asteisia tapauksia, joissa osa singulaariarvoista on nollia, mutta jatkossa tarkastelemme lähes poikkeuksetta vain täysiulotteista multinormaalijakaumaa. Tutkiessamme multinormaalijakauman ominaisuuksia käytämme usein apuna konstruktiivisia määritelmiä (), () ja (3), jotka yleensä tekevät tarkastelut yksinkertaisemmiksi kuin jos perustaisimme ne multinormaalijakauman tiheysfunktion esitykseen. Useimmat oppikirjat lähtevät liikkeelle suoraan esim. tiheysfunktiosta tai karakteristisesta funktiosta, jolloin helposti kadotetaan jakauman luonnollinen tausta... Reunajakaumat Tulemme useasti tarkastelemaan p komponentin satunnaisvektoria X kahden osavektorin X () ja X () yhdistelmänä siten, että X () käsittää q (q<p) ensimmäistä muuttujaa X () =(X,X,...,X q ) ja X () loput p-q muuttujaa X () = (X q+,x q+,...,x p ). Mikä tahansa muuttujien osajoukko saadaan näiden tarkastelujen piiriin järjestämällä muuttujavektorin X komponentit sopivasti uudelleen. Ositettujen matriisien merkintätapoja noudattaen on siis X = X () X (),

. Multinormaalijakauma jolloin odotusarvovektorin µ ja kovarianssimatriisin Σ ositetut esitykset ovat µ () Σ Σ µ () Σ Σ µ = Σ =. Osoitamme nyt, että muuttujavektorin X () jakauma on N(µ (),Σ ). Tämä tapahtuu määritelmän () avulla eli kirjoittamalla X = AV + µ ositetussa muodossa X () A µ () X () A µ () X = = V +, jolloin X () = A V + µ (). Tällöin määritelmän () mukaan X () N(µ (), A A ) = N(µ (),Σ )... Muuttujien vaihto Konstruktiivisen määritelmän mukaan on mitä ilmeisintä, että multinormaalisuus säilyy muuttujien lineaarisissa kuvauksissa. Näytämme täsmällisemmin, että jos X N(µ,Σ) ja Y=BX, missä B on täysiasteinen m p-matriisi ( r(b)=m, m p ), niin Y N(Bµ,BΣB ). Tämän todistamiseksi käytämme määritelmää () eli X=AV+µ, jolloin Y = BX = BAV + Bµ eli Y syntyy määritelmän () mukaan (0,)-normaalisista V-muuttujista käyttäen kuvausmatriisia BA ja lisäystä Bµ. Siis Y N(Bµ,BAA B ) eli Y N(Bµ,BΣB ), sillä AA =Σ. Erityisesti havaitaan, että jokainen X-muuttujien lineaarinen kombinaatio noudattaa tavallista yksiulotteista normaalijakaumaa seuraavasti. Olkoon α=(α,α,...,α p ) p komponentin pystyvektori. Tällöin Y = α X + α X +... + α p X p = α X N(α µ, α Σα).

Monimuuttujamenetelmät 3..994/S.Mustonen...3 Ehdolliset jakaumat Ehdolliset jakaumat johdetaan tavallisesti operoimalla yhteisjakauman ja reunajakaumien tiheysfunktioiden avulla. Konstruktiivinen määritelmämme tarjoaa tässäkin periaatteessa yksinkertaisemman ja selvemmän tavan. Tarkastellaan osavektorin X () jakaumaa ehdolla X () =c (). Toimitaan määritelmän () X=AV+µ pohjalta ja valitaan A kovarianssimatriisin Σ Cholesky-hajotelmasta Σ=AA, jossa A on yläkolmiomatriisi. Osittamalla vektori V samalla tavalla kuin X saadaan X () 0 A V () µ () X () A A V () µ () X = = +, jolloin X () = A V () + µ () = c () eli V () - = A (c () µ () ) ja X () = A V () + A V () + µ () = A V () - + A A (c () - µ () ) + µ (). Määritelmän () perusteella toteamme, että X () ehdolla X () =c () noudattaa multinormaalijakaumaa N(µ () - + A A (c () µ () ), A A ). Kirjoittamalla yhtälö Σ=AA ositetussa muodossa Σ Σ A A A 0 Σ = = Σ Σ 0 A A A näytetään "helposti", että ja A A = Σ Σ Σ - - A A = Σ Σ. - Σ Näin ollen X () ehdolla X () =c () noudattaa multinormaalijakaumaa N(µ () - + Σ Σ (c () µ () - ), Σ Σ Σ Σ ). Matriisista - Σ Σ Σ Σ, jota sanotaan jäännös- tai osittaiskovarianssimatriisiksi, käytetään tavallisesti lyhennysmerkintää - Σ. = Σ Σ Σ Σ.

. Multinormaalijakauma 3 On huomionarvoista, että Σ. ei riipu lainkaan siitä, mille tasolle c () ehtomuuttujat X () on asetettu. Tällöin on oikeutettua sanoa, että Σ. kertoo kovarianssimatriisina muuttujien X () välisistä riippuvuuksista, kun muuttujien X () vaikutus on poistettu. Toinen merkittävä seikka on ehdollisten odotusarvojen eli regressiofunktioiden E(X () X () =c () ) = µ () - + Σ Σ (c () µ () ) rakenne. Ne riippuvat ehtomuuttujien arvoista c () vain lineaarisesti. Tämä on ominaisuus, joka on voimassa vain multinormaalijakaumassa. q q-osittaiskovarianssimatriisin Σ. alkioita merkitään σ ij. q+,...,p, i,j=,,...,q, jolloin ehdollisen jakauman korrelaatiokertoimet eli osittaiskorrelaatiokertoimet ovat ρ ij. q+,...,p = σ ij. q+,...,p / σ ii. q+,...,p σ jj. q+,...,p, i,j=,,...,q. Esim. Tarkastellaan tapausta p=, q= eli kaksiulotteista normaalijakaumaa ja ensimmäisen muuttujan X jakaumaa ehdolla, että toinen muuttuja X on vakio x. Tällöin µ () =µ, µ () =µ, Σ =σ, Σ =σ σ ρ, Σ =σ, missä ρ on muuttujien välinen korrelaatiokerroin. Edelleen - Σ. = σ σ σ ρσ σ σ ρ = σ (-ρ ) eli kyseinen jakauma on N(µ +σ ρ/σ (x µ ), σ ( ρ )). Esim. : "Kopiointiprosessi" Mitataan tietyn kappaleen pituus X ja yritetään tehdä siitä kopio, mutta kopioinnissa syntyy satunnaisvirhettä niin, että kopion pituudeksi tulee X. Jatketaan kopioimalla kopio, jolloin saadaan kappale, jonka pituus on X 3, ja toistetaan kopioiden kopioimista niin, että saadaan kaiken kaikkiaan mittaustulokset X=(X,X,...,X p ). Oletetaan, että X noudattaa multinormaalijakaumaa ja että peräkkäisten "sukupolvien" X i ja X i+ välinen korrelaatiokerroin on vakio ρ kaikilla arvoilla i=,,...,p-. Kopioinnin luonteen perusteella oletetaan lisäksi, että kaikki tieto pituudesta "sukupolvien" i ja i+ välillä kulkee sukupolven i+ kautta. Siis vaaditaan, että ρ i,i+. i+ =0 kaikilla i=,,...,p-. Katsotaan, mitä tästä voi päätellä yleensä korrelaatiomatriisin rakenteen suhteen. Koska korrelaatiokertoimet ja osittaiskorrelaatiokertoimet säilyvät muuttujien erillisissä, positiiviskertoimisisissa lineaarisissa muunnoksissa, riittää yksinkertaisuuden vuoksi tarkastella tilannetta, jossa muuttujien keskihajonnat ovat eli Σ=P.

4 Monimuuttujamenetelmät 3..994/S.Mustonen. Rajoitutaan tapaukseen p=3, jolloin korrelaatiomatriisi Ρ on muotoa 3 3 ρ x Ρ = ρ ρ x ρ 3 x ρ Ρ * = x ρ ρ ρ 3 x ρ x-ρ -ρ Tässä x:llä on merkitty tuntematonta korrelaatiokerrointa ρ 3 =ρ 3 ja osittaiskovarianssin σ 3. laskemisen helpottamiseksi on vaihdettu muuttujien X ja X 3 paikat, jolloin saadaan yllä toisena oleva korrelaatiomatriisi Ρ *. Kun siis muuttujan X vaikutus poistetaan, saadaan osittaiskovarianssimatriisiksi muuttujien X ja X 3 välillä - x ρ ρ ρ -ρ x-ρ =, jolloin vaatimuksesta σ 3. =x-ρ =0 seuraa x=ρ. Harjoitustehtäväksi jää osoittaa, että yleisesti ρ ij =ρ i-j, i,j=,,...,p. Harjoitustehtäväksi jätetään myös selvittää, miten matriisi A tulisi valita, jotta määritelmä () X=AV+µ antaa muuttujavektorille X juuri edellä esitetyn korrelaatiorakenteen...4 Muuttujaryhmien riippumattomuus Muuttujaryhmät X () ja X () ovat toisistaan riippumattomia vain jos niiden syntyyn vaikuttavat eri V-muuttujat konstruktiivisessa määritelmässä () X=AV+µ. On siis voimassa esim. X () = A V () + µ (), X () = A V () + µ () eli A =0 ja A =0. Tällöin Σ Σ A 0 A 0 A A 0 Σ = = = Σ Σ 0 A 0 A 0 A A eli Σ =0 (samoin kuin Σ =0) ja muuttujaryhmien väliset korrelaatiokertoimet ovat nollia. Kääntäen, jos Σ =0, X () ehdolla X () =c () on N(µ (),Σ ), mikä on X () :n reunajakauma. Muuttujaryhmät ovat tällöin siis myös riippumatttomia. On huomattava, että korreloimattomuudesta ei yleisesti seuraa riippumattomuutta. Tämä ominaisuus koskee vain multinormaalijakaumaa, jossa korreloi-