12.11.1999 INTERVALLIPÄÄTÖSPUUT JANNE GUSTAFSSON 45433E Mat-2.142 Optimointiopin seminaari Referaatti Syksy 1999
1. JOHDANTO Thomas M. Stratin artikkeli Decision Analysis Using Belief Functions käsittelee päätösanalyysia Shaferin uskomusfunktioteorian valossa. Uskomusfunktioesityksellä voidaan mallintaa esimerkiksi epätietoisuutta päätöstilanteen todellisesta luonteesta. Uskomusfunktioteoria tuottaa intervalleja tapahtumien todennäköisyyksille ja odotusarvoille, joten päätösongelmassa saattaa käydä niin, että usean vaihtoehdon hyötyintervallit muodostuvat osittain päällekkäisiksi. Tällöin muodostuu ongelmaksi, mikä vaihtoehdoista tulisi valita. Strat pyrkiikin artikkelissaan kehittämään yksinkertaisen menetelmän, jolla tämä pulma ratkaistaisiin. Stratin menetelmässä hyötyintervalli redusoidaan yhdeksi luvuksi, jonka perusteella ratkaisu on sitten helppo tehdä. Lopputuloksena tällöin päädytään kuitenkin käytännössä perinteiseen hyötyteoriaan, mutta jo pelkkä intervallien tarkastelu ennen päätöskriteerin määräämistä saattaa antaa lisäymmärrystä päätöksentekijälle. Shaferin teorian sovellus päätösteoriaan vaikuttaa varsin mielenkiintoiselta, vaikka teoria redustoituukin todennäköisyyslaskuun, kun satunnaismuuttujan otosavaruuden osajoukkojen sisäiset todennäköisyydet määrätään. Selkeästä esityksestä huolimatta artikkelin notaatiossa on kuitenkin paljon parantamisen varaa. Esitelmöitsijä onkin joutunut korjaamaan Stratin käyttämää notaatiota useista paikoista johdonmukaisemmaksi. 2. TODENNÄKÖISYYSJAKAUMASTA USKOMUSFUNKTIOHIN Intervallipäätöspuut perustuvat todennäköisyysjakaumien korvaamiseen Shaferin uskomusfunktioilla. Tällöin maailmantilojen hyödyille ja todennäköisyksille muodostuu intervalleja yksittäisten arvojen sijasta. Stratin artikkeilin ydin perustuukin uskomusfunktioiden käyttöön päätöspuun sattumasolmuissa. Uskomusfunktioteoriassa määritellään massafunktio m, joka on käytännössä todennäköisyysjakauman laajennus. Kun todennäköisyysjakauma voi antaa todennäköisyyden ainoastaan satunnaismuuttujan otosavaruuden yksittäisille alkioille, voidaan massafunktiolla jakaa uskomusmassaa otosavaruuden alkioden lisäksi myös otosavaruuden (muille) osajoukoille. Usean alkion
käsittävien osajoukkojen saama uskomusmassa tulkitaan siten, että satunnaismuuttuja voi ko. todennäköisyydellä saada arvokseen jonkin joukon alkiosta (kuitenkaan erittelemättä tarkemmin). Massafunktio on edellä kuvatun mukaisesti kuvaus otosavaruuden Θ kaikkien osajoukkojen joukolta 2 Θ reaaliakselille. Samoin kuin todennäköisyysjakauman antamien todennäköisyyksien summa tulee olla 1, tulee myös massafunktion osajoukoille antamien uskomusmassojen vastaavasti summatua yhteen. Kun tavallisessa todennäköisyyslaskussa voidaan laskea satunnaismuuttujan todennäköisyysjakaumasta satunnaismuuttujan odotusarvo, saadaan Shaferin uskomusfunktioteoriassa odotusarvointervalli. Shaferin teorian mukainen odotusarvointervalli saadaan laskemalla uskomusmassoin painotettu summa otosavaruuden osajoukoista. Odotusarvointervallin alarajalla kutakin osajoukkoa edustaa joukon pienin alkio ja ylärajalla suurin alkio. Odotusarvointervallin laskeminen edellyttää tietysti, että summausoperaattorin lisäksi myös vertailuoperaattori on otosavaruudessa määritelty. [ E ( x), E ( )] EVI( x) = x, missä (1) x) = A i Θ E ( inf( A ) m ( ) ja (2) i Θ A i E x) = sup( Ai ) mθ ( A i ) Θ (. (3) A i Uskomusfunktioteoriasta saadaan myös intervallit otosavaruuden tapahtumien todennäköisyyksille, so. uskomusintervallit. Tapahtuman A uskomusintervalli voidaan laskea kaavasta BI ( A) = mθ ( Ai ),1 mθ ( Ai ). (4) Ai A Ai A 3. ODOTUSARVO USKOMUSFUNKTIOILLA Koska Shaferin teorian käyttöä päätöspuissa on ilmeisesti käsitelty kirjallisuudessa jo ennen tätäkin, löytyy artikkelin varsinainen suola kappaleesta, jossa esitellään, kuinka odotusarvointervallit saadaan redusoitua yhdeksi luvuksi, odotusarvoksi (jota voidaan sitten käyttää päätöskriteerinä). Tämän
avulla päätösteorian mukaiset päätökset on sitten suoraviivaista tehdä. Strat esittelee kaksi kirjallisuudessa esiintynyttä ja yhden oman tapansa laskea odotusarvo. Ensimmäinen, maksimientropia, olettaa, että jokaisen osajoukon alkiot ovat yhtä todennäköisiä. Toisessa tavassa osajoukkojen sisäinen todennäköisyysjakauma päätellään tehtävänasettelusta. Kolmas on Stratin esittämä tapa, jossa otetaan käyttöön parametri ρ, joka kuvaa todennäköisyyttä, että satunnaismuuttujan realisaatio on joukon alkioista paras mahdollinen. Vastaavasti todennäköisyydellä 1-ρ realisaatio on huonoin joukon alkioista. Esitelmöitsijä on antanut parametrille nimen edullisuustodennäköisyys. Edullisuustodennäköisyyden etuna on se, että sen antama odotusarvo voidaan laskea suoraan odotusarvointervallista (katso kaava (5)). Ongelmana menetelmässä on kuitenkin parametrin ρ määrääminen, mihin ei ole yksikäsitteistä tapaa. E( x ρ ) = ρe ( x) + (1 ρ) E ( x) = E ( x) + ρ[ E ( x) E ( x)] (5) Voidaan todeta, että edullisuustodennäköisyyden valitseminen sopivasti tuottaa monenlaisia, jo entuudestaan tunnettuja päätössääntöjä. Kun ρ on 0, valitaan aina vaihtoehto, jonka odotusarvointervallin alaraja on suurin (Waldin maximinkriteeri). Kun ρ on 1, saadaan puolestaan maximax-päätössääntö, ja ρ:n ollessa 0.5 kyseessä on central values-päätössääntö. Lopuksi kannattaa huomata, että kaikki odotusarvon määräävät tavat käytännössä määrittävät kaikkien osajoukkojen sisäiset todennäköisyydet. Kun lisäksi tiedetään osajoukkojen todennäköisyydet, voidaan otosavaruuden kunkin alkion todennäköisyys laskea eksplisiittisesti ja uskomusfunktioesitys palautuu tavalliseen todennäköisyyslaskuun. Tästä voidaan puolestaan laskea helposti odotusarvo, jota voidaan käyttää päätöskriteerinä hyötyteoriassa. 4. PÄÄTÖSPUISTA INTERVALLIPÄÄTÖSPUIHIN Päätöspuiden laajentaminen intervallipäätöspuiksi on suoraviivaista, kun Shaferin uskomusfunktioteoria tunnetaan. Intervallipäätöspuissa sattumasolmujen todennäköisyysjakaumat korvataan uskomusfunktioteorian massafunktioilla. Tällöin sattumasolmusta lähteville haaroille tulee
todennäköisyysintervallit ja siten myös sattumasolmun odotetulle tuotolle kaavan (1) mukaisesti. Päätössolmun hyöty on puolestaan valitun haaran hyötyintervalli. Ongelmaksi muodostuu kuitenkin päätöksen tekeminen pelkän intervallin perusteella (etenkin, jos on päällekkäisiä intervalleja), joten Stratin esittämän tai jonkin muun päätössäännön käyttöönotto on välttämätöntä. Strat on kuitenkin intervallipäätöspuissaan päätynyt kummalliseen ratkaisuun, sillä hän esittelee lehtisolmuissa mahdolliset maailmantilojen disjunktiot, jotka vastaavat uskomusfunktioesityksen usean alkion käsittäviä osajoukoja. Sattumasolmu voi siis saada realisaatiokseen maailmantilojen disjunktion, jolloin päädytään lehtisolmuun, jossa on maailmantilojen hyödyistä määräytyvä hyötyintervalli. Mielestäni tämä on täysin turhanpäiväinen lisäys ja jopa Shaferin teorian vastainen. Teoriassahan määritellään, että satunnaismuuttuja voi saada arvokseen jonkin osajoukon alkioista, ei koko joukkoa! Maailmantilat tulisikin pitää erillään omissa lehtisolmuissaan, jolloin myös päätöspuun tulkinta helpottuisi huomattavasti. Lukija voi tarkistaa, että kaikki Stratin esittelemät esimerkit voidaan kuvata intervallipäätöspuina, joissa ei käytetä lainkaan maailmantilojen disjunktioita vaan ainostaan Shaferin uskomusfunktioteoriaa. Tätä käsittelee myös annettu kotitehtävä. 5. POHDINTOJA JA YHTEENVETO Pitkällisen pohdinnan jälkeen totesin, että intervallipäätöspuut voivat olla hyvinkin käyttökelpoinen väline epätarkkojen (epätietoisuutta sisältävien) päätöstilanteiden kuvaamiseen. Tämä vaatii kuitenkin pitäytymistä pelkissä Shaferin uskomusfunktioissa, eikä maailmantilojen disjunktioihin kannata turvautua. Disjunktioiden käyttöönotto itse asiassa saattaa tehdä päätösongelmasta sellaisen, ettei sitä voida edes kuvata päätöspuulla. Intervallipäätöspuihin liittyy monia etuja ja haittoja. Ongelmapuolella on lähinnä päätösongelman mallin ja vastaavan matematiikan monimutkaistuminen. Lisäksi joskus joudutaan tekemään joitain oletuksia ongelman luonteesta (kuten onnenpyörän peitetyn sektorin tuotoista), vaikka tähän ei olisi riittävästi perusteita. Usein kuitenkin tällaiset rajoitusehdot ongelmalle ovat välttämättömiä eikä niitä voida muillakaan menetelmillä kiertää. Päätössäännönkään valinta ei ole myöskään yksiselitteinen, mutta vastaavanlaisiin päätössääntöihin joudutaan
turvautumaan muissakin intervalleja käsittelevissä menetelmissä. Intervallipäätöspuiden etuihin lukeutuu se, että ne ottavat huomioon päätöstilanteen, johon sisältyy epätietoisuutta (esimerkiksi jostain todennäköisyysjakaumasta). Tällöin saadaan annetuin reunaehdoin helposti laskettua hyödyn odotusarvolle muodostuva intervalli. Shaferin teoria soveltuu myös yksittäisten tapahtumien todennäköisyyden arvioinnin jakamiseen osiin. Jos tapahtuma on mukana useassa otosavaruuden osajoukossa, saadaan todennäköisyysestimaattia tarkennettua yrittämällä määrätä osajoukkojen sisäiset todennäköisyydet.