Mat-.4 Optimointiopin seminaari, syksy 999 Referaatti 7.0.999 Gaussinen vaikutuskaavio Tommi Gustafsson 45434f Tfy IV
JOHDATO Ross D. Shachter a C. Robert Kenley (989) esittelevät artikkelissaan Gaussian Influence Diagrams vaikutuskaavion sovelluksen, ossa okaisessa solmussa oleva muuttua on atkuva a normaaliakautunut. Jokaisen muuttuan odotusarvo a varianssi riippuu sen edeltäien odotusarvoista a variansseista. Tällaista vaikutuskaaviota he kutsuvat gaussiseksi vaikutuskaavioksi. GAUSSIE VAIKUTUSKAAVIO Jotta vaikutuskaaviota voitaisiin kuvata matemaattisesti, sen solmut tulee indeksoida (indeksioukoksi ), olloin solmuihin voidaan viitata niiden indeksillä. Käytäntönä on ollut numeroida solmut siten, että okaisen solmun edeltäillä on pienemmät indeksit kuin itse solmulla, olloin algoritmien kiroittaminen vaikutuskaavion muunnoksille helpottuu. Tapana on myös ollut merkitä solmua pienellä kiraimella (esim. ) a solmuoukkoa isolla kiraimella (esim. J). C():llä merkitään solmun edeltäien (indeksi)oukkoa a S():llä solmun (suorien) seuraaien oukkoa. Solmuun liittyvää muuttuaa merkitään, a solmuoukkoon J liittyviä muuttuia vastaa vektori J. Kaikki gaussisen vaikutuskaavion muuttuat ovat normaaliakautuneita, a niitä karakterisoivat kullekin muuttualle ominainen ehdollinen odotusarvo µ i a ehdollinen varianssi v i (ossa i on solmun indeksi). Solmuen muuttuat riippuvat edeltäistään, mitä kuvataan solmuun tulevilla kaarilla. Jokaiseen kaareen liittyy lineaarinen termi b i (i:stä :hin), oka kuvaa riippuvuussuhteen voimakkuutta. Gaussinen vaikutuskaavio voidaan kiroittaa kokonaisuudessaan seuraavina regressioyhtälöinä: = µ + [ bk ( k µ k )] + v Z, =,..., n k C ( ) missä n on solmuen lukumäärä a Z,, Z ovat (0,)-normaaliakautuneita riippumattomia satunnaismuuttuia. Lineaarinen termi b i kertoo, kuinka palon :n odotusarvo muuttuu, kun i :n poikkeaa odotusarvostaan. Tästä seuraava tärkeä ilmiö gaussisessa vaikutuskaaviossa on muuttuan odotusarvon muutoksen leviäminen. Kun muuttuan i odotusarvo muuttuu, leviää muutos okaista solmusta i lähtevää (suunnattua)
b (µ, v ) (µ, v ) µ ' = E[ = E[ µ = µ + b + b ] = E[ E[ ( µ ( ' µ µ )] )] ]] Kuva. Solmun muuttuan odotusarvon muutos arvosta µ arvoon µ leviää solmuun. polkua pitkin. Kuvassa on havainnolistettu tämä kahden solmun vaikutuskaaviossa. Haittaparametriksi sanotaan muuttuaa, olla ei ole merkitystä päätöksentekiälle. () Gaussisesta vaikutuskaaviosta voidaan poistaa sellaiset solmut, oissa on haittaparametri a oilla ei ole yhtään seuraaaa. () Kahden sattumasolmun välinen kaari voidaan kääntää, olloin vaikutuskaavion solmuen odotusarvot a varianssit sekä lineaariset termit muuttuvat. (3) Mikä tahansa sattumasolmu voidaan poistaa, os kaaret sen seuraaiin käännetään, minkä älkeen se voidaan poistaa ():n perusteella. 3 ELIÖLLIE ARVOFUKTIO Gaussiseen vaikutuskaavioon voi liittyä yksi hyötysolmu, ota merkitään indeksillä 0. Hyötysolmu ei varsinaisesti kuulu vaikutuskaavioon (0 ). Hyötysolmun muuttua 0 on päätöksen tekiän kriteeri vaikutuskaavion hyödystä. Se riippuu kaikista vaikutuskaavion muuttuista, eli kaikista solmuista on kaari hyötysolmuun. Arvofunktio V( ) on 0 :n ehdollinen odotusarvo kaikkien vaikutuskaavion solmuen suhteen eli V ( + T T ) = E[ 0 ] = Q + p r, missä Q on symmetrinen. Arvofunktiota päivitetään aina, kun vaikutuskaavosta poistetaan solmu. Päivitys tapahtuu Schahterin a Kenleyn ohtamalla lauseella, ota tässä ei kuitenkaan käsitellä. Kun vaikutuskaaviosta on redusoitu kaikki solmut pois, vaikutuskaavion hyöty (arvofunktion arvo V( )) saadaan vakion r arvona.
4 PÄÄTÖSSOLMUT Gaussisen vaikutuskaavion päätössolmussa on muuttua, onka odotusarvon suuruutta päätöksentekiä kontrolloi. Päätössolmuen varianssi on yleensä nolla, vaikkakin olisi mahdollista tarkastella päätöksiä, oissa on epävarmuutta. Kuten tavallisissakin vaikutuskaaviossa päätössolmuihin osoittavat kaaret kertovat, minkä muuttuien realisaatiot päätöksentekiä tietää päätöshetkellä. Päätösmuuttuille tarvitaan referenssiarvot, oiden avulla muiden muuttuien parametrit voidaan arvioida. Vaikutuskaaviota ratkaistaessa päätössolmu voidaan korvata sattumasolmulla, onka muuttuan odotusarvoksi tulee optimaalinen päätös a varianssiksi 0. Optimaalinen päätös voidaan selvittää melko yksinkertaisesti soveltamalla tähän tarkoitukseen ohdettua lausetta. Tässä referaatissa sitä ei kuitenkaan käsitellä tarkemmin. 5 VAIKUTUSKAAVIO RAKETAMIE Kuvassa on konsultin ongelman gaussinen vaikutuskaavio. Se kuvaa tilannetta, ossa konsultti haluaa vuokrata omistamaansa tietokonetta silloin, kun hän ei itse käytä sitä. (00, 0) ( 500, 40 000) (58 000, 4 000 000) -5 ( 500, 50 000) Konsultointihinthinta Konsultointi- Konsul- Konsultointitunnitunnitointi- -3 4 (3 500, 00) Konsul- Konsultointikulukulutointi- 33 Konsul- Konsultointiarviarvitointi- 44 0.05 Vapaat Vapaat tunnit tunnit 55 -.5 Tuotto Tuotto 00 Tietokoneaan Tietokoneaan vuokraushinta vuokraushinta 66 Vuokraustunnitunnikulukulut Vuokraus- Vuokraus- -0.5 Vuokraus- 77 88 (5, 0) (750, 0 000) (5 000, 40 000) Kuva. Konsultin ongelman gaussinen vaikutuskaavio. Solmun vieressä olevat numerot ovat solmun muuttuan keskiarvo a varianssi, tässä ärestyksessä.
Vaikutuskaaviota rakennettaessa mietitään ensiksi, mitä muuttuia on olemassa a mitkä ovat niiden väliset suhteet, eli muodostetaan vaikutuskaavio, ossa ei ole numeroarvoa. Sen älkeen okaiselle muuttualle asetetaan indeksiärestyksessä okin referenssiarvo a arvioidaan, mitä tällöin sen seuraaat saavat arvokseen. Esimerkiksi konsultin ongelmassa konsultti on asettanut konsultointihinnan referenssiarvoksi 00, olla hän arvelee saavansa odotusarvoisesti 500 konsultointituntia. Konsultointituntien määrä ei ole vakio vaan normaaliakautunut muuttua, olla on varianssi 40000. Yhden dollarin konsultointihinnan noston konsultti on arvioinut alentavan konsultointituntien odotusarvoa viidellä. Samoin konsultti on arvioinut, että mikäli konsultointituntea on enemmän kuin niiden odotusarvo 500, niin okaista tuntia kohden konsultointikulut nousevat $4:llä, konsultointiarviota kasvatetaan yhdellä a vapaat tunnit vähenevät kolmella. Jos konsultointituntea on alle 500, on muutos konsultointituntisolmun seuraaissa päinvastainen. Konsultin ongelman arvofunktio on konsultointihinta*konsultointitunnit + tietokoneen vuokrausaika*vuokraustunnit konsultointikulut vuokrauskulut eli V( ) = * + 6 * 7 3 8, oka on neliöllistä muotoa. 6 POHDITOJA Gaussinen vaikutuskaavio eroaa tavallisesta vaikutuskaaviosta monella eri tavalla. Täydellisestä gaussisesta vaikutuskaaviosta ilmenee selkeästi solmuen välisien suhteiden painot a muuttuien tunnusluvut. Tällaista esitysmuotoa ei tavallisessa vaikutuskaaviossa ole. Gaussisessa vaikutuskaaviossa muuttuat ovat atkuvia, kun taas tavallisessa vaikutuskaavion ne ovat diskreetteä. Jatkuvilla muuttuilla ei ouduta raoittumaan tarkastelemaan yksinkertaisia skenaarioita. Kuitenkin gaussisessa vaikutuskaaviossa kaikkien muuttuien on oltava normaaliakautuneita, mitä todellisuuden ilmiöt eivät välttämättä ole. Lisäksi mikäli mallinnettavassa ilmiössä on selvästi diskreetteä muuttuia (esim. syttyykö sota), on gaussisen vaikutuskaavion soveltaminen vaikeaa. ämä tosiasiat raoittavat huomattavasti gaussisen vaikutuskaavion käyttöä. Vaikka kaikki mallinnettavat muuttuat olisivatkin normaaliakautuneita, ongelmaksi tulee odotusarvoen, varianssien a lineaaristen termien arviointi. Jos
oitain näistä termeistä ei osata arvioida luotettavasti, ei vaikutuskaavionkaan tuloksiin voida luottaa. Mallin lineaarisuus sattaa puolestaan ohtaa siihen, että onkun luonnostaan ei-negatiivisen muuttuan odotusarvo voi pudota alle nollan, kun sen edeltäien odotusarvot muuttuvat. Lisäksi normaaliakauman ominaisuuksiin kuuluu, että se saa arvoa koko reaaliakselilta, oten negatiivisten tai kohtuuttoman suurten arvoen saaminen on mahdollista vaikkakin hyvin epätodennäköistä. Arvofunktio oli määritelty muuttuan 0 ehdollisena odotusarvona. Arvofunktiota tarkastellessa ei siis mallin variansseilla ole mitään merkitystä, mikä voi olla harhaanohtavaa. Toisaalta voitaisiin tarkastella (esim. Monte Carlo simuloinneilla), miten kriteerin arvo 0 käyttäytyy optimipäätöksillä, a tehdä siitä lisää ohtopäätöksiä. Varianssien tarkasteluun a arviointiin Schahter a Kenley eivät kuitenkaan artikkelissaan puuttuneet. LÄHDELUETTELO Ross D. Schahter, C. Robert Kenley (989). Gaussian Influence Diagrams, Management Science, Vol 35, o.5, May 989.