Nyt voitaisiin kirjoittaa instance Functor Set where type Inv Set e = (Ord e) fmap = map jossa metodin tyyppi onkin nyt fmap :: (Ord a,ord b) => (a -> b) -> Set a -> Set b joka onkin nyt samaa tyyppiä kuin kirjastofunktio Data.Set.map. Nykyinen laajennus tulee käyttöön määrittelyillä {-# LANGUAGE ConstraintKinds,... #-}... import GHC.Exts(Constraint) joilla otetaan käyttöön 1 ensimmäiseksi kielilaajennus 2 toiseksi uusi laji. 6 Algebralliset tietotyypit Haskellin datan kaltaisia tietotyyppeja, joiden arvoja kootaan konstruktoreilla tutkitaan hahmonsovituksella kutsutaan algebrallisiksi tietotyypeiksi (Algebraic Data Type, ADT). Tämän nimityksen takana on idea, että sellaisen tyypin τ arvojen joukko A τ on matemaattisesti yksi englanniksi: finitely generated free algebra suomennos: äärellisesti tuotettu vapaa algebra. Matematiikassa yksi algebra tarkoittaa sellaista rakennetta, jossa on joukko ja laskutoimituksia sen alkioilla, eli funktioita joiden parametrit ja tulos kuuluvat tähän joukkoon. Esimerkiksi sanomme että luonnolliset luvut N sekä niiden yhteenlasku + ja kertolasku muodostavat sellaisen algebran, jossa pätee.... Yleisinimi algebra tarkoittaa sitä matematiikan haraa, joka tutkii tällaisia rakenteita ja mitä niissä pätee. ADT-ideassa joukkona on A τ ja sen laskutoimituksina ovat tyypin τ konstruktorit, koska ne 99
saavat parametreinaan toisia joukon A τ alkioita (kun tarkastellaan vain niitä parametreja, joiden tyyppi on sama τ) tuottavat niistä arvonaan joukon A τ uuden alkion. Joukko voidaan tuottaa äärellisesti jos on olemassa äärellinen kokoelma funktioita, joita käyttämällä saadaan kaikki sen alkiot. Vakiot ovat parametrittomia funktioita. Esimerkiksi luonnolliset luvut N voidaan tuottaa äärellisesti vakiosta Z eli nolla funktiolla S(n) eli lukua n seuraava luku. eli 0 = Z, 1 = S(Z), 2 = S(S(Z)), 3 = S(S(S(Z))),... Siis äärettömänkin joukon voi tuottaa äärellisesti. ADT-ideassa data-määritelmä on tämä äärellinen kokoelma konstruktoreita. Ahkerassa kielessä olisi A τ = A pienin τ jonka voi tuottaa äärellisesti tähän tapaan. Haskellin laiskuuden vuoksi sen joukkona onkin A suurin τ jota ei voikaan tarkkaan ottaen tuottaa äärellisesti tähän tapaan koska siellä ovat myös äärettömät alkiot. Tarkkaan ottaen Haskellissa pitäisikin siis puhua koalgebroista ja sellaisista tietotyypeistä. Algebra on vapaa jos sen joukon alkioiden välillä on vain pakolliset yhtälöt, mutta ei mitään muita yhtälöitä. Jos f on n-parametrinen funktio algebrassa, niin jos a 1 = b 1 ja a 2 = b 2 ja a 3 = b 3 ja... ja a n = b n niin myös f a 1 a 2 a 3... a n = f b 1 b 2 b 3... b n (12) on tällainen pakollinen yhtälö muutenhan f ei olisikaan funktio. Vapaassa algebrassa on vain nämä yhtälöt (12). Silloin tällainen implikaatio (12) vahventuu ekvivalenssiksi jos ja vain jos. Esimerkiksi luonnollisten lukujen N ja niiden yhteenlaskun + muodostama algebra ei ole vapaa, koska siellä on myös muitakin yhtälöitä kuten vaihdannaisuus a + b = b + a. Vapaita algebroja käytetään teoreettisen tietojenkäsittelyn monilla eri osa-alueilla, koska ne ovat puhtaan syntaktisia ilman muiden yhtälöiden lisäämää semantiikkaa. ADT-ideassa algebra ajatellaan vapaa: Kun yhtälössä (12) funktio f onkin konstruktori, niin se sanoo että jos kentät ovat yhtäsuuret niin myös konstruoidut arvot ovat yhtäsuuret. Viittausten läpikuultavuus takaa sen Haskellissa. 100
Ilman viittausten läpikuultavuutta pitää erotella yhtäsuuruus vs. samuus esimerkiksi Javan equals vs. ==. Implikaatio (12) vahventuu ekvivalenssiksi, koska jos jonkin kentän arvot a i b i niin ohjelmoija yllättyisi jos konstruoidut arvot olisivatkin silti yhtäsuuret. (Sillon yhtäsuuruus ei ottaisikaan huomioon kaikkia kenttiä. Haskell-ohjelmoija voi määritellä tällaisen Eq-jäsenyyden käsin, mutta se on varsin epätavallista.) Tästä algebrallisesta näkökulmasta hahmonsovitus on yhtälön case lauseke of Hahmo -> haara ratkaisemista tässä vapaassa algebrassa. Se on selvästi täyttä yhtälönratkaisua helpompaa: lauseke = Hahmo (13) Vain Hahmossa esiintyy muuttujia joille pitää löytää arvot, lauseke on muuttujaton. Siksi tätä kutsutaankin sovitukseksi. Algebran vapauden vuoksi ainoa ratkaisukriteeri on syntaktinen samuus: Yhtälö (13) pätee jos ja vain jos kumpikin puoli alkaa samalla konstruktorilla ja niiden kentätkin sovittuvat pareittain toisiinsa. Kukin näistä muuttujista esiintyy Hahmossa vain kerran, joten muuttujan arvoksi ei koskaan ole kahta kilpailevaa vaihtoehtoa. lauseketta sievennetään kohti arvoaan vain sen verran kuin tämän yhtälön (13) ratkaisu vaatii. 6.1 Haamutyypit datan tyyppiparametria kutsutaan haamutyypiksi (phantom type) jos sitä ei tarvitakaan määriteltävän tyypin arvoissa. Tavallisin haamutyyppi esiintyy datassa yhtäsuuruusmerkin = vasemmalla puolella mutta ei sen oikealla puolella. Myös kuvan 3 Braun-puun tyyppiparametri t on haamutyyppi, koska sen arvojen rakenne ei riipu siitä, mikä tyyppi t on: Täsmälleen samat arvot olisi saatu määrittelyllä data Braun u = Braun { value :: u, zero :: Braun u, one :: Braun u } ilman tätä haamutyyppiparametria t. Tämä haamutyyppiparametri t muistaa sen Integral- eli kokonaislukutyypin, jolla growbraun puun loi...... jotta lookbraun osaa palauttaa myöhemmin samantyyppisen (eikä pelkästään -sisältöisen) funktion. 101
Määrittely Braun unohtaisi tämän tyypin, jolloin olisi mahdollista vaikkapa 1 ensin luoda growbraunilla puu tyyppiä Braun Bool funktiolle joka on tyyppiä Integral -> Bool 2 sitten lukea lookbraunilla siitä funktio, jonka tyyppi onkin Int -> Bool koska itse puussa ei ole mitään informaatiota siitä, oliko tyyppi luotaessa Integer vai Int (vai Word vai...). Näin haamutyyppiparametrilla voi esittää sellaista tyyppi-informaatiota, jota ei voi päätellä tyypin arvoista, ja joka siis kertoo jotakin muuta ja abstraktimpaa kuin kyseinen tietorakenne. ghc sallii jopa tyhjät data-määrittelyt. Niissä on vain yhtäsuuruusmerkin = vasen puoli, mutta ei lainkaan oikeata puolta. Koska tällaisessa määritelmässä ei ole lainkaan konstruktoreita, ei näin määritellyillä tyypeillä ole yhtään arvoa (paitsi ). Tällainen tyyppi tai tyyppikonstruktori onkin tarkoitettu käytettäväksi vain haamutyyppiparametrin arvona. 6.2 Eksistentiaaliset tyypit Haamutyyppiparametri on sellainen tyyppiparametri, joka esiintyy data-määritelmässä yhtäsuuruusmerkin = vasemmalla puolella, vaikka sitä ei tarvitakaan sen oikealla puolella. Sillä voi lisätä tyyppiin sellaista informaatiota, joka ei käy ilmi tyypin arvoista. Vastaavasti ghc-kielilaajennus ExistentialQuantification sallii uuden tyyppiparametrin käyttämisen vain sen oikealla puolella, kunhan se forall-esitellään sitä käyttävän konstruktorin alussa. Vastaavasti sillä voi poistaa tyypistä informaatiota, ja luoda arvoihin kenttiä joiden tyyppi on tuntematon, mutta se voi yhä olla tässä ja nyt -monimuotoinen. Siten data T a = forall b. (R b) => K a b... määrittelee tyypille T sellaisen konstruktorin K jonka tyyppi on K :: forall b. (R b) => a -> b -> T a jonka jälkimmäisen kentän tyyppi b on jokin tyyppiluokan R jäsenistä mutta tulostyyppi T a ei ilmaisekaan mikä niistä. Kun tämän konstruktorin K tuottama arvo sopii hahmoon K x y niin sen jälkimmäisen kentän sisältö y on tätä tuntematonta tyyppiä b, josta tiedetään vain sen rajoite R b. 102
Haskellin tyyppiturvallisuuden vuoksi tätä sisältöä y voi käsitellä vain sen rajoitteen R lupaamilla metodeilla koska sen todellisesta tyypistä b ei tiedetä enää mitään muuta. Esimerkiksi Javassa List<? extends R> ilmaisee tyypin lista, jonka alkiot kuuluvat olioluokan R aliluokkiin. Sen alkiot muistavat yhä sisäisesti oman aliluokkansa, joten tässä ja nyt -monimuotoisuus valitsee jokaiselle alkiolle sen oman toteutuksen luokan R metodeille. Vastaavasti apumääritelmän data A = forall a. (R a) => E a avulla Haskell-listatyyppi [A] koostuu alkioista muotoa E y jossa sisällön y tyyppi kuuluu tyyppiluokkaan R. Sen alkiot muistavat yhä sisäisesti oman tyyppinsä, joten tässä ja nyt -monimuotoisuus valitsee jokaiselle alkiolle sen oman toteutuksen tyyppiluokan R metodeille. Siten esimerkiksi data H = forall a. (Show a) => S a luo sellaisen tyypin, jossa: Arvot ovat ( H tai) muotoa S y jossa y on mikä tahansa sellainen arvo jolle on määritelty metodi show Kentän arvoon y voi soveltaa vain tätä metodia show. Tämä soveltaminen show y tulostaa arvon y merkkijonoksi niin kuin sen sen tyyppiset arvot tulostetaan vaikka kutsuja ei tiedäkään, mikä sen tyyppi on. Siten esimerkiksi [S 123, S "hei", S True] :: [H] koska jokainen alkio on samaa tyyppiä H vaikka jokaisessa niistä kenttä onkin eri tyyppiä. Tähän listaan voi soveltaa funktiota map (\ (S y) -> show y) koska jokainen kentän arvo y on jotakin tyyppiluokkaan Show kuuluvaa tyyppiä. Tuloksena on ["123","\"hei\"","True"] jossa jokainen kentän arvo y on tulostunut oman tyyppinsä mukaisella tavalla. Tällaista tyyppiä kutsutaan eksistentiaaliseksi (existential) koska sen sisällöllä on jokin tyyppi, vaikka vain sisältö itse tietää mitä tyyppiä se on. Eksistentiaalinen tyyppi piilottaa rajapinnan toteutuksen (piilottamalla sen toteuttavan tarkan tyypin) ja on siten väline abstraktin (abstract) tietotyypin luomiseen. 103
6.3 Yleistetyt algebralliset tietotyypit Haamutyyppiparametrit ja eksistentiaaliset tyypit ovat erikoistapauksia yleistetyistä algebrallisista tietotyypeistä (generalized ADT, GADT). Tavallinen uuden tyypin määrittely kuten data Nimi a = Konstruktori Kenttä_1 Kenttä_2... luo konstruktorin, jonka tyyppi on Konstruktori :: Kenttä_1 -> Kenttä_2 -> Nimi a jonka parametreina ovat kentät ja tuloksen tyyppi on täsmälleen sama kuin määriteltävänä oleva tyyppi. ghc-laajennuksella GADTs saa niiden lisäksi käyttöön myös määrittelytavan data Nimi a where Konstruktori :: Kenttä_1 -> Kenttä_2 -> Nimi a... jossa ohjelmoija kirjoittaakin itse konstruktoreidensa tyypit. (Haskell luo konstruktorit kuten ennenkin.) Näin ohjelmoija pääsee tyypittämään konstruktorinsa kuten hän itse haluaa käyttäen kaikkea mitä Haskell tarjoaa. Jos ohjelmoija haluaa että Kenttä_1 on eksistentiaalinen, niin hän voi tyypittää sen Konstruktori :: (forall b. Kenttä_1) -> Kenttä_2 -> Nimi a ottamalla käyttöön toisen ghc-laajennuksen Rank2Types joka sallii forallin funktion parametrin sisällä. (Tai RankNTypes joka sallii myös sisäkkäiset forallit.) Ohjelmoija voi tyypittää tarkemmin myös konstruktorinsa tuloksen: Sen ei tarvitsekaan olla täsmälleen sama Nimi a kuin datan perässä, vaan ohjelmoija voikin antaa sen tyyppiparametrille a haluamansa arvon. Siis yhdellä konstruktoreista voisi olla tulostyyppinään Nimi Int, toisella taas Nimi Bool, jne. Erityisesti jokainen konstruktori voi antaa näin haluamansa arvon haamutyyppiparametrille a jota ei käytetty kenttien tyypeissä. 7 Monadit Puhtaassa ohjelmointikielessä funktioilla ei saa olla sivuvaikutuksia. Toisaalta vaikkapa I/O-operaatioilla on sivuvaikutuksia: esimerkiksi operaatio putstr eli tulosta merkkijono stdoutiin tehdään juuri sivuvaikutuksensa eli tulostamisen vuoksi ei siksi että kutsuja olisi kovin kiinnostunut sen palauttamasta tuloksesta. 104
Laiskassa ohjelmointikielessä myös näiden sivuvaikutusten tahdistaminen on pulmallista: Jos jotakin lasketaan vain silloin (tai jos!) sen tulosta tarvitaan, niin milloin tehdään putstr jonka tulos ei kiinnosta kutsujaa? Haskell on omaksunut monadit (monad) vastaukseksi muun muassa tällaisiin ongelmiin. Monadin yleinen idea syntyi kategoriateoriassa (category theory) joka on eräs matematiikan osa-alue. Tämä osa-alue on muutenkin hedelmällinen (funktionaalisen) ohjelmoinnin teorian kannalta. Monadeihin voi tutustua tästä alkuperäisestä matemaattisesta näkökulmasta, mutta me otamme niihin sen sijaan (Haskell-)ohjelmoinnin näkökulman. Valitettavasti sama termi monadi on käytössä myös algebrassa, joka on matematiikan eri osa-alue...... ja termi kategoria on käytössä myös muualla, kuten formaalissa kielitieteessä. Tällä monadin yleisellä idealla on paljon käyttökohteita Haskellissa. Siksi Haskellin kirjastoissa on paljon yksittäisiä monadeja eri tarkoituksiin. Haskell-ohjelmoinnin näkökulmasta monadi m :: * -> * on 1-parametrinen tyyppikonstruktori, jonka intuitio on: m a on sellaisten laskentojen (computation) tyyppi, että jos sellainen laskenta suoritetaan, niin se tuottaa lopuksi vastauksen tyyppiä a. Näin monadi m erottaa toisistaan laskennan muodostamisen jonka voi nyt ohjelmoida tavallisena operaationa, joka käsittelee sellaisia arvoja, joiden tyyppi on m jotain. Esimerkiksi peräkkäissuoritus 1 tee ensin tämä 2 ja sen jälkeen tuo ilmaistaan 1 muodosta yksi laskenta= ensin tämä ja sen jälkeen tuo kahdesta pienemmästä laskennasta tämä ja tuo kuten (++) 2 suorita näin muodostettu laskenta. suorittamisen joka on jakamaton operaatio, eli kun jotakin laskentaa ryhdytään suorittamaan, niin se suoritetaan loppuun saakka, jotta saadaan tietää sen vastaus. Tällainen jakamaton suoritus voi tehdä sellaisia sivuvaikutuksia, jotka eivät näy sen ulkopuolelle. Monadissa m sallittu operaatio on siten tavallinen Haskell-funktio, jonka tyyppi on operaatio :: parametri(t) -> m vastaus 105
eli se tekee parametristaan laskennan, jonka suorittamisesta tulee sen vastaus. Myös sen parametrilla voi olla tyyppi m jokin. Silloin se on tämän monadin m kontrollirakenne. Esimerkiksi peräkkäissuoritus on määritely operaattorina (>>) :: (Monad m) => m a -> m b -> m b Tämän vuoksi monadeja kutsutaan joskus ohjelmoitavaiksi puolipisteiksi intuitiivisesti koska ohjelmoija voi määritellä mitä tämä;tuo tarkoittaa määrittelemällä mitä (>>) hänen omassa monadissaan tarkoittaa. Monadin M laskenta suoritetaan puolestaan funktiolla tyyppiä runm :: parametri(t) -> M vastaus -> vastaus. Vaikka monadit ovatkin ohjelmointikieliriippumaton idea, niin Haskell soveltuu niille erityisen hyvin: Monadit ovat viivästettyä laskentaa, joka ensin määritellään ja myöhemmin suoritetaan. Laiskassa suorituksessa tämä on automaattista ja siten vaivatonta, kun taas ahkerassa suorituksessa ohjelmoija joutuisi kirjoittamaan viivästyksen käsin. Laiskassa suorituksessa laskennan esittäminen monadisena tietorakenteena jota suoritetaan askel askeleelta on yhtä luontevaa kuin laiskan listan sieventäminen kohti arvoaan alkio alkiolta silloinkin kun tulos on päättymätön. Ahkerassa suorituksessa tietorakenteet ovat äärellisiä. Yleiskäsite monadit voidaan esittää luontevasti tyyppiluokkana. Tämä konstruktoriluokka on class Monad m where (>>=) :: m a -> (a -> m b) -> m b return :: a -> m a Tässä ovat ne 2 metodia, jotka jokainen sen jäsen määrittelee omalla tavallaan. return x tekee tyyppinsä perusteella parametristaan x sellaisen laskennan, joka palauttaa tämän saman arvon x. returnin idea on luoda yksinkertaisin mahdollinen laskenta, joka ei tee mitään muuta. Haskellin return ei ole kontrollirakenne vaan tavallinen metodi. Se ei siis pomppaa ulos nykyisestä laskennasta. Tämä nimi on valittu siksi, että return on yleensä se funktio, jota laskenta kutsuu viimeiseksi palauttaakseen vastauksensa kutsujalleen. Operaattori (>>=) on se yleisperiaate jolla kaksi laskentaa tämä ja tuo yhdistetään peräkkäin yhdeksi laskennaksi ensin tämä ja sitten tuo. Idea näkyy sen jälkimmäisen argumentin tyypistä a -> m b. 106
Parametrityyppinsä a perusteella se saa parametrinaan sen arvon x :: a jonka tämä :: m a laskenta tuottaa. Siten yhdistyn laskennan pitää alkaa sillä, että ensin tehdään tämä jotta saadaan x. Tulostyyppinsä m b perusteella se tuottaa tuon laskennan, johon yhdistetty laskenta päättyy. Saatu x voi vaikuttaa siihen, millainen laskenta tuosta tulee. Yhteenvetona siis p >>= q sanoo suorita ensimmäinen laskenta p jotta tiedät millaisella laskennalla q x sen jälkeen pitää jatkaa. Aikaisemmin mainittu peräkkäissuoritusoperaattori p >> q = p >>= \_ -> q on se erikoistapaus, jossa tämän laskennan tulos x ei vaikutakaan tuohon laskentaan silti tämä suoritetaan vaikka sen tulosta x eri käytetäkään, jotta saadaan tuo. Näin monadi on onnistunut esittämään peräkkäisyyden ensin tämä ja sitten tuo Haskellin laskentamallissa, joka ei perustu kontrollivuon ohjailuun vaan tietoriippuvuuksiin: Koska kutsusta run_m koko halutaan vastaus niin koko laskennan viimeinen askel pitää suorittaa, mutta sitä ennen pitääkin suorittaa sen toiseksi viimeinen askel, mutta sitä ennen... Siten Haskellin laskentamalliin voi liittää kontrollivuon ohjailuun perustuvaa laskentaa kunhan se tehdään sille sopivassa monadissa. Monet monadeista onkin määritelty newtypellä jolloin näitä käännösaikaisia tietoriippuvuuksia ja -tyyppejä ei olekaan enää suoritusaikana. Sellainen monadi käyttää Haskellin tyyppijärjestelmää määrittelemään halutun ohjelmointikurin jota ohjelmoija tulee automaattisesti noudattaneeksi kirjoittaessaan siinä monadissa toimivaa koodia. Tyyppikonstruktorin m täytyy kuitenkin toteuttaa monadilait ollakseen järkevä monadina. Lakien perusidea on, että operaation(>>=) pitää olla liitännäinen ja returnin pitää olla sen neutraalialkio kuten (++) ja []. Lakien yksi muotoilu on return x >>= f f x (14) f >>= return f (15) (f >>= g) >>= h f >>= (\ x -> g x >>= h). (16) Liitännäisyyslain (16) idea on, että kaikki peräkkäiset laskennat kuten ensin tämä, sitten tuo, ja lopuksi se (ensin tämä, sitten tuo) ja lopuksi se ensin tämä, sitten (tuo, ja lopuksi se) ovat samat riippumatta siitä, miten ne on suluin ryhmitelty. 107
Vasemmanpuoleisen neutraalialkiolain (14) ja oikeanpuoleisen neutraalialkiolain (15) idea on, ettei return tee muuta laskentaa kuin välittää parametrinsa eteenpäin. Monadit ovat keskeisiä nykyisessä Haskell-standardissa. Erityisesti I/O-operaatiot suoritetaan omassa IO-monadissaan. Tutkimuksessa on kehitetty monadeja eteenpäin esimerkiksi nuoliksi (arrow). Monadinen tyypitys ja ohjelmointityyli on monoliittista. Jos funktio f haluaa kutsua jonkin monadin M operaatiota, jonka tyyppi on siis jokin g ::... -> M tulos niin silloin myös sen oma tyyppi on f ::... -> M vastaus. Olkoon M vaikkapa jokin sellainen monadi, joka sallii tietyt sivuvaikutukset (kuten I/O-operaatiot). Koska f haluaa kutsua operaatiota g, jolla voi siis olla näitä sivuvaikutuksia, niin myös funktiolla f voi olla näitä samoja sivuvaikutuksia. Siten ohjelmoijan on jo suunnitteluvaiheessa päätettävä tuleeko koodista monadista vai tavallista tavallisen koodin monadisointi jälkikäteen pakottaa kirjoittamaan sen uudelleen. 7.1 Monadinen syntaksi Monadin M laskentoja voi ketjuttaa peräkkäin tällä operaattorilla(>>=), ja tällaisen ketjun lopussa on tavallisesti return vastaus. Haskell sisältää erityisen do-syntaksin helpottamaan tällaista laskentojen ketjuttamista. do-syntaksi tekee koodista imperatiivisemman näköistä, mutta kyse on silti funktionaalisesta koodista. do-syntaksi muistuttaa listojen erikoissyntaksia koska itse asiassa listatkin ovat eräs monadi. Toisto ilmaistaan näissä laskennoissa Haskellin tavalliseen tapaan rekursiolla. Monadin M do-lausekkeen syntaksi on do{ lause ; lause ; lause ;... ; lauseke } jossa lause on 108
Hahmo <- lauseke jossa lauseke :: M a ja Hahmo :: a joka tarkoittaa suorita se laskenta jonka tämä lauseke antaa ja nimeä sen vastaus tällä Hahmolla lauseke :: M a on Haskell-lauseke jonka vastaus lasketaan. Jos se on don viimeisenä niin se antaa koko don vastauksen ja sen tyypin ja se onkin useimmiten return vastaus sisällä niin sen vastausta ei nimetäkään millään Hahmolla eli se suoritetaankin vain sivuvaikutustensa vuoksi let määritelmät (ilman in-osaa) tekee paikalliset määritelmät, jotka näkyvät tämän don loppuun saakka. Aaltosulut {...} ja niiden sisällä olevat puolipisteet ; voi jättää pois do-lausekkeesta sisentämällä sen sisältö keskenään samaan sarakkeeseen. do-lauseke kääntyy tavalliseksi Haskell-lausekkeeksi kirjoitusjärjestyksessä seuraavasti: Jos ensimmäinen lause on do{ Hahmo <- lauseke ; loput } niin sen käännös on jonka let ok Hahmo = do{ loput } ok _ = fail virheilmoitus in lauseke >>= ok ok on uusi apufunktio fail :: String -> M a on tämän monadin M metodi, jonka oletustoteutus päättää laskennan sopivaan virheilmoitukseen ja vastaukseen M a Hahmonsovituksen on tarkoitus onnistua, joten vain harvat monadit määrittelevät failiaan uudelleen. Jos ensimmäinen lause on yksinkertaisempi do{ lauseke ; loput } niin sen käännöskin on yksinkertaisempi lauseke >> do{ loput } Jos ensimmäinen lause on do{ let määritelmät ; loput } niin sen käännös on 109
let määritelmät in do{ loput } Koko don viimeinen do{ lauseke } on se lauseke itse. Otetaan esimerkkinä 1 summa = 0; 2 repeat 3 tulosta nykyinen summa; 4 seuraava = lue seuraava rivi numerona; 5 summa = summa + seuraava 6 until seuraava = 0; 7 return summa. summaa1 operaattorilla (>>=) summaa2 do-syntaksilla. Käytämme niissä I/O-monadin operaatioita riviä 3 ja putstr :: String -> IO () readln :: (Read a) => IO a riviä 4 varten. summaa1,summaa2 :: IO Double summaa1 = let silmukka summa = putstr (show summa ++ " > ") >> readln >>= \ seuraava -> if seuraava == 0 then return summa else silmukka (summa+seuraava) in silmukka 0 summaa2 = let silmukka summa = do putstr (show summa ++ " > ") seuraava <- readln if seuraava == 0 then return summa else silmukka (summa+seuraava) in silmukka 0 110
ulkomaailma syöte tulostus IO-monadi kutsuu funktionaalinen koodi Haskell-sovellus 7.2 IO-monadi Kuva 4: Haskell-sovelluksen yleisrakenne. Haskellin I/O-operaatiot ovat monadissa IO. IO on siinä(kin) mielessä erityinen monadi, että sillä ei ole omaa suoritusfunktiota tyyppiä runio :: IO a -> a koska sellaisen pitäisi pystyä kapseloimaan parametrinaan saamansa I/O-laskennan sivuvaikutukset niin, etteivät ne näkyisi tämän funktion ulkopuolelle. Se taas olisi mahdotonta, koska esimerkiksi kun getchar :: IO Char lukee seuraavan merkin oletussyötevirrasta stdin, niin tämä merkki katoaa sieltä eivätkä muut runio-kutsut sitä enää näkisi. Siksi Haskell-ohjelma käynnistyy valmiiksi IO-monadissa: Tulkin ghci komentorivillä voi suorittaa IO-lausekkeita. Käännetyn Haskell-ohjelman pääohjelma on main :: IO () josta ohjelman suoritus alkaa. Siten IO-koodi voi kutsua funktionaalista koodia, mutta funktionaalinen koodi ei voi kutsua IO-koodia. Tämä vuoksi Haskell-sovelluksen yleisrakenne on Kuva 4 mukainen, eli IO-monadi kommunikoi ulkomaailman kanssa ja kutsuu ohjelman funktionaalista koodia niiden välisenä suojakerroksena. Preluden perusfunktioita tekstimuotoiseen tulostukseen oletustulosvirtaan stdout ovat putchar :: Char -> IO () joka tulostaa yhden merkin putstr :: String -> IO () joka tulostaa merkkijonon putstrln :: String -> IO () joka tulostaa merkkijonon ja rivinvaihdon print :: (Show a) =>a -> IO () joka on putstrln. show ja jota tulkki ghci kutsuu laskemalleen arvolle silloin kun sen tyyppi kuuluu tähän tyyppiluokkaan. syötteen lukemiseen oletussyötevirrasta stdin ovat 111
getchar :: IO Char joka lukee yhden merkin getline :: IO String joka lukee yhden rivin. Jos syötteen tiedetään esittävän tyyppiä a olevaa arvoa, niin silloin tämä arvo saadaan seuraavilla funktioilla: readio :: (Read a) =>String -> IO a joka konvertoi annetun merkkijonon tyypin a arvoksi readln :: (Read a) =>IO a joka lukee syöterivin oletussyötevirrasta stdin ja konvertoi sen. Jos merkkijonoa konvertoitaessa törmätäänkin syntaksivirheeseen, niin siitä seuraa I/O-poikkeus, jonka ohjelmoija voi käsitellä kuten jatkossa kuvataan. Funktionaalisempaa syötteen käsittelyä on funktio getcontents :: IO String joka palauttaa oletussyötevirran stdin koko (jäljellä olevan) sisällön laiskana merkkijonona, jota luetaan sitä mukaa kun ohjelma etenee sen merkistä seuraavaan. Se on deklaratiivinen (joskin hieman hidas) tapa lukea syöte eräajo-ohjelmaan jonka jälkeen siihen voi soveltaa kaikkia Haskellin tarjoamia listankäsittelyfunktioita. Funktionaalisempaa oletussyötevirran stdin ja oletustulosvirran stdout käsittelyä on funktiointeract :: (String -> String) -> IO () jonka parametri onkin puhdas Haskell-funktio joka saa syötteenään oletussyötevirran stdin koko (jäljellä olevan) sisällön laiskasti luettavana merkkijonona antaa tuloksenaan oletustulosvirtaan stdout laiskasti kirjoitettavan merkkijonon. Nimestään huolimatta sekin on tarkoitettu lähinnä eräajo-ohjelmiin. Mutkikkaammat I/O-operaatiot kuten esimerkiksi tiedostojen käsittely löytyvät vakiokirjastosta System.IO. Esimerkiksi usein halutaan oletustulosvirta stdout sellaiseksi, ettei sitä puskuroidakaan, vaan tulostus tapahtuukin välittömästi. Siihen System.IO tarjoaa kutsun hsetbuffering stdout NoBuffering. Puskuroinnin asetukset aiheuttavat harmeja eri käyttöjärjestelmien ja -ympäristöjen välillä. Esimerkiksi getchar lukee seuraavan merkin Windowsissa vasta kun sen sen sisältämä rivi on lähetetty ohjelmalle Enter - näppäimellä Linuxissa tavallisesti heti kun käyttäjä painaa näppäintä, mutta tämä riippuu terminaaliasetuksista. Poikkeukset (exception) ovat erittäin hyödyllisiä. Erityisesti I/O-operaatioissa voi tapahtua ohjelmasta riippumattomia virheitä, joiden käsittely erikseen jokaisen I/O-operaation jälkeen olisi vaivalloista. 112
Poikkeusten käsittely on kuitenkin hankala sovittaa yhteen puhtaan funktionaalisen ohjelmoinnin kanssa: Se milloin poikkeus käsitellään olettaa, että ohjelmoija tietäisi milloin jotakin tapahtuu laskennan kuluessa mutta puhtaassa funktionaalisessa ohjelmoinnissahan ohjelmoija tietää korkeintaan että se joskus tapahtuu... Haskellin vakiokirjasto System.IO.Error tarjoaakin yksinkertaisen poikkeusmekanismin erilaisten I/O-virheiden käsittelyyn koska monadissa IO on tällainen järjestys, jonka määrää (>>=). Toteutuksen ghc mukana tulee myös sen omakin kirjasto Control.Exception jolla poikkeuksia voi nostaa myös puhtaassa Haskell-koodissa käsitellä silti vain monadissa IO. Vakiokirjaston I/O-poikkeusmekanismi koostuu tyypistä IOError eli jokin I/Ovirhe sekä funktioista (jotka eivät siis ole uusia kontrollirakenteita) ioerror :: IOError -> IO a joka nostaa parametrina ilmoitetun I/O-poikkeuksen catch :: IO a -> (IOError -> IO a) -> IO a jonka ensimmäinen parametri on I/O-tyyppinen lauseke (kuten esimerkiksi jokin do-lauseke) jonka laskenta voi aiheuttaa I/O-poikkeuken. Laskenta ei tavallisesti aiheuta I/O-poikkeusta, ja silloin catchin arvoksi tulee laskennan antama arvo. jälkimmäinen parametri on funktio, jota kutsutaan, jos laskenta aiheuttaakin I/O-poikkeuksen. Se saa parametrinaan sen aiheutuneen poikkeuksen. Se voi käsitellä kyseisen poikkeustilanteen palauttamalla jonkin arvon, josta tulee tämän catchin arvo. Jos se ei osaakaan käsitellä tilannetta, niin sen pitääkin nostaa sama poikkeus uudelleen, jolloin tilanteen käsittelyvastuu siirtyykin seuraavalle ulommalle catchille. Jos mikään catch ei osaakaan sitä käsitellä, niin silloin koko laskenta keskeytyy suoritusaikaiseen virheeseen a. try :: IO a -> IO (Either IOError a) joka koettaa suorittaa parametrinaan saamansa laskennan. Jos sen arvo on Right x niin tämä laskenta eteni virheittä ja antoi tämän lopputuloksen x Left e niin silloin se aiheuttikin poikkeuksen e. Siten try tekee myös poikkeuksesta e tavallisen arvon. Toteutuksen ghc omassa vakiokirjastossa sen nimi onkin tryioerror. Otetaan sitten esimerkiksi I/O-ohjelmoinnista nelilaskin, jossa pidetään muistissa yhtä liukulukua kerrallaan käyttäjä voi antaa komentonaan lisää/vähennä/kerro/jaa se luvulla... tämän komentorivin mahdolliset virheet käsitellään tyhjä komentorivi lopettaa ohjelman suorituksen. 113
import System.IO import System.IO.Error main :: IO () main = laskin 0 laskin :: Double -> IO () laskin muisti = do putstr $ "Muistissani on: " ++ show muisti ++ "\nkomentosi? " komentorivi <- getline case komentorivi of "" -> do putstrln "Kiitos!" return () (komento:rivi) -> case lookup komento komennot of Nothing -> do putstrln $ "Tunnen vain seuraavat laskutoimitukset: " ++ map fst komennot ++ "!" laskin muisti Just operaattori -> tryioerror (readio rivi) >>= either (const $ do putstrln "Tajuan vain liukulukuja!" laskin muisti) (laskin. (muisti operaattori )) komennot :: [(Char,Double->Double->Double)] komennot = [( +,(+)),( -,(-)),( *,(*)),( /,(/)) ] Monadissa IO voi käyttää uudelleensijoitettavia muistipaikkoja ghc-kirjastosta Data.IORef taulukoita ghc-kirjastosta Data.Array.IO jos käyttöliittymään tarvitaan proseduraalista ohjelmointia. Haskellin keskeinen käytännön puute on, ettei sille ole standardoitua kirjastoa graafisten käyttöliittymien tekemiseen, eikä tahoa joka sellaista ylläpitäisi. Haskellille on tehty akateemisesti tai harrastepohjalta 114
matalan tason kirjastoja kuten ghc:n Windows- ja Haskell Platformin OpenGLrajapinnat. välitason kirjastoja kuten Gtk2HS jolla voi käyttää ilmaista käyttöliittymänsuunnittelutyökalua Glade. Käyttöliittymän toiminnallisuus ohjelmoidaan monadissa IO. korkean abstraktiotason kirjastoja kuten Gtk2HS:n päälle rakennettu Grapefruit, jossa käyttöliittymän toiminnallisuus ohjelmoidaankin monadin IO sijaan nuolilla. 7.3 Tuttuja tyyppejä monadeina Monet tutut tyyppikonstruktorit voi nähdä monadeina. Esimerkiksi Mayben voi nähdä sellaisten laskentojen tyyppinä, jotka voivat myös päättyä saamatta aikaan mitään vastausta. Tämän näkökannan ilmaisee instance Monad Maybe where (Just x) >>= k = k x Nothing >>= k = Nothing return = Just fail s = Nothing sanomalla, että jos peräkkäissuorituksessa (>>=) edeltävästä askeleesta tuli vastaukseksi Nothing niin myös tämänkin askeleen vastaus on Nothing. Se on esimerkki Monadista, jonka fail onkin osa laskentaa. Silloin esimerkiksi Maybe a -tyyppisessä do-lausekkeessa Hahmo <- lauseke toimii siten, että jos lauseke :: Maybe b antaa vastauksen Just x niin Hahmoa sovitetaan tähän x. Jos se sopii niin do-lausekkeen suoritus jatkuu normaalisti näillä Hahmon uusilla nimennöillä ei sovikaan niin suoritetaankin fail "...". Nothing niin koko do-lausekkeen vastaus onkin Nothing. Tämä tapahtuu siis niin, että jokainen keskeneräinen (>>=) saa vastauksekseen Nothing eikä se siis suoritakaan jälkimmäistä parametriaan k. fail "...":: Maybe b suoritetaan kuten Nothing yllä. Esimerkkinä olkoon tilanne, jossa pitää tarkistaa onko kummassakin Mapissa p ja q määritelty arvo avaimelle x. Jos on, niin palautetaan Just niiden arvojen muodostama pari. Jos ei ole, niin palautetaan Nothing. Tämän voi ilmaista do-syntaksilla paljon selvemmin kuin ilman sitä. 115
import qualified Data.Map as Map molemmissa x p q = maybe Nothing (\ xp -> maybe Nothing (\ xq -> Just (xp,xq)) (Map.lookup x q)) (Map.lookup x p) kummassakin x p q = do xp <- Map.lookup x p xq <- Map.lookup x q return (xp,xq) Näin Maybe tarjoaa siis yksinkertaisen poikkeusmekanismin sellaiselle puhtaan funktionaaliselle koodille joka on kirjoitettu monadisella ohjelmointityylillä (eli käyttäen do-notaatiota tai (>>=)-operaattoria) jossa tällaista poikkeusta ei käsitellä vaan se päättää laskennan Nothingiin jonka poikkeuksissa ei välitetä mitään lisäinformaatiota esimerkiksi failin merkkijonoparametri unohdetaan. Monipuolisemman poikkeusmekanismin puhtaalla monadisella tyylillä kirjoitetulle koodille tarjoaa Haskell Platformin kirjasto Control.Monad.Error johon on tarkoitus palata myöhemmin monadimuuntimien yhteydessä. Näin Maybe esittää yhtä laskentaa, joka voi myös epäonnistua. Silloin kun onkin monta laskentaa, jotka voivat myös epäonnistua, niin kyseessä on epädeterminismi (nondeterminism). Listat ovat se Monadi, joka esittää tällaisen epädeterminismin: instance Monad [] where m >>= k = concat (map k m) return x = [x] fail s = [] Epädeterministisellä laskenta-askeleella voi olla useita mahdollisia jatkovaihtohtoa, ja nämä eri vaihtoehdot esitetään listana. (>>=) sanoo laske kaikki epädeterministisen laskenta-askeleen k mahdolliset jatkovaihtoehdot jokaiselle nykyiselle vaihtoehdolle jotka ovat listana m. return luo yhden tällaisen laskennan. fail ilmoittaa, että tällä laskennalla ei ole yhtään jatkovaihtoehtoa. Listojen erikoissyntaksi [tulos osat] onkin monadisella syntaksilla 116
do osat return tulos kun jokainen sen osa muotoa ehto :: Bool kirjoitetaan muodossa True <- return ehto. Haskellin toteuttaa listojen erikoissyntaksin eli tämän monadin haarautuvan epädeterministisen laskennan eri vaihtoehtojen laiskana syvyyssuuntaisena läpikäyntinä. 7.4 Tilaperustaisen ohjelmoinnin monadi Monadissa IO voi siis tarvittaessa käyttää uudelleensijoitettavia muistipaikkoja ja taulukoita proseduraalista I/O-ohjelmointia varten. ghc-kirjastossa on monadi Control.Monad.ST jossa voi käyttää uudelleensijoitettavia muuttujia kirjastosta Data.STRef taulukoita kirjastosta Data.Array.ST joten tässä monadissa voi kirjoittaa sellaista proseduraalista koodia, joka ei tarvitse I/O-operaatioita. Tämän monadin ST proseduraalista koodia voi kutsua funktionaalisesta koodista, koska sen suoritusfunktio runst kapseloi kaikki sivuvaikutukset sisäänsä, jolloin sen rajapinnat ovat yhä funktionaalisia. Tämän kapseloivan suoritusfunktion tyyppi on runst :: (forall s. ST s a) -> a jossa suoritettavan laskennan tyypissä ST s on se varsinainen monadi, ja a sen vastauksen tyyppi s on eksistentiaalisesti kvantifioitu tyyppi. Täsätä tyypistä ei tiedetä yhtään mitään (koska sille ei annettu edes rajoitteita, jotka olisivat kertoneet sen metodeja) joten se voidaan vain välittää eteenpäin suoritettavan laskennan tyyppeihin. Tämä sama eksistentiaalinen tyyppiparametri s esiintyykin tämän monadin jokaisen operaation tyypissä. Esimerkiksi operaation newstref :: a -> ST s (STRef s a) tulostyyppi on monadin ST s laskenta, jonka vastaustyyppi on STRef s a eli tämän monadin uudelleensijoitettava muistipaikka, jonka sisältö on tyyppiä a. Kummassakin esiintyyy tämä s koska tämän monadin koko nimi on ST s. Tämä sama eksistentiaalinen tyyppiparametri s takaa halutun kapseloinnin käännösaikana: 117
Vain runst k saa suorittaa sellaisen laskennan jonka tyyppi on k :: ST s a. Samalla tämä runst kvantifioi tämän s eksistentiaalisesti tässä laskennassa k. Siis on olemassa sellainen tyyppi s joka laskennassa k.... Jos tästä laskennasta k yritetään palauttaa sellainen vastaus, jonka tyypissä a esiintyy s, niin Haskellin tyypinpäättely ei annakaan tehdä sitä, koska silloin tämä s pääsisi karkuun siitä näkyvyysalueesta k jolle runst sen määritteli. Siten s ei voi esiintyä laskennan k vastaustyypissä a. Siten laskennan k vastauksessa ei voi esiintyä esimerkiksi sen aikana luotuja uudelleensijoitettavia muistipaikkoja tai taulukoita. Otetaan esimerkiksemme seuraava ohjelmointiongelmaa: Saamme listan pareja (x,y) jotka tarkoittavat että alkioiden x ja y pitää kuulua samaan joukkoon. Mitkä nämä joukot ovat, kun alkiot pidetään erillään, ellei mikään tällainen pari vaadi niiden kuuluvan yhteen? Tämä ohjelmointiongelma esiintyy vaikkapa Kruskalin algoritmissa, jolla lasketaan suuntaamattoman verkon virittävää metsää samastuksessa joka oli tärkeä työväline esimerkiksi laskennallisessa logiikassa HM-tyypinpäättelyssä joka hyödyntää samastusta. Tämä ohjelmointionglema vaatii tietorakenteen, jossa on seuraavat operaatiot: initial joka alustaa sen siten, että jokainen alkio on aluksi yksin omassa joukossaan. union joka yhdistää ne joukot, joissa annetut alkiot x ja y nyt ovat. Siitä käytetään myös nimeä merge. find palauttaa sen joukon edustajan johon alkio z nyt kuuluu. Joukon edustaja on jokin sen alkioista. Sitä käytetään koko joukon nimenä. Kun esimerkiksi kysytään ovatko alkiot x ja y jo nyt samassa joukossa niin re ratkaistaan kysymällä, onko alkion x joukon edustaja sama kuin alkion y joukon edustaja. Tämä tietorakenne tunnetaankin nimellä union-find tai merge-find. Tämä vaikuttaa sellaiselta ohjelmointiongelmalta, jonka imperatiivinen ratkaisu on funktionaalista nopeampi: Koska imperatiivisessa ratkaisussa voidaan käyttää uudelleensijoitusta, niin siellä voidaan tiivistää hakupolku alkiosta x sen edustajaan, jotta seuraavat kyselyt sujuvat nopeammin. Tällöin saadaan ratkaisu, joka toimii askeleessa, jossa O((m + n) α(m + n)) 118
m on alkioiden lukumäärä n on operaatioiden union ja find lukumäärä α on erittäin hitaasti kasvava funktio. Se on Ackermannin funktion (joka kasvaa erittäin nopeasti) käänteisfunktion sukulainen. Käytännössä α(m + n) > 5 vasta kun m + n > alkeishiukkasten arvioitu lukumäärä koko maailmankaikkeudessamme... Funktionaalisessa onjelmoinnissa tämä polun tiivistäminen ei ole mahdollista, ja ainakin yksinkertaiset tietorakenneratkaisut tarvitsevat funtion α tilalla logaritmifunktion. Imperatiivisessa ratkaisussa on oleellisesti taulukko mem jossa alkiosta z 0 alkava polku mem[z 0 ] mem[z 1 ] mem[z 2 ] z 0 z 1 z 2 mem[zp] z p+1 johtaa alkion z 0 joukon edustajaan z p+1 saakka. Kun kysytään operaatiolla find alkion x joukon edustajaa, niin samalla tämä polku tiivistetään muotoon mem[z 0 ] =mem[z 1 ] =mem[z 2 ] = =mem[z p ] = z p+1 jolloin kaikkien näiden muidenkin alkioiden z 1, z 2, z 3,...,z p 1 edustajien haku operaatiolla find nopeutuvat. Operaatiota union voidaan taas tehostaa seuraavasti: Pidetään yllä jokaisessa edustajassa tietoa rank joka olisi näistä mem-linkeistä koostuvan puun korkeus ilman polkujen tiivistämistä. Tämän tiedon avulla yhdistetään aina matalamman puun juuri korkeamman puun juuren alipuuksi. Nämä juuret eli edustajat antaa siis operaatio find. Monadissa ST voimme luoda tällaisen taulukon mem ja käyttää sitä: Operaatio newarray_::(marray a e m,ix i)=> (i, i) -> m (a i e) luo taulukon tälle indeksivälille sellaisessa monadissa m jossa taulukot sallitaan. ST ja IO ovat siis sellaisia monadeja m. Tyyppiluokka Ix on ne tyypit, joita voi käyttää taulukkoindekseinä. Operaatio readarray::(marray a e m,ix i)=> a i e -> i -> m e lukee tällaisen taulukon arvon annetusta indeksistä. Operaatio writearray::(marray a e m,ix i)=> a i e -> i -> e -> m () kirjoittaa tällaisen taulukon annnettuun indeksiin annetun arvon. 119
module UnionFind where import Control.Monad import Control.Monad.ST import Data.Array.ST import Data.Word unions :: (Ix t) => [(t,t)] -> [[t]] unions xys = let lo = minimum xsys hi = maximum xsys xsys = xs ++ ys (xs,ys) = unzip xys in runst $ do mem <- initial lo hi sequence_ $ map (uncurry $ union mem) xys sequence_ $ map (find mem) $ range (lo,hi) memz <- getassocs mem parties <- parts lo hi sequence $ map ( \ (i,it) -> let j = case it of Rank _ -> i Ranked k -> k in do jt <- readarray parties j writearray parties j $ i:jt) memz groupies <- getelems parties return $ map reverse $ filter (not. null) groupies data Item t = Rank Word Ranked t deriving (Show) type UF s t = STArray s t (Item t) parts :: (Ix t) => t -> t -> ST s (STArray s t [t]) parts lo hi = newarray (lo,hi) [] initial :: (Ix t) => t -> t -> ST s (UF s t) initial lo hi = do mem <- newarray_ (lo,hi) sequence_ $ map (flip (writearray mem) (Rank 0)) $ range (lo,hi) return mem find :: (Ix t) => UF s t -> t -> ST s t 120
find mem = let finder i = do here <- readarray mem i case here of Rank r -> return i Ranked j -> do k <- finder j writearray mem i $ Ranked k return k in finder union :: (Ix t) => UF s t -> t -> t -> ST s () union mem x y = do i <- find mem x j <- find mem y when (i/=j) $ do Rank p <- readarray mem i Rank q <- readarray mem j if p<q then writearray mem i (Ranked j) else do writearray mem j (Ranked i) when (p==q) $ writearray mem i $ Rank (p+1) 121