Kolmogorov-kompleksisuus, Shannonin informaatioteoria ja näiden soveltaminen tiedontiivistysmenetelmissä

Koko: px
Aloita esitys sivulta:

Download "Kolmogorov-kompleksisuus, Shannonin informaatioteoria ja näiden soveltaminen tiedontiivistysmenetelmissä"

Transkriptio

1 hyväksymispäivä arvosana arvostelija Kolmogorov-kompleksisuus, Shannonin informaatioteoria ja näiden soveltaminen tiedontiivistysmenetelmissä Aku Peltonen Helsinki Kandidaatintutkielma HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos

2 HELSINGIN YLIOPISTO HELSINGFORS UNIVERSITET UNIVERSITY OF HELSINKI Tiedekunta Fakultet Faculty Laitos Institution Department Matemaattis-luonnontieteellinen Tietojenkäsittelytieteen laitos Tekijä Författare Author Aku Peltonen Työn nimi Arbetets titel Title Kolmogorov-kompleksisuus, Shannonin informaatioteoria ja näiden soveltaminen tiedontiivistysmenetelmissä Oppiaine Läroämne Subject Tietojenkäsittelytiede Työn laji Arbetets art Level Aika Datum Month and year Sivumäärä Sidoantal Number of pages Kandidaatintutkielma Tiivistelmä Referat Abstract Tässä tutkielmassa käsitellään Shannonin entropiaa ja Kolmogorov-kompleksisuutta sekä käytännön sovelluksia joissa niiden periaatteita sovelletaan. Shannonin entropia on eräänlainen mittari informaatiolle jostakin joukosta objekteja, ja erityisesti näiden objektien todennäköisyysjakaumasta. Samalla se on myös teoreettinen alaraja informaatiomäärälle jolla jokainen joukon alkio keskimäärin voidaan yksilöllisesti esittää. Kolmogorov-kompleksisuus puolestaan on pienimmän sellaisen tietokoneohjelman pituus jolla jokin merkkijono voidaan esittää. Kolmogorov-kompleksisuus on siis karkeasti mitta merkkijonon sisältämälle rakenteellisuudelle, sillä säännöllistä rakennetta noudattavat merkkijonot voidaan kuvata lyhyemmillä ohjelmilla kuin täysin satunnaiset. Vaikka Kolmogorovkompleksisuus ja Shannonin entropia eivät suoraan ole sovellettavissa käytännön ongelmiin, ne ovat olleet lähtökohtina menetelmissä joita käytetään informaation tiivistämiseen liittyvissä ongelmissa ja sovelluksissa. Tässä tutkielmassa näistä menetelmistä käsitellään universaaleja koodeja ja MDL-periaatetta, erityisesti missä määrin ne ammentavat informaatioteoriasta. Sekä universaaleja koodeja että MDL-periaatetta käytetään useilla eri sovellusaloilla, kuten tiedon tiivistämisessä, koneoppimisessa ja data-analyysissä. ACM Computing Classification System (CCS): E.4 [CODING AND INFORMATION THEORY] Avainsanat Nyckelord Keywords Kolmogorov-kompleksisuus, informaatioteoria, Shannonin entropia, universaalit koodit, MDL-periaate Säilytyspaikka Förvaringsställe Where deposited Muita tietoja övriga uppgifter Additional information

3 Sisältö 1 Johdanto 1 2 Informaatioteoria Prefiksikoodit ja Kraftin epäyhtälö Shannonin entropia Kolmogorov-kompleksisuus Määritelmä Ominaisuuksia Shannonin entropia ja Kolmogorov-kompleksisuus 8 5 Universaalit koodit 9 6 MDL-periaate Karkea versio Algoritminen MDL Yhteenveto 14 Lähteet 15 ii

4 1 Johdanto Informaatioteorian voidaan katsoa saaneen alkunsa Claude E. Shannonin vuonna 1948 ilmestyneestä artikkelista A Mathematical Theory of Communication. Shannonin artikkeli käsitteli kommunikoinnin ongelmia häiriöllisessä lähetyskanavassa ja tämän lähetyskanavan kautta lähetetyn viestin tiivistämistä riippuen mahdollisten viestien joukon todennäköisyysjakaumasta. Tässä tutkielmassa käsitellään informaatioteoriasta Shannonin entropiaa, joka mittaa satunnaisen tapahtuman informaatiota ja epävarmuutta joka liittyy tapahtuman lopputulokseen sekä kertoo konkreettisesti keskimääräisen bittimäärän, joka vaaditaan jokaisen viestin yksilöimiseen mahdollisten viestien joukosta. Otetaan esimerkiksi joukko A jossa on kaksi alkiota, a ja b, jotka merkitsevät mahdollisia viestejä. Sillä ei ole merkitystä mitä nämä alkiot ovat, ne voivat olla esimerkiksi merkkijonot "Tulen illalla baariin" ja "En tule illalla baariin" mutta tärkeää on se, että joukko A on tunnettu sekä viestin lähettäjälle että vastaanottajalle. Koska joukossa on vain kaksi alkiota, tarvitaan vain yksi bitti informaatiota yksilöimään molemmat viestit. Kun lähetetään viesti osapuolelta toiselle, tähän liittyvä entropia riippuu mahdollisten viestien todennäköisyyksistä. Jos viestin a (ja siten myös b:n) todennäköisyys on 50%, entropia on 1, mutta jos a:n esiintymisen todennäköisyys on 90%, laskee entropia noin puoleen tästä. Viestin sisältöön liittyvä epävarmuus on siis vähentynyt, sillä viestin sisältö voidaan ennustaa tarkemmin. Shannonin entropiaa käsitellään informaatioteorian osana luvussa 2. Shannonin entropia on ongelmallinen mittari jos halutaan mitata jonkin objektin informaation määrää joka ei riipu siitä, millä tavoin kyseinen objekti on valittu. Tämän ongelman motivoimana Ray Solomonoffin, Gregory Chaitinin ja Andrei Kolmogorovin julkaisujen pohjalta kehittyi 1960-luvulla algoritminen informaatioteoria, joka tutkii merkkijonojen kompleksisuuksia, mukaanluettuna Kolmogorov-kompleksisuutta. Merkkijonon Kolmogorov-kompleksisuus määritellään yksinkertaisesti lyhyimmän sellaisen tietokoneohjelman pituutena, joka tulostaa merkkijonon ja pysähtyy [GrV08]. Yksittäisellä objektilla voi olla lukuisia erilaisia kuvauksia, mutta jokaisen kuvauksen tulee kuvata vain yksi merkkijono. Intuitiivisesti yksinkertaiset merkkijonot, kuten vaikkapa luku 1

5 2 100, joka juuri ilmaistiin muutamalla tavulla, voidaan esittää lyhyemmillä ohjelmilla kuin monimutkaisemmat, enemmän kohinaa sisältävät merkkijonot. Samoin myös π, jonka binääriesitys ensinäkemältä vaikuttaa täysin satunnaiselta, voidaan tulostaa mielivaltaisen tarkasti lyhyellä, vakiomittaisella tietokoneohjelmalla. Kolmogorov-kompleksisuus onkin eräänlainen mitta merkkijonon satunnaisuudelle. Useimmilla merkkijonoilla ei ole olemassa merkittävästi lyhyempää kuvausta kuin merkkijono itse, mikä seuraa kyyhkyslakkaperiaatteesta (pigeon hole principle): n bitillä voidaan kuvata 2 n erilaista objektia, ja jos merkkijonon pituus on k n, vain hyvin pieni osa k:n pitusista merkkijonoista voidaan esittää n bitillä. Kolmogorov-kompleksisuus esitellään luvussa 3. Sekä Shannonin informaatioteoria että algoritminen informaatioteoria tutkivat sen informaation määrää, joka vaaditaan esittämään jokin havainnoitava objekti mahdollisimman tiiviisti. Kuitenkin siinä missä Shannonin informaatioteoria keskittyy ennalta määrätyn joukon todennäköisyysjakaumaan, algoritminen informaatioteoria kuvaa yksittäisten objektien informaatiota, tarkemmin sanoen vähäisintä määrää bittejä joka vaaditaan kuvaamaan tarkasteltava objekti täydellisesti ja häviöttömästi [GrV08]. Algoritmisen informaatioteorian ja Shannonin informaatioteorian merkittävä ero on siis se, että jälkimmäisessä tarkasteltava objekti on valittu jostakin ennalta määrätystä joukosta mahdollisia objekteja, kun taas edellisessä tarkastelun kohteena ovat kaikki mahdolliset äärellisen pituiset objektit, ja objektin sisältämä informaatio riippuu vain siitä itsestään. Huolimatta erilaisista lähtökohdista, on näillä kahdella teorialla varsin läheinen yhteys, sillä etenkin suurikokoisilla jakaumilla jakauman entropia on lähes yhtä suuri kuin sen odotusarvoinen Kolmogorov-kompleksisuus. Shannonin entropian ja Kolmogorov-kompleksisuuden yhteyttä tarkastellaan luvussa 4. Shannonin informaatioteoria ja Kolmogorov-kompleksisuus eivät sellaisenaan ole suoraan sovellettavissa informaation tiivistämiseen liittyviin ongelmiin. Shannonin entropiassa oletetaan todennäköisyysjakauma tunnetuksi, vaikka todellisuudessa se ei aina ole kannattavaa tai edes mahdollista laskea, eikä Kolmogorov-kompleksisuus ole laskettavissa lainkaan. Tästä huolimatta molempien teorioiden ideoita on hyödynnetty menetelmissä jotka tähtäävät käytännön ongelmien ratkaisuun. Tutkielman lopussa tarkastellaan kahta 2

6 tällaista menetelmää: universaaleja koodeja (universal codes) ja MDL-periaatetta (Minimum Description Length principle). Universaalit koodit soveltuvat tiedon tiivistämiseen kun merkkijonojen todennäköisyysjakauma tai pituus ei ole ennalta tiedossa, mutta joilla päästään silti lähelle teoriassa optimaalisten tiivistämismenetelmien pakkaussuhdetta. MDL-periaate puolestaan kuvaa menetelmää muodostaa annetun datan perusteella malli jonka avulla data voidaan ilmaista. Paras malli on sellainen, joka tuottaa lyhyimmän yhdistetyn kuvauksen mallista ja tämän mallin avulla ilmaistavasta datasta. MDLperiaatteen algoritminen versio pohjautuu Kolmogorov-kompleksisuuteen [BaC91]. 2 Informaatioteoria 2.1 Prefiksikoodit ja Kraftin epäyhtälö Kun jokin viesti joukosta A lähetetään vastaanottajalle, se täytyy koodata jollakin tavalla binäärimerkkijonoksi. Koodauksen tulisi olla mahdollisimman lyhyt mutta kuitenkin sellainen, että vastaanottaja voi muodostaa alkuperäisen viestin uudelleen täydellisesti, kun koodauksen purkufunktio on tiedossa. Uniikit koodit (uniquely decodable codes) ovat sellaisia, joissa jokainen koodausaakkoston symboli kuvautuu lähdeaakkoston symbolille bijektiivisesti. Näistä erikoistapauksena ovat prefiksikoodit (prefix codes), joiden määrittävänä piirteenä on, ettei yksikään joukossa esiintyvä koodisana ole toisen koodisanan etuliite (prefiksi), jolloin koodia purettaessa tiedetään aina kun on saavuttu koodisanan loppuun. Voidaan osoittaa, että jokainen uniikki koodaus binääriaakkostossa voidaan esittää prefiksikoodauksena säilyttäen koodisanojen pituudet [LiV08, p. 77]. Mikäli merkkijonoille x, y, z {0, 1} pätee y = xz, z ɛ, on x y:n prefiksi. Joukko {x, y,...} {0, 1} on prefiksivapaa, mikäli yksikään joukon alkioista ei ole toisen alkion prefiksi. Funktio D : {0, 1} A N määrittää prefiksikoodin, jos sen lähtöjoukko A on prefiksivapaa [GrV04]. Äärellisen pituiset binäärimerkkijonot voidaan kuvata luonnollisiksi luvuiksi seuraavalla 3

7 tavalla: (0, ɛ), (1, 0), (2, 1), (3, 00), (4, 01),..., (1) jossa ɛ tarkoittaa tyhjää merkkijonoa. Merkintä l(x) tarkoittaa merkkijonon x pituutta bitteinä, esimerkiksi l(010) = 3. Kun x kuvataan luonnollisena lukuna, l(x) = log(x+1) ja kun x 2 pätee log x l(x) log x. Olkoon x = x 1 x 2... x n binäärimerkkijono joka koodataan seuraavasti [GrV04]: x = } 11 {{... 1} 0x 1 x 2... x n. (2) n kpl Tuloksena saatava koodi on prefiksikoodi, mutta sen pituus on l( x) = 2n + 1. Huomattavasti lyhyempään koodipituuteen päästään soveltamalla kaavaa (2) merkkijonon x sijasta sen pituuteen l(x). Tällöin saadaan x = l(x)x, jossa l(x) tulkitaan binäärimerkkijonoksi kaavan (1) mukaisesti. Näin saatava koodi D (x ) = x on prefiksikoodi, jonka pituus l(x ) = n + 2 log n + 1. Tätä koodia kutsutaan standardiksi prefiksikoodaukseksi luonnollisille luvuille (standard prefix-code for the natural numbers) ja sen pituudesta käytetään merkintää L N (x) = l(x ). Kun x kuvataan luonnollisena lukuna kaavan (1) mukaan, on L N (x) = log x + 2 log log x + 1. Tiedon tiivistämisessä symbolin esiintymisen todennäköisyys vaikuttaa sen koodauksen pituuteen. Esimerkiksi aritmeettisessa koodauksessa pätee p(x i ) = 2 l(x i) kaikille x i Σ, jossa Σ on jokin äärellinen aakkosto symbolikoodauksia, l(x i ) symbolin koodauspituus ja p(x i ) x i :n esiintymistodennäköisyys. Siten symbolin koodauksen pituus l(x i ) = log p(x i ) bittiä. Jokainen prefiksikoodaus aakkostossa {0, 1} toteuttaa seuraavan kaavan, joka tunnetaan Kraftin epäyhtälönä: n 2 l(xi) 1, i=1 missä l(x 1 ), l(x 2 ),..., l(x n ) N ovat koodausten pituudet. Prefiksikoodaus joka toteuttaa epäyhtälön tiukalla yhtäläisyydellä 2 l(x i) = 1 on täydellinen (complete), toisin sanoen uuden koodisanan lisäys johtaa siihen, ettei kyseessä enää ole prefiksikoodaus. Kraftin epäyhtälö luo yhteyden koodisanojen pituuksien ja niiden esiintymistodennäköisyyksien välille, sillä kaikilla jakaumilla P (x) aakkostossa Σ pätee: p(x i ) = 1. x i Σ 4

8 2.2 Shannonin entropia Shannonin entropia (jatkossa entropia) kuvaa informaation määrää joka jonkin äärellisen joukon tapahtuman realisaatioon liittyy. Olkoon Σ äärellinen joukko symboleita x i ja X satunnaismuuttuja joka saa arvokseen x i :n jakaumalla P (X = x i ) = p(x i ). Tällöin entropia satunnaismuuttujalle X on [Sha48] H(X) = x i Σ p(x i ) log p(x i ). Erityistapauksena mainittakoon tilanne, jossa p(x i ) = 1 n kaikilla x 1, x 2,..., x n Σ. Tällöin entropia redusoituu muotoon H(X) = log n. Edellä on oletettu, että jakauma P on ennalta tiedossa. Todellisuudessa näin ei kuitenkaan usein ole, eikä jakauma välttämättä ole edes laskettavissa, jolloin entropiakaan ei ole määritettävissä [GrV04]. Entropia on eräänlainen epävarmuuden mittari jakaumassa. Esimerkiksi jos aakkoston koko on 1, jolloin p(x) = 1, on entropia H(X) = 0. Toisin sanoen tällöin satunnaismuuttujaan ei liity minkäänlaista epävarmuutta, vaan pystymme ennustamaan täysin mikä seuraava merkki jossain tämän aakkoston merkkijonossa on. Toisaalta taas entropia on sitä suurempi mitä enemmän aakkostossa on symboleita ja mitä lähempänä symboleiden esiintymistodennäköisyydet ovat toisiaan. Tämä tarkoittaa sitä, että epävarmuus seuraavasta symbolista on suurempi. Esimerkiksi nopanheitossa jokaisen silmäluvun todennäköisyys on 1 6 ja heittoon liittyvän satunnaismuuttujan entropia on H(X) Jos noppa on painotettu siten, että yhden silmäluvun todennäköisyys on 5 6 viiden silmäluvun todennäköisyydet 1 30 kullakin, on entropia enää H(X) ja muiden Entropia myös määrittää alarajan aakkoston keskimääräiselle symbolipituudelle, toisin sanoen pienimmälle määrälle bittejä joilla jokainen viesti voidaan yksilöllisesti määritellä. Millään ensimmäisen kertaluvun (first-order) tiivistämismenetelmällä ei voida päästä pienempään keskimääräiseen symbolipituuteen. Prefiksikoodien keskimääräinen symbolipituus L onkin H(X) L H(X) + 1 [GrV04]. 5

9 3 Kolmogorov-kompleksisuus 3.1 Määritelmä Kolmogorov-kompleksisuus merkkijonolle x on lyhyimmän sellaisen tietokoneohjelman p pituus l(p) joka tulostaa x:n, mahdollisesti annettuna lisäinformaatiolla y. Lisäinformaatio tulee "ilmaiseksi", eli sitä ei lasketa mukaan Kolmogorov-kompleksisuutta määritettäessä. Sekä merkkijonojen, että ohjelmien ajatellaan tässä koostuvan biteistä, eli niiden aakkosto on binääriaakkosto {0, 1}. Siten merkkijonon Kolmogorov-kompleksisuus on funktio äärellisen pituisilta merkkijonoilta luonnollisille luvuille: K : {0, 1} [GrV08]. Formaalisti: K(x y) = min{l(p) : U(p, y) = x}, N missä U on universaali Turing-kone. Tämä on niin sanottu ehdollinen Kolmogorov-kompleksisuus, toisin sanoen l(p) riippuu annetusta y:stä, kun taas ei-ehdollinen K on erikoistapaus tästä: K(x) = K(x ɛ), missä l(ɛ) = 0. Siinä triviaalissa tapauksessa, että x = y ohjelmaksi riittää yksinkertainen syötteen tulostuskäsky, jolloin K(x y) = O(1). Jos K(x y) on huomattavasti pienempi kuin K(x), voidaan y:n tulkita sisältävän paljon informaatiota x:stä [LiV08, p. 186]. Saattaa vaikuttaa siltä, että objektin kuvauskielen valinnalla olisi suurikin merkitys Kolmogorov-kompleksisuuden määrittämisessä. Kuitenkin invarianssiteoreeman mukaan Turing-koneen tai ohjelmointikielen valinta vaikuttaa objektin Kolmogorovkompleksisuuteen vain määrätyn vakion verran, joka ei riipu objektista vaan ainoastaan valitusta kielestä, kunhan valittu kieli on Turing-täydellinen [LiV08, pp ]. 3.2 Ominaisuuksia Yksinkertaisten objektien Kolmogorov-kompleksisuus on K(x) = O(log n), jossa n on luonnollinen luku, usein merkkijonon x pituus [GrV08]. Esimerkiksi johdannossa mainitun π:n n ensimmäisen bitin tulostamiseen vaadittavan ohjelman pituus on luokkaa O(log n), sillä on olemassa vakiomittainen ohjelma joka tulostaa π:n desimaaleja haluttuun lukuun n asti. Tällöin ainut muuttuva osuus ohjelmassa on n. Joillekin merkkijonoil- 6

10 le Kolmogorov-kompleksisuus on vieläkin pienempi. Esimerkiksi luku n = 2 m, m N voidaan esittää määrittämällä ensin m jonka esityksen pituus on luokkaa O(log m), ja sitten ohjelma funktion g(k) = 2 k esittämiseksi. Tällaisille luvuille n merkkijonon Kolmogorovkompleksisuus on K(x) = O(log m) = O(log log n). Merkkijono x on c-pakkaamaton (c-incompressible) jos K(x) l(x) c jossa c on vakio [LiV08, pp ]. Merkkijonoa ei siis tällöin voi tiivistää enempää kuin c bittiä. Merkkijonolle jonka pituus on n on olemassa 2 n 2 n c + 1 c-pakkaamatonta merkkijonoa, jolloin merkittävä osa merkkijonoista ei ole juurikaan pakattavissa. Pienillä vakioilla käytetään yksinkertaisesti termiä pakkaamaton. Pakkaamattomissa merkkijonoissa ei ole minkäänlaista mallinnettavaa rakennetta ja niitä voidaankin sanoa satunnaisiksi. Tällaisten merkkijonojen lyhin kuvaus on siis käytännössä merkkijono itse. Kolmogorov-kompleksisuuden eräs ikävä piirre on, ettei se ole laskettavissa; ei ole olemassa ohjelmaa joka merkkijonon syötteenä saatuaan tulostaisi lyhyimmän ohjelman joka tulostaa kyseisen merkkijonon. Ei myöskään ole olemassa ohjelmaa joka jokin toinen ohjelma ja merkkijono syötteenään kertoisi onko syötteenä saatu ohjelma lyhin merkkijonon tulostava ohjelma [LiV08, pp ]. Ikävä tämä piirre on siitä syystä, että mikäli Kolmogorovkompleksisuus olisi laskettavissa, se helpottaisi huomattavasti tiedon tiivistämistä, sillä tällöin pakkausohjelmaksi riittäisi toteuttaa Kolmogorov-kompleksisuuden laskeva funktio. Ei-laskettavuuden todistamiseksi on hyödyllistä kuvata äärelliset binäärimerkkijonot luonnollisille luvuille kaavassa (1) kuvatulla tavalla. Tällöin myös Kolmogorov-kompleksisuus voidaan kuvata funktiona K : N N. Nyt tehdään vastaoletus, että K on laskettavissa ja määritellään funktio δ(m) = min{x : K(x) m}, x, m N joka vastaoletuksen mukaan on niin ikään laskettavissa. Tästä seuraa että K(δ(m)) m ja koska δ on laskettavissa, on olemassa äärellisen mittainen ohjelma joka syötteellä m tulostaa δ(m):n ja pysähtyy. Koska K(δ(m)) on lyhimmän tällaisen ohjelman pituus, pätee K(δ(m)) l(m)+c 2 log m+c, jollakin vakiolla c. Tästä seuraa ristiriita m 2 log m+c joten väite on todistettu [GrV08]. 7

11 4 Shannonin entropia ja Kolmogorov-kompleksisuus Shannonin informaatioteorian ja Kolmogorov-kompleksisuuden merkittävin erottava tekijä on niiden erilaiset lähtökohdat siihen, mitä informaatiota oikeastaan halutaan kuvata. Shannonin teoriassa motivaationa on informaation lähettäminen osapuolelta toiselle jotakin lähetyskanavaa pitkin, sillä oletuksella että mahdollisten viestien joukko on molempien osapuolten tiedossa. Viesteihin liittyvän informaation määrä on riippuvainen ainoastaan viestien todennäköisyysjakaumasta ja satunnaismuuttujasta jolla yksittäinen viesti valitaan lähetettäväksi ja viestien varsinainen sisältö on epäoleellinen. Kolmogorovkompleksisuus puolestaan liittyy ainoastaan viestin sisältöön [LiV08, p. 603]. Toisin sanoen Shannonin informaatioteorian, ja erityisesti Shannonin entropian tulos on pienin keskimääräinen bittimäärä jolla satunnainen viesti voidaan lähettää virheetöntä lähetyskanavaa pitkin, kun taas Kolmogorov-kompleksisuudessa se on pienin bittimäärä johon jokin tietty viesti voidaan tiivistää ja josta se voidaan täydellisesti palauttaa. Jos esimerkiksi halutaan lähettää viesti kahden yhtä todennäköisen viestin joukosta, Shannonin entropian perusteella siihen tarvitaan ainoastaan yksi bitti informaatiota, vaikka viestien Kolmogorov-kompleksisuus voi olla hyvinkin korkea [GrV08]. Huolimatta eroavaisuuksista näiden kahden teorian välillä on oleellinen yhteys, sillä odotusarvoinen (expected) Kolmogorov-kompleksisuus lähestyy entropiaa kun merkkijonojen pituus kasvaa. Olkoon X satunnaismuuttuja joka saa arvonsa jakaumalla f(x) = P (X = x), x {0, 1}. K(x) on lyhin kuvaus x:stä, ja riippumaton jakaumasta P. Keskimääräinen koodauksen pituus jakaumalla P voidaan nyt laskea summasta x f(x)k(x). Summan ja entropian H(X) välinen erotus on [LiV08, pp ]: 0 x f(x)k(x) H(X) K(f) + O(1). Erotus siis riippuu vain jakaumasta P ja vakiosta O(1), joka puolestaan riippuu valitusta kuvauskielestä. Näin ollen yksinkertaisilla jakaumilla odotusarvoinen Kolmogorovkompleksisuus on hyvin lähellä entropiaa, kun taas monimutkaisilla jakaumilla erotus voi olla hyvinkin suuri [GrV04]. Odotusarvoisen Kolmogorov-kompleksisuuden ja entropian välille saadaan myös asymp- 8

12 toottinen yhteys. Olkoon Y satunnaismuuttuja joka saa arvokseen n-mittaisia binäärimerkkijonoja y jakaumalla P (Y = y) = 2 n ja odotusarvoinen Kolmogorov-kompleksisuus E = l(y)=n p(y)k(y). C-pakkaamattomien merkkijonojen lukumäärä on 2n (1 2 c+1 ). Tällöin pätee [LiV08, p. 188]: Kun sijoitetaan c = log n saadaan: n n + O(1) H(Y ) E n (1 2 c+1 )(n c). H(Y ) lim n E = 1. Odotusarvoinen Kolmogorov-kompleksisuus jakaumalle siis lähestyy sen entropiaa kun merkkijonojen pituus kasvaa rajatta. Voidaan osoittaa, että jokainen lineaarinen epäyhtälö Shannonin entropiassa pätee vastaavasti Kolmogorov-kompleksisuuteen, logaritmisen virhetermin tarkkuudella [LiV08, p. 607]. 5 Universaalit koodit Olkoot D 1, D 2,... järjestetty lista prefiksikoodeja ja L 1, L 2,... vastaavasti niiden pituusfunktiot, jolloin L i (x) = min y {l(y) : D i (y) = x}. Mikäli on olemassa y jolla kaikilla D i pätee D i (y) x, merkitään L i (y) =. Nyt merkkijono x voidaan koodata käyttämällä ensin luvussa 2.1 esiteltyä standardia prefiksikoodausta luvulle k N ja sitten koodaamalla x käyttäen prefiksikoodia D k. Tämä johtaa kaksiosaiseen prefiksikoodiin D jonka pituusfunktio on [GrV04] L(x) = min k N L N(k) + L k (x). Käyttämällä tätä koodia päästään lähes yhtä hyvään koodauspituuteen kuin käyttämällä prefiksikoodia D k joka parhaiten tiivistäisi merkkijonon x. Ne eroavat ainoastaan logaritmisella termillä joka riippuu k:sta, jolloin k:n ollessa rajoitettu, saadaan lim n L(x) L k (x) 1, (3) jossa n on merkkijonon x pituus. Koodi D joka toteuttaa yllä olevan on universaali koodi (universal code) suhteessa prefiksikoodien joukkoon {D 1, D 2,...} [GrV04]. Toisin sanoen 9

13 se tiivistää minkä tahansa merkkijonon lähes yhtä hyvin kuin se D k joka tiivistäisi jotakin tiettyä merkkijonoa eniten. Käytetään merkintää x kuvaamaan lyhintä merkkijonon x tulostavaa ohjelmaa, siis K(x) = l(x ). Merkkijonon koodausfunktio on siten E (x) = x ja sitä vastaava prefiksikoodi D (x ) = x. Oletetaan että kaikki prefiksikoodit D k ovat laskettavissa, jolloin saadaan seuraava yhtälö: [GrV04] l(e (x)) = K(x) L k (x) + O(1). Tästä nähdään että prefiksikoodi D on universaali koodi suhteessa joukkoon {D 1, D 2,...} ja jossa Kolmogorov-kompleksisuus on sen pituusfunktio. Mikäli mahdollisten merkkijonojen jakauma tiedetään ennalta, keskimäärin optimaalisin koodaustapa on käyttää Shannon-Fano-koodia [GrV04], jossa todennäköisemmin esiintyville symboleille annetaan lyhyet koodisanat ja epätodennäköisille pidemmät. Aina jakaumaa ei kuitenkaan tunneta tai se ei ole laskettavissa, jolloin Shannon-Fano-koodit saattavat johtaa erittäin pitkään koodiesitykseen. Olkoon {f} = {f 1, f 2,...} järjestetty joukko jakaumia, jossa f k = (f 1 k, f 2 k,...) ja f n k jokin n-mittaisen merkkijonon jakauma, jolla satunnaismuuttuja X jakautuu. Tällöin fk n (x) = P (X = x). Jokaiselle tällaiselle jakaumalle voidaan muodostaa optimaalinen Shannon-Fano-koodi, jossa merkkijonon x koodipituus on l SF (x) = log fk n (x), pyöristettynä ylöspäin lähimpään kokonaislukuun. Annetulle jakaumalle f {f} entropia on H(f n ) = x {0,1} n f n (x) log f n (x). Kaksiosainen universaali koodi voidaan nyt muodostaa koodaamalla n ja k standardilla prefiksikoodauksella luonnollisille luvuille ja koodaamalla x sen jälkeen l SF (x) bitillä käyttäen optimaalista Shannon-Fano-koodia. Tällöin on voimassa ˆL n k(x) = x {0,1} n f n k (x)l SF (x) H(f n k ) + O(log n), josta seuraa lim n ˆL n k (X) H(f n k ) 1. 10

14 Saatu koodi on universaali koodi suhteessa jakaumien joukkoon {f} [GrV04]. Edellä on esitelty yhdenlainen, varsin yksinkertainen tapa muodostaa universaaleja koodeja. On kuitenkin olemassa lukuisia erityyppisiä universaaleja koodeja joilla päästään lähes yhtäläisiin koodipituuksiin [Gru07, p. 172]. 6 MDL-periaate 6.1 Karkea versio Objektin informaatiota mitataan sen Kolmogorov-kompleksisuudella, ja tässä esityksessä jokainen bitti on informaatiota, toisin sanoen tämä esitys ei sisällä lainkaan redundanssia. Mutta objektin informaatio ei välttämättä ole merkityksellistä: tuhannen kolikonheiton sarjan bittiesitys on hyvin suurella todennäköisyydellä sellaisenaan sen lyhin mahdollinen esitys [VeV04]. Toisaalta, esimerkiksi ääretön merkkijono x = josta otetaan satunnaisesti n ensimmäistä merkkiä voidaan esittää kahdessa osassa: ohjelmana p joka tulostaa mielivaltaisen määrän merkkijonoja 01 peräkkäin, ja lukuna n N. Tällöin ensimmäinen osa sisältää x:n säännöllisen osan ("merkityksellisen informaation") ja n epäsäännöllisen ("satunnaisen informaation"). Objektin x Kolmogorov-kompleksisuus on täten [GrV04] K(x) = min{k(n) + l(p) : U(p, n) = x} + O(1). p,n Ohjelmaa p voidaan tällöin pitää mallina joka yhdessä epäsäännöllisen osan kanssa esittää alkuperäisen merkkijonon x lyhimmällä mahdollisella tavalla. Edellä kuvattu kaksiosainen koodaus x:lle ei ole kovin käytännöllinen sen ei-laskettavuuden vuoksi. Tästä syystä on otettava käyttöön jokin vähemmän ilmaisuvoimainen tapa kuvata malleja kuin universaalit Turing-koneet tai ohjelmointikielet. Tällaisen kuvausmetodin täytyy olla tarpeeksi rajoittunut jotta mille tahansa datalle x voidaan aina määrittää lyhin kuvaus, mutta kuitenkin sellainen, että sen avulla voidaan tiivistää datassa olevia säännöllisyyksiä [Gru07, p. 11]. Usein kuvausmetodin valintaan vaikuttaa se, mitä tiedämme datasta. Esimerkiksi datan koostuessa pisteistä 2-ulotteisessa koordinaatistos- 11

15 sa, voimme riittävänä approksimaationa rajata mahdollisten mallien joukon eriasteisiin polynomeihin. Karkea kaksiosainen versio MDL-periaatteesta voidaan ilmaista seuraavalla tavalla: olkoon A 1, A 2,... lista mahdollisia malleja kuvaamaan dataa x, jossa A k on esimerkiksi k-asteisten polynomien joukko. Tällöin paras hypoteesi, eli tässä tapauksessa yksittäinen polynomi, kuvaamaan data on sellainen joka minimoi summan L(h) + L(x h), jossa h A 1 A 2..., L(h) hypoteesin h pituus bitteinä ja L(x h) datan pituus bitteinä hypoteesin avulla kuvattuna [Gru07, p. 14]. Mitä paremmin hypoteesi on valittu vastaamaan dataa, sitä pienempi on summan jälkimmäinen osa. Toisaalta datan ylimitoittaminen (overfitting) johtaa yleensä tarpeettoman monimutkaisiin ja siten bittiesitykseltään pitkiin malleihin jotka huomioivat liikaa satunnaisia poikkeamia ja joiden ennustusvoima on varsin heikko. Paras hypoteesi on siten sellainen, joka kuvaa riittävän hyvin datassa ilmenevän säännöllisyyden ja joka on myös ennustava. Tällä tarkoitetaan sitä, että jos samasta lähteestä saadaan lisää dataa, valittu hypoteesi kuvaa myös tämän datan suhteellisen vähäisellä määrällä bittejä. Tyypillisesti hypoteeseinä käytetään todennäköisyysjakaumia P, jolloin yllä olevan esimerkin polynomit voidaan muuntaa jakaumiksi lisäämällä niihin normaalijakautunut korjaustermi [Gru07, pp ]. Jakaumilla kuvattuna karkea MDL voidaan esittää seuraavasti: L 1 (P ) + L 2 (D P ) = L 1,2 (P, D), jossa D = (x 1, x 2,..., x n ) on annettu data ja P jakauma joka kuuluu johonkin malliin P M. Tällöin tulee valita se jakauma P joka minimoi summan. Mikäli tällaisia on useita, valitaan osan L 1 (P ) minimoiva jakauma. Yllä kuvatussa L k tarkoittaa koodausmenetelmän C k pituusfunktiota. C 1,2 kuvaa jokaisen parin (P, D) yhdistämällä koodit C 1 ja C 2, jossa C 1 on koodi mallille P M ja C 2 datalle mallin avulla kuvattuna. Koska hypoteesi P on tunnettu todennäköisyysjakauma, voimme käyttää koodiin C 2 Shannon-Fano-koodia, jolloin L 2 (D P ) = log P (D) [Gru07, p. 136]. Shannon-Fano-koodien käyttö johtaa tällöin automaattisesti sitä pienempään koodauspituuteen, mitä paremmin valittu hypoteesi vastaa dataa. Ongelma tässä tavassa on kuitenkin muodostaa C 1. Mikäli yksittäisen 12

16 hypoteesin sijaan koodataankin koko malli P M, voidaan käyttää universaalia koodia kuvaamaan C 1,2 (D P M ). Tästä seuraa että jos jokin hypoteesi P kuvaa datan hyvin, siten että L 2 (D P ) on lyhyt, koodipituus L 1,2 (D P M ) on myös lyhyt [Gru07, pp ]. 6.2 Algoritminen MDL Jorma Rissanen kehitti 1970-luvulla MDL-periaatteen paljolti Kolmogorov-kompleksisuuden innoittamana. Sen kuitenkin ollessa käytännöllinen työkalu, se ei käytä suoraan Kolmogorovkompleksisuuden käsitettä, mutta useita algoritmisia versioita, jotka taas pohjautuvat siihen, on kehitetty sen jälkeen [Gru07, p. 570]. Seuraavassa esitetään eräs versio, jossa malleina käytetään binäärimerkkijonojen joukkoja. Olkoon x = x 1 x 2... x n sarja n kolikonheiton tuloksia, jossa kruunien määrä on 0 k n, ja jossa kruunia kuvataan bitillä 1 ja klaavoja bitillä 0. Tällöin voidaan muodostaa äärellinen, järjestetty joukko S n-mittaisia merkkijonoja joissa on k kappaletta merkkiä 1. Merkkijonon x ehdollinen Kolmogorov-kompleksisuus joukolla S toteuttaa siten seuraavan [VeV04]: K(x S) log S + O(1). Joukko S on siis malli merkkijonolle x, ja mallin hyvyys riippuu siitä, kuinka tyypillinen alkio x on joukossa. Tyypillisyydellä tarkoitetaan sitä, kuinka yhtenäinen rakenne joukon merkkijonoilla on keskenään. Edellä kuvatussa esimerkissä kaikki merkkijonot sisältävät yhtä monta kappaletta merkkiä 1, ja malli olisi huonompi, jos joukko S olisi sisältänyt kaikki n-mittaiset merkkijonot, jolloin malli olisi alimitoittanut merkkijonon x. Parhaan mahdollisen mallin tulisi kuvata merkkijonon rakenteellisuus siten, että mallin ja sen avulla kuvattavan merkkijonon kompleksisuus on mahdollisimman alhainen. Mallin hyvyyttä voidaan kuvata Kolmogorov-struktuurifunktiolla (Kolmogorov structure function) [VeV04]: h x (α) = min{log S : x S, K(S) α}, S jossa α N on jokin joukon S kompleksisuutta rajoittava luku. Jokaiselle äärelliselle joukolle S x pätee K(x) K(S) + log S + O(1), sillä x voidaan 13

17 kuvata joukon ja alkion x indeksin avulla. Kyseessä on siis kaksiosainen koodi merkkijonolle x, jossa K(S) kuvaa x:n säännöllistä osaa ja log S epäsäännöllistä, eli alkion x indeksiä joukossa S [VeV04]. Joukko S on optimaalinen malli x:lle, mikäli pätee K(x) = K(S) + log S + O(1). Lyhin ohjelma optimaaliselle joukolle S on merkkijonon x minimaalinen algoritminen otossuure (algorithmic minimal sufficient statistic, AMSS), mikäli ei ole olemassa toista optimaalista joukkoa S jolle K(S ) < K(S). Lisäksi merkkijono x on tyypillinen alkio joukossa S jos joukko on optimaalinen. Mikä tahansa joukko S x joka minimoi erotuksen K(S) log S on hyvä malli merkkijonolle x. Toisin sanoen, mikä tahansa optimaalinen joukko. Kuitenkin, on olemassa optimaalisia joukkoja S jotka eivät kuvaa kaikkea merkkijonon rakennetta, jolloin joukko joka on AMSS on parempi valinta malliksi [GrV04]. 7 Yhteenveto Tässä tutkielmassa on esitelty Shannonin entropia ja Kolmogorov-kompleksisuus, sekä näiden periaatteita hyödyntävistä menetelmistä universaalit koodit ja MDL-periaate. Näillä kaikilla on perusajatuksena se, miten jokin objekti tai joukko dataa voidaan esittää pienimmällä mahdollisella bittimäärällä, mutta jokaisella on kuitenkin hieman erilainen motivaatio informaation kuvaamiseen ja ylipäänsä siihen, mitä informaatiota kuvataan. Shannonin entropian lähtökohta on osapuolten välisessä kommunikaatiossa ja siinä, miten kommunikaatiokanavaa pitkin lähetetty informaatio voidaan tiivistää mahdollisimman tehokkaasti. Oletuksena siinä on, että kaikkien osapuolten tiedossa on mahdollisten viestien joukko ja todennäköisyysjakauma tästä joukosta. Täten Shannonin entropian voidaan tietyssä mielessä katsoa kuvaavan metainformaatiota, tietoa tiedosta. Vastakohtana tälle, Kolmogorov-kompleksisuus keskittyy täysin yksittäisen objektin sisältämään informaatioon. Ehdollisen Kolmogorov-kompleksisuuden tapauksessa tosin tutkitaan mitä informaatiota jokin toinen objekti y sisältää tarkastelun kohteena olevas- 14

18 ta objektista x. Intuitiivisesti on selvää, että mitä pienempi ehdollinen Kolmogorovkompleksisuus on, sitä enemmän informaatiota y sisältää x:stä. Yhtä lailla selvää on, että Kolmogorov-kompleksisuus on yksinkertaisille objekteille pienempi kuin monimutkaisille. Universaalit koodit kuvaavat menetelmiä muodostaa yksikäsitteinen esitys jostakin mallista tai objektista kun ei ole etukäteen varmaa mikä olisi optimaalinen koodaustapa tietylle objektille. Universaaleilla koodeilla voidaan kuitenkin saavuttaa lähes yhtä tehokas tiivistyssuhde kuin parhailla mahdollisilla koodaustavoilla. MDL-periaatteen nykyaikaiset versiot hyödyntävät universaaleja koodeja. MDL-periaatteen ensimmäinen keskeinen idea on, että mitä tahansa säännöllisyyttä datassa voidaan käyttää tiivistämään sitä. Tässä mielessä se on hyvin yhtenäinen Kolmogorovkompleksisuuden kanssa, jota voidaan pitää mittarina merkkijonon säännöllisyydelle. Toinen keskeinen ajatus on, että säännöllisyyttä voidaan hyödyntää datasta oppimiseen. Ajatuksena siis on löytää mahdollisimman hyvä malli kuvaamaan dataa ja jonka ennustusvoima on myös hyvä, sortumatta kuitenkaan oletukseen että jokin tietty hypoteesi olisi datan alkuperäinen lähde. Lähteet GrV08 BaC91 LiV08 Grünwald, P., Vitányi, P., Algorithmic Information Theory CoRR, abs/ , Barron, Andrew R., Cover Thomas M., Minimum Complexity Density Estimation IEEE Transactions on Information Theory, Vol. 37, No. 4, pp , July 1991 Li, M., Vitányi, P., An Introduction to Kolmogorov Complexity and Its 15

19 Applications ISBN: , Springer, 2008 GrV04 Sha48 Gru07 VeV04 Grünwald, P., Vitányi, P., Shannon Information and Kolmogorov Complexity CoRR, cs.it/ , 2004, Shannon, Claude E., A Mathematical Theory of Communication The Bell System Technical Journal, Vol. 27, pp & July & October Grünwald, P., The Minimum Description Length Principle ISBN-13: , The MIT Press, 2007 Vereshchagin, Nikolai K., Vitányi, Paul M. B., Kolmogorov s structure functions and model selection IEEE Transactions on Information Theory, Vol. 50, No. 12, pp , Dec

Matematiikan tukikurssi

Matematiikan tukikurssi Matematiikan tukikurssi Kurssikerta 8 1 Derivaatta Tarkastellaan funktion f keskimääräistä muutosta tietyllä välillä ( 0, ). Funktio f muuttuu tällä välillä määrän. Kun tämä määrä jaetaan välin pituudella,

Lisätiedot

Kolmogorov-kompleksiteetti

Kolmogorov-kompleksiteetti Kolmogorov-kompleksiteetti Laskennan teorian opintopiiri Sebastian Björkqvist 3. helmikuuta 2014 Tiivistelmä Työssä esitetään määritelmät merkkijonon lyhimmälle kuvaukselle sekä Kolmogorov-kompleksiteetille

Lisätiedot

Luento 6. June 1, 2015. Luento 6

Luento 6. June 1, 2015. Luento 6 June 1, 2015 Normaalimuodon pelissä on luontevaa ajatella, että pelaajat tekevät valintansa samanaikaisesti. Ekstensiivisen muodon peleissä pelin jonottaisella rakenteella on keskeinen merkitys. Aluksi

Lisätiedot

Luonnollisten lukujen laskutoimitusten määrittely Peanon aksioomien pohjalta

Luonnollisten lukujen laskutoimitusten määrittely Peanon aksioomien pohjalta Simo K. Kivelä, 15.4.2003 Luonnollisten lukujen laskutoimitusten määrittely Peanon aksioomien pohjalta Aksioomat Luonnolliset luvut voidaan määritellä Peanon aksioomien avulla. Tarkastelun kohteena on

Lisätiedot

Induktio kaavan pituuden suhteen

Induktio kaavan pituuden suhteen Induktio kaavan pituuden suhteen Lauselogiikan objektikieli määritellään kurssilla Logiikka 1B seuraavasti: 1. Lausemuuttujat p 1, p 2, p 3,... ovat kaavoja. 2. Jos A on kaava, niin A on kaava. 3. Jos

Lisätiedot

Johdatus diskreettiin matematiikkaan Harjoitus 7, 28.10.2015

Johdatus diskreettiin matematiikkaan Harjoitus 7, 28.10.2015 Johdatus diskreettiin matematiikkaan Harjoitus 7, 28.10.2015 1. Onko olemassa yhtenäistä verkkoa, jossa (a) jokaisen kärjen aste on 6, (b) jokaisen kärjen aste on 5, ja paperille piirrettynä sivut eivät

Lisätiedot

TILASTOLLINEN LAADUNVALVONTA

TILASTOLLINEN LAADUNVALVONTA 1 Aki Taanila TILASTOLLINEN LAADUNVALVONTA 31.10.2008 2 TILASTOLLINEN LAADUNVALVONTA Tasalaatuisuus on hyvä tavoite, jota ei yleensä voida täydellisesti saavuttaa: asiakaspalvelun laatu vaihtelee, vaikka

Lisätiedot

Matematiikan tukikurssi

Matematiikan tukikurssi Matematiikan tukikurssi Kurssikerta 10 1 Sarjakehitelmiä Palautetaan mieliin, että potenssisarja on sarja joka on muotoa a n (x x 0 ) n = a 0 + a 1 (x x 0 ) + a 2 (x x 0 ) 2 + a 3 (x x 0 ) 3 +. n=0 Kyseinen

Lisätiedot

Matematiikan tukikurssi 3.4.

Matematiikan tukikurssi 3.4. Matematiikan tukikurssi 3.4. Neliömuodot, Hessen matriisi, deiniittisyys, konveksisuus siinä tämän dokumentin aiheet. Neliömuodot ovat unktioita, jotka ovat muotoa T ( x) = x Ax, missä x = (x 1,, x n )

Lisätiedot

Oletetaan, että funktio f on määritelty jollakin välillä ]x 0 δ, x 0 + δ[. Sen derivaatta pisteessä x 0 on

Oletetaan, että funktio f on määritelty jollakin välillä ]x 0 δ, x 0 + δ[. Sen derivaatta pisteessä x 0 on Derivaatta Erilaisia lähestymistapoja: geometrinen (käyrän tangentti sekanttien raja-asentona) fysikaalinen (ajasta riippuvan funktion hetkellinen muutosnopeus) 1 / 13 Derivaatan määritelmä Määritelmä

Lisätiedot

Esimerkkejä derivoinnin ketjusäännöstä

Esimerkkejä derivoinnin ketjusäännöstä Esimerkkejä derivoinnin ketjusäännöstä (5.9.008 versio 1.0) Esimerkki 1 Määritä funktion f(x) = (x 5) derivaattafunktio. Funktio voidaan tulkita yhdistettynä funktiona, jonka ulko- ja sisäfunktiot ovat

Lisätiedot

(x 0 ) = lim. Derivoimissääntöjä. Oletetaan, että funktiot f ja g ovat derivoituvia ja c R on vakio. 1. Dc = 0 (vakiofunktion derivaatta) 2.

(x 0 ) = lim. Derivoimissääntöjä. Oletetaan, että funktiot f ja g ovat derivoituvia ja c R on vakio. 1. Dc = 0 (vakiofunktion derivaatta) 2. Derivaatta kuvaa funktion hetkellistä kasvunopeutta. Geometrisesti tulkittuna funktion derivaatta kohdassa x 0 on funktion kuvaajalle kohtaan x 0 piirretyn tangentin kulmakerroin. Funktio f on derivoituva

Lisätiedot

Epäyhtälön molemmille puolille voidaan lisätä sama luku: kaikilla reaaliluvuilla a, b ja c on voimassa a < b a + c < b + c ja a b a + c b + c.

Epäyhtälön molemmille puolille voidaan lisätä sama luku: kaikilla reaaliluvuilla a, b ja c on voimassa a < b a + c < b + c ja a b a + c b + c. Epäyhtälö Kahden lausekkeen A ja B välisiä järjestysrelaatioita A < B, A B, A > B ja A B nimitetään epäyhtälöiksi. Esimerkiksi 2 < 6, 9 10, 5 > a + + 2 ja ( + 1) 2 2 + 2 ovat epäyhtälöitä. Epäyhtälössä

Lisätiedot

Algoritmit 2. Luento 8 Ke 13.4.2016. Timo Männikkö

Algoritmit 2. Luento 8 Ke 13.4.2016. Timo Männikkö Algoritmit 2 Luento 8 Ke 13.4.2016 Timo Männikkö Luento 8 Rekursioyhtälöt Master-lause Lähin pistepari Ahne menetelmä Lyhin virittävä puu Kruskalin menetelmä Primin menetelmä Merkkitiedon tiivistäminen

Lisätiedot

String-vertailusta ja Scannerin käytöstä (1/2) String-vertailusta ja Scannerin käytöstä (2/2) Luentoesimerkki 4.1

String-vertailusta ja Scannerin käytöstä (1/2) String-vertailusta ja Scannerin käytöstä (2/2) Luentoesimerkki 4.1 String-vertailusta ja Scannerin käytöstä (1/2) Vertailuja tehdessä törmätään usein tilanteeseen, jossa merkkijonoa (esimerkiksi merkkijonomuuttujaa) pitää vertailla toiseen merkkijonoon. Tällöin tavanomainen

Lisätiedot

Diskreetit rakenteet

Diskreetit rakenteet Diskreetit rakenteet 811120P 5 op 7. Oulun yliopisto Tietojenkäsittelytieteiden laitos 2015 / 2016 Periodi 1 Mikä on verkko? verkko (eli graafi) koostuu solmuista ja väleistä, jotka yhdistävät solmuja

Lisätiedot

monissa laskimissa luvun x käänteisluku saadaan näyttöön painamalla x - näppäintä.

monissa laskimissa luvun x käänteisluku saadaan näyttöön painamalla x - näppäintä. .. Käänteisunktio.. Käänteisunktio Mikäli unktio : A B on bijektio, niin joukkojen A ja B alkioiden välillä vallitsee kääntäen yksikäsitteinen vastaavuus eli A vastaa täsmälleen yksi y B, joten myös se

Lisätiedot

Lukion. Calculus. Polynomifunktiot. Paavo Jäppinen Alpo Kupiainen Matti Räsänen Otava PIKATESTIN JA KERTAUSKOKEIDEN TEHTÄVÄT RATKAISUINEEN

Lukion. Calculus. Polynomifunktiot. Paavo Jäppinen Alpo Kupiainen Matti Räsänen Otava PIKATESTIN JA KERTAUSKOKEIDEN TEHTÄVÄT RATKAISUINEEN Calculus Lukion MAA Polynomifunktiot Paavo Jäppinen Alpo Kupiainen Matti Räsänen Otava PIKATESTIN JA KERTAUSKOKEIDEN TEHTÄVÄT RATKAISUINEEN Polynomifunktiot (MAA) Pikatesti ja kertauskokeet Tehtävien ratkaisut

Lisätiedot

arvostelija OSDA ja UDDI palveluhakemistoina.

arvostelija OSDA ja UDDI palveluhakemistoina. Hyväksymispäivä Arvosana arvostelija OSDA ja UDDI palveluhakemistoina. HELSINGIN YLIOPISTO HELSINGFORS UNIVERSITET UNIVERSITY OF HELSINKI Tiedekunta/Osasto Fakultet/Sektion Faculty/Section Laitos Institution

Lisätiedot

Kuntosaliharjoittelun kesto tunteina Kokonaishyöty Rajahyöty 0 0 5 1 5 10 2 15 8 3 23 6 4 29 4 5 33 -

Kuntosaliharjoittelun kesto tunteina Kokonaishyöty Rajahyöty 0 0 5 1 5 10 2 15 8 3 23 6 4 29 4 5 33 - Harjoitukset 1 Taloustieteen perusteet Ratkaisuehdotukset Kesäyliopisto 2014 1. Oheisessa taulukossa on esitettynä kuluttajan saama hyöty kuntosaliharjoittelun kestosta riippuen. a) Laske taulukon tyhjään

Lisätiedot

Lauri Tarkkonen: Kappa kerroin ja rinnakkaisten arvioitsijoiden yhdenmukaisuus

Lauri Tarkkonen: Kappa kerroin ja rinnakkaisten arvioitsijoiden yhdenmukaisuus Lauri Tarkkonen: Kappa kerroin ja rinnakkaisten arvioitsijoiden yhdenmukaisuus Tässä rajoitutaan tarkastelemaan kahden arvioitsijan tapausta, Olettakaamme, että n havaintoa on arvioitu kahden arvioitsijan

Lisätiedot

MAA10 HARJOITUSTEHTÄVIÄ

MAA10 HARJOITUSTEHTÄVIÄ MAA0 Määritä se funktion f: f() = + integraalifunktio, jolle F() = Määritä se funktion f : f() = integraalifunktio, jonka kuvaaja sivuaa suoraa y = d Integroi: a) d b) c) d d) Määritä ( + + 8 + a) d 5

Lisätiedot

Tekijät: Hellevi Kupila, Katja Leinonen, Tuomo Talala, Hanna Tuhkanen, Pekka Vaaraniemi

Tekijät: Hellevi Kupila, Katja Leinonen, Tuomo Talala, Hanna Tuhkanen, Pekka Vaaraniemi 2. OSA: GEOMETRIA Tekijät: Hellevi Kupila, Katja Leinonen, Tuomo Talala, Hanna Tuhkanen, Pekka Vaaraniemi Alkupala Montako tasokuviota voit muodostaa viidestä neliöstä siten, että jokaisen neliön vähintään

Lisätiedot

2.2 Täydellinen yhtälö. Ratkaisukaava

2.2 Täydellinen yhtälö. Ratkaisukaava . Täydellinen yhtälö. Ratkaisukaava Tulon nollasäännöstä näkee silloin tällöin omituisia sovellutuksia. Jotkut näet ajattelevat, että on olemassa myöskin tulon -sääntö tai tulon "mikä-tahansa"- sääntö.

Lisätiedot

1.7 Gradientti ja suunnatut derivaatat

1.7 Gradientti ja suunnatut derivaatat 1.7 Gradientti ja suunnatut derivaatat Funktion ensimmäiset osittaisderivaatat voidaan yhdistää yhdeksi vektorifunktioksi seuraavasti: Missä tahansa pisteessä (x, y), jossa funktiolla f(x, y) on ensimmäiset

Lisätiedot

Dynaamisen järjestelmän siirtofunktio

Dynaamisen järjestelmän siirtofunktio Dynaamisen järjestelmän siirtofunktio Nyt päästään soveltamaan matriisilaskentaa ja Laplace muunnosta. Tutkikaamme, miten lineaarista mallia voidaan käsitellä. Kuten edellä on jo nähty säätötekniikassa

Lisätiedot

Ongelma 1: Onko datassa tai informaatiossa päällekkäisyyttä?

Ongelma 1: Onko datassa tai informaatiossa päällekkäisyyttä? Ongelma 1: Onko datassa tai informaatiossa päällekkäisyyttä? 2012-2013 Lasse Lensu 2 Ongelma 2: Voidaanko dataa tai informaatiota tallettaa tiiviimpään tilaan koodaamalla se uudelleen? 2012-2013 Lasse

Lisätiedot

PHYS-C0220 Termodynamiikka ja statistinen fysiikka Kevät 2016

PHYS-C0220 Termodynamiikka ja statistinen fysiikka Kevät 2016 PHYS-C0220 Termodynamiikka ja statistinen fysiikka Kevät 2016 Emppu Salonen Lasse Laurson Toni Mäkelä Arttu Lehtinen Luento 4: Entropia Pe 4.3.2016 1 AIHEET 1. Klassisen termodynamiikan entropia 2. Entropian

Lisätiedot

Hypoteesin testaus Alkeet

Hypoteesin testaus Alkeet Hypoteesin testaus Alkeet Keijo Ruotsalainen Oulun yliopisto, Teknillinen tiedekunta Matematiikan jaos Johdanto Kokeellinen tutkimus: Varmennetaan teoreettista olettamusta fysikaalisen systeemin käyttäytymisestä

Lisätiedot

Matematiikan tukikurssi

Matematiikan tukikurssi Matematiikan tukikurssi Kurssikerta Integrointi Integrointi on erivoinnin käänteistoimitus: jos funktion F(x) erivaatta on f (x), niin funktion f (x) integraali on F(x). Täten, koska esimerkiksi funktion

Lisätiedot

Funktion raja-arvo 1/6 Sisältö ESITIEDOT: reaalifunktiot

Funktion raja-arvo 1/6 Sisältö ESITIEDOT: reaalifunktiot Funktion raja-arvo 1/6 Sisältö Esimerkki funktion raja-arvosta Lauseke f() = 1 cos määrittelee reaauuttujan reaaliarvoisen funktion f, jonka lähtöjoukko muodostuu nollasta eroavista reaaliluvuista. Periaatteessa

Lisätiedot

Hierarkkiset koeasetelmat. Heliövaara 1

Hierarkkiset koeasetelmat. Heliövaara 1 Hierarkkiset koeasetelmat Heliövaara 1 Hierarkkiset koeasetelmat Kaksiasteista hierarkkista koeasetelmaa käytetään tarkasteltaessa seuraavaa kysymystä: Miten varianssianalyysissa tutkitaan kahden tekijän

Lisätiedot

Johdatus yliopistomatematiikkaan, 2. viikko (2 op)

Johdatus yliopistomatematiikkaan, 2. viikko (2 op) Johdatus yliopistomatematiikkaan, 2. viikko (2 op) Jukka Kemppainen Mathematics Division Yhtälöt ja epäyhtälöt Jokainen osaa ratkaista ensimmäisen asteen yhtälön ax + by + c = 0. Millä parametrien a, b

Lisätiedot

Johdatus tilastotieteeseen Testit järjestysasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen Testit järjestysasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen Testit järjestysasteikollisille muuttujille TKK (c) Ilkka Mellin (2004) 1 Testit järjestysasteikollisille muuttujille Järjestysasteikollisten muuttujien testit Merkkitesti Wilcoxonin

Lisätiedot

Ratkaisuehdotukset Kesäyliopisto 2014. 1. Kuvassa on esitetty erään ravintolan lounasbuffetin kysyntäfunktio.

Ratkaisuehdotukset Kesäyliopisto 2014. 1. Kuvassa on esitetty erään ravintolan lounasbuffetin kysyntäfunktio. Harjoitukset 2 Taloustieteen perusteet Ratkaisuehdotukset Kesäyliopisto 2014 1. Kuvassa on esitetty erään ravintolan lounasbuffetin kysyntäfunktio. a) Mikä on kysynnän hintajousto 12 :n ja 6 :n välillä?

Lisätiedot

Eksponenttifunktion Laplace muunnos Lasketaan hetkellä nolla alkavan eksponenttifunktion Laplace muunnos eli sijoitetaan muunnoskaavaan

Eksponenttifunktion Laplace muunnos Lasketaan hetkellä nolla alkavan eksponenttifunktion Laplace muunnos eli sijoitetaan muunnoskaavaan Laplace muunnos Hieman yksinkertaistaen voisi sanoa, että Laplace muunnos muuttaa derivaatan kertolaskuksi ja integroinnin jakolaskuksi. Tältä kannalta katsottuna Laplace muunnoksen hyödyllisyyden ymmärtää;

Lisätiedot

Mallin arviointi ja valinta. Ennustevirhe otoksen sisällä, parametrimäärän valinta, AIC, BIC ja MDL

Mallin arviointi ja valinta. Ennustevirhe otoksen sisällä, parametrimäärän valinta, AIC, BIC ja MDL Mallin arviointi ja valinta Ennustevirhe otoksen sisällä, parametrimäärän valinta, AIC, BIC ja MDL Sisältö Otoksen ennustevirheen estimointi AIC - Akaiken informaatiokriteeri mallin valintaan Parametrimäärän

Lisätiedot

MS-A0004 - Matriisilaskenta Laskuharjoitus 3

MS-A0004 - Matriisilaskenta Laskuharjoitus 3 MS-A0004 - Matriisilaskenta Laskuharjoitus 3 atkaisut Tehtävä Merkitään matriisin rivejä, 2 ja 3. Gaussin eliminoinnilla saadaan 3 5 4 7 3 5 4 7 3 2 4 2+ 0 3 0 6 6 8 4 3+2 2 0 3 0 6 3 5 4 7 0 3 0 6 3+

Lisätiedot

Taloustieteen perusteet 31A00110 2016 Mallivastaukset 3, viikko 4

Taloustieteen perusteet 31A00110 2016 Mallivastaukset 3, viikko 4 Taloustieteen perusteet 31A00110 2016 Mallivastaukset 3, viikko 4 1. Tarkastellaan pulloja valmistavaa yritystä, jonka päiväkohtainen tuotantofunktio on esitetty alla olevassa taulukossa. L on työntekijöiden

Lisätiedot

Sähköpostiohjeet. Tehokas ja huoleton sähköposti

Sähköpostiohjeet. Tehokas ja huoleton sähköposti Sähköpostiohjeet 1 Uuden PST tiedoston luominen sähköposteille... 3 Tärkeää!... 3 Tiedoston luominen... 3 Kansioiden luominen datatiedostoon... 5 Pikatoimintojen luominen... 8 Odottaa vastausta allekirjoitus...

Lisätiedot

4A 4h. KIMMOKERROIN E

4A 4h. KIMMOKERROIN E TURUN AMMATTIKORKEAKOULU TYÖOHJE 1/5 A h. KIMMOKERROIN E 1. TYÖN TAVOITE 2. TEORIAA Tässä työssä muista töistä poiketen tärkein tavoite on ymmärtää fysikaalisten suureiden keskinäistä riippuvuutta toisistaan

Lisätiedot

30 + x. 15 + 0,5x = 2,5 + x 0,5x = 12,5 x = 25. 27,5a + 27,5b = 1,00 55 = 55. 2,5a + (30 2,5)b (27,5a + 27,5b) = 45 55.

30 + x. 15 + 0,5x = 2,5 + x 0,5x = 12,5 x = 25. 27,5a + 27,5b = 1,00 55 = 55. 2,5a + (30 2,5)b (27,5a + 27,5b) = 45 55. RATKAISUT, Insinöörimatematiikan koe 1.5.201 1. Kahdessa astiassa on bensiinin ja etanolin seosta. Ensimmäisessä astiassa on 10 litraa seosta, jonka tilavuudesta 5 % on etanolia. Toisessa astiassa on 20

Lisätiedot

Lisää segmenttipuusta

Lisää segmenttipuusta Luku 24 Lisää segmenttipuusta Segmenttipuu on monipuolinen tietorakenne, joka mahdollistaa monenlaisten kyselyiden toteuttamisen tehokkaasti. Tähän mennessä olemme käyttäneet kuitenkin segmenttipuuta melko

Lisätiedot

Esimerkki 8. Ratkaise lineaarinen yhtälöryhmä. 3x + 5y = 22 3x + 4y = 4 4x 8y = 32. 3 5 22 r 1 + r 3. 0 13 26 4 8 32 r 3 4r 1. LM1, Kesä 2014 47/68

Esimerkki 8. Ratkaise lineaarinen yhtälöryhmä. 3x + 5y = 22 3x + 4y = 4 4x 8y = 32. 3 5 22 r 1 + r 3. 0 13 26 4 8 32 r 3 4r 1. LM1, Kesä 2014 47/68 Esimerkki 8 Ratkaise lineaarinen yhtälöryhmä 3x + 5y = 22 3x + 4y = 4 4x 8y = 32. 3 5 22 r 1 + r 3 3 4 4 4 8 32 1 3 10 0 13 26 4 8 32 r 3 4r 1 1 3 10 3 4 4 r 2 3r 1 4 8 32 1 3 10 0 13 26 r 2 /13 0 4 8

Lisätiedot

Selainpelien pelimoottorit

Selainpelien pelimoottorit Selainpelien pelimoottorit Teemu Salminen Helsinki 28.10.2017 Seminaaritutkielma Helsingin yliopisto Tietojenkäsittelytiede ! 1 HELSINGIN YLIOPISTO HELSINGFORS UNIVERSITET UNIVERSITY OF HELSINKI Tiedekunta

Lisätiedot

Väli- ja loppuraportointi

Väli- ja loppuraportointi Väli- ja loppuraportointi Hyvän raportin merkitys hankkeen tulosten kuvaamisessa Sari Ahvenainen ESR-koordinaattori 25.5.2011 Uudenmaan ELY-keskus Väliraportti (1/8) Miksi väliraportti tehdään? - Tarkoituksena

Lisätiedot

2.7 Neliöjuuriyhtälö ja -epäyhtälö

2.7 Neliöjuuriyhtälö ja -epäyhtälö 2.7 Neliöjuuriyhtälö ja -epäyhtälö Neliöjuuren määritelmä palautettiin mieleen jo luvun 2.2 alussa. Neliöjuurella on mm. seuraavat ominaisuudet. ab = a b, a 0, b 0 a a b =, a 0, b > 0 b a2 = a a > b, a

Lisätiedot

MATEMATIIKAN KOE, PITKÄ OPPIMÄÄRÄ 18.3.2015 HYVÄN VASTAUKSEN PIIRTEITÄ

MATEMATIIKAN KOE, PITKÄ OPPIMÄÄRÄ 18.3.2015 HYVÄN VASTAUKSEN PIIRTEITÄ MATEMATIIKAN KOE, PITKÄ OPPIMÄÄRÄ 8..5 HYVÄN VASTAUKSEN PIIRTEITÄ Alla oleva vastausten piirteiden, sisältöjen ja pisteitysten luonnehdinta ei sido ylioppilastutkintolautakunnan arvostelua. Lopullisessa

Lisätiedot

Koht dialogia? Organisaation toimintaympäristön teemojen hallinta dynaamisessa julkisuudessa tarkastelussa toiminta sosiaalisessa mediassa

Koht dialogia? Organisaation toimintaympäristön teemojen hallinta dynaamisessa julkisuudessa tarkastelussa toiminta sosiaalisessa mediassa Kohtdialogia? Organisaationtoimintaympäristönteemojenhallinta dynaamisessajulkisuudessatarkastelussatoiminta sosiaalisessamediassa SatuMariaPusa Helsinginyliopisto Valtiotieteellinentiedekunta Sosiaalitieteidenlaitos

Lisätiedot

Aluksi. 2.1. Kahden muuttujan lineaarinen epäyhtälö

Aluksi. 2.1. Kahden muuttujan lineaarinen epäyhtälö Aluksi Matemaattisena käsitteenä lineaarinen optimointi sisältää juuri sen saman asian kuin mikä sen nimestä tulee mieleen. Lineaarisen optimoinnin avulla haetaan ihannearvoa eli optimia, joka on määritelty

Lisätiedot

Viikko 2: Ensimmäiset ennustajat Matti Kääriäinen matti.kaariainen@cs.helsinki.fi

Viikko 2: Ensimmäiset ennustajat Matti Kääriäinen matti.kaariainen@cs.helsinki.fi Viikko 2: Ensimmäiset ennustajat Matti Kääriäinen matti.kaariainen@cs.helsinki.fi Exactum C222, 5.-7.11.2008. 1 Tällä viikolla Sisältösuunnitelma: Ennustamisstrategioista Koneoppimismenetelmiä: k-nn (luokittelu

Lisätiedot

OHJ-1151 Ohjelmointi IIe

OHJ-1151 Ohjelmointi IIe Tampereen teknillinen yliopisto Ohjelmistotekniikan laitos OHJ-1151 Ohjelmointi IIe Harjoitustyö Tomaattisota Välipalautus / Loppudokumentaatio Assistentin nimi Välipalautusaika (päivä ja kellonaika) ja

Lisätiedot

Mat-2.091 Sovellettu todennäköisyyslasku 5. harjoitukset/ratkaisut. Jatkuvat jakaumat

Mat-2.091 Sovellettu todennäköisyyslasku 5. harjoitukset/ratkaisut. Jatkuvat jakaumat Mat-2.09 Sovellettu todennäköisyyslasku /Ratkaisut Aiheet: Jatkuvat jakaumat Avainsanat: Binomijakauma, Eksponenttijakauma, Jatkuva tasainen jakauma, Kertymäfunktio, Mediaani, Normaaliapproksimaatio, Normaalijakauma,

Lisätiedot

TURBOKOODAUS. Miten turbokoodaus eroaa konvoluutiokoodauksesta? 521361A Tietoliikennetekniikka II Osa 26 Kari Kärkkäinen Syksy 2015

TURBOKOODAUS. Miten turbokoodaus eroaa konvoluutiokoodauksesta? 521361A Tietoliikennetekniikka II Osa 26 Kari Kärkkäinen Syksy 2015 1 TURBOKOODAUS Miten turbokoodaus eroaa konvoluutiokoodauksesta? TURBOKOODAUKSEN IDEA 2 V. 1993 keksityt koodit eivät löytyneet systemaattisen koodausteorian soveltamisen seurauksena pyrkimyksenä päästä

Lisätiedot

Käyttöjärjestelmät: Virtuaalimuisti

Käyttöjärjestelmät: Virtuaalimuisti Käyttöjärjestelmät: Virtuaalimuisti Teemu Saarelainen Tietotekniikka teemu.saarelainen@kyamk.fi Lähteet Stallings, W. Operating Systems Haikala, Järvinen, Käyttöjärjestelmät Eri Web-lähteet Muistinhallinta

Lisätiedot

Numeeriset menetelmät

Numeeriset menetelmät Numeeriset menetelmät Luento 9 Ti 4.10.2011 Timo Männikkö Numeeriset menetelmät Syksy 2011 Luento 9 Ti 4.10.2011 p. 1/44 p. 1/44 Funktion approksimointi Etsitään p siten, että p f, mutta ei vaadita, että

Lisätiedot

Keskinäisinformaatiosta

Keskinäisinformaatiosta Keskinäisinformaatiosta Mikko Malinen 31. heinäkuuta, 2008 1 Johdanto Keskinäisinformaatio (mutual information) on tärkeitä informaatioteorian käsitteitä. Keskinäisinformaatio I(X; Y ) on eräs riippuvuuden

Lisätiedot

Numeeriset menetelmät

Numeeriset menetelmät Numeeriset menetelmät Luento 1 Ti 6.9.2011 Timo Männikkö Numeeriset menetelmät Syksy 2011 Luento 1 Ti 6.9.2011 p. 1/28 p. 1/28 Numeriikan termejä Simulointi: Reaalimaailman ilmiöiden jäljitteleminen (yleensä)

Lisätiedot

Algoritmit ja tietorakenteet Copyright Hannu Laine. 1, kun n= 0. n*(n-1)!, kun n>0;

Algoritmit ja tietorakenteet Copyright Hannu Laine. 1, kun n= 0. n*(n-1)!, kun n>0; 1 Rekursio Rekursion periaate ja rekursio määrittelyvälineenä Rekursiota käytetään tietotekniikassa ja matematiikassa erilaisiin tarkoituksiin. Eräänä käyttöalueena on asioiden määrittely. Esimerkkinä

Lisätiedot

Small World networks

Small World networks 1 Jouko Laitinen Tutkija/ käyttövarmuus ja kunnossapito Konstruktiotekniikan laitos 2 Small World networks = Six Degrees of separation Pieni maailma -idean alkuperiä: Bacon numero: Hollywood näyttelijöistä

Lisätiedot

Tietoturva langattomissa verkoissa. Anekdootti

Tietoturva langattomissa verkoissa. Anekdootti Tietoturva langattomissa verkoissa Anekdootti Tapio Väättänen 21.04.2005 Tiivistelmä Tässä tutkimuksessa on tutkittu kattavasti langattomien verkkojen tietoturvaa. Tutkimuksen välineinä on käytetty kannettavaa

Lisätiedot

Päätöksentekomenetelmät

Päätöksentekomenetelmät L u e n t o Päätösongelmia löytyy joka paikasta Hanna Virta / Liikkeenjohdon systeemit Päätöksentekomenetelmät Luennon sisältö Johdanto päätöksentekoon Päätöksenteko eri tilanteissa Päätöspuut Päästökauppa:

Lisätiedot

Testit järjestysasteikollisille muuttujille

Testit järjestysasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit järjestysasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit järjestysasteikollisille muuttujille >> Järjestysasteikollisten

Lisätiedot

Tilastollinen päättely. 5. Väliestimointi. 5.1. Johdanto. 5.2. Luottamusvälien konstruointi. 5.3. Luottamusvälien vertailu

Tilastollinen päättely. 5. Väliestimointi. 5.1. Johdanto. 5.2. Luottamusvälien konstruointi. 5.3. Luottamusvälien vertailu ilastollinen päättely 5.. Johdanto Estimointi, Joukkoestimointi, Kriittinen alue, uottamusjoukko, uottamustaso, uottamusväli, Otos, Parametri, Peittotodennäköisyys, Piste estimointi, Väliestimaatti, Väliestimaattori,

Lisätiedot

FUNKTIONAALIANALYYSIN PERUSKURSSI 1. 0. Johdanto

FUNKTIONAALIANALYYSIN PERUSKURSSI 1. 0. Johdanto FUNKTIONAALIANALYYSIN PERUSKURSSI 1. Johdanto Funktionaalianalyysissa tutkitaan muun muassa ääretönulotteisten vektoriavaruuksien, ja erityisesti täydellisten normiavaruuksien eli Banach avaruuksien ominaisuuksia.

Lisätiedot

Shannonin ensimmäinen lause

Shannonin ensimmäinen lause Shannonin ensimmäinen lause Pro gradu Maija-Liisa Metso Matemaattisten tieteiden laitos Oulun yliopisto Syksy 2014 Sisältö Tiivistelmä 2 1 Johdanto informaatioteoriaan 2 1.1 Informaatioteorian historiaa...................

Lisätiedot

5. www-kierroksen mallit

5. www-kierroksen mallit 5. www-kierroksen mallit Tehtävä 1 Ratkaistaan tasapainopiste merkitsemällä kysyntä- ja tarjontakäyrät yhtäsuuriksi: 3 4 q+20=q+6 q=8 ja sijoittamalla p=14. Kuluttajan ja tuottajan ylijäämä voidaan ratkaista

Lisätiedot

(1) Pekan pakasta vetämät neljä korttia ovat hertta 5, hertta 6, hertta 7 ja pata 7. Mikä on todennäköisyys, että seuraava kortti

(1) Pekan pakasta vetämät neljä korttia ovat hertta 5, hertta 6, hertta 7 ja pata 7. Mikä on todennäköisyys, että seuraava kortti Todennäköisyyslaskenta: sarja 1 Todennäköisyyyslaskenta-tehtäväsarjassa on tehtäviä seuraavista asioista: klassinen todennäköisyys, todennäköisyyden laskusäännöt, kombinatoriikka, toistokoe sekä diskreetti-

Lisätiedot

Raportointi hankkeen tulosten kuvaajana ja toteutuksen tukena

Raportointi hankkeen tulosten kuvaajana ja toteutuksen tukena Raportointi hankkeen tulosten kuvaajana ja toteutuksen tukena Tiivistelmät, väli- ja loppuraportit Auli Vuorela ESR-koordinaattori Uudenmaan ELY-keskus 6.5.2013 Raportteja, raportteja, raportteja Loppuraportti

Lisätiedot

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 7.6.2011 Ratkaisut ja arvostelu

VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 7.6.2011 Ratkaisut ja arvostelu VALTIOTIETEELLINEN TIEDEKUNTA TILASTOTIETEEN VALINTAKOE 7.6.2011 Ratkaisut ja arvostelu 1.1 Noudattakoon satunnaismuuttuja X normaalijakaumaa a) b) c) d) N(5, 15). Tällöin P (1.4 < X 12.7) on likimain

Lisätiedot

Testejä suhdeasteikollisille muuttujille

Testejä suhdeasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman

Lisätiedot

5.2 Eulerin kehät ja -polut

5.2 Eulerin kehät ja -polut 5.2 Eulerin kehät ja -polut Königsbergin sillat: onko mahdollista tehdä (kuivin jaloin) kävelyretki siten, että jokainen silta kuljetaan tasan kerran Eulerin polku on verkon polku, joka kulkee jokaisen

Lisätiedot

Huomaa, että 0 kitkakerroin 1. Aika harvoin kitka on tasan 0. Koska kitkakerroin 1, niin

Huomaa, että 0 kitkakerroin 1. Aika harvoin kitka on tasan 0. Koska kitkakerroin 1, niin Kun alat vetää jotain esinettä pitkin alustaa, huomaat, että tarvitaan tietty nollaa suurempi voima ennen kuin mainittu esine lähtee edes liikkeelle. Yleensä on vielä niin, että liikkeelle lähteminen vaatii

Lisätiedot

3. Useamman kuin kahden muuttujan yhteyden kuvaus

3. Useamman kuin kahden muuttujan yhteyden kuvaus 3. Useamman kuin kahden muuttujan yhteyden kuvaus 25 a) Kolmisuuntaiset ristiintaulukot Ristiintaulukoinnin ei tarvitse mitenkään välttämättä pysähtyä aiemmin esitettyyn kaksisuuntaiseen taulukkoon; melko

Lisätiedot

Kenguru 2016 Mini-Ecolier (2. ja 3. luokka) Ratkaisut

Kenguru 2016 Mini-Ecolier (2. ja 3. luokka) Ratkaisut sivu 1 / 11 TEHTÄVÄ 1 2 3 4 5 6 VASTAUS E B C D D A TEHTÄVÄ 7 8 9 10 11 12 VASTAUS E C D C E C TEHTÄVÄ 13 14 15 16 17 18 VASTAUS A B E E B A sivu 2 / 11 3 pistettä 1. Anni, Bert, Camilla, David ja Eemeli

Lisätiedot

Sähköstaattisen potentiaalin laskeminen

Sähköstaattisen potentiaalin laskeminen Sähköstaattisen potentiaalin laskeminen Potentiaalienegia on tuttu mekaniikan kussilta eikä se ole vieas akielämässäkään. Sen sijaan potentiaalin käsite koetaan usein vaikeaksi. On hyvä muistaa, että staattisissa

Lisätiedot

Aika/Datum Month and year Kesäkuu 2012

Aika/Datum Month and year Kesäkuu 2012 Tiedekunta/Osasto Fakultet/Sektion Faculty Laitos/Institution Department Filosofian, historian, kulttuurin ja taiteiden tutkimuksen laitos Humanistinen tiedekunta Tekijä/Författare Author Veera Lahtinen

Lisätiedot

Teen koko ajan aktiivista mainontaa Googlessa. Tavoite on olla etusivulla, kun haetaan henkisiä tapahtumia, kursseja, yrittäjiä.

Teen koko ajan aktiivista mainontaa Googlessa. Tavoite on olla etusivulla, kun haetaan henkisiä tapahtumia, kursseja, yrittäjiä. 1 Palvelut ja Hinnasto 4.3.2016 Palvelut Ilmaisia sivuja ovat Tapahtumakalenteri, Yrityksiä ja Vuokrattavia tiloja. Näillä sivuilla on lomakkeet, joilla saat tapahtuman ja yrityksesi sivuille. Valokeilassa

Lisätiedot

FILOSOFIA JA USKONTO LÄNSIMAINEN NÄKÖKULMA USKONTOON. Thursday, February 19, 15

FILOSOFIA JA USKONTO LÄNSIMAINEN NÄKÖKULMA USKONTOON. Thursday, February 19, 15 FILOSOFIA JA USKONTO LÄNSIMAINEN NÄKÖKULMA USKONTOON USKONNONFILOSOFIA HY USKONNONFILOSOFIAA OPISKELLAAN JA TUTKITAAN SEURAAVISSA TIETEISSÄ: TEOLOGINEN TIEDEKUNTA (KRISTILLINEN PUOLI) TEOREETTINEN FILOSOFIA

Lisätiedot

Dominointianalyysi. Teppo Niinimäki. Helsinki Approksimointialgoritmit HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos

Dominointianalyysi. Teppo Niinimäki. Helsinki Approksimointialgoritmit HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos Dominointianalyysi Teppo Niinimäki Helsinki 10.5.2010 Approksimointialgoritmit HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos HELSINGIN YLIOPISTO HELSINGFORS UNIVERSITET UNIVERSITY OF HELSINKI Tiedekunta

Lisätiedot

ARVIOINTIPERIAATTEET

ARVIOINTIPERIAATTEET PSYKOLOGIAN YHTEISVALINNAN VALINTAKOE 2012 ARVIOINTIPERIAATTEET Copyright Helsingin yliopisto, käyttäytymistieteiden laitos, Materiaalin luvaton kopiointi kielletty. TEHTÄVÄ 1. (max. 34.5 pistettä) 1 a.i)

Lisätiedot

KiVa Koulu tilannekartoituskysely 2016 sivu 1/31. KiVa Koulu tilannekartoituskysely 2016 sivu 2/31. KiVa Koulu tilannekartoituskysely 2016 sivu 3/31

KiVa Koulu tilannekartoituskysely 2016 sivu 1/31. KiVa Koulu tilannekartoituskysely 2016 sivu 2/31. KiVa Koulu tilannekartoituskysely 2016 sivu 3/31 KiVa Koulu tilannekartoituskysely 2016 sivu 1/31 Tervetuloa täyttämään kysely! Koulutunnus: Oppilaiden tilannekartoitussalasana: Kirjaudu kyselyyn KiVa Koulu tilannekartoituskysely 2016 sivu 2/31 Kukaan

Lisätiedot

II- luento. Etiikan määritelmiä. Eettisen ajattelu ja käytänteet. 1 Etiikka on oikean ja väärän tutkimusta

II- luento. Etiikan määritelmiä. Eettisen ajattelu ja käytänteet. 1 Etiikka on oikean ja väärän tutkimusta II- luento Eettisen ajattelu ja käytänteet Etiikan määritelmiä 1 Etiikka on oikean ja väärän tutkimusta 2. Etiikka ei ole samaa kuin moraali, se on moraalin tutkimusta 3. Etiikka ei ole tutkimusta siitä,

Lisätiedot

TW- EAV510: WDS- TOIMINTO KAHDEN TW- EAV510 LAITTEEN VÄLILLÄ

TW- EAV510: WDS- TOIMINTO KAHDEN TW- EAV510 LAITTEEN VÄLILLÄ TWEAV510: WDSTOIMINTO KAHDEN TWEAV510 LAITTEEN VÄLILLÄ Alla kaksi vaihtoehtoista ohjetta WDSverkon luomiseksi Ohje 1: WDSyhteys käyttää WPAsalausta. Tässä ohjeessa WDSyhteys toimii vain, kun tukiasema

Lisätiedot

Osa 2: Otokset, otosjakaumat ja estimointi

Osa 2: Otokset, otosjakaumat ja estimointi Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Väliestimointi TKK (c) Ilkka Mellin (2007) 1 Väliestimointi >> Todennäköisyysjakaumien parametrien estimointi Luottamusväli

Lisätiedot

Lyhimmän kuvauspituuden periaate mallin valinnassa

Lyhimmän kuvauspituuden periaate mallin valinnassa hyväksymispäivä arvosana arvostelija Lyhimmän kuvauspituuden periaate mallin valinnassa Eric Andrews Helsinki 6.5.2011 Kandidaatintutkielma HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos HELSINGIN

Lisätiedot

EUROOPAN YHTEISÖJEN KOMISSIO. Ehdotus: NEUVOSTON ASETUS. neljännesvuosittaista julkista velkaa koskevien tietojen laatimisesta ja toimittamisesta

EUROOPAN YHTEISÖJEN KOMISSIO. Ehdotus: NEUVOSTON ASETUS. neljännesvuosittaista julkista velkaa koskevien tietojen laatimisesta ja toimittamisesta EUROOPAN YHTEISÖJEN KOMISSIO Bryssel 9.12.2003 KOM(2003) 761 lopullinen 2003/0295 (CNS) Ehdotus: NEUVOSTON ASETUS neljännesvuosittaista julkista velkaa koskevien tietojen laatimisesta ja toimittamisesta

Lisätiedot

1 Määrittelyjä ja aputuloksia

1 Määrittelyjä ja aputuloksia 1 Määrittelyjä ja aputuloksia 1.1 Supremum ja infimum Aluksi kerrataan pienimmän ylärajan (supremum) ja suurimman alarajan (infimum) perusominaisuuksia ja esitetään muutamia myöhemmissä todistuksissa tarvittavia

Lisätiedot

11.4. Rakenteellista käsittelyä tilavuusrenderöintialgoritmeissa

11.4. Rakenteellista käsittelyä tilavuusrenderöintialgoritmeissa 11.4. Rakenteellista käsittelyä tilavuusrenderöintialgoritmeissa Tilavuusdatan katseluprosessi on käsitteellisesti yksinkertaista. Se pitää sisällään tilavuuden kierron katselusuuntaan ja sitten säteen

Lisätiedot

Tarkastelemme ensin konkreettista esimerkkiä ja johdamme sitten yleisen säännön, joilla voidaan tietyissä tapauksissa todeta kielen ei-säännöllisyys.

Tarkastelemme ensin konkreettista esimerkkiä ja johdamme sitten yleisen säännön, joilla voidaan tietyissä tapauksissa todeta kielen ei-säännöllisyys. Ei-säännöllisiä kieliä [Sipser luku 1.4] Osoitamme, että joitain kieliä ei voi tunnistaa äärellisellä automaatilla. Tulos ei sinänsä ole erityisen yllättävä, koska äärellinen automaatti on äärimmäisen

Lisätiedot

Derivaatta, interpolointi, L6

Derivaatta, interpolointi, L6 , interpolointi, L6 1 Wikipeia: (http://fi.wikipeia.org/wiki/ ) Etälukio: (http://193.166.43.18/etalukio/ pitka_matematiikka/kurssi7/maa7_teoria10.html ) Maths online: (http://www.univie.ac.at/future.meia/

Lisätiedot

KEMA221 2009 KEMIALLINEN TASAPAINO ATKINS LUKU 7

KEMA221 2009 KEMIALLINEN TASAPAINO ATKINS LUKU 7 KEMIALLINEN TASAPAINO Määritelmiä Kemiallinen reaktio A B pyrkii kohti tasapainoa. Yleisessä tapauksessa saavutetaan tasapainoa vastaava reaktioseos, jossa on läsnä sekä lähtöaineita että tuotteita: A

Lisätiedot

Racket ohjelmointia. Tiina Partanen 2014

Racket ohjelmointia. Tiina Partanen 2014 Racket ohjelmointia Tiina Partanen 2014 Sisältö 1) Peruslaskutoimitukset 2) Peruskuvioiden piirtäminen 3) Määrittelyt (define) 4) Yhdistettyjen kuvien piirtäminen 5) Muuttujat ja funktiot 6) Animaatiot

Lisätiedot

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een

031021P Tilastomatematiikka (5 op) kertausta 2. vk:een 031021P Tilastomatematiikka (5 op) kertausta 2. vk:een Jukka Kemppainen Mathematics Division 2. välikokeeseen Toinen välikoe on la 31.03.2012 klo. 9.00-12.00 saleissa L1,L3 Jukka Kemppainen Mathematics

Lisätiedot

Taulukkolaskenta II. Taulukkolaskennan edistyneempiä piirteitä

Taulukkolaskenta II. Taulukkolaskennan edistyneempiä piirteitä Taulukkolaskenta II Taulukkolaskennan edistyneempiä piirteitä Edistyneempää taulukkolaskentaa Tekstitiedoston tuonti taulukkolaskentaohjelmaan Lajittelu - taulukon lajittelu pyydettyjen sarakkeiden mukaan

Lisätiedot

MIKROTEORIA, HARJOITUS 4 KULUTTAJAN YLIJÄÄMÄ, MARKKINAKYSYNTÄ JA TASAPAINO

MIKROTEORIA, HARJOITUS 4 KULUTTAJAN YLIJÄÄMÄ, MARKKINAKYSYNTÄ JA TASAPAINO MIKROTEORIA, HARJOITUS 4 KULUTTAJAN YLIJÄÄMÄ, MARKKINAKYSYNTÄ JA TASAPAINO HUOM! Kun arvioidaan politiikkamuutoksen vaikutusta kuluttajien hyvinvointiin, täytyy pohtia kahta vaihetta: 1) miten muutos vaikuttaa

Lisätiedot

P A R T. Professional Assault Response Training 2002. Seppo Salminen Auroran koulu. Valtakunnalliset sairaalaopetuksen koulutuspäivät 16.11.

P A R T. Professional Assault Response Training 2002. Seppo Salminen Auroran koulu. Valtakunnalliset sairaalaopetuksen koulutuspäivät 16.11. P A R T Professional Assault Response Training 2002 Seppo Salminen Auroran koulu Valtakunnalliset sairaalaopetuksen koulutuspäivät 16.11.2007 PART -taustaa Ammatillista reagointia uhkaavissa ja väkivaltaisissa

Lisätiedot

POTENSSIINKOROTUSALGORITMIT JA NIIDEN VERTAILU RSA:SSA

POTENSSIINKOROTUSALGORITMIT JA NIIDEN VERTAILU RSA:SSA POTENSSIINKOROTUSALGORITMIT JA NIIDEN VERTAILU RSA:SSA Mirka Räzm Pro gradu -tutkielma Kesäkuu 2012 MATEMATIIKAN JA TILASTOTIETEEN LAITOS TURUN YLIOPISTO TURUN YLIOPISTO Matematiikan ja tilastotieteen

Lisätiedot

Matematiikan tukikurssi. Syksy 2009

Matematiikan tukikurssi. Syksy 2009 Matematiikan tukikurssi Syksy 2009 Sisältö I Ensimmäinen välikoe 5 Matemaattisesta päättelystä 5 2 Toisen asteen yhtälöistä 6 3 Joukko-oppia 8 4 Funktiokäsitteestä 5 Määrittelyjoukoista 6 6 Relaatioista

Lisätiedot

Learning cafen yhteenveto. Helsinki 23.1.2014

Learning cafen yhteenveto. Helsinki 23.1.2014 Learning cafen yhteenveto Helsinki 23.1.2014 Miten ohjaamme asiakkaita ammatilliseen kuntoutukseen? Tieto tulleista muutoksista (palveluntuottajat), tiedon jakaminen sidosryhmille/ammattilaisille ja asiakkaille

Lisätiedot