Relevanttien sivujen etsintä verkosta: satunnaiskulut verkossa Linkkikeskukset ja auktoriteetit (hubs and authorities) -algoritmi

Samankaltaiset tiedostot
Luku 8. Diskreettejä menetelmiä laajojen 0-1 datajoukkojen analyysiin

Kurssin loppuosa. Luku 8. Diskreettejä menetelmiä laajojen 0-1 datajoukkojen analyysiin. Suuret 0-1 datajoukot. Tämän luvun sisältö

Sovellettu todennäköisyyslaskenta B

Etsintä verkosta (Searching from the Web) T Datasta tietoon Heikki Mannila, Jouni Seppänen

Tilastotieteen kertaus. Vilkkumaa / Kuusinen 1

Tilastollisia peruskäsitteitä ja Monte Carlo

D ( ) E( ) E( ) 2.917

4. laskuharjoituskierros, vko 7, ratkaisut

Johdatus tilastotieteeseen Testit laatueroasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Etsintä verkosta (Searching from the Web) T Datasta tietoon Jouni Seppänen

Testit laatueroasteikollisille muuttujille

MAT Todennäköisyyslaskenta Tentti / Kimmo Vattulainen

811120P Diskreetit rakenteet

Diskreetin satunnaismuuttujan odotusarvo, keskihajonta ja varianssi

Gripenberg. MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi Tentti ja välikoeuusinta

χ = Mat Sovellettu todennäköisyyslasku 11. harjoitukset/ratkaisut

Ratkaisu: a) Kahden joukon yhdisteseen poimitaan kaikki alkiot jotka ovat jommassakummassa joukossa (eikä mitään muuta).

Todennäköisyyslaskenta I, kesä 2017 Helsingin yliopisto/avoin Yliopisto Harjoitus 1, ratkaisuehdotukset

4.1. Olkoon X mielivaltainen positiivinen satunnaismuuttuja, jonka odotusarvo on

Testejä suhdeasteikollisille muuttujille

Olkoon seuraavaksi G 2 sellainen tasan n solmua sisältävä suunnattu verkko,

Sovellettu todennäköisyyslaskenta B

A ja B pelaavat sarjan pelejä. Sarjan voittaja on se, joka ensin voittaa n peliä.

Jos nollahypoteesi pitää paikkansa on F-testisuuren jakautunut Fisherin F-jakauman mukaan

3.7 Todennäköisyysjakaumia

Tilaston esittäminen frekvenssitaulukossa ja graafisesti. Keskiluvut luokittelemattomalle ja luokitellulle aineistolle: moodi, mediaani, keskiarvo.

Luku 9. Relevanttien sivujen etsintä verkosta: satunnaiskulut verkossa

Mat Sovellettu todennäköisyyslasku A

Juuri 10 Tehtävien ratkaisut Kustannusosakeyhtiö Otava päivitetty

11. laskuharjoituskierros, vko 15, ratkaisut

Taulun avoimista haaroista saadaan kelvolliset lausejoukot

Ilkka Mellin (2008) 1/5

Tämän luvun sisältö. Luku 9. Relevanttien sivujen etsintä verkosta: satunnaiskulut verkossa. Webin lyhyt historia 1992: ensimmäisiä selaimia

isomeerejä yhteensä yhdeksän kappaletta.

Sovellettu todennäköisyyslaskenta B

T Luonnollisen kielen tilastollinen käsittely Vastaukset 3, ti , 8:30-10:00 Kollokaatiot, Versio 1.1

Sovellettu todennäköisyyslaskenta B

Lineaariset yhtälöryhmät ja matriisit

7. Satunnaisalgoritmit (randomized algorithms)

811120P Diskreetit rakenteet

MS-A0004/A0006 Matriisilaskenta

dx=2&uilang=fi&lang=fi&lvv=2015

1. Kuusisivuista noppaa heitetään, kunnes saadaan silmäluku 5 tai 6. Olkoon X niiden heittojen lukumäärä, joilla tuli 1, 2, 3 tai 4.

Käytetään satunnaismuuttujaa samoin kuin tilastotieteen puolella:

30A02000 Tilastotieteen perusteet

T Datasta tietoon, syksy 2005 Laskuharjoitus 8.12., ratkaisuja Jouni Seppänen

Ilkka Mellin Todennäköisyyslaskenta. Osa 3: Todennäköisyysjakaumia. Diskreettejä jakaumia. TKK (c) Ilkka Mellin (2007) 1

Sovellettu todennäköisyyslaskenta B

Tilastollinen päättely II, kevät 2017 Harjoitus 1A

Todennäköisyysjakaumia

6. laskuharjoitusten vastaukset (viikot 10 11)

Johdatus tn-laskentaan torstai

Sovellettu todennäköisyyslaskenta B

Johdatus todennäköisyyslaskentaan Diskreettejä jakaumia. TKK (c) Ilkka Mellin (2005) 1

Lohkoasetelmat. Vilkkumaa / Kuusinen 1

Tilastollinen aineisto Luottamusväli

PARITUS KAKSIJAKOISESSA

T Luonnollisten kielten tilastollinen käsittely

V. V. Vazirani: Approximation Algorithms, luvut 3-4 Matti Kääriäinen

Formalisoidaan hieman täsmällisemmin, millaisia suoritustakuita satunnaisalgoritmeilta voidaan vaatia.

Johdatus todennäköisyyslaskentaan Normaalijakaumasta johdettuja jakaumia. TKK (c) Ilkka Mellin (2005) 1

(b) Tarkista integroimalla, että kyseessä on todella tiheysfunktio.

Johdatus tilastotieteeseen Testit suhdeasteikollisille muuttujille. TKK (c) Ilkka Mellin (2004) 1

Todennäköisyyden ominaisuuksia

Matriisi-vektori-kertolasku, lineaariset yhtälöryhmät

Todennäköisyyslaskun kertaus. Vilkkumaa / Kuusinen 1

Otosavaruus ja todennäköisyys Otosavaruus Ë on joukko, jonka alkiot ovat kokeen tulokset Tapahtuma on otosavaruuden osajoukko

Suotuisien tapahtumien lukumäärä Kaikki alkeistapahtumien lukumäärä

Tehtävä 4 : 2. b a+1 (mod 3)

Tuloperiaate. Oletetaan, että eräs valintaprosessi voidaan jakaa peräkkäisiin vaiheisiin, joita on k kappaletta

Johdatus tn-laskentaan perjantai

Jos nyt on saatu havaintoarvot Ü ½ Ü Ò niin suurimman uskottavuuden

Testit järjestysasteikollisille muuttujille

Lisää Diskreettejä jakaumia Lisää Jatkuvia jakaumia Normaalijakaumasta johdettuja jakaumia

Jatkuvat satunnaismuuttujat

Algoritmi on periaatteellisella tasolla seuraava:

Talousmatematiikan perusteet: Luento 11. Lineaarikuvaus Matriisin aste Käänteismatriisi

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Tutkimustiedonhallinnan peruskurssi

(b) Onko hyvä idea laske pinta-alan odotusarvo lähetmällä oletuksesta, että keppi katkeaa katkaisukohdan odotusarvon kohdalla?

ABHELSINKI UNIVERSITY OF TECHNOLOGY

tilastotieteen kertaus

Harjoitus 7: NCSS - Tilastollinen analyysi

Lineaariavaruudet. Span. Sisätulo. Normi. Matriisinormit. Matriisinormit. aiheita. Aiheet. Reaalinen lineaariavaruus. Span. Sisätulo.

Tilastotieteen kertaus. Kuusinen/Heliövaara 1

Lohkoasetelmat. Heliövaara 1

= 5! 2 2!3! = = 10. Edelleen tästä joukosta voidaan valita kolme särmää yhteensä = 10! 3 3!7! = = 120

Algoritmit 2. Luento 12 To Timo Männikkö

MS-A0501 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

5. laskuharjoituskierros, vko 8, ratkaisut

Normaalijakaumasta johdettuja jakaumia

Diskreetit todennäköisyysjakaumat. Kertymäfunktio Odotusarvo Binomijakauma Poisson-jakauma

Diskreetin matematiikan perusteet Laskuharjoitus 1 / vko 8

Osittaistuenta Gaussin algoritmissa: Etsitään 1. sarakkeen itseisarvoltaan suurin alkio ja vaihdetaan tämä tukialkioiksi (eli ko. rivi 1. riviksi).

D ( ) Var( ) ( ) E( ) [E( )]

Sovellettu todennäköisyyslaskenta B

Kurssilla esitetään lyhyt katsaus niihin todennäköisyyden ja satunnaisprosessien peruskäsitteisiin ja -ominaisuuksiin, joita tarvitaan digitaalisten

Matriisit, L20. Laskutoimitukset. Matriisikaavoja. Aiheet. Määritelmiä ja merkintöjä. Laskutoimitukset. Matriisikaavoja. Matriisin transpoosi

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

Transkriptio:

Kurssin loppuosa Diskreettejä menetelmiä laajojen 0-1 datajoukkojen analyysiin Kattavat joukot ja niiden etsintä tasoittaisella algoritmilla Relevanttien sivujen etsintä verkosta: satunnaiskulut verkossa Linkkikeskukset ja auktoriteetit (hubs and authorities) -algoritmi Sekvenssien segmentointi Dynaaminen ohjelmointi Kutakin asiaa vain raapaistaan; kaikki merkittäviä tutkimusalueita TKK, Informaatiotekniikan laboratorio 1

Diskreettejä menetelmiä laajojen 0-1 datajoukkojen analyysiin Suuret 0-1 datajoukot Datan kuvailua Usein esiintyvien muuttujakombinaatioiden etsintä: kattavat joukot TKK, Informaatiotekniikan laboratorio 2

Suuret 0-1 datajoukot Paljon muuttujia (rivejä), paljon sarakkeita (havaintoja) 0-1 dataa: esiintymädataa Esiintyykö jokin tietty ilmiö tietyssä havainnossa Matriisin (taulun) D alkio D(m, h) kertoo, esiintyykö muuttujan m kuvaama ilmiö havainnossa h D(m, h) = 1 tai D(m, h) = 0 TKK, Informaatiotekniikan laboratorio 3

Esimerkkejä Sanojen esiintyminen dokumenteissa Havainto: dokumentti Muuttuja: (perusmuodossa oleva) sana Data D(s, d) = 1 : esiintyikö sana s ainakin kerran dokumentissa d? Webbisivut Havainto: webbisivu Muuttuja: webbisivu D(s, p) = 1 jos ja vain jos sivulta s on linkki sivulle p TKK, Informaatiotekniikan laboratorio 4

Lisää esimerkkejä Nisäkäslajien esiintyminen luonnossa Havainto: 50x50 km ruutu r Muuttuja: Nisäkäslaji l D(l, r) = 1 jos ja vain jos laji l esiintyi ruudussa r Osamolekyylien esiintyminen molekyyleissä Havainto: Molekyyli m (tyypillisesti suuri) Muuttuja: Molekyyli p (pienempi) D(p, m) = 1 jos ja vain jos molekyyli p on osa molekyyliä m TKK, Informaatiotekniikan laboratorio 5

Dokumenttiesimerkki Erillisenä. TKK, Informaatiotekniikan laboratorio 6

0-1 datajoukko verkkona Verkko: joukko solmuja, joista osa on yhdistetty toisiinsa kaarilla 0-1-datajoukosta on helppo tehdä kaksijakoinen (bipartite) verkko: muuttujat ja havainnot ovat solmuja, ja muuttujan ja havainnon välillä on kaari jos ja vain jos vastaava datan arvo on 1 h 1 h 2 h 3 h 4 h 5 h 6 m 1 1 0 1 0 0 1 m 2 1 1 0 0 0 0 m 3 0 0 1 1 0 0 m 4 0 0 1 0 1 1 TKK, Informaatiotekniikan laboratorio 7

TKK, Informaatiotekniikan laboratorio 8

Mitä tällaisesta datasta voisi etsiä? Mitä datassa on? Minkälaisia ryhmittymiä datan muuttujilla ja havainnoilla on? Miten muuttujat riippuvat toisistaan? Jne. Muuttujien ja havaintojen astelukujen analyysi (kuinka monta kaarta muuttujasta lähtee, eli kuinka monessa havainnossa muuttuja on mukana): power laws hyvin aktiivinen tutkimusalue Jatkossa: miten etsitään pieniä kiinnostavia muuttujajoukkoja TKK, Informaatiotekniikan laboratorio 9

Merkintöjä n havaintoa {}}{ d muuttujaa X d-ulotteinen havaintovektori x; sen alkiot x 1, x 2,..., x d Useat havaintovektorit x(1),...,x(n) Havaintovektorin x(j) muuttujan i arvoa merkitään x(i, j) TKK, Informaatiotekniikan laboratorio 10

Usein esiintyvien (kattavien) muuttujajoukkojen etsintä Jos muuttujia on esim. 30000, kaikkien parittaisten korrelaatioiden etsintä ei ole mahdollista. Usein yhdessä esiintyvät muuttujat? Etsi kaikki muuttujaparit (a, b) siten että on olemassa ainakin N havaintoa x(i), jolla x(a, i) = 1 ja x(b, i) = 1. Yleisemmin: etsi kaikki muuttujajoukot {a 1, a 2,...,a k } siten että on olemassa ainakin N havaintoa x(i), jolla x(a 1, i) = 1 ja x(a 2, i) = 1 ja... ja x(a k, i) = 1. Kutsutaan tällaista muuttujajoukkoa {a 1, a 2,...,a k } kattavaksi (engl. frequent set). TKK, Informaatiotekniikan laboratorio 11

Miten paljon kattavia joukkoja on? Jos datassa on pelkkiä ykkösiä, niin kaikki muuttujaparit tai muuttujaosajoukot täyttävät o. ehdon Ongelman mielekkyys edellyttää, että data on harvaa. Koneoppimisterminologialla: etsitään usein esiintyviä positiivisia konjunktioita TKK, Informaatiotekniikan laboratorio 12

Miten kattavia muuttujajoukkoja etsitään? Triviaali lähestymistapa: käydään läpi kaikki muuttujien osajoukot d muuttujaa 2 d muuttujaosajoukkoa Jos muuttujia on esim. 100, niin osajoukkoja on liikaa Täytyy siis toimia jotenkin nokkelammin Perushavainto: jos muuttujajoukko {a 1, a 2,...,a k } on kattava, niin kaikki sen osajoukot ovat kattavia. Kääntäen: {a 1, a 2,...,a k } voi olla kattava vain jos jokainen sen osajoukko on kattava TKK, Informaatiotekniikan laboratorio 13

Esimerkki Oletetaan, että muuttujat 1, 2, 3, 5, 6, 7 esiintyvät tarpeeksi usein Silloin pari (a, b) on mahdollisesti kattava joukko, kun a, b = 1,...,7. Oletetaan, että parit {1, 2}, {1, 3}, {1, 5, }, {1, 6}, {2, 3}, {2, 5}, {3, 7} ovat kattavia Silloin {1, 2, 3} ja {1, 2, 5} ovat ainoat mahdolliset kolmen kokoiset kattavat joukot (Ja itse asiassa tiedämme, että mitään neljän kokoista kattavaa joukkoa ei voi olla.) TKK, Informaatiotekniikan laboratorio 14

Tasoittainen algoritmi Etsitään ensin yhden kokoiset kattavat joukot, sitten kahden jne. Kattavat joukot jossa on yksi alkio: muuttuja a,, jolla on vähintään N arvoa 1 datassa, ts. vähintään N havaintoa (saraketta) i, jolla x(a, i) = 1 Nämä on helppo etsiä lukemalla data kertaalleen läpi ja laskemalla kunkin muuttujan esiintymisfrekvenssi TKK, Informaatiotekniikan laboratorio 15

Tasoittainen algoritmi, jatkoa Kun yhden kokoiset kattavat joukot tunnetaan, niin muodostetaan kahden kokoiset ehdokasjoukot Muuttujajoukko {a, b} on ehdokasjoukko, jos sekä {a} että {b} ovat kattavia Käydään data uudestaan läpi ja lasketaan kullekin ehdokasjoukolle kuinka monessa havainnossa on sekä a- että b-muuttujan kohdalla 1. Näin löydetään kahden kokoiset kattavat joukot. TKK, Informaatiotekniikan laboratorio 16

Tasoittainen algoritmi, jatkoa Oletetaan, että tunnetaan kaikki k:n kokoiset kattavat joukot; olkoon tämä kokoelma C k Muodostetaan kokoa k + 1 olevat ehdokasjoukot: joukot jotka saattaisivat olla kattavia Ts. sellaiset muuttujajoukot, joissa on k + 1 alkiota, jo jonka kaikki osajoukot ovat kattavia Riittää tarkastaa, että kaikki k alkiota sisältävät osajoukot ovat kattavia Otetaan kaikki joukkoparit A = {a 1,...,a k } ja B = {b 1,...,b k } kokoelmasta C k, lasketaan niiden yhdiste A B, tarkistetaan että yhdisteessä on k + 1 alkiota ja että sen kaikki k:n alkion osajoukot ovat kattavia (ts. kuuluvat kokoelmaan C k ). TKK, Informaatiotekniikan laboratorio 17

Tasoittainen algoritmi, jatkoa Kun k + 1:n kokoiset ehdokasjoukot on laskettu, niin käydään data läpi ja lasketaan kullakin ehdokasjoukolla, monellako rivillä ehdokasjoukon kaikki muuttujat ovat =1. Näin löydetään kokoa k + 1 olevat kattavat joukot. Algoritmia jatketaan kunnes uusia ehdokasjoukkoja ei enää löydy. TKK, Informaatiotekniikan laboratorio 18

Esimerkki tasoittaisen algoritmin tuloksesta Erillisenä. TKK, Informaatiotekniikan laboratorio 19

Mitä muuttujajoukon kattavuus merkitsee? Jos muuttujajoukko esiintyy usein, voiko se johtua sattumasta? Olkoot a ja b muuttujia, ja olkoon datassa n a havaintoa, joissa a esiintyy ja n b havaintoa, joissa b esiintyy Kaikkiaan n havaintoa p(a = 1): todennäköisyys sille, että satunnaisesti valitussa havainnossa on a = 1 p(a = 1) = n a /n ja p(b = 1) = n b /n TKK, Informaatiotekniikan laboratorio 20

Riippumattomuus Kuinka monessa havainnossa a ja b esiintyvät yhtäaikaa, jos niiden oletetaan olevan riippumattomia? p(a = 1 b = 1): todennäköisyys sille, että havainnossa on sekä a = 1 että b = 1 ( = ja) Riippumattomuus: p(a = 1 b = 1) = p(a = 1)p(b = 1) = (n a /n)(n b /n) = n a n b /n 2. TKK, Informaatiotekniikan laboratorio 21

Esimerkki a = Computational: n a = 7803 b = Algorithms: n b = 6812 Riippumattomuus: computational ja algorithms esiintyvät satunnaisella rivillä todennäköisyydellä n a n n b n = 7803 128000 6812 128000 =.003244 Odotusarvo tällaisten rivien lukumäärälle on n n a n n b n = n an b n = 415 Datassa tällaisia rivejä on n ab = 1974 kappaletta. Merkitseekö tämä mitään? TKK, Informaatiotekniikan laboratorio 22

Merkitsevyyden tutkiminen? Ajatellaan datan generointia toistokokeena Tehdään 128000 havaintoa Kullakin havainnon kohdalla onnistutaan (tuotetaan havainto, jossa on sekä a = 1 että b = 1 todennäköisyydellä q = n a n b /n 2 Onnistumisten lukumäärä on binomijakautunut parametrein n ja n a n b /n 2 Kuinka todennäköistä on, että saadaan vähintään n ab onnistumista? Kuinka pieni on todennäköisyys, että saisimme odotusarvosta niin paljon poikkeavan tuloksen? Jos tämä todennäköisyys on pieni, niin löydetty hahmo kertoo jotakin kiinnostavaa. TKK, Informaatiotekniikan laboratorio 23

Binomijakauman hännän todennäköisyyden arviointi: n B(n, i, q), i=n ab +1 missä B(n, i, q) on todennäköisyys, että n:n toiston kokeessa saadaan tasan i onnistumista, kun onnistumisen todennäköisyys on q: B(n, i, q) = ( ) n q i (1 q) n i. i Perinteiset approksimaatiot (normaaliapproksimaatio, Poisson-approksimaatio) eivät välttämättä suoraan sovi tähän (todennäköisyys q on pieni, mutta onnistumisten määrä on suuri) Chernoffin rajat TKK, Informaatiotekniikan laboratorio 24

Simulointitestaus Satunnaistus: kokeillaan miten käy kun heitetään rahaa 128000 kertaa Onnistumistodennäköisyys p = 0.003244 Lasketaan onnistumisten määrä TKK, Informaatiotekniikan laboratorio 25

Ohjelmana p = 0.003244; for a=1:10 count(a) = 0; for i=1:128000 % hidas tapa if rand(1,1)<p count(a)=count(a)+1; end end end for a=1:1000 % nopeampi tapa Matlabissa count(a) = sum(rand(128000,1)<p); end TKK, Informaatiotekniikan laboratorio 26

Onnistumisten lukumäärän jakauma 1000 kokeessa 60 50 40 30 20 10 0 340 360 380 400 420 440 460 480 Todennäköisyys saada 1974 onnistumista lienee siis pieni; mutta kuinka pieni? TKK, Informaatiotekniikan laboratorio 27

Chernoffin raja Olkoon X onnistumisten lukumäärä toistokokeessa, jossa n koetta ja todennäköisyys onnistumiselle on p. Tällöin onnistumisen lukumäärän odotusarvo on np. Pr(X > (1 + δ)np) < ( e δ (1 + δ) 1+δ ) np < 2 δnp. p =.003244, odotusarvo np = 415, havaittu arvo X = 1974. X > (1 + δ)np eli δ = (X np)/np = 3.757 Todennäköisyys Pr(X > 1974) = Pr(X > (1+3.757)415) < ( 42.8 1667 )415 0.0257 415 < 10 660 eli varsin pieni. 2 δnp 2 3.757 415 10 469 TKK, Informaatiotekniikan laboratorio 28

Moninkertaisen testauksen ongelma Oletetaan, että löydetään 100 kiinnostavaa muuttujaparia (a, b), ja tutkitaan kaikilla pareilla onko n a,b merkittävästi suurempi (tai pienempi) kuin riippumattomuusoletuksen antaman arvio n an b /n. Saadaan tulokseksi esim., että parilla (a, b) näin suuri ero esiintyy sattumalta todennäköisyydellä 0.01. Todennäköisyys, että 100 parista jollakin tulee tällainen tulos on (miksi?) 1 (1 0.01) 100 0.63 TKK, Informaatiotekniikan laboratorio 29

Tutkittaessa usean hahmon esiintymäfrekvenssien satunnaisuutta pitää ottaa huomioon se, että tarkastelemme useita hahmoja. Bonferroni-korjaus: jos tutkitaan M:n hahmon esiintymistodennäköisyyksiä, niin sattumalta esiintymisen todennäköisyydet tulee kertoa M:llä. Edellä yksittäisen hahmon todennäköisyys oli niin pieni, että korjaus ei muuta asiaa. Suurin osa löydetyistä muuttujapareista esiintyy niin usein yhdessä, että tämän tapahtuman esiintyminen sattumalta on erittäin epätodennäköistä. TKK, Informaatiotekniikan laboratorio 30

Entä suuremmat kattavat joukot? Oletetaan, että muuttujajoukko {a, b, c} esiintyy datassa n abc kertaa (ts. datassa on n abc riviä, joilla muuttujat a, b ja c ovat kaikki 1. Onko tämä enemmän kuin satunnaisessa tapauksessa voisi olettaa? Mikä on satunnainen tapaus tässä tilanteessa? Esim. n = 1000 ja n a = n b = n c = 500. Jos muuttujat ovat riippumattomia, niin n abc on luultavasti noin 125. Jos n abc = 250, niin {a, b, c} on jotenkin epätavallinen kokoelma. Tämä voi johtua siitä, että esim. a ja b ovat vahvasti toisistaan riippuvia. (Jos n ab = 500, niin sen jälkeen n abc = 250 on odotettavaa.) Mikä on sovelias nollahypoteesi? Esim. ns. maksimientropiahypoteesi. TKK, Informaatiotekniikan laboratorio 31

Miten vaikeata kattavien joukkojen etsintä on? Annettuna 0-1 data ja kynnysarvo N Etsittävä kaikki kattavat joukot Vastaus voi olla hyvin suuri Käytännössä tasoittainen algoritmi on riitävän tehokas TKK, Informaatiotekniikan laboratorio 32

Muunlaisten usein esiintyvien hahmojen etsintä Samoja periaatteita voidaan käyttää myös muihin tehtäviin Usein esiintyvien episodien etsintä Usein esiintyvien aliverkkojen etsintä Usein esiintyvien alipuiden etsintä Sama tasoittaisen algoritmin perusidea toimii TKK, Informaatiotekniikan laboratorio 33