Hierarkkisesti jäsenneltyjen kieliaineistojen puurakenteen hyödyntäminen tiedon louhinnassa
|
|
- Helinä Helmi Korhonen
- 8 vuotta sitten
- Katselukertoja:
Transkriptio
1 hyväksymispäivä arvosana arvostelija Hierarkkisesti jäsenneltyjen kieliaineistojen puurakenteen hyödyntäminen tiedon louhinnassa Elina Ekola Seminaariraportti Helsinki HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos
2 HELSINGIN YLIOPISTO HELSINGFORS UNIVERSITET UNIVERSITY OF HELSINKI Tiedekunta/Osasto Fakultet/Sektion Faculty/Section Laitos Institution Department Matemaattis-luonnontieteellinen tiedekunta Tietojenkäsittelytieteen laitos Tekijä Författare Author Elina Ekola Työn nimi Arbetets titel Title Hierarkkisesti jäsenneltyjen kieliaineistojen puurakenteen hyödyntäminen tiedon louhinnassa Oppiaine Läroämne Subject Tietojenkäsittelytiede / Seminaari: Kielitieteelliset aineistot Työn laji Arbetets art Level Aika Datum Month and year Sivumäärä Sidoantal Number of pages 12 Seminaariraportti Tiivistelmä?Referat?Abstract Eri tavoin kerätyt kielitieteelliset aineistot, korpukset, sisältävät paljon tietoa kielestä, sen rakenteesta ja eri tavoista käyttää kieltä. Paljon sekä kieleen itseensä että sen välittämiin merkityksiin liittyvää tietoa on koodattuna kielen hierarkkisesti jäsentyneisiin rakenteisiin, jotka ovatkin tärkeää tiedon hankinnan ja louhinnan aineistoa. Syntaktisesti jäsennetyt korpukset, joihin voidaan lisätä myös semanttisia selitteitä, ovat tutkimuksen lähtökohta, tutkittiinpa sitten kielen rakennetta tai tekstin merkityksen muodostumista. Näiden rakenteiden avulla ja esimerkiksi koneoppimisen algoritmeja käyttäen voidaan korpuksista löytää tietoa, jonka löytäminen muuten olisi vaikeaa. Esimerkkinä kielen syntaktisen rakenteen hyödyntämisestä tiedon hankinnassa on osana kansainvälistä hanketta (International Corpus of English, ICE) kerätty ICE-GB-korpus. Esimerkkinä korpuksista, joihin on lisätty semanttisia selitteitä, ovat FrameNet ja PropBank. ACM Computing Classification System (CCS): I.2.6 Learning : Knowledge acquisition H.3.3 Information Search and Retrieval : Query formulation, Retrieval models I.2.7 Natural Language Processing : Language parsing and understanding Avainsanat Nyckelord Keywords korpus, syntaktinen jäsennys, semanttinen jäsennys, tiedon hankinta, tiedon louhinta Säilytyspaikka Förvaringställe Where deposited Muita tietoja Övriga uppgifter Additional information
3 1 Johdanto Tiedon louhinnan tavoitteet Hierarkkisesti jäsennelty korpus Syntaktisen jäsennyspuun ominaisuudet Semanttinen jäsennys Syntaktisen jäsentelyn käyttö kielen ilmiöiden tutkimisessa Puurakenteiden osista kielen rakenneosiin Koneoppimisen algoritmit toistuvien piirteiden "löytäjinä" Merkitys? - Tekstin louhintaa syntaktisen jäsennyksen perusteella Yhteenveto Lähteet... 12
4 1 Johdanto Eri tavoin kerätyt kielitieteelliset aineistot, korpukset, sisältävät paljon tietoa kielestä, sen rakenteesta ja eri tavoista käyttää kieltä. Aineistot on yleensä varustettu sanaluokkia, lukua, kielenkäyttötilannetta, puhujaa tai kirjoittajaa selventävillä kommenteilla ja jäsennetty syntaktisesti. Etenkin aiemmin tämä syntaktinen jäsennys oli suuri ja paljon asiantuntijatyötä vaativa tehtävä, mutta erilaisia jäsennysalgoritmeja on kehitetty ja kehitetään edelleen, joten tämäkin vaihe korpusten esikäsittelystä tulee yhä nopeammaksi [WaN97, WaN01]. Korpukset sisältävät niin paljon erilaista kieltä koskevaa tietoa, että niiden mahdollisimman laaja ja monipuolinen käyttö on järkevää. Paljon sekä kieleen itseensä että sen välittämiin merkityksiin liittyvää tietoa on koodattuna kielen hierarkkisesti jäsentyneisiin rakenteisiin, jotka ovatkin tärkeää tiedon hankinnan ja louhinnan aineistoa. Syntaktisesti jäsennetyt korpukset ovat tutkimuksen lähtökohta, tutkittiinpa sitten kielen rakennetta tai tekstin merkityksen muodostumista, ja syntaktiseen jäsennyspuuhun, joka itsessään on syklitön, järjestetty ja lauseen täydellisesti kuvaava, voidaan liittää myös semanttisia selitteitä. Näiden rakenteiden avulla ja esimerkiksi koneoppimisen algoritmeja käyttäen voidaan korpuksista löytää tietoa, jonka löytäminen muuten olisi vaikeaa [WaN97, WaN01, HKW05, ANW07, COM08]. Esimerkkinä kielen syntaktisen rakenteen hyödyntämisestä tiedon hankinnassa on ICE-GBkorpus. Tämä on syntynyt osana kansainvälistä hanketta (International Corpus of English, ICE), jossa lähes 20 englanninkielisessä maassa kerätään identtiset korpukset kunkin maan omalla englannin kielen variantilla. ICE-GB on ICE-hankkeen Ison-Britannian korpus, johon on kehitetty oma, sumeita puun osia (Fuzzy Tree Fragments, FTF) apuna käyttävä, graafinen kyselytyökalu ICECUP [WaN97, WaN01, ANW07]. Tässä työssä esitellään joitain esimerkkejä tämän kyselytyökalun käytöstä. Esimerkkinä korpuksista, joihin on lisätty semanttisia selitteitä, ovat FrameNet ja PropBank. 1 Kummassakin semanttiset selitteet lisätään syntaktiseen jäsennyspuuhun, mutta mm. selitteiden muodot ovat erilaiset [HKW05]. Erilaiset jäsennykset, näiden kuvaukset ja näitä hyödyntävät kyselytyökalut ovat kaikki hyödyllisiä, mutta usein hierarkkisiin rakenteisiin sisältyvän tiedon löytäminen vaatii myös aineiston kommentoinnin tai kuvaamisen uudestaan nimenomaan tutkittavan ongelman näkökulmasta, monenlaisten eri menetelmien soveltamisen ja tietenkin asiantuntijan, joka kykenee löydetyt tiedot tulkitsemaan. 2 Tiedon louhinnan tavoitteet Tiedon louhinnan päätehtävä on löytää tutkimuskysymyksen kannalta mielenkiintoisia rakenteita tai vuorovaikutuksia tutkittavasta aineistosta, joka usein on jollain tavalla rakenteista. Tämä rakenne itsessään on jo tärkeä tiedonlähde ja osoittaa sellaisenaan eri ilmiöiden tai olioiden suhteita [COM08]. Kielitieteellisessä tutkimuksessa jäsennellyt ja hyvin kommentoidut korpukset ovat olennaisessa osassa. Kielen käyttötapojen tutkiminen, kielen rakenteisiin liittyvien hypoteesien laadinta ja etenkin niiden oikeellisuuden varmistaminen edellyttävät edustavien ja oikeellisten korpusten käyttöä. Ja kun tällaisia korpuksia on saatu laadittua, niitä myös kannattaa hyödyntää mahdollisimman hyvin sekä louhimalla niistä tietoa ja tietämystä että käyttämällä aineistoa muutenkin laajamittaisesti [WaN01]. 1 1 FrameNetistä löytyy lisätietoja osoitteesta ja PropBankista osoitteesta
5 Erityisen hyödyllisiä jäsennetyt korpukset ovat silloin, kun tutkitaan kielenkäyttöä eri tilanteissa, erilaisissa teksteissä ja eri konteksteissa. Luonnollisista kielenkäyttötilanteista kootut tekstit tuovat tietoa siitä, miten kieltä missäkin yhteydessä käytetään, ja tämä tieto kannattaa käyttää hyväksi tutkimalla korpuksia erilaisin menetelmin, selvittämällä rakenteiden eroja ja tarkastelemalla aineistoa eri näkökulmista [WaN97, WaN01, ANW07]. Jo itse jäsennyspuun rakentamistakin voidaan tarkastella tiedonhankintaprosessina, sillä tiedon hankintaa (knowledge acquisition, KA tai knowledge elicitation, KE) voidaan kuvata hyvin samanlaisena prosessina kuin kieliaineiston jäsennystä (kuva 1). Prosesseissa on samanlainen syklinen ja iteroiva lähestymistapa, jossa yksittäistapausten perusteella luodaan laajempi kokonaisuus, jota testataan ja jonka perusteella tehdään lisää päätelmiä [WaN97]. Sen lisäksi, että näin saadaan jäsennettyä yksi kieliaineisto, voidaan itse jäsennysprosessia tutkimalla ja kehittämällä laatia yhä parempia automaattisia jäsentäjiä, joilla voidaan selvittää kielen sekä syntaktisia että semanttisia rakenteita ja niihin koodattua tietoa [WaN01]. Vastaavasti syntaktisen jäsennyspuun semanttinen kommentointi on eräänlainen tiedonhankintatai oppimisprosessi, ja myös semanttisen kommentoinnin automatisointiin on pyritty kehittämään oppivia järjestelmiä. Tällaisten jäsentäjien tarkoitus on löytää tekstistä semanttisia suhteita eli siis suorittaa eräänlaista semanttisten suhteiden louhintaa syntaktisesti jäsennellystä korpuksesta (ks. kuva 12) [COM08]. 2 Kuva 1 Tiedon hankinnan (a) ja korpusten syntaktisen jäsennyksen (b) kaksitasoiset ja iteratiiviset prosessimallit [WaN97]. Menetelmiä, joita on kehitetty muilla tutkimusalueilla, on voitu hyödyntää korpuslingvistisessä tutkimuksessa. Näin on erityisesti sekä syntaktisen että semanttisen jäsennyksen kehittämisessä, jotka molemmat ovat hyötyneet koneoppimisen algoritmeista [WaN01, COM08]. Hyöty ei ole kuitenkaan pelkästään yksisuuntaista, vaan korpusten rakenteisen datan tutkimuksessa kehitettyjä ja testattuja menetelmiä olisi mahdollista soveltaa myös muille aloille, joilla data on mallinnettavissa hierarkkisina suhteina. Tällaisina sovellusaloina mainitaan esimerkiksi biotieteisiin liittyvä proteiinien vuorovaikutustutkimus [COM08].
6 3 3 Hierarkkisesti jäsennelty korpus 3.1 Syntaktisen jäsennyspuun ominaisuudet Eri lähteistä kootut kieliaineistot, korpukset, kommentoidaan ja varustetaan erilaisin selittein ennen kuin niitä voidaan varsinaisesti hyödyntää tutkimuksessa. Perustason kommentointi käsittää ainakin sanojen luokittelun sanaluokkiin ja sanojen luvun täsmentämisen, minkä automatisointi on jo pitkällä. Tällainen jäsentely ei vielä ole hierarkkisesti rakentunutta. Syntaktinen kommentointi tuottaa puolestaan hierarkkisesti jäsenneltyä tietoa, jonka tuottaminen aiemmin oli hyvinkin työlästä [WaN01], mutta johon nyt on kehitetty toimivia jäsennysalgoritmeja [ANW07]. Syntaktinen jäsennys kuvaa lauseen rakenteen hierarkkisena puuna - puun muuttuminen tarkoittaa samalla jäsenneltävän lauseen muuttumista - ja päinvastoin. Kielitieteellisesti käyttökelpoisen syntaktisen jäsennyspuun tulee täyttää seuraavat ehdot (kuva 2): Jäsennyspuu on puhdas, syklitön puurakenne (acyclicity), jossa kullakin solmulla on vain yksi isäsolmu. Puu on täydellinen (closure) eli se rakentuu yhden juurisolmun ja lauseen sanoja vastaavan lehtisolmujoukon väliin niin, että juurisolmu määrittelee yhden jäsennysyksikön (lauseen) ja lehtisolmut ovat konkreettisen lauseen sanojen määritteitä ja siten heikosti järjestyneitä (weak ordering). Varsinainen jäsennys rakentuu näiden rajojen väliin siten, että puun kaikki solmut ovat vahvasti järjestyneitä (strong ordering), mikä määritellään siten, että Millä tahansa solmulla a, joka edeltää välitöntä sisarsolmuaan b, pätee se, että solmun a viimeinen lapsisolmu edeltää solmun b ensimmäistä lapsisolmua. Vahvasti järjestetyssä syntaktisessa puussa solmujen väliset särmät eivät siis leikkaa toisiaan eli puussa ei ole ristikkäisiä viittauksia puun eri tasojen välillä. Tällainen puurakenne kuvaa jäsennettyä lausetta juuri siinä muodossa kuin se on tallennettu, eikä ns. kieliopillisesti oikeassa muodossa. Kieltä ja sen ilmiöitä on siten mahdollista tutkia sellaisina kuin ne käytännössä ilmenevät [WaN97]. Puun sisäsolmuille määritellään usein niiden tehtävä (function) lauseessa - esimerkiksi subjekti tai objekti - ja luokka (category), joka tässä tapauksessa on tehtävää toteuttamassa - kuten substantiivilauseke. Tehtävä määrää sen, mihin luokkiin solmu voi kuulua, ja luokkaan puolestaan liittyy joukko ominaisuuksia (feature property) (kuva 3). Hierarkkisesta rakenteestaan johtuen jäsennyspuuhun voidaan ajatella liittyvän myös jonkinlaista periytyvyyttä (inheritance), mutta tämä näkökulma lienee lähinnä tapauskohtaista eikä ole jäsennyksen keskeinen ominaisuus [WaN97].
7 4 Kuva 2 Jäsennyspuun ominaisuudet eli syklittömyys (a), täydellisyys (b), heikko järjestys (c) ja vahva järjestys (d) [WaN97]. Kuva 3 ICE-projektin kehittämä tapa mallintaa ja kuvata syntaktinen jäsennyspuu. Esimerkkilauseena on englanninkielinen lause I saw the man (PU = Parsing Unit; CL = Clause; SU = Subject; NP = Noun Phrase; NPHD = Noun Phrase Head; PRON = Pronoun; VB = Verb; VP = Verb Phrase; MVB = Main Verb; V = Verb; OD = Direct Object; DT = Determiner; DTP = Deteminer Phrase; DTCE = Central Determiner; ART = Article; N = Noun) [WaN97]. Syntaktinen jäsennyspuu kuvaa lauseen kieliopillisen rakenteen puumaisena hierarkiana. Periaatteessa rakenne voidaan esittää puhtaana puurakenteena (kuva 4), mutta tiedot voidaan myös visualisoida eri tavoin (vrt. kuva 3) Kuva 4 Syntaktinen jäsennyspuu [COM08].
8 3.2 Semanttinen jäsennys Semanttista tietoa voidaan lisätä suoraan lauseen syntaktiseen jäsennyspuuhun liittämällä puun solmuihin semanttisia suhteita kuvaavia lisätietoja. Kuvassa 5 on abstrakti jäsennyspuu, johon on liitetty näitä suhteita kuvaavat luokitukset. Eri elementit, jotka ovat semanttisesti vuorovaikutuksessa keskenään, voivat sijaita syntaktisessa puussa kaukanakin toisistaan [COM08]. 5 Kuva 5 Abstrakti esimerkki jäsennyspuusta, johon on merkitty kohdesana (tgt) eli predikaatti ja sen argumentit (R 0, R 1, R 3 ). Argumenttiluokkia, jotka muodostavat predikaatin kanssa erilaisia vuorovaikutussuhteita, sanotaan rooleiksi. Tätä abstraktia esimerkkiä kannattaa verrata kuvaan 4, jossa on esitetty konkreettinen esimerkkilause. Kohdesanojen, predikaattien, sanaluokkaa kuvaavat määritteet (VB) on kuvassa 4 ympyröity ja niihin jossain suhteessa, roolissa, olevien muiden sanojen luokat (NP) on ympäröity suorakulmaisin kehyksin [COM08]. Semanttiset määritteet voivat olla lauseen predikaattiin (ns. kohdesana, target) liittyviä, ja sen merkitystä heijastelevia erityisselitteitä. Esimerkkinä tällaisista erityisselitteistä voisivat olla lauseeseen Tuomari tuomitsi rikollisen lisätyt selitteet. Koska lauseen predikaattina on tuomitsi, liitetään tuomari-sanaan semanttinen selite TUOMITSIJA ja rikollisen-sanaan selite TUOMITTU. Tämän tyyppistä semanttista kommentointia käytetään esimerkiksi FrameNet-korpuksessa [HKW05]. Toinen lähestymistapa on käyttää predikaatin merkityksestä riippumattomia selitteitä, kuten ARG0, ARG1 jne.. Kullakin tällaisella yleisselitteellä on jokin tietty merkitys esimerkiksi niin, että ARG0 on ns. PROTO-AGENT, joka on yleensä lauseen subjekti, ja ARG1 on ns. PROTO-PATIENT, joka on puolestaan lauseen objekti. Näiden pääargumenttien lisäksi lauseisiin voidaan merkitä lisäargumentteja kuvaamaan esimerkiksi paikanmääreitä (ARGM-LOC) tai aikamääreitä (ARGM-TMP) (kuva 6). Näin semanttinen tieto välitetään hieman yleiskäyttöisemmillä kommenteilla, jotka kuitenkin paljastavat sanan merkityksen lausekokonaisuudessa. Esimerkkinä tämän tyyppisestä semanttisesta kommentoinnista on PropBank-korpus [HKW05]. Kuva 6 Syntaktisen jäsennyspuun semanttinen kommentointi, jossa on käytetty predikaatin merkityksestä riippumattomia semanttisia selitteitä [HKW05].
9 Puurakenteet ovat tyypillisesti järjestettyjä - syntaktisissa jäsennyspuissahan tämä on suorastaan rakenteen edellytys. Semanttiset suhteet voidaan kuitenkin ilmaista myös järjestämättömissä puissa (unordered trees), joissa sisarussolmujen järjestyksellä ei ole väliä, tai vapaissa puissa (free trees), joissa solmujen välisten särmien suunnalla ei ole väliä. Kuvassa 7, jossa kuvattujen lauseiden merkitykset ovat toki erilaisia, puu (d) on järjestettynä puuna sama kuin puu (a), mutta eri kuin puut (b) ja (c). Järjestämättömänä puuna se on sama kuin puut (a) ja (b), mutta eri kuin puu (c). Vapaana puuna se sen sijaan vastaa kaikkia puita (a), (b) ja (c) [MAI05]. 6 Kuva 7 Esimerkkejä syntaktisista riippuvuuspuista tai -osapuista [MAI05]. 4 Syntaktisen jäsentelyn käyttö kielen ilmiöiden tutkimisessa 4.1 Puurakenteiden osista kielen rakenneosiin ICE-aineiston käsittelyä varten on kehitetty menetelmä, jossa käytetään ns. sumeita puun osia (Fuzzy Tree Fragment, jatkossa FTF) 2, jotka ovat tapa kuvata rakenteisia kieliopillisia kyselyitä. FTF on ikään kuin yleistetty jäsennyspuun osa, jossa osa elementeistä on jätetty täsmentämättä ja vain halutun kyselyn kannalta olennaiset osat on kuvattu. FTF voi sisältää esimerkiksi solmujen ja tekstin osien ylimalkaisen kuvauksen, elementtien välisiä suhteita, todellisia lauseen osia ja rakenteen rajapintoja kuvaavia elementtejä (kuva 8) [WaN01, ANW07]. FTF:n solmujen väliset linkit on koodattu niiden vierekkäisyyden tai läheisyyden (adjacency), järjestyksen (order) ja oikeellisuuden (correctedness) mukaan. Vierekkäisyys voi olla joko välitöntä tai lopulta ilmenevää, kuten parent:child-suhteen välitön vierekkäisyys (musta linkki solmujen välillä) tai ancestor:child-suhteen lopulta ilmenevää vierekkäisyyttä (valkoinen linkki solmujen välillä). Vastaavasti child:child-suhteen määritteinä voi olla seuraa välittömästi (kaavioissa musta nuoli), ennen tai jälkeen esiintyvä (kaavioissa kaksisuuntainen valkoinen nuoli) tai jopa tuntematon (ei nuolta lainkaan), jota tarvitaan tilanteessa, jossa FTF:n kaksi lapsisolmua eivät varsinaisessa jäsennyspuussa ole välttämättä lainkaan sisaruksia [WaN01]. 2 Termi fuzzy on tässä käännetty sumeaksi, vaikka se ei alkuperäisartikkelin mukaan olekaan FTF-termissä täysin samassa merkityksessä kuin esimerkiksi käsitteessä fuzzy logic.
10 7 Kuva 8 Esimerkit FTF-rakenteista. a) Kieliopillinen kysely, jossa etsitään englannin kielen substantiivista muodostuvaa suoraa objektia, jossa on artikkeli, määre ja substantiivi välittömästi peräkkäin. b) Tekstikysely, jossa haetaan yhdistelmärakennetta, jossa kyselykaaviossa annettua sanaa about seuraa numeraali. Kyselyn määrittävät solmut ovat lehtisolmuja (eli niihin liittyy välittömästi jokin lauseen sana), ja juurisolmu on niihin yhteydessä ancestor-relaatiolla (valkoinen linkki). Lehtisolmujen järjestys on määritelty välittömästi seuraavaksi (musta nuoli oikealla) [WaN01]. Koska ICE-aineistossa kokonaiset jäsennyspuut kuvataan samanlaisella grafiikalla kuin kyselyitä kuvaavat FTF:t, nämä ovat hyvä ja havainnollinen tapa tutkia koko aineistoa, sillä valmiin FTF:n sovittaminen aineistoon on jo silmämääräisestikin mahdollista (kuva 9). Samoin tutkimusongelman abstrahointi kokonaisesta jäsennyspuusta ongelmaa selvittäväksi kysymykseksi on myös helpompaa, kun jäsennyspuuta voi ikään kuin karsia kyselyn tuottamiseksi. Kuva 9 Jäsennyspuussa esiintyvä lause, johon on sovitettu kuvan 8 kyselyt. Objekti-kysely on esitetty harmaalla ja tekstikysely mustalla [WaN01]. 4.2 Koneoppimisen algoritmit toistuvien piirteiden "löytäjinä" Pidemmälle menevä korpusten hyväksikäyttö, esimerkiksi kielitieteellisten hypoteesien testaaminen tai kielen rakenteeseen liittyvän tiedon louhinta, vaatii kuitenkin enemmän kuin pelkän aineiston jäsennyksen. Lähestymistapana on usein menetelmä, jossa korpus jäsennyksen jälkeen vielä käsitteellistetään ja mallinnetaan jollain tutkimusaiheeseen sopivalla tavalla. Ja vasta tästä
11 vielä pidemmälle mallinnetusta aineistosta tehdään analyysejä. Vaikka pohjana siis ovat koko aineiston rakenteinen jäsennys ja mahdollisesti myös hierarkkisesti jäsennetyt tutkimusongelmat ja -kysymykset, täytyy aineisto vielä kommentoida uudelleen (redescription) nimenomaan tutkittavan ongelman näkökulmasta (kuva 10) [WaN01]. 8 Kuva 10 Prosessi, jolla korpusten käyttöä voidaan laajentaa tiedon louhintaan tai tiedonhankintaan (3A perspective = Annotation, Abstraction, Analysis) [WaN01]. ICE-aineiston käsittelyssä pyritään löytämään aineiston rakenteista löytyvää tietämystä, ja tavoitteena on tiedon hakeminen tekstimuotoisesta tietokannasta (Knowledge Discovery in Databases, KDD). Aineistoon sovelletaan koneoppimisen algoritmeja, joilla pyritään löytämään merkitseviä riippuvuuksia ja vuorovaikutuksia. Silloinkin, kun tällaisia löytyy, analyysi ei pääty tähän, sillä löydetyt ilmiöt vaativat yleensä vielä tarkemman selvityksen ja mahdollisesti vielä lisää tutkimusta. Kuitenkin, kun varsinaiset hypoteesit löydetään näin aineiston mallinnuksen ja koneoppimisalgoritmien avulla, voidaan välttää mahdolliset raaka-aineiston tai aiemman kokemuksen perusteella tehdyt virhetulkinnat [WaN01]. Normaali relaatiotietokantakin pitää normalisoida, siitä pitää poistaa mahdollinen toisteisuus ja toisistaan riippuvat ja epärelevantit tiedot ennen kuin sen tarkempi analysointi tai oppivan järjestelmän rakentaminen sen varaan on järkevää. Tekstitietokannassa, korpuksessa, aineiston uudelleenkuvaus tai mallintaminen on suorastaan ehdottoman välttämätöntä. Mallintaminen tai abstrahointi tarkoittaa korpusten yhteydessä sekä tutkimusaiheelle olennaisten muuttujien ja niihin liittyvien kuvaussääntöjen määrittämistä että tutkittavan kielenkäyttötapauksen täsmentämistä. ICE-aineistossa kummassakin näistä tehtävistä käytetään apuna FTF-rakenteita, joilla sekä kuvaussäännöt että kielenkäyttötapaukset voidaan esittää (kuva 11) [WaN01]. Kuvan 11 englanninkieltä mallintavassa esimerkissä tutkittavaksi kielenkäyttötapaukseksi (case) määritellään substantiivilauseke, jolla on jokin jälkimääre (noun phrase postmodifying, NPPO). Esimerkkejä tällaisesta rakenteesta on taulukossa 1. Tutkimusaiheen kannalta tärkeitä muuttujia puolestaan ovat esimerkiksi rakenteen muoto (form) ja verbin muoto (VP transitivity). Rakenne voi olla muodoltaan eräänlainen lauseenvastikerakenne (nonfinite) tai relatiivilause (relative), ja verbi puolestaan intransitiivinen, transitiivinen tai kopula. Nämä muuttujat on kuvattu FTF:inä, jolloin ne muodostavat tekstiin sovitettavat kuvaussäännöt. Kun nämä määritykset on tehty, käytetään koneoppimisen algoritmeja, jotka etsivät sääntöjä, joiden perusteella määriteltyjen muuttujien eri arvojen esiintymistä voi ennustaa. Sääntö voi olla esimerkiksi: IF VP_TRANSITIVITY = COP THEN FORM = RELATIVE IF TEXT_CATEGORY = "DIALOGUE" THEN FORM = RELATIVE
12 9 Kuva 11 Kielenkäyttötapauksen täsmentäminen, tutkimusaiheen kannalta tärkeät muuttujat ja niihin liittyvät kuvaussäännöt [WaN01]. Taulukko 1 Mallilauseet esimerkkikielenkäyttötapauksesta, jossa yhtenä olennaisena muuttujana on lauserakenteen muoto (form). Lauseenvastikerakenne (nonfinite) People living in Hawaii. The book published in London. Relatiivilause (relative) People who live in Hawaii. The book which was published in London. Sääntöjen tulkinta, niiden merkityksen ja merkityksellisyyden selvittäminen ja jalostaminen pidemmälle, esimerkiksi yhdistetyiksi säännnöiksi, vaatii asiantuntijatyötä, mutta jo tällaisten sääntöjen löytäminen laajasta korpuksesta on askel eteenpäin korpuksen rakenteisiin kätkeytyneen tiedon löytämisessä [WaN01]. 4.3 Merkitys? - Tekstin louhintaa syntaktisen jäsennyksen perusteella Tiedon hankinnan ja louhinnan mahdollisuuksia voidaan lisätä, jos syntaktisesti jäsennellyssä kieliaineistossa on myös semanttista tietoa. Lähtökohtana on tällöin siis jo varhaisemmassa vaiheessa tehty syntaktinen, hierarkkinen jäsennys, johon lisätään uutta informaatiota. Tällainen informaatio voidaan ilmaista eräänlaisena predikaatti-argumentti-rakenteena (predicate argument structure, PAS), jossa tietty sana, ns. kohde (target) saa aikaan jonkin toiminnon, tilanteen tai tapahtuman ja määrittää siten muiden lauseenosien väliset suhteet. Kun tuo toiminnon laukaiseva sana, joka usein on verbi, on määritelty, pyritään tunnistamaan ja merkitsemään ne sanat tai sanaryhmät, joilla on jokin rooli suhteessa toiminnon laukaisevaan kohdesanaan. Tätä vaihetta kutsutaan semanttisten roolien määrittelyksi (Semantic Role Labeling, SRL),. Roolit ilmaisevat tyypillisesti kohdesanan ja sen argumenttien välisiä suhteita, kuten esimerkiksi lauseessa John gave Mary the ball seuraavat: John gave Mary the ball - ANTAJA (GIVER), argumentti (rooli) - kohdesana (target), predikaatti (kohdesana) - VASTAANOTTAJA (RECIPIENT), argumentti (rooli) - ANNETTU (GIVEN_OBJECT), argumentti (rooli)
13 Nämä semanttiset roolit voidaan itse asiassa päätellä jo lauseen syntaktisesta jäsennyspuusta, johon itse roolit sitten määritellään solmuihin lisätyillä koodauksilla. Syntaktisen ja semanttisen jäsentelyn yhteys tekee mahdolliseksi myöhemmässä analyysissä löytää yhteyksiä myös kaukana toisistaan sijaitsevien lauseen osien tai sanojen välillä. Semanttiset roolit määrittävän järjestelmän tehtävänä voidaankin pitää sitä, että se pyrkii löytämään syntaktisena rakenteena kuvatun järjestelmän osien väliset semanttiset suhteet [COM08]. Predikaatti-argumentti-rakenteiden eli semanttisten suhteiden tunnistaminen on ongelma, jonka ratkaisussa voidaan käyttää apuna koneoppimisen menetelmiä ja algoritmeja. Tunnistaminen voidaan jakaa kahteen pienempään ongelmaan: Tutkittavasta lauseesta täytyy ensin tunnistaa se kohdesana, joka varsinaisesti luo elementtien väliset suhteet, ja tämän jälkeen täytyy vielä tunnistaa ne elementit eli argumentit, jotka ovat jossain suhteessa kohdesanaan. Tätä vaihetta voidaan kutsua solmun valinnaksi (node selection, NS) tai argumentin valinnaksi (argument selection). Kun argumentit on valittu, kullekin valitulle elementille täytyy määrittää sen rooli puhutaankin rooliluokituksesta (role classification, RC). Nämä molemmat vaiheet voidaan mallintaa erikseen oppimisongelmina, joissa käytetään valmiiksi kommentoitua malliaineistoa luokitusjärjestelmän opettamiseen (kuva 12). 10 Kuva 12 Semanttisten suhteiden hakuprosessi, jossa pyritään automatisoimaan toiminto kehittämällä oppiva järjestelmä, automaattinen semanttinen jäsentäjä (Relational Mining Architecture, RMA) [COM08]. Aineistosta poistetaan kaikki sellaiset elementit, joista jo etukäteen tiedetään, etteivät ne kuulu mihinkään predikaatti-argumentti-rakenteeseen. Tässä vaiheessa, jota voidaan sanoa ehdokkaiden suodatukseksi (candidate filtering), tekstiaineistosta poistetaan esimerkiksi XML-kommentit, kaikki indeksointitieto ja metadata, jotka eivät sisällä varsinaiseen tekstiin liittyviä semanttisia (osa)kokonaisuuksia. Tämän suodatuksen jälkeen aineistossa on jäljellä vain sellaisia osia, joilla voi olla jokin merkityksellinen yhteys valittuun predikaattiin eli kohdesanaan. Ominaisuuksien kartoitusvaiheessa (feature extraction) edellä valituista ehdokaselementeistä pyritään löytämään ne rakenteelliset tekijät, jotka yhdistävät predikaatin ja ehdokaselementin. Nämä jäsennetyistä
14 lauseista eristetyt ehdokaselementit varustetaan semanttisin selittein ja niitä käytetään opetusaineistona, jolla järjestelmä opetetaan tekemään sekä solmujen valinta että rooliluokitus. Tulokseksi pyritään saamaan järjestelmä, joka automaattisesti etsii - ja löytää - syntaktisiin rakenteisiin koodatun semanttisen tiedon [COM08]. Yleensä semanttisten suhteiden louhinta - tai merkitysten haku - perustuu järjestetyn syntaktisen jäsennyspuun tutkimiseen [HKW05, COM08], mutta rakenteiden tutkiminen voidaan laajentaa myös järjestämättömiin ja vapaisiin puihin [MAI05]. Tällöinkin semanttisen tiedon haun ensimmäisenä vaiheena on syntaktisen jäsennyksen teko [MAI05]. 5 Yhteenveto Korpuksiin sisältyy paljon tietoa kielestä, sen käytöstä ja tavoista, joilla tekstin merkitys muodostuu. Paljon tästä tiedosta on kiinnittyneenä kielen rakenteisiin, ja näitä rakenteita - niin syntaktisia kuin semanttisiakin - tutkimalla on mahdollista löytää uutta tietoa, varmistaa oletuksia ja luoda hypoteeseja ennemminkin aineiston kartoituksen kuin oletusten perusteella. Kieliaineiston laajempi hyödyntäminen perustuu yleensä kieliaineiston tarkkaan kommentointiin. Perustason kommentointi, joka sisältää sanaluokkien, luvun ym. merkitsemisen, ei riitä, vaan aineisto on myös jäsennettävä syntaktisesti. Tämän hierarkkisen jäsennyksen tutkiminen on jo sinänsä antoisaa, ja voi tuoda uutta tietoa. Vielä lisää tietoa voidaan löytää, kun syntaktiseen jäsennykseen lisätään semanttinen kommentointi, jossa selvitetään lauseen sanojen väliset suhteet ja eri sanojen roolit merkityksen muodostumisessa. Sekä syntaktiseen että semanttiseen jäsennykseen on kehitetty automaattisia jäsentäjiä. Syntaktinen jäsennyspuu on täydellinen syklitön puurakenne, jonka juurisolmu on jäsennysyksikkö - usein lause - ja lehtisolmut liittyvät suoraan jäsennettävän lauseen sanoihin. Varsinainen jäsennys rakentuu näiden väliin vahvasti järjestyneenä puuna, jossa ei ole ristikkäisiä viittauksia puun eri tasojen välillä. Jäsennyspuun muuttuminen tarkoittaa jäsennettävän lauseen muuttumista ja päinvastoin. Tästä rakenteesta ja sen osista on mahdollista löytää siihen koodattua tietoa, kun apuna käytetään itse rakennetta ja sen säännöllisiä ominaisuuksia, tutkimusaiheen mukaan luotua mallinnusta ja aineiston uudelleen kuvausta ja esimerkiksi koneoppimisen algoritmeja. Semanttisten suhteiden tutkiminen lähtee myös liikkeelle syntaktisesta jäsennyksestä ja siihen lisättävistä semanttisista selitteistä. Semanttiset suhteet voidaan kuitenkin kuvata vapaammin kuin syntaktiset, ja niiden kuvaamisessa ovat hyödyksi myös järjestämättömät ja vapaat puurakenteet. Esimerkkinä syntaktisesta puurakenteesta, sen graafisesta kyselykielestä ja tämän hyödyntämisestä yhdessä koneoppimisen algoritmien kanssa on ICE-GB-aineisto. Korpuksia, joihin on eri tavoin kuvattu semanttisia suhteita, ovat esimerkiksi FrameNet ja PropBank. Sekä syntaktisen ja semanttisen rakenteen tutkimuksessa että etsittäessä näihin rakenteisiin koodattua tietoa käytetään usein apuna koneoppimisen algoritmeja - toisaalta menetelmiä, jotka on kehitetty kielen rakenteiden tutkimiseen voitaneen hyödyntää myös muilla tutkimusaloilla, joilla aineisto on mallinnettavissa rakenteisina kokonaisuuksina. 11
15 12 Lähteet ANW07 Aarts, B, Nelson, G ja Wallis, S. Using fuzzy tree fragments to explore English grammar. English Today, 23 (2007), sivut COM08 Coppola, B., Moschitti, A. ja Pighin, D. Generalized framework for syntax-based relation mining. Eighth IEEE International Conference on Data Mining (2008), sivut HKW05 Support vector learning for semantic argument classification. Machine Learning, 60 (1-3) (2005), sivut MAI05 WaN97 WaN01 Morinaga, S., Arimura, H., Ikeda, T. Sakao, Y. ja Akamine, S. Key semantics extraction by dependency tree mining. Proceedings of the ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (2005), sivut Wallis, S. ja Nelson, G. Syntactic parsing as a knowledge acquisition problem. Knowledge acquisition, modeling and management 1319, (1997), sivut Wallis, S. ja Nelson, G. Knowledge discovery in grammatically analysed corpora. Data Mining and Knowledge Discovery, 5, 4 (2001), sivut
Kielitieteellisten aineistojen käsittely
Kielitieteellisten aineistojen käsittely 1 Johdanto...1 2 Aineistojen kommentointi, metadatan tyypit...1 3 Aineistojen käsittely...2 3.1 Rakenteisten kieliaineistojen kyselykielet...2 3.2 Tiedonlouhinta
arvostelija OSDA ja UDDI palveluhakemistoina.
Hyväksymispäivä Arvosana arvostelija OSDA ja UDDI palveluhakemistoina. HELSINGIN YLIOPISTO HELSINGFORS UNIVERSITET UNIVERSITY OF HELSINKI Tiedekunta/Osasto Fakultet/Sektion Faculty/Section Laitos Institution
Selainpelien pelimoottorit
Selainpelien pelimoottorit Teemu Salminen Helsinki 28.10.2017 Seminaaritutkielma Helsingin yliopisto Tietojenkäsittelytiede ! 1 HELSINGIN YLIOPISTO HELSINGFORS UNIVERSITET UNIVERSITY OF HELSINKI Tiedekunta
Tiedonlouhinta rakenteisista dokumenteista (seminaarityö)
Tiedonlouhinta rakenteisista dokumenteista (seminaarityö) Miika Nurminen (minurmin@jyu.fi) Jyväskylän yliopisto Tietotekniikan laitos Kalvot ja seminaarityö verkossa: http://users.jyu.fi/~minurmin/gradusem/
Ohjelmistojen mallintaminen
Ohjelmistojen mallintaminen - Mallit - Ohjelmiston kuvaaminen malleilla 31.10.2008 Harri Laine 1 Malli: abstraktio jostain kohteesta Abstrahointi: asian ilmaiseminen tavalla, joka tuo esiin tietystä näkökulmasta
Yhteydettömät kieliopit [Sipser luku 2.1]
Yhteydettömät kieliopit [ipser luku 2.1] Johdantoesimerkkinä tarkastelemme kieltä L = { a n b m a n n > 0, m > 0 }, joka on yhteydetön (mutta ei säännöllinen). Vastaavan kieliopin ytimenä on säännöt eli
Pro gradu -tutkielma Meteorologia SUOMESSA ESIINTYVIEN LÄMPÖTILAN ÄÄRIARVOJEN MALLINTAMINEN YKSIDIMENSIOISILLA ILMAKEHÄMALLEILLA. Karoliina Ljungberg
Pro gradu -tutkielma Meteorologia SUOMESSA ESIINTYVIEN LÄMPÖTILAN ÄÄRIARVOJEN MALLINTAMINEN YKSIDIMENSIOISILLA ILMAKEHÄMALLEILLA Karoliina Ljungberg 16.04.2009 Ohjaajat: Ari Venäläinen, Jouni Räisänen
Aika/Datum Month and year Kesäkuu 2012
Tiedekunta/Osasto Fakultet/Sektion Faculty Laitos/Institution Department Filosofian, historian, kulttuurin ja taiteiden tutkimuksen laitos Humanistinen tiedekunta Tekijä/Författare Author Veera Lahtinen
Työn laji Arbetets art Level Aika Datum Month and year Sivumäärä Sidoantal Number of pages
Tiedekunta/Osasto Fakultet/Sektion Faculty Laitos Institution Department Tekijä Författare Author Työn nimi Arbetets titel Title Oppiaine Läroämne Subject Työn laji Arbetets art Level Aika Datum Month
Englannin lausekerakenteita ja taulukkojäsentäminen
Englannin lausekerakenteita ja taulukkojäsentäminen Kontekstittomat jäsennysmenetelmät Lili Aunimo lili.aunimo@helsinki.fi Helsingin yliopisto Kieliteknologia Lili Aunimo Englannin lausekerakenteita ja
Luonnontieteiden popularisointi ja sen ideologia
Luonnontieteiden popularisointi ja sen ideologia Tapauksina Reino Tuokko ja Helsingin Sanomat 1960-luvulla Ahto Apajalahti Helsingin yliopisto Humanistinen tiedekunta Suomen ja Pohjoismaiden historia Pro
Ohjelmistotekniikan menetelmät Luokkamallit ohjelmiston mallintamisessa Harri Laine 1
Ohjelmistotekniikan menetelmät Luokkamallit ohjelmiston mallintamisessa 14.11.2008 Harri Laine 1 Oliot ohjelmiston mallinnuksessa käyttötapaus käyttää Käyttämämme oliokeskeinen perusmalli ohjelmistojen
Ohjelmistojen mallintaminen, mallintaminen ja UML
582104 Ohjelmistojen mallintaminen, mallintaminen ja UML 1 Mallintaminen ja UML Ohjelmistojen mallintamisesta ja kuvaamisesta Oliomallinnus ja UML Käyttötapauskaaviot Luokkakaaviot Sekvenssikaaviot 2 Yleisesti
Automaattinen semanttinen annotointi
Automaattinen semanttinen annotointi Matias Frosterus, Reetta Sinkkilä, Katariina Nyberg Semantic Computing Research Group (SeCo) School of Science and Technology, Department of Media Technology and University
! #! %! & #!!!!! ()) +
! #! %! & #!!!!! ()) + Tiedekunta/Osasto Fakultet/Sektion Faculty Humanistinen tiedekunta Laitos Institution Department Taiteiden tutkimuksen laitos Tekijä Författare Author Matti Pesonen Työn nimi Arbetets
PN-puu. Helsinki Seminaari: Tietokannat nyt HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos
PN-puu Erno Härkönen Helsinki 24.10.2006 Seminaari: Tietokannat nyt HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos HELSINGIN YLIOPISTO HELSINGFORS UNIVERSITET UNIVERSITY OF HELSINKI Tiedekunta/Osasto
JOHDATUS TEKOÄLYYN TEEMU ROOS
JOHDATUS TEKOÄLYYN TEEMU ROOS LUONNOLLISEN KIELEN KÄSITTELY (NATURAL LANGUAGE PROCESSING, NLP) TEKOÄLYSOVELLUKSET, JOTKA LIITTYVÄT IHMISTEN KANSSA (TAI IHMISTEN VÄLISEEN) KOMMUNIKAATIOON, OVAT TEKEMISISSÄ
Luento 12: XML ja metatieto
Luento 12: XML ja metatieto AS-0.110 XML-kuvauskielten perusteet Janne Kalliola XML ja metatieto Metatieto rakenne sanasto Resource Description Framework graafikuvaus XML Semanttinen Web agentit 2 1 Metatieto
Algoritmit 2. Luento 6 To Timo Männikkö
Algoritmit 2 Luento 6 To 28.3.2019 Timo Männikkö Luento 6 B-puun operaatiot Nelipuu Trie-rakenteet Standarditrie Pakattu trie Algoritmit 2 Kevät 2019 Luento 6 To 28.3.2019 2/30 B-puu 40 60 80 130 90 100
Maailman muutosta tallentamassa Marko Vuokolan The Seventh Wave -valokuvasarja avauksena taidevalokuvan aikaan
Maailman muutosta tallentamassa Marko Vuokolan The Seventh Wave -valokuvasarja avauksena taidevalokuvan aikaan Pro gradu -tutkielma 31.1.2012 Helsingin yliopisto Humanistinen tiedekunta Filosofian, historian,
Pinot, jonot, yleisemmin sekvenssit: kokoelma peräkkäisiä alkioita (lineaarinen järjestys) Yleisempi tilanne: alkioiden hierarkia
Pinot, jonot, yleisemmin sekvenssit: kokoelma peräkkäisiä alkioita (lineaarinen järjestys) Yleisempi tilanne: alkioiden hierarkia Kukin alkio (viite) talletettuna solmuun (node) vastaa paikan käsitettä
Algoritmit 1. Luento 7 Ti Timo Männikkö
Algoritmit 1 Luento 7 Ti 31.1.2017 Timo Männikkö Luento 7 Järjestetty binääripuu Binääripuiden termejä Binääripuiden operaatiot Solmun haku, lisäys, poisto Algoritmit 1 Kevät 2017 Luento 7 Ti 31.1.2017
Yhteentoimivuusalusta: Miten saadaan ihmiset ja koneet ymmärtämään toisiaan paremmin?
Yhteentoimivuusalusta: Miten saadaan ihmiset ja koneet ymmärtämään toisiaan paremmin? Avoin verkkoalusta ihmisen ja koneen ymmärtämien tietomääritysten tekemiseen Riitta Alkula 20.3.2019 Esityksen sisältö
Katsaus korruption vaikutuksesta Venäjän alueelliseen talouskasvuun ja suoriin ulkomaisiin investointeihin
INSTITUUTIOTTALOUSKASVUNEDELLYTYKSENÄ KatsauskorruptionvaikutuksestaVenäjänalueelliseentalouskasvuunjasuoriin ulkomaisiininvestointeihin2000 2010 AshekMohamedTarikHossain HelsinginYliopisto Valtiotieteellinentiedekunta
Algoritmit 2. Luento 5 Ti Timo Männikkö
Algoritmit 2 Luento 5 Ti 26.3.2019 Timo Männikkö Luento 5 Puurakenteet B-puu B-puun korkeus B-puun operaatiot B-puun muunnelmia Algoritmit 2 Kevät 2019 Luento 5 Ti 26.3.2019 2/34 B-puu B-puut ovat tasapainoisia
TIEA241 Automaatit ja kieliopit, syksy Antti-Juhani Kaijanaho. 30. marraskuuta 2015
TIEA241 Automaatit ja kieliopit, syksy 2015 Antti-Juhani Kaijanaho TIETOTEKNIIKAN LAITOS 30. marraskuuta 2015 Sisällys t Väitöstilaisuus 4.12.2015 kello 12 vanhassa juhlasalissa S212 saa tulla 2 demoruksia
3. Käsiteanalyysi ja käsitekaavio
3. Käsiteanalyysi ja käsitekaavio lehtori Pasi Ranne Metropolia ammattikorkeakoulu E-mail: pasi.ranne@metropolia.fi sivu 1 Käsiteanalyysi Selvitetään mitä tietokantaan pitää tallentaa Lähtökohtana käyttäjien
Ohjelmistotekniikan menetelmät, luokkamallin laatiminen
582101 - Ohjelmistotekniikan menetelmät, luokkamallin laatiminen 1 Lähestymistapoja Kokonaisvaltainen lähestymistapa (top-down) etsitään kerralla koko kohdealuetta kuvaavaa mallia hankalaa, jos kohdealue
Tietokantojen perusteet k2004helsingin yliopisto/tktl Tietokantojen perusteet, s 2007 ER-mallin peruskäsitteet.
Tietosisällön kuvaaminen Toteutusvälineistä riippumaton tietosisällön kuvaus Entity-Relationship malliperhe Lähtökohta: Chenin malli vuodelta 1976 Useita muunnelmia, pieniä eroja peruskäsitteissä ja erityisesti
Verbin valenssi määrää, minkälaisia argumentteja ja komplementteja verbi odottaa saavansa millaisissa lauseissa verbi voi esiintyä.
Valenssista Valenssi saksalaisessa ja venäläisessä kieliopintutkimuksessa käytetty nimitys, joka tavallisesti tarkoittaa verbin ominaisuutta: sitä, kuinka monta ja millaisia nomineja obligatorisesti ja
Oppimateriaalin kokoaminen ja paketointi
Oppimateriaalin kokoaminen ja paketointi Pekka Simola Helsinki 14.4.2004 HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos HELSINGIN YLIOPISTO HELSINGFORS UNIVERSITET UNIVERSITY OF HELSINKI Tiedekunta/Osasto
Julian graafinen annotointityökalu ja erityisontologioiden editori. Jaason Haapakoski P Kansanterveyslaitos , 28.3.
Julian graafinen annotointityökalu ja erityisontologioiden editori Jaason Haapakoski P. 040 7612 811 Kansanterveyslaitos 28.2.2006, 28.3.2006 Perusnäkymä Ohjelmalle on konfiguroitavissa useita eri käsitteistöjä
Epätäsmällisen tiedon esittäminen semanttisen webin ontologioissa
Epätäsmällisen tiedon esittäminen semanttisen webin ontologioissa FinnOnto, 16.11.2005 Markus Holi (markus.holi@tkk.fi) Semantic Computing Research Group http://www.seco.tkk.fi/ UNIVERSITY OF HELSINKI
Koht dialogia? Organisaation toimintaympäristön teemojen hallinta dynaamisessa julkisuudessa tarkastelussa toiminta sosiaalisessa mediassa
Kohtdialogia? Organisaationtoimintaympäristönteemojenhallinta dynaamisessajulkisuudessatarkastelussatoiminta sosiaalisessamediassa SatuMariaPusa Helsinginyliopisto Valtiotieteellinentiedekunta Sosiaalitieteidenlaitos
Algoritmit 2. Luento 4 Ke Timo Männikkö
Algoritmit 2 Luento 4 Ke 22.3.2017 Timo Männikkö Luento 4 Hajautus Yhteentörmäysten käsittely Avoin osoitteenmuodostus Hajautusfunktiot Puurakenteet Solmujen läpikäynti Algoritmit 2 Kevät 2017 Luento 4
Jäsennysaiheesta lisää Täydentäviä muistiinpanoja TIEA241 Automaatit ja kieliopit, syksy 2016
Jäsennysaiheesta lisää Täydentäviä muistiinpanoja TIA241 Automaatit ja kieliopit, syksy 2016 Antti-Juhani Kaijanaho 4. lokakuuta 2016 1 simerkki arleyn algoritmin soveltamisesta Tämä esimerkki on laadittu
Ongelma(t): Miten jollakin korkeamman tason ohjelmointikielellä esitetty algoritmi saadaan suoritettua mikro-ohjelmoitavalla tietokoneella ja siinä
Ongelma(t): Miten jollakin korkeamman tason ohjelmointikielellä esitetty algoritmi saadaan suoritettua mikro-ohjelmoitavalla tietokoneella ja siinä olevilla komponenteilla? Voisiko jollakin ohjelmointikielellä
Algoritmit 2. Luento 5 Ti Timo Männikkö
Algoritmit 2 Luento 5 Ti 28.3.2017 Timo Männikkö Luento 5 Puurakenteet B-puu B-puun korkeus B-puun operaatiot Algoritmit 2 Kevät 2017 Luento 5 Ti 28.3.2017 2/29 B-puu Algoritmit 2 Kevät 2017 Luento 5 Ti
A274101 TIETORAKENTEET JA ALGORITMIT
A274101 TIETORAKENTEET JA ALGORITMIT PUURAKENTEET, BINÄÄRIPUU, TASAPAINOTETUT PUUT MIKÄ ON PUUTIETORAKENNE? Esim. Viereinen kuva esittää erästä puuta. Tietojenkäsittelytieteessä puut kasvavat alaspäin.
Algoritmit 2. Luento 4 To Timo Männikkö
Algoritmit 2 Luento 4 To 21.3.2019 Timo Männikkö Luento 4 Hajautus Yhteentörmäysten käsittely Avoin osoitteenmuodostus Hajautusfunktiot Puurakenteet Solmujen läpikäynti Algoritmit 2 Kevät 2019 Luento 4
CIRI Ontologiaperustainen tiedonhakuliittymä
CIRI Ontologiaperustainen tiedonhakuliittymä Eija Airio, Kalervo Järvelin, Sari Suomela, Pirkko Saatsi ja Jaana Kekäläinen Tampereen yliopisto Informaatiotutkimuksen laitos Ontologian kolmitasomalli kehitetty
ARVO - verkkomateriaalien arviointiin
ARVO - verkkomateriaalien arviointiin Arvioitava kohde: Jenni Rikala: Aloittavan yrityksen suunnittelu, Arvioija: Heli Viinikainen, Arviointipäivämäärä: 12.3.2010 Osa-alue 1/8: Informaation esitystapa
Sisällönanalyysi. Sisältö
Sisällönanalyysi Kirsi Silius 14.4.2005 Sisältö Sisällönanalyysin kohde Aineistolähtöinen sisällönanalyysi Teoriaohjaava ja teorialähtöinen sisällönanalyysi Sisällönanalyysi kirjallisuuskatsauksessa 1
Rakenteisen oppimateriaalin tuottaminen verkossa esimerkki Rhaptos. Antti Auer Koordinaattori, HT Jyväskylän yliopisto Virtuaaliyliopistohanke
Rakenteisen oppimateriaalin tuottaminen verkossa esimerkki Rhaptos Antti Auer Koordinaattori, HT Jyväskylän yliopisto Virtuaaliyliopistohanke Rakenteisuus kahdella tasolla Oppimisaihiot ( Learning Objects
2. Olio-ohjelmoinnin perusteita 2.1
2. Olio-ohjelmoinnin perusteita 2.1 Sisällys Esitellään peruskäsitteitä yleisellä tasolla: Luokat ja oliot. Käsitteet, luokat ja oliot. Attribuutit, olion tila ja identiteetti. Metodit ja viestit. Olioperustainen
v 1 v 2 v 3 v 4 d lapsisolmua d 1 avainta lapsen v i alipuun avaimet k i 1 ja k i k 0 =, k d = Sisäsolmuissa vähint. yksi avain vähint.
Yleiset hakupuut 4 Monitiehakupuu: Binäärihakupuu 0 1 3 5 6 7 8 v k 1 k k 3 v v 3 v 4 k 1 k 3 k 1 k k k 3 d lapsisolmua d 1 avainta Yleinen hakupuu? Tietorakenteet, syksy 007 1 Esimerkki monitiehakupuusta
Algoritmit 2. Luento 6 Ke Timo Männikkö
Algoritmit 2 Luento 6 Ke 29.3.2017 Timo Männikkö Luento 6 B-puun operaatiot B-puun muunnelmia Nelipuu Trie-rakenteet Standarditrie Pakattu trie Algoritmit 2 Kevät 2017 Luento 6 Ke 29.3.2017 2/31 B-puu
Analyysi, staattinen mallintaminen, kohdealueen malli ja luokkakaavio
Analyysi, staattinen mallintaminen, kohdealueen malli ja luokkakaavio Analyysi Tarkentaa ja jäsentää vaatimusmäärittelyä, vastaa kysymykseen MITÄ järjestelmän tulisi tehdä. Suoritetaan seuraavia tehtäviä:
TIEDONHALLINTA - SYKSY Luento 7. Pasi Ranne /10/17 Helsinki Metropolia University of Applied Sciences
TIEDONHALLINTA - SYKSY 2017 Kurssikoodi: Saapumisryhmä: Luento 7 TX00CN57-3001 TXQ16ICT, TXQ16S1 ja TXQ16PROS Pasi Ranne 02.10.2017 1/10/17 Helsinki Metropolia University of Applied Sciences 1 Tietokannan
Hallintomallit Suomen valtionhallinnon tietohallintostrategioissa
Hallintomallit Suomen valtionhallinnon tietohallintostrategioissa Lauri Eloranta Helsingin yliopisto Valtiotieteellinen tiedekunta Viestintä Pro gradu -tutkielma, 2014 Hallintomallit)Suomen)valtionhallinnon)tietohallintostrategioissa
Semanttinen Web. Ossi Nykänen. Tampereen teknillinen yliopisto (TTY), Digitaalisen median instituutti (DMI), Hypermedialaboratorio W3C Suomen toimisto
Semanttinen Web Ossi Nykänen Tampereen teknillinen yliopisto (TTY), Digitaalisen median instituutti (DMI), Hypermedialaboratorio W3C Suomen toimisto Esitelmä Hyvin lyhyt versio: Semanttinen Web (SW) on
The OWL-S are not what they seem
The OWL-S are not what they seem...vai ovatko? Verkkopalveluiden koostamisen ontologia OWL-S Seminaariesitelmä 15.4.2013 Emilia Hjelm Internet on hankala Nykyinternet on dokumenttien verkko Asiat, joita
Algoritmit 2. Luento 2 Ke Timo Männikkö
Algoritmit 2 Luento 2 Ke 15.3.2017 Timo Männikkö Luento 2 Tietorakenteet Lineaarinen lista, binääripuu Prioriteettijono Kekorakenne Keko-operaatiot Keon toteutus taulukolla Algoritmit 2 Kevät 2017 Luento
Tiedekunta/Osasto Fakultet/Sektion Faculty Valtiotieteellinen tiedekunta
Tiedekunta/Osasto Fakultet/Sektion Faculty Valtiotieteellinen tiedekunta Laitos Institution Department Politiikan ja talouden tutkimuksen laitos Tekijä Författare Author Virta, Mikko Antero Työn nimi Arbetets
Laskennallinen yhteiskuntatiede
Laskennallinen yhteiskuntatiede Matti Nelimarkka Helsinki 5.5.2011 LuK tutkielma HELSINGIN YLIOPISTO Tietojenkasittelytieteen laitos HELSINGIN YLIOPISTO HELSINGFORS UNIVERSITET UNIVERSITY OF HELSINKI Tiedekunta
Useaa tietolähdettä käyttävä klusterointi
Useaa tietolähdettä käyttävä klusterointi Mikko Heinonen Tiedon louhinnan seminaari, kevät 2008 HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos 1 HELSINGIN YLIOPISTO HELSINGFORS UNIVERSITET UNIVERSITY
Palvelun versio 1.0 Toimeenpanopalvelun tunnus (ks. M ) 10fea, 9c2f, 4760, 9095, f4f9295f4b19
1 5. Luokittamispalvelu 5.1. Palveluinformaatio Palvelun nimi Luokittamispalvelu Palvelun versio 1.0 Toimeenpanopalvelun tunnus (ks. M14.4.42) 10fea, 9c2f, 4760, 9095, f4f9295f4b19 5.2 Avainkäsitteet 5.2.1
Algoritmit 2. Luento 2 To Timo Männikkö
Algoritmit 2 Luento 2 To 14.3.2019 Timo Männikkö Luento 2 Tietorakenteet Lineaarinen lista, binääripuu Prioriteettijono Kekorakenne Keko-operaatiot Keon toteutus taulukolla Algoritmit 2 Kevät 2019 Luento
Ohjelmistojen mallintaminen luokkamallin lisäpiirteitä
582104 Ohjelmistojen mallintaminen luokkamallin lisäpiirteitä 1 Luokkamallin lisäpiirteitä Erilaiset yhteystyypit kooste kompositio Muita luokkien välisiä suhteita riippuvuudet periytyminen eli luokkahierarkia
Yhteentoimivuusvälineistö
Yhteentoimivuusvälineistö Yhteinen tiedon hallinta (YTI) hanke V 1.0, 5.9.2017 Päivittyvä Miksi yhteentoimivuusvälineistöä tarvitaan? Ongelmana on kielen moniselitteisyys Tavallisessa kielenkäytössä emme
Täydentäviä muistiinpanoja jäsennysalgoritmeista
äydentäviä muistiinpanoja jäsennysalgoritmeista Antti-Juhani Kaijanaho 7. helmikuuta 2012 1 simerkki arleyn algoritmin soveltamisesta arkastellaan kielioppia G : + () c ja sovelletaan arleyn algoritmia
8 XSLT-muunnoskieli XSLT-muunnoskieli
8 XSLT-muunnoskieli 51 8 XSLT-muunnoskieli XML-dokumentti kuvaa siis vain tiedon sisältöä eikä määritä ulkoasua mitenkään. CSS on suunniteltu HTML-dokumenttien ulkoasun kuvaamiseen eli tiedon esittämiseen
Fakta- ja näytenäkökulmat. Pertti Alasuutari Tampereen yliopisto
Fakta- ja näytenäkökulmat Pertti Alasuutari Tampereen yliopisto Mikä on faktanäkökulma? sosiaalitutkimuksen historia: väestötilastot, kuolleisuus- ja syntyvyystaulut. Myöhemmin kysyttiin ihmisiltä tietoa
MEMS-muisti relaatiotietokannoissa
MEMS-muisti relaatiotietokannoissa Antti Tikka Espoo 28.2.2009 Seminaari HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos HELSINGIN YLIOPISTO HELSINGFORS UNIVERSITET UNIVERSITY OF HELSINKI Tiedekunta/Osasto
TIEA241 Automaatit ja kieliopit, kevät Antti-Juhani Kaijanaho. 2. helmikuuta 2012
TIEA241 Automaatit ja, kevät 2012 Antti-Juhani Kaijanaho TIETOTEKNIIKAN LAITOS 2. helmikuuta 2012 Sisällys Sisällys Chomskyn hierarkia kieli säännöllinen kontekstiton kontekstinen rekursiivisesti lueteltava
PSY181 Psykologisen tutkimuksen perusteet, kirjallinen harjoitustyö ja kirjatentti
PSY181 Psykologisen tutkimuksen perusteet, kirjallinen harjoitustyö ja kirjatentti Harjoitustyön ohje Tehtävänäsi on laatia tutkimussuunnitelma. Itse tutkimusta ei toteuteta, mutta suunnitelman tulisi
11.4. Context-free kielet 1 / 17
11.4. Context-free kielet 1 / 17 Määritelmä Tyypin 2 kielioppi (lauseyhteysvapaa, context free): jos jokainenp :n sääntö on muotoa A w, missäa V \V T jaw V. Context-free kielet ja kieliopit ovat tärkeitä
Etsintä verkosta (Searching from the Web) T Datasta tietoon Heikki Mannila, Jouni Seppänen
Etsintä verkosta (Searching from the Web) T-61.2010 Datasta tietoon Heikki Mannila, Jouni Seppänen 12.12.2007 Webin lyhyt historia http://info.cern.ch/proposal.html http://browser.arachne.cz/screen/
luonnonilmiölauseessa paikan tai ajan ilmaus täyttää subjektin paikan: tunnekausatiivilauseissa subjektin paikan perii partitiivimuotoinen kokija:
Sanajärjestys ja subjektin paikka subjektittomat lauseet jättävät subjektin normaalin, finiittiverbiä edeltävän paikan tyhjäksi ellipsi- ja pronominin poisjättötapauksissa paikka jää tyhjäksi: Ø Lähdemme
TIEA241 Automaatit ja kieliopit, syksy Antti-Juhani Kaijanaho. 3. lokakuuta 2016
TIEA241 Automaatit ja kieliopit, syksy 2016 Antti-Juhani Kaijanaho TIETOTEKNIIKAN LAITOS 3. lokakuuta 2016 Sisällys n tunnistin Jay : An Efficient Context-Free Parsing Algorithm. Communications of the
Työkalujen merkitys mittaamisessa
Työkalujen merkitys mittaamisessa Mittaaminen ja Ohjelmistotuotanto -seminaari Toni Sandelin 18.4.2001, VTT Elektroniikka, Oulu 1 Sisältö Mihin työkalutukea tarvitaan? Työkalut & metriikat: luokitus Mittausohjelmien
Puhesynteesin perusteet Luento 5: unit selection -synteesi
Puhesynteesin perusteet Luento 5: unit selection -synteesi Nicholas Volk 14.2.2008 Käyttäytymistieteellinen tiedekunta Idea Aitoa puhetta on tallennettu tietokantaan tuhansien äänteiden verran Jopa yksittäisen
Kieli merkitys ja logiikka. 2: Helpot ja monimutkaiset. Luento 2. Monimutkaiset ongelmat. Monimutkaiset ongelmat
Luento 2. Kieli merkitys ja logiikka 2: Helpot ja monimutkaiset Helpot ja monimutkaiset ongelmat Tehtävä: etsi säkillinen rahaa talosta, jossa on monta huonetta. Ratkaisu: täydellinen haku käy huoneet
Department of Mathematics, Hypermedia Laboratory Tampere University of Technology. Roolit Verkostoissa: HITS. Idea.
Roolit Tommi Perälä Department of Mathematics, Hypermedia Laboratory Tampere University of Technology 25.3.2011 J. Kleinberg kehitti -algoritmin (Hypertext Induced Topic Search) hakukoneen osaksi. n taustalla
Tenttikysymykset. + UML- kaavioiden mallintamistehtävät
Tenttikysymykset 1. Selitä mitä asioita kuuluu tietojärjestelmän käsitteeseen. 2. Selitä kapseloinnin ja tiedon suojauksen periaatteet oliolähestymistavassa ja mitä hyötyä näistä periaatteista on. 3. Selitä
Muotoilumaailman hahmottaminen - Tuotesemantiikka
TUOTESEMANTIIKAN TEORIA kreik. semeion = merkki Tuotesemantiikka kiinnostaa tutkimusmielessä monia erilaisia tuotteiden kanssa tekemisiin joutuvia elämänalueita. Sellaisia ovat esimerkiksi Markkinointi,
Tietokantojen suunnittelu, relaatiokantojen perusteita
Tietokantojen suunnittelu, relaatiokantojen perusteita A277, Tietokannat Teemu Saarelainen teemu.saarelainen@kyamk.fi Lähteet: Leon Atkinson: core MySQL Ari Hovi: SQL-opas TTY:n tietokantojen perusteet-kurssin
T Syksy 2004 Logiikka tietotekniikassa: perusteet Laskuharjoitus 7 (opetusmoniste, kappaleet )
T-79144 Syksy 2004 Logiikka tietotekniikassa: perusteet Laskuharjoitus 7 (opetusmoniste, kappaleet 11-22) 26 29102004 1 Ilmaise seuraavat lauseet predikaattilogiikalla: a) Jokin porteista on viallinen
Paikkatiedon hallinta ja analyysi 4. Paikkatiedon indeksointi
HELSINGIN YLIOPISTO HELSINGFORS UNIVERSITET UNIVERSITY OF HELSINKI Paikkatiedon hallinta ja analyysi 4. Paikkatiedon indeksointi Antti Leino 29. maaliskuuta 2005 Tietojenkäsittelytieteen
jäsentäminen TIEA241 Automaatit ja kieliopit, syksy 2015 Antti-Juhani Kaijanaho 26. marraskuuta 2015 TIETOTEKNIIKAN LAITOS
TIEA241 Automaatit ja kieliopit, syksy 2015 Antti-Juhani Kaijanaho TIETOTEKNIIKAN LAITOS 26. marraskuuta 2015 Sisällys Tunnistamis- ja jäsennysongelma Olkoon G = (N, Σ, P, S) kontekstiton kielioppi ja
Johnson, A Theoretician's Guide to the Experimental Analysis of Algorithms.
Kokeellinen algoritmiikka (3 ov) syventäviä opintoja edeltävät opinnot: ainakin Tietorakenteet hyödyllisiä opintoja: ASA, Algoritmiohjelmointi suoritus harjoitustyöllä (ei tenttiä) Kirjallisuutta: Johnson,
FORMAALI SYSTEEMI (in Nutshell): aakkosto: alkeismerkkien joukko kieliopin määräämä syntaksi: sallittujen merkkijonojen rakenne, formaali kuvaus
FORMAALI SYSTEEMI (in Nutshell): Formaali kieli: aakkosto: alkeismerkkien joukko kieliopin määräämä syntaksi: sallittujen merkkijonojen rakenne, formaali kuvaus esim. SSM:n tai EBNF:n avulla Semantiikka:
Algoritmi on periaatteellisella tasolla seuraava:
Algoritmi on periaatteellisella tasolla seuraava: Dijkstra(V, E, l, v 0 ): S := { v 0 } D[v 0 ] := 0 for v V S do D[v] := l(v 0, v) end for while S V do valitse v V S jolle D[v] on minimaalinen S := S
Fenomenografia. Hypermedian jatko-opintoseminaari Päivi Mikkonen
Fenomenografia Hypermedian jatko-opintoseminaari 12.12.2008 Päivi Mikkonen Mitä on fenomenografia? Historiaa Saksalainen filosofi Ulrich Sonnemann oli ensimmäinen joka käytti sanaa fenomenografia vuonna
Mitä murteita Suomessa onkaan?
HELSINGIN YLIOPISTO HELSINGFORS UNIVERSITET UNIVERSITY OF HELSINKI Mitä murteita Suomessa onkaan? Antti Leino antti.leino@cs.helsinki.fi 9. syyskuuta 2006 Tietojenkäsittelytieteen laitos Kotimaisten kielten
T Luonnollisen kielen tilastollinen käsittely Vastaukset 3, ti , 8:30-10:00 Kollokaatiot, Versio 1.1
T-61.281 Luonnollisen kielen tilastollinen käsittely Vastaukset 3, ti 10.2.2004, 8:30-10:00 Kollokaatiot, Versio 1.1 1. Lasketaan ensin tulokset sanaparille valkoinen, talo käsin: Frekvenssimenetelmä:
1 Kannat ja kannanvaihto
1 Kannat ja kannanvaihto 1.1 Koordinaattivektori Oletetaan, että V on K-vektoriavaruus, jolla on kanta S = (v 1, v 2,..., v n ). Avaruuden V vektori v voidaan kirjoittaa kannan vektorien lineaarikombinaationa:
HELIA 1 (17) Outi Virkki Tiedonhallinta 4.11.2000
HELIA 1 (17) Luento 4.5 Normalisointi... 2 Tavoitteet... 2 Attribuuttien väliset riippuvuudet... 4 Funktionaalinen / moniarvoinen riippuvuus... 4 Transitiivinen / suora riippuvuus... 6 Täydellinen / osittainen
Yhdyssana suomen kielessä ja puheessa
Yhdyssana suomen kielessä ja puheessa Tommi Nieminen Jyväskylän yliopisto Anna Lantee Tampereen yliopisto 37. Kielitieteen päivät Helsingissä 20. 22.5.2010 Yhdyssanan ortografian historia yhdyssanan käsite
Transitiivisuus. Tommi Jantunen, SVKS112,
Transitiivisuus Tommi Jantunen, SVKS112, 19.3.2019 Transitiivisuus verbien vertailukäsitteenä HASPELMATH, M. (2015). Transitivity prominence. In A. Malchukov & B. Comrie (Eds.), Valency classes in the
Malliperustainen ohjelmistokehitys (Model-Driven Engineering, MDE)
Malliperustainen ohjelmistokehitys (Model-Driven Engineering, MDE) Pasi Lehtimäki Helsinki 10.9.2007 HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos HELSINGIN YLIOPISTO HELSINGFORS UNIVERSITET UNIVERSITY
HELIA 1 (14) Outi Virkki Käyttöliittymät ja ohjlmiston suunnittelu
HELIA 1 (14) Luento 7 Käyttöliittymäolio... 2 Olioajattelun perusteet... 3 Tavoitteet... 3 Peruskäsitteet... 4 Olio / Olioinstanssi / Olion esiintymä... 4 Ominaisuudet... 4 Toiminnot... 4 Olioluokka /
näkökulma lähekkäisten vedenkokoumien nimeämiseen
näkökulma lähekkäisten vedenkokoumien nimeämiseen http://www.cs.helsinki.fi/u/leino/jutut/ktp-03/ leino@cs.helsinki.fi aleino@kotus.fi 13. toukokuuta 2003 Sivu 0 / 6 Maanmittauslaitoksen paikannimirekisteri
Suunnitteluvaihe prosessissa
Suunnittelu Suunnitteluvaihe prosessissa Silta analyysin ja toteutuksen välillä (raja usein hämärä kumpaankin suuntaan) Asteittain tarkentuva Analyysi -Korkea abstraktiotaso -Sovellusläheiset käsitteet
Arkkitehtuurinen reflektio
Arkkitehtuurinen reflektio Toni Ruokolainen Toni.Ruokolainen@cs.helsinki.fi Helsinki 6.10.2003 Tiivistelmä HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos HELSINGIN YLIOPISTO HELSINGFORS UNIVERSITET
Äärellisten automaattien ja säännöllisten lausekkeiden minimointi
Äärellisten automaattien ja säännöllisten lausekkeiden minimointi Timi Suominen, Riia Ohtamaa ja Pessi Moilanen Helsinki..01 HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos Äärellisten automaattien
TIEA241 Automaatit ja kieliopit, syksy 2015. Antti-Juhani Kaijanaho. 3. joulukuuta 2015
TIEA241 Automaatit ja, syksy 2015 Antti-Juhani Kaijanaho TIETOTEKNIIKAN LAITOS 3. joulukuuta 2015 Sisällys Formaalisti Määritelmä Nelikko G = (V, Σ, P, S) on kontekstiton kielioppi (engl. context-free
Rajapinnasta ei voida muodostaa olioita. Voidaan käyttää tunnuksen tyyppinä. Rajapinta on kuitenkin abstraktia luokkaa selvästi abstraktimpi tyyppi.
11. Rajapinnat 11.1 Sisällys Johdanto. Abstrakti luokka vai rajapinta? Rajapintojen hyötyjä. Kuinka rajapinnat määritellään ja otetaan käyttöön? Eläin, nisäkäs, kissa ja rajapinta. Moniperiytyminen rajapintojen
Eero Hyvönen. Semanttinen web. Linkitetyn avoimen datan käsikirja
Eero Hyvönen Semanttinen web Linkitetyn avoimen datan käsikirja WSOY:n kirjallisuussäätiö on tukenut teoksen kirjoittamista Copyright 2018 Eero Hyvönen & Gaudeamus Gaudeamus Oy www.gaudeamus.fi Kansi:
Pinoautomaatit. TIEA241 Automaatit ja kieliopit, syksy Antti-Juhani Kaijanaho. 6. lokakuuta 2016 TIETOTEKNIIKAN LAITOS
.. TIEA241 Automaatit ja kieliopit, syksy 2016 Antti-Juhani Kaijanaho TIETOTEKNIIKAN LAITOS 6. lokakuuta 2016 Sisällys. Harjoitustehtävätilastoja Tilanne 6.10.2016 klo 8:28 passed potential redo submitters