14. Haku sisällön perusteella Johdanto
|
|
- Siiri Niemi
- 8 vuotta sitten
- Katselukertoja:
Transkriptio
1 4. Haku sisällön perusteella 4.. Johdanto Tietokantojen yhteydessä perinteinen kyselyn käsite on hyvin määritelty. Tiedonlouhinnassa on kyse edellistä yleisimmistä, mutta vähemmän täsmällisistä kyselyistä. Olkoon esimerkkinä lääketieteellinen data, jossa on potilastietoa, kuten demografista (ikä, sukupuoli jne.), verikokeiden tuloksia ja muita fysiologisia testituloksia sekä biolääketieteellisiä aikasarjoja ja röntgenkuvia. Lääkäriä kiinnostaisi tietää, sisältääkö sairaalan tietokanta ketään samankaltaista potilasta ja myönteisessä tapauksessa tämän diagnoosit, hoidot ja tulokset. Ongelman vaikea osa on määritellä samanlaisuus potilaiden joukossa eri datatyyppeihin pohjautuen (tässä monimuuttujaiset, aikasarjat ja kuvadata). Tarkan täsmäyksen käsite on tällöin jokseenkin epätarkoituksenmukainen, koska on sangen epätodennäköistä, että olisi toista täsmälleen samanlaista potilasta käytettyjen mittausten suhteen. 4. luku 580 Tarkastellaan em. kaltaisia ongelmia ja varsinkin niihin liittyen teknisiä ongelmia, joihin on vastattava kyselyiden mahdollistamiseksi yleismuotoisista datajoukoista: Etsi datajoukosta k kohdetta, jotka ovat samanlaisimmat määrätyn kyselyn tai kohteen kanssa. Esimerkkejä voivat olla: Satelliittikuvatietokannasta etsitään maasta kuvia, jotka sisältävät todisteita tulivuorenpurkauksista Keski Amerikassa. Etsitään tietoverkosta dokumentteja, jotka käsittelevät tietoa Tampereen ravintoloista. 4. luku 58 Tällaista hakumuotoa pidetään vuorovaikutteisena tiedonlouhintana, koska käyttäjä vaikuttaa suoraan datan tutkimiseen määrittämällä kyselyjä ja tulkitsemalla tuloksia prosessin kuluessa. Tämä on vastakohtainen tilanne verrattuna moniin ennustavan ja kuvaavan tiedonlouhinnan tehtäviin. Tavallisesti on esimerkkitapaus sille, mitä pyritään etsimään, kyselyhahmo Q. Siitä johdetaan, mitkä tietokannan muut kohteet ovat samanlaisimmat sen kanssa. Lähestymistapa tunnetaan hakuna sisällön perusteella. Tunnetuin sovellus on tekstihaku. Kyselyhahmo Q on yleensä suppea (kyselysanojen lista) ja se täsmätään suuren dokumenttien joukon kanssa. 4. luku 582 Keskitytään lähinnä tekstidokumentteihin, koska tämä on tunnetuin ja kypsin sovellusalue. Yleisen ongelman voidaan ymmärtää käsittävän kolme peruskomponenttia: miten määritellään kohteiden välinen samanlaisuusmitta, miten toteutetaan laskennallisesti tehokas hakualgoritmi (tunnettaessa samanlaisuusmitta) ja miten sisällytetään käyttäjän palaute ja vuorovaikutus hakuprosessiin. Pohditaan pääasiassa ensimmäistä ja kolmatta kysymystä; toista tarkasteltiin luvussa luku 583
2 Haku sisällön perusteella nojautuu voimakkaasti samanlaisuuden tai sen vastakohdan etäisyyden käsitteeseen. Luvussa 2 käsiteltiin erilaisia etäisyyksiä. Näistä on hyvä huomata, esim. euklidisesta, että kysymys on matemaattisista etäisyysfunktioista, jotka eivät välttämättä vastaa intuitiota samanlaisuudesta ihmisen näkökulmasta. Esim. tekstidokumenttien yhteydessä semanttinen sisältö voi olla merkittävä. 4. luku Hakujärjestelmien arviointi Haun tehokkuuden arvioinnin vaikeus Luokittelussa ja regressiossa mallin suorituskykyä voidaan aina arvioida objektiivisesti estimoimalla sen tarkkuutta kokeellisesti. Haussa sisällön perusteella suorituskykyarvioinnin ongelma on vaikeampi. Perimmäinen vaikeus on se, että hakusysteemin hyvyys määrätään haetun informaation hyödyllisyydellä. Sovelluksissa tällainen mitta on luonteeltaan subjektiivinen. Haku on käyttäjäkeskeistä ja vuorovaikutteista, mikä tekee suorituskykyarvioinnista vaikeaa. Joitakin melko objektiivisia menetelmiä voidaan arviointia varten kuitenkin antaa tehtäessä ensin muutama yksinkertaistus. Oletetaan, että jokaiselle kyselylle on olemassa tieto (binääri luokitteluarvo), mikä kohde on relevantti kyseiselle kyselylle. Käytännön kannalta tällainen arvo on luonnollisesti yksinkertaistus, sekä arvon binäärisyys että oletus sen olemassaolosta jokaiselle tapaukselle. 4. luku Täsmällisyys vastaan palautus Arvioidaan jonkin hakualgoritmin suorituskykyä määrätyn kyselyn Q tilanteessa riippumattomalla datajoukolla. Tämän kohteet on luokiteltu etukäteen joko relevanteiksi tai epärelevanteiksi kyselyn Q suhteen. Oletetaan luonnollisesti, että testidataa ei ole käytetty hakualgoritmin suorituskyvyn säätämiseen. Voidaan siis ajatella algoritmin yksinkertaisesti luokittelevan kohteet kyselyn Q suhteen, jolloin todelliset luokka arvot ovat tietysti piilossa algoritmilta, mutta ovat käytettävissä testitulosten arvioimiseksi tavanomainen testaustilanne. Jos algoritmi käyttää etäisyysmittaa (kohteen ja kyselyn välillä) arvioidakseen joukon kohteet, se parametrisoidaan tavallisesti kynnysarvolla T. Algoritmi palauttaa K T lajiteltua kohdetta, jotka ovat lähempänä kuin kynnysarvon T verran kyselyä Q. 4. luku 586 Kynnysarvon muuttaminen mahdollistaa algoritmin suorituskyvyn muuttamisen. Kynnysarvon ollessa matala, luokitellaan kohteita säästeliäästi relevanteiksi, mutta joitakin ehkä relevantteja saatetaan menettää. Sen ollessa korkea palautetaan enemmän kohteita, mutta mahdollisuus kasvaa, että ne eivät ehkä ole relevantteja. Olkoon datajoukossa N kohdetta, ja hakualgoritmi palauttaa K T mahdollisesti relevanttia. Algoritmin suorituskyky on ilmaistavissa taulukon 4.. mukaisesti, jossa N = TP + FP + FN + TN on kohteiden kokonaismäärä, TP + FP = K T on algoritmin hakemien kohteiden määrä ja TP + FN on relevanteiksi leimattujen kohteiden määrä. Täsmällisyys (precision) määritellään niiden kohteiden osuutena haetuista, jotka ovat oikeasti relevantteja, ts. TP / (TP + FP). Palautus (recall) määritellään haettujen oikeasti relevanttien osuutena kaikista datajoukon relevanteista kohteista, ts. TP / (TP + FN). Näille käsitteille on olemassa muitakin nimikkeitä, mutta näitä käytetään tässä yhteydessä. 4. luku 587
3 todellisuus: relevantti todellisuus: epärelevantti algoritmi: relevantti algoritmi: epärelevantti TP FN Taulukko 4.. Kaavakuva neljästä mahdollisesta tuloksesta haulle, jossa dokumentteja nimetään relevanteiksi tai epärelevanteiksi kyselyn Q suhteen. Sarakkeet vastaavat todellista tilannetta ja rivit algoritmin päättelyä. Lyhenteet TP, FP, FN ja TN viittaavat oikeaan positiiviseen, väärään positiiviseen, väärään negatiiviseen ja oikeaan negatiiviseen päättelyyn. Täysin oikein toimiva algoritmi tuottaisi tuloksen halkaisijalta, jolloin olisi FP = FN = 0. FP TN Näiden kahden käsitteen välillä on vastakkainen vaikutus. Kun saatujen kohteiden lukumäärää K T nostetaan nostamalla kynnysarvoa, palautusarvon voidaan odottaa kasvavan (enimmillään tietysti ), kun taas täsmällisyysarvon voidaan odottaa vähenevän. Ajettaessa hakualgoritmia eri kynnysarvoilla T saadaan palautus ja täsmällisyysarvopareja. Nämä kuvataan käytännössä, ei yhden kyselyn suhteen, vaan keskimääräisenä suorituskykynä kyselyjen joukon suhteen (esim. kuva 4..). Tämä vastaa suoraan nk. ROC kuvausta (receiver operating characteristic), tosin akselit on nimetty eri tavoin. 4. luku luku täsmällisyys algoritmi C algoritmi A algoritmi B palautus Kuva 4.. Kuvitteellinen esimerkki täsmällisyys palautuskäyristä kolmen hypoteettisen algoritmin tapauksessa. Algoritmilla A on suurimmat täsmällisyysarvot muihin verrattuna pienillä palautusarvoilla, kun taas algoritmilla B on suurimmat täsmällisyysarvot suurilla palautusarvoilla. Algoritmi C on yleisesti huonompi kuin muut. Käyrät ovat tyypillisiä tekstidokumenttialgoritmien tapauksessa, missä 50 % täsmällisyys ja palautusarvo sattuvat algoritmille B. 4. luku Tekstihaku Tekstipohjainen informaation etsiminen on perinteisesti nimetty informaationhauksi (IR, information retrieval), ja se on käynyt entistäkin tärkeämmäksi tietoverkkojen ja näissä hakukoneiden tulon jälkeen. Tekstin katsotaan koostuvan kahdesta perusyksiköstä, nimittäin dokumentista ja termistä. Edellinen mielletään sekä perinteiseksi kirjaksi tai lehtiartikkeliksi että yleisemmin miksi tahansa rakenteiseksi tekstisegmentiksi, jossa on lukuja, osia, kappaleita, tai jopa sähköpostiviestiksi, wwwsivuksi, ohjelman lähdekoodiksi jne. Termi voi olla sana, sanapari tai fraasi dokumentissa, esim. tieto tai tiedonlouhinta. Tekstikyselyt ymmärretään informaationhaussa termien joukkona. Vaikka dokumentit ovat kyselyjä paljon pitempiä, voidaan molemmat mieltää ja esittää yksikköinä, joiden välinen etäisyys lasketaan. 4. luku 59
4 4.3.. Tekstin esitysmuotoja Merkittävissä määrin on tutkittu dokumenttien yleisiä esitysmuotoja, jotka tukevat kykyä säilyttää mahdollisimman paljon semanttista sisältöä datasta ja etäisyysmittojen laskentaa kyselyjen ja dokumenttien välillä tehokkaalla tavalla. Informaationhaussa ei lähdetä liikkeelle semantiikan käsittelystä tekoälyn tässä keskeisen alueen, luonnollisen kielen ymmärtämisen valossa, koska siinä törmättäisiin vaikeisiin kysymyksiin esim. homonyymeistä (samalla sanalla eri merkityksiä) ja synonyymeistä (eri sanoja saman käsitteen ilmaisemiseksi). Sitä vastoin tarkastellaan yksinkertaisia termien täsmäyksiä ja esiintymiä. 4. luku 592 Dokumentin sisältö kuvataan tavallaan termien esiintymismääriä esittävällä vektorilla. Oletetaan, että on etukäteen määrätty termien t j joukko, j =,,T, hakua varten. Joukon koko voi olla melko suuri (esim. T = termiä). Jokainen yksittäinen dokumentti D i, i =,, N, esitetään termivektorina D i = (d i, d i2,, d it ), missä d ij edustaa jotakin informaatiota j:nnen termin esiintymästä i:nnessä dokumentissa. Yksittäiset arvot d ij ovat termien painoarvoja (termivektorin komponentteja). Boolen esityksenä painoarvot ilmaisevat, esiintykö vai ei määrätyt termit dokumentissa (d ij =, jos esiintyy, ja d ij = 0, jos ei). Reaaliarvoisina ne voivat merkitä termien esiintymismääriä tai suhteellisia frekvenssejä dokumenteissa. 4. luku Kyselyjen ja dokumenttien täsmääminen Useimpia luvussa 2 esitettyjä etäisyysmittoja voidaan käyttää dokumenttienkin yhteydessä. Yksi laajasti sovellettu mitta tässä yhteydessä on kosinietäisyys, jossa kosinimitta d c vähennetään :stä. T dikd jk d (, ) = k= c Di D j. T T 2 2 d ik d jk k= k= Tämä on kahden vektorin välisen kulman kosini (ekvivalentisti niiden välinen pistetulo, kun vektorit on normoitu yksikkövektorin pituisiksi). Se kuvastaa samanlaisuutta termikomponenttien suhteellisen jakauman mielessä. Kysely on esitettävissä loogisena Boolen funktiona soveltuvalle termien osajoukolle. Tyypillinen kysely voisi olla data AND mining AND NOT(coal). Perushaku käsittää tällöin käänteistiedoston selaamisen dokumenttien löytämiseksi, jotka tarkasti täsmäävät kyselyn kanssa. Perustilanteeseen voidaan lisätä mm. painokertoimia osoittamaan joidenkin termien suhteellista tärkeyttä. Boolen esityksen puutteena on, ettei se mahdollista semantiikkaa käsitteelle etäisyys kyselyjen ja dokumenttien välille ja täten dokumenttien asettamista arvojärjestykseen niiden relevanttiuden suhteen. Toisinaan on myös vaikeaa esittää Boolen kyselyinä käyttäjän (ihmisen) esittämiä kysymyksiä. 4. luku luku 595
5 Vektoriavaruusesityksessä kysely ilmaistaan painoarvojen vektorina. Ne termit, jotka eivät esiinny kyselyssä, määrätään implisiittisesti nolliksi. Yksinkertaisin kyselymuoto asettaa yksikköpainon jokaiselle kyselyn termille. Käyttäjä voi antaa yleisemmän, termin suhteellisen tärkeyden osoittavan arvon (tyypillisesti väliltä [0,]). Käytännössä näiden asettaminen voi olla hankalaa, joten on muodostettu laskennallisia keinoja sellaisten arvojen asettamiseksi (esim. relevanssipalaute). Olkoon d ik painoarvo (komponentti), k =,,T, dokumentissa D i. Informaationhaussa on käytetty useita erilaisia (ad hoc) menettelyjä määrätä painoarvot niin, että relevantit dokumentit saisivat korkeamman sijan arvojärjestyksessä kuin epärelevantit. Boolen arvon käyttäminen dokumentissa esiintyvälle termille on taipuvainen suosimaan laajoja dokumentteja (relevanttien asemesta) yksinkertaisesti, koska laajat dokumentit todennäköisemmin sisältävät kyseisen termin. 4. luku 596 Eräs painoarvojen laskentatapa on osoittautunut erityisen hyväksi. Kyse on TF IDF painoarvoista, joissa TF tarkoittaa termin frekvenssiä, so. jokainen termivektorin komponentti kerrotaan termin esiintymisfrekvenssillä dokumentissa. Tämä lisää usein esiintyvien termien painoarvoa. Toisaalta, jos jokin termi esiintyy usein monessa dokumentissa, TF painoarvoilla saattaa olla vähän erottelukykyä haussa, ts. se kasvattaa palautusta, mutta saattaa aiheuttaa huonon täsmällisyyden. Käänteinen dokumenttifrekvenssi (IDF) painoarvo parantaa erottelukykyä. Se määritellään arvona log(n/n j ) eli termin j sisältävien dokumenttien (n j ) osuuden käänteisluvun logaritmina koko dokumenttijoukkoon N nähden. IDF painoarvot suosivat termejä, jotka esiintyvät melko harvoissa dokumenteissa, ts. sillä on erottelukykyä. Logaritmista IDF painoarvoa käytettäessä pelkän IDF:n asemesta tekee siitä epäherkän dokumenttien lukumäärälle N. 4. luku Automaattiset suosittelijajärjestelmät 4.5. Dokumenttien ja tekstin luokittelu Yhden käyttäjän mieltymysten mallintamisen sijasta voidaan yleistää tilanteeseen, missä tietokannassa on informaatiota useiden käyttäjien kiinnostuksesta suureen määrään kohteita. Yhteissuodatuksen menetelmä on yksinkertainen lähestymistapa. Olkoon esimerkkinä sovellus, jossa käyttäjä haluaa ostaa määrätyn musiikkityypin CD levyn tietoverkon kautta. Mahdollisesti lukuisat muut käyttäjät ovat ostaneet saman CD levyn ja on todennäköistä, että ainakin osalla heistä on samanlainen musiikkimaku. Tätä voidaan yleistää eri suuntiin. Pidetään käyttäjien kiinnostuksen kohteista ja ostoista vektoriesitystä yllä. Tällaisten välillä lasketaan sitten etäisyyksiä samanlaisuusmetriikoilla. Vertailemalla näiden tuloksia suosittelija algoritmi voi esittää suosituksia mahdollisesti käyttäjää kiinnostavista kohteista. Koska termivektorit ovat tavallisesti hyvin suuridimensioisia (esim termiä tai enemmän), luokittelumenetelminä tulevat kyseeseen pääasiassa valintamenetelmät. Luokittelupuut eivät ole tällöin tarpeeksi informatiivisia, puhumattakaan monikerroksisista perseptron neuroverkoista, jotka eivät ole käytännössä mahdollisiakaan suoritettaviksi niin suurille dimensioille. Bayesin luokittelijat tai erinäiset painoarvojen lineaarikombinaatiot toimivat melko hyvin dokumenttiesityksille, koska ne voivat yhdistää tietoa monesta piirteestä suhteellisen yksinkertaisella (lineaarilla) tavalla. 4. luku luku 599
6 4.6. Kuvanhaku Kuvien ymmärtäminen Kuva ja videodatan merkitys on kasvanut viime aikoina merkittävästi. Haku sellaisen datan yhteydessä on monesti erityisen hyödyllistä. Esim. voidaan tutkia lääketieteessä radiologisten kuvien samanlaisuutta. Ihminen oppii hämmästyttävän hyvin erottamaan ja muistamaankin kuvia. Algoritmisesti tämä on erittäin vaikea ongelma, mikä on todettu usean vuosikymmenen tutkimuksissa hahmontunnistuksessa ja konenäössä. Niinpä useimmat menetelmät perustuvat melko matalantason visuaalisiin vihjeisiin Kuvanesitysmuodot Alkuperäinen pikselidata voidaan abstrahoida piirre esityksiksi hakutarkoituksia varten. Piirteet esitetään primitiivien suhteen. Näitä ovat väri ja tekstuuripiirteet. Kuten dokumenteilla, alkuperäiset kuvat muunnetaan standardimaisempaan muotoon datamatriiseiksi, joissa rivit (kohteet) esittävät kuvia ja sarakkeet (muuttujat) kuvien piirteitä. Tällainen esitysmuoto on yleensä paljon epäherkempi skaalaukselle ja siirroille kuin välittömät pikseliesitykset. Toisaalta ne saattavat olla vain vähäisissä määrin invariantteja valon, varjon, katsomissuunnan jne. suhteen. Yleensä kuvien piirteet lasketaan ja talletetaan etukäteen kuvatietokantaan hakuja varten. Etäisyyslaskenta voidaan sitten suorittaa näiden piirreavaruuksien suhteen. Kuvien piirredata talletetaan näin N d datamatriisiin, jossa kukin kuva on esitetty d dimensioisena piirrevektorina. 4. luku luku Kuvakyselyt Tekstidatan tapaan kuvien abstraktin esityksen luonne (lasketut piirteet) määräävät olennaisesti, mitä kysely ja hakutyyppejä voidaan suorittaa. Kyselyt voivat olla kahdentyyppisiä. Kyselyssä esimerkin mukaan annetaan esimerkkikuva tai luonnos kiinnostavan kohteen muodoista. Piirteet lasketaan sitten näistä ja etsitään piirteiden avulla täsmääviä kuvia tietokannasta. Vaihtoehtoisesti kysely voidaan esittää suoraan piirreesityksenä. Esim. etsitään kuvia, joilla on 50 % alastaan punaista väriä ja jotka sisältävät määrätyntyyppistä tekstuuria. Tällöin vain piirteiden osajoukkoa on käytetty kyselyssä, joten vastaavia muuttujia on käytettävä etäisyyslaskennassakin. Piirrevektoreiden käyttö kuvilla on melko samantapaista kuin tekstihaussa. Nyt hyödynnetään kuitenkin usein reaaliarvoisia muuttujia. 4. luku Aikasarjat ja sekvenssien haku Hahmojen tehokas löytäminen aikasarjoista ja sekvenssidatasta on lukuisissa yhteyksissä tarpeellista, mutta vaikea ongelma. Esimerkkejä ovat asiakkaiden etsiminen, joiden kulutustottumukset ovat samanlaisia annetun ajan mittaan, samanlaisten epätyypillisten sensorisignaalien tapahtumien reaaliaikainen seuranta ja vikadiagnostiikka esim. lentokoneessa ja kohinainen (häiriöitä sisältävä) täsmäys proteiinisekvenssien osajonoista. Sekvenssidata voi olla yksidimensioista tai kaksidimensioista (kuvadataa). Aikasarjoissa dataa on mitattu ajan suhteen, jolloin jokainen havainto on indeksoitu aikamuuttujan t suhteen. Yleensä näytteiden välillä on vakiomittainen aikaintervalli, jolloin voidaan aika määrittää kokonaisluvuilla väliltä [,T]. Kukin mittaus voi olla myös monimuuttujainen. Sovellusaloja on lukemattomia, kuten talous, lääke, luonnon ja teknisistä tieteistä. Sekvenssidatan käsite on yleisempi kuin aikasarjojen riippuessaan muusta kuin ajasta. Esim. molekyylibiologiassa proteiineja indeksoidaan paikan mukaan sekvensseihin. 4. luku 603
7 Perinteinen aikasarjamallintaminen perustuu globaaleihin lineaareihin malleihin. Esimerkkinä on Box Jenkinsin autoregressiiviset mallit, joissa nykyinen arvo y(t) mallinnetaan aiempien arvojen y(t k) painotetulla lineaarikombinaatiolla sekä lisätyllä kohinalla seuraavasti y( t) = k αi y( t i) + e( t), i= missä α:t i ovat painokertoimia ja e(t) kohina (tavallisesti oletettu nollakeskiarvoisena normaalijakautuneeksi) ajanhetkellä t. Käsite autoregressio tulee regressiomenetelmän käytöstä saman muuttujan aiemmille arvoille. Luvun tekniikat soveltuvat parametrien α i estimointiin. Mallirakenteen (arvon k) määrääminen perustuu mm. ristiinvalidointiin. Tätä voidaan yleistää käyttäen epälineaarisuutta (g(.)) hyväksi muodolla k y( t) = g i y( t i) α + e( t). i= 4. luku 604
Seuraavassa taulukossa on annettu mittojen määritelmät ja sijoitettu luvut. = 40% = 67% 6 = 0.06% = 99.92% 6+2 = 0.
T-6.28 Luonnollisen kielen tilastollinen käsittely Vastaukset, ti 7.2.200, 8:30-0:00 Tiedon haku, Versio.0. Muutetaan tehtävässä annettu taulukko sellaiseen muotoon, joka paremmin sopii ensimmäisten mittojen
LisätiedotEsimerkkejä vaativuusluokista
Esimerkkejä vaativuusluokista Seuraaville kalvoille on poimittu joitain esimerkkejä havainnollistamaan algoritmien aikavaativuusluokkia. Esimerkit on valittu melko mielivaltaisesti laitoksella tehtävään
LisätiedotVektorien pistetulo on aina reaaliluku. Esimerkiksi vektorien v = (3, 2, 0) ja w = (1, 2, 3) pistetulo on
13 Pistetulo Avaruuksissa R 2 ja R 3 on totuttu puhumaan vektorien pituuksista ja vektoreiden välisistä kulmista. Kuten tavallista, näiden käsitteiden yleistäminen korkeampiulotteisiin avaruuksiin ei onnistu
LisätiedotJoukot. Georg Cantor ( )
Joukot Matematiikassa on pyrkimys määritellä monimutkaiset asiat täsmällisesti yksinkertaisempien asioiden avulla. Tarvitaan jokin lähtökohta, muutama yleisesti hyväksytty ja ymmärretty käsite, joista
LisätiedotTiedonlouhinta rakenteisista dokumenteista (seminaarityö)
Tiedonlouhinta rakenteisista dokumenteista (seminaarityö) Miika Nurminen (minurmin@jyu.fi) Jyväskylän yliopisto Tietotekniikan laitos Kalvot ja seminaarityö verkossa: http://users.jyu.fi/~minurmin/gradusem/
LisätiedotTiedonhakumenetelmät Tiedonhakumenetelmät Helsingin yliopisto / TKTL. H.Laine 1. Rankkaukseen perustuva tiedonhaku.
Boolen haut Tiedonhakumenetelmät Rankkaukseen perustuva tiedonhaku Boolen haussa dokumentti joko täyttää hakuehdon tai ei täytä hakuehtoa Hakuehdon täyttäviä vastauksia voi olla runsaasti (tuhansia - miljoonia)
Lisätiedot1 Kannat ja kannanvaihto
1 Kannat ja kannanvaihto 1.1 Koordinaattivektori Oletetaan, että V on K-vektoriavaruus, jolla on kanta S = (v 1, v 2,..., v n ). Avaruuden V vektori v voidaan kirjoittaa kannan vektorien lineaarikombinaationa:
LisätiedotMatematiikan tukikurssi
Matematiikan tukikurssi Kurssikerta 7 1 Useamman muuttujan funktion raja-arvo Palautetaan aluksi mieliin yhden muuttujan funktion g(x) raja-arvo g(x). x a Tämä raja-arvo kertoo, mitä arvoa funktio g(x)
LisätiedotVapaus. Määritelmä. jos c 1 v 1 + c 2 v c k v k = 0 joillakin c 1,..., c k R, niin c 1 = 0, c 2 = 0,..., c k = 0.
Vapaus Määritelmä Oletetaan, että v 1, v 2,..., v k R n, missä n {1, 2,... }. Vektorijono ( v 1, v 2,..., v k ) on vapaa eli lineaarisesti riippumaton, jos seuraava ehto pätee: jos c 1 v 1 + c 2 v 2 +
Lisätiedot805306A Johdatus monimuuttujamenetelmiin, 5 op
monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos K:n lähimmän naapurin menetelmä (K-Nearest neighbours) Tarkastellaan aluksi pientä (n = 9) kurjenmiekka-aineistoa, joka on seuraava:
LisätiedotTietotekniikan valintakoe
Jyväskylän yliopisto Tietotekniikan laitos Tietotekniikan valintakoe 2..22 Vastaa kahteen seuraavista kolmesta tehtävästä. Kukin tehtävä arvostellaan kokonaislukuasteikolla - 25. Jos vastaat useampaan
LisätiedotAlgoritmit 2. Luento 13 Ti Timo Männikkö
Algoritmit 2 Luento 13 Ti 30.4.2019 Timo Männikkö Luento 13 Simuloitu jäähdytys Merkkijonon sovitus Horspoolin algoritmi Ositus ja rekursio Rekursion toteutus Algoritmit 2 Kevät 2019 Luento 13 Ti 30.4.2019
Lisätiedot1 Määrittelyjä ja aputuloksia
1 Määrittelyjä ja aputuloksia 1.1 Supremum ja infimum Aluksi kerrataan pienimmän ylärajan (supremum) ja suurimman alarajan (infimum) perusominaisuuksia ja esitetään muutamia myöhemmissä todistuksissa tarvittavia
LisätiedotMatematiikan tukikurssi
Matematiikan tukikurssi Kurssikerta 4 Jatkuvuus Jatkuvan funktion määritelmä Tarkastellaan funktiota f x) jossakin tietyssä pisteessä x 0. Tämä funktio on tässä pisteessä joko jatkuva tai epäjatkuva. Jatkuvuuden
LisätiedotLineaarikombinaatio, lineaarinen riippuvuus/riippumattomuus
Lineaarikombinaatio, lineaarinen riippuvuus/riippumattomuus 1 / 51 Lineaarikombinaatio Johdattelua seuraavaan asiaan (ei tarkkoja määritelmiä): Millaisen kuvan muodostaa joukko {λv λ R, v R 3 }? Millaisen
LisätiedotMATEMATIIKKA 5 VIIKKOTUNTIA. PÄIVÄMÄÄRÄ: 8. kesäkuuta 2009
EB-TUTKINTO 2009 MATEMATIIKKA 5 VIIKKOTUNTIA PÄIVÄMÄÄRÄ: 8. kesäkuuta 2009 KOKEEN KESTO: 4 tuntia (240 minuuttia) SALLITUT APUVÄLINEET: Eurooppa-koulun antama taulukkovihkonen Funktiolaskin, joka ei saa
LisätiedotTietorakenteet ja algoritmit - syksy 2015 1
Tietorakenteet ja algoritmit - syksy 2015 1 Tietorakenteet ja algoritmit - syksy 2015 2 Tietorakenteet ja algoritmit Johdanto Ari Korhonen Tietorakenteet ja algoritmit - syksy 2015 1. JOHDANTO 1.1 Määritelmiä
LisätiedotTekstuurintunnistuksen lyhyt oppimäärä. Ts. pari tapaa erottaa tiiliseinä pensaasta.
Tekstuurintunnistuksen lyhyt oppimäärä Ts. pari tapaa erottaa tiiliseinä pensaasta. Mitä on tekstuuri? Vaikea määritellä, mutta: Pintakuvio Ornamentti tuntu kuviointi Miksi tämän pitäisi kiinnostaa? (Maantienmerkkausrobotti)
LisätiedotKoodausteoria, Kesä 2014
Koodausteoria, Kesä 2014 Topi Törmä Matemaattisten tieteiden laitos 3.3 Lineaarisen koodin dekoodaus Oletetaan, että lähetettäessä kanavaan sana c saadaan sana r = c + e, missä e on häiriön aiheuttama
LisätiedotArkkitehtuurikuvaus. Ratkaisu ohjelmistotuotelinjan monikielisyyden hallintaan Innofactor Oy. Ryhmä 14
Arkkitehtuurikuvaus Ratkaisu ohjelmistotuotelinjan monikielisyyden hallintaan Innofactor Oy Ryhmä 14 Muutoshistoria Versio Pvm Päivittäjä Muutos 0.4 1.11.2007 Matti Eerola 0.3 18.10.2007 Matti Eerola 0.2
LisätiedotNeuroverkkojen soveltaminen vakuutusdatojen luokitteluun
Neuroverkkojen soveltaminen vakuutusdatojen luokitteluun Sami Hokuni 12 Syyskuuta, 2012 1/ 54 Sami Hokuni Neuroverkkojen soveltaminen vakuutusdatojen luokitteluun Turun Yliopisto. Gradu tehty 2012 kevään
LisätiedotA = a b B = c d. d e f. g h i determinantti on det(c) = a(ei fh) b(di fg) + c(dh eg). Matriisin determinanttia voi merkitä myös pystyviivojen avulla:
11 Determinantti Neliömatriisille voidaan laskea luku, joka kertoo muun muassa, onko matriisi kääntyvä vai ei Tätä lukua kutsutaan matriisin determinantiksi Determinantilla on muitakin sovelluksia, mutta
LisätiedotRelevanttien sivujen etsintä verkosta: satunnaiskulut verkossa Linkkikeskukset ja auktoriteetit (hubs and authorities) -algoritmi
Kurssin loppuosa Diskreettejä menetelmiä laajojen 0-1 datajoukkojen analyysiin Kattavat joukot ja niiden etsintä tasoittaisella algoritmilla Relevanttien sivujen etsintä verkosta: satunnaiskulut verkossa
LisätiedotOngelma(t): Miten merkkijonoja voidaan hakea tehokkaasti? Millaisia hakuongelmia liittyy bioinformatiikkaan?
Ongelma(t): Miten merkkijonoja voidaan hakea tehokkaasti? Millaisia hakuongelmia liittyy bioinformatiikkaan? 2012-2013 Lasse Lensu 2 Ihmisen, eläinten ja kasvien hyvinvoinnin kannalta nykyaikaiset mittaus-,
Lisätiedot4. Lasketaan transienttivirrat ja -jännitteet kuvan piiristä. Piirielimien arvot ovat C =
BMA58 Funktiot, lineaarialgebra ja vektorit Harjoitus 6, Syksy 5. Olkoon [ 6 6 A =, B = 4 [ 3 4, C = 4 3 [ 5 Määritä matriisien A ja C ominaisarvot ja ominaisvektorit. Näytä lisäksi että matriisilla B
LisätiedotApprobatur 3, demo 1, ratkaisut A sanoo: Vähintään yksi meistä on retku. Tehtävänä on päätellä, mitä tyyppiä A ja B ovat.
Approbatur 3, demo 1, ratkaisut 1.1. A sanoo: Vähintään yksi meistä on retku. Tehtävänä on päätellä, mitä tyyppiä A ja B ovat. Käydään kaikki vaihtoehdot läpi. Jos A on rehti, niin B on retku, koska muuten
LisätiedotTampereen yliopisto Tietokonegrafiikka 2013 Tietojenkäsittelytiede Harjoitus
Tampereen yliopisto Tietokonegrafiikka 201 Tietojenkäsittelytiede Harjoitus 6 1..201 1. Tarkastellaan Gouraudin sävytysmallia. Olkoon annettuna kolmio ABC, missä A = (0,0,0), B = (2,0,0) ja C = (1,2,0)
LisätiedotAlgoritmit 2. Luento 12 To Timo Männikkö
Algoritmit 2 Luento 12 To 3.5.2018 Timo Männikkö Luento 12 Geneettiset algoritmit Simuloitu jäähdytys Merkkijonon sovitus Horspoolin algoritmi Algoritmit 2 Kevät 2018 Luento 12 To 3.5.2018 2/35 Algoritmien
Lisätiedot2.2. Kohteiden konstruktiivinen avaruusgeometrinen esitys
.. Kohteiden konstruktiivinen avaruusgeometrinen esitys Avaruusgeometrinen esitys on käyttäjäriippuvainen ja vaati erikoismenetelmiä tai lopuksi konversion monikulmiomalliksi. Se on korkean tason esitys
LisätiedotKannan vektorit siis virittävät aliavaruuden, ja lisäksi kanta on vapaa. Lauseesta 7.6 saadaan seuraava hyvin käyttökelpoinen tulos:
8 Kanta Tässä luvussa tarkastellaan aliavaruuden virittäjävektoreita, jotka muodostavat lineaarisesti riippumattoman jonon. Merkintöjen helpottamiseksi oletetaan luvussa koko ajan, että W on vektoreiden
LisätiedotT Luonnollisen kielen tilastollinen käsittely Vastaukset 3, ti , 8:30-10:00 Kollokaatiot, Versio 1.1
T-61.281 Luonnollisen kielen tilastollinen käsittely Vastaukset 3, ti 10.2.2004, 8:30-10:00 Kollokaatiot, Versio 1.1 1. Lasketaan ensin tulokset sanaparille valkoinen, talo käsin: Frekvenssimenetelmä:
LisätiedotDerivaatta: funktion approksimaatio lineaarikuvauksella.
Viikko 5 Tällä viikolla yleistetään R 2 :n ja R 3 :n vektorialgebran peruskäsitteet n-ulotteiseen avaruuteen R n, ja määritellään lineaarikuvaus. Tarkastellaan funktioita, joiden määrittelyjoukko on n-ulotteisen
LisätiedotKarteesinen tulo. Olkoot A = {1, 2, 3, 5} ja B = {a, b, c}. Näiden karteesista tuloa A B voidaan havainnollistaa kuvalla 1 / 21
säilyy Olkoot A = {1, 2, 3, 5} ja B = {a, b, c}. Näiden karteesista tuloa A B voidaan havainnollistaa kuvalla c b a 1 2 3 5 1 / 21 säilyy Esimerkkirelaatio R = {(1, b), (3, a), (5, a), (5, c)} c b a 1
LisätiedotMS-A0003/A0005 Matriisilaskenta Laskuharjoitus 3 /
MS-A3/A5 Matriisilaskenta, II/27 MS-A3/A5 Matriisilaskenta Laskuharjoitus 3 / 3. 7..27 Tehtävä (L): Etsi kaikki yhtälön Ax = b ratkaisut, kun 3 5 4 A = 3 2 4 ja b = 6 8 7 4. Ratkaisu : Koetetaan ratkaista
Lisätiedot2 Osittaisderivaattojen sovelluksia
2 Osittaisderivaattojen sovelluksia 2.1 Ääriarvot Yhden muuttujan funktiolla f(x) on lokaali maksimiarvo (lokaali minimiarvo) pisteessä a, jos f(x) f(a) (f(x) f(a)) kaikilla x:n arvoilla riittävän lähellä
Lisätiedotpitkittäisaineistoissa
Puuttuvan tiedon käsittelystä p. 1/18 Puuttuvan tiedon käsittelystä pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto Puuttuvan tiedon
LisätiedotAineistoista. Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin
Aineistoista 11.2.09 IK Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin Muotoilussa kehittyneet menetelmät, lähinnä luotaimet Havainnointi:
LisätiedotNumeeriset menetelmät
Numeeriset menetelmät Luento 5 Ti 20.9.2011 Timo Männikkö Numeeriset menetelmät Syksy 2011 Luento 5 Ti 20.9.2011 p. 1/40 p. 1/40 Choleskyn menetelmä Positiivisesti definiiteillä matriiseilla kolmiohajotelma
LisätiedotKoodausteoria, Kesä 2014
Koodausteoria, Kesä 2014 Topi Törmä Matemaattisten tieteiden laitos 3.5 Reedin-Mullerin koodit Olkoon tässä kappaleessa F = F2 = Z2 ja n = 2 m. Määritellään avaruuteen F n kertolasku koordinaateittain:
LisätiedotMatematiikan tukikurssi
Matematiikan tukikurssi Kurssikerta 9 1 Implisiittinen derivointi Tarkastellaan nyt yhtälöä F(x, y) = c, jossa x ja y ovat muuttujia ja c on vakio Esimerkki tällaisesta yhtälöstä on x 2 y 5 + 5xy = 14
LisätiedotJOHDATUS TEKOÄLYYN TEEMU ROOS
JOHDATUS TEKOÄLYYN TEEMU ROOS TERMINATOR SIGNAALINKÄSITTELY KUVA VOIDAAN TULKITA KOORDINAATTIEN (X,Y) FUNKTIONA. LÄHDE: S. SEITZ VÄRIKUVA KOOSTUU KOLMESTA KOMPONENTISTA (R,G,B). ÄÄNI VASTAAVASTI MUUTTUJAN
LisätiedotKonvergenssilauseita
LUKU 4 Konvergenssilauseita Lause 4.1 (Monotonisen konvergenssin lause). Olkoon (f n ) kasvava jono Lebesgueintegroituvia funktioita. Asetetaan f(x) := f n (x). Jos f n
LisätiedotTehtävä 2: Loppuosataulukko
Tehtävä 2: Loppuosataulukko Tutustu tarkoin seuraavaan tekstiin ja vastaa sitä hyväksi käyttäen tehtävän loppuosassa esitettyihin viiteen kysymykseen. Annetun merkkijonon (ns. hahmo) esiintymän haku pidemmästä
LisätiedotP (X B) = f X (x)dx. xf X (x)dx. g(x)f X (x)dx.
Yhteenveto: Satunnaisvektorit ovat kuvauksia tn-avaruudelta seillaiselle avaruudelle, johon sisältyy satunnaisvektorin kaikki mahdolliset reaalisaatiot. Satunnaisvektorin realisaatio eli otos on jokin
LisätiedotLaskut käyvät hermoille
Laskut käyvät hermoille - Miten ja miksi aivoissa lasketaan todennäköisyyksiä Aapo Hyvärinen Matematiikan ja tilastotieteen laitos & Tietojenkäsittelytieteen laitos Helsingin Yliopisto Tieteen päivät 13.1.2011
Lisätiedot10.2. Säteenjäljitys ja radiositeettialgoritmi. Säteenjäljitys
10.2. Säteenjäljitys ja radiositeettialgoritmi Säteenjäljitys Säteenjäljityksessä (T. Whitted 1980) valonsäteiden kulkema reitti etsitään käänteisessä järjestyksessä katsojan silmästä takaisin kuvaan valolähteeseen
Lisätiedot1 Aritmeettiset ja geometriset jonot
1 Aritmeettiset ja geometriset jonot Johdatus Johdatteleva esimerkki 1 Kasvutulille talletetaan vuoden jokaisen kuukauden alussa tammikuusta alkaen 100 euroa. Tilin nettokorkokanta on 6%. Korko lisätään
LisätiedotCantorin joukon suoristuvuus tasossa
Cantorin joukon suoristuvuus tasossa LuK-tutkielma Miika Savolainen 2380207 Matemaattisten tieteiden laitos Oulun yliopisto Syksy 2016 Sisältö Johdanto 2 1 Cantorin joukon esittely 2 2 Suoristuvuus ja
Lisätiedot2.2 Neliöjuuri ja sitä koskevat laskusäännöt
. Neliöjuuri ja sitä koskevat laskusäännöt MÄÄRITELMÄ 3: Lukua b sanotaan luvun a neliöjuureksi, merkitään a b, jos b täyttää kaksi ehtoa: 1o b > 0 o b a Esim.1 Määritä a) 64 b) 0 c) 36 a) Luvun 64 neliöjuuri
Lisätiedot2. Olio-ohjelmoinnin perusteita 2.1
2. Olio-ohjelmoinnin perusteita 2.1 Sisällys Esitellään peruskäsitteitä yleisellä tasolla: Luokat ja oliot. Käsitteet, luokat ja oliot. Attribuutit, olion tila ja identiteetti. Metodit ja viestit. Olioperustainen
LisätiedotJohdatus tekoälyn taustalla olevaan matematiikkaan
Johdatus tekoälyn taustalla olevaan matematiikkaan Informaatioteknologian tiedekunta Jyväskylän yliopisto 2. luento 10.11.2017 Keinotekoiset neuroverkot Neuroverkko koostuu syöte- ja ulostulokerroksesta
LisätiedotTietorakenteet ja algoritmit Johdanto Lauri Malmi / Ari Korhonen
Tietorakenteet ja algoritmit Johdanto Lauri Malmi / Ari 1 1. JOHDANTO 1.1 Määritelmiä 1.2 Tietorakenteen ja algoritmin valinta 1.3 Algoritmit ja tiedon määrä 1.4 Tietorakenteet ja toiminnot 1.5 Esimerkki:
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 18. lokakuuta 2007 Antti Rasila () TodB 18. lokakuuta 2007 1 / 19 1 Tilastollinen aineisto 2 Tilastollinen malli Yksinkertainen satunnaisotos 3 Otostunnusluvut
LisätiedotTehtäväsarja I Tehtävät 1-5 perustuvat monisteen kappaleisiin ja tehtävä 6 kappaleeseen 2.8.
HY, MTO / Matemaattisten tieteiden kandiohjelma Todennäköisyyslaskenta IIa, syksy 8 Harjoitus Ratkaisuehdotuksia Tehtäväsarja I Tehtävät -5 perustuvat monisteen kappaleisiin..7 ja tehtävä 6 kappaleeseen.8..
LisätiedotTEEMU ROOS (KALVOT MUOKATTU PATRIK HOYERIN LUENTOMATERIAALISTA)
JOHDATUS TEKOÄLYYN TEEMU ROOS (KALVOT MUOKATTU PATRIK HOYERIN LUENTOMATERIAALISTA) KONEOPPIMISEN LAJIT OHJATTU OPPIMINEN: - ESIMERKIT OVAT PAREJA (X, Y), TAVOITTEENA ON OPPIA ENNUSTAMAAN Y ANNETTUNA X.
LisätiedotFUNKTIONAALIANALYYSIN PERUSKURSSI 1. 0. Johdanto
FUNKTIONAALIANALYYSIN PERUSKURSSI 1. Johdanto Funktionaalianalyysissa tutkitaan muun muassa ääretönulotteisten vektoriavaruuksien, ja erityisesti täydellisten normiavaruuksien eli Banach avaruuksien ominaisuuksia.
Lisätiedot1. TILASTOLLINEN HAHMONTUNNISTUS
1. TILASTOLLINEN HAHMONTUNNISTUS Tilastollisissa hahmontunnistusmenetelmissä piirteitä tarkastellaan tilastollisina muuttujina Luokittelussa käytetään hyväksi seuraavia tietoja: luokkien a priori tn:iä,
LisätiedotLineaarikuvauksen R n R m matriisi
Lineaarikuvauksen R n R m matriisi Lauseessa 21 osoitettiin, että jokaista m n -matriisia A vastaa lineaarikuvaus L A : R n R m, jolla L A ( v) = A v kaikilla v R n. Osoitetaan seuraavaksi käänteinen tulos:
LisätiedotLAUSELOGIIKKA (1) Sanalliset ilmaisut ovat usein epätarkkoja. On ilmaisuja, joista voidaan sanoa, että ne ovat tosia tai epätosia, mutta eivät molempia. Ilmaisuja, joihin voidaan liittää totuusarvoja (tosi,
LisätiedotBM20A5800 Funktiot, lineaarialgebra ja vektorit Harjoitus 4, Syksy 2016
BM20A5800 Funktiot, lineaarialgebra ja vektorit Harjoitus 4, Syksy 2016 1. Hahmottele karkeasti funktion f : R R 2 piirtämällä sen arvoja muutamilla eri muuttujan arvoilla kaksiulotteiseen koordinaatistoon
LisätiedotLineaariset Lien ryhmät / Ratkaisut 6 D 381 klo
JYVÄSKYLÄN YLIOPISO MAEMAIIKAN JA ILASOIEEEN LAIOS Lineaariset Lien ryhmät 27.2.2012 / t 6 D 381 klo. 16-18. 1. Matriisiryhmällä U(n) on epätriviaali normaali aliryhmä SU(n), joka on homomorfismin det
LisätiedotEtsintä verkosta (Searching from the Web) T Datasta tietoon Heikki Mannila, Jouni Seppänen
Etsintä verkosta (Searching from the Web) T-61.2010 Datasta tietoon Heikki Mannila, Jouni Seppänen 12.12.2007 Webin lyhyt historia http://info.cern.ch/proposal.html http://browser.arachne.cz/screen/
LisätiedotJOHDATUS TEKOÄLYYN TEEMU ROOS
JOHDATUS TEKOÄLYYN TEEMU ROOS TERMINATOR SIGNAALINKÄSITTELY KUVA VOIDAAN TULKITA KOORDINAATTIEN (X,Y) FUNKTIONA. LÄHDE: S. SEITZ VÄRIKUVA KOOSTUU KOLMESTA KOMPONENTISTA (R,G,B). ÄÄNI VASTAAVASTI MUUTTUJAN
Lisätiedot1 Raja-arvo. 1.1 Raja-arvon määritelmä. Raja-arvo 1
Raja-arvo Raja-arvo Raja-arvo kuvaa funktion f arvon f() kättätmistä, kun vaihtelee. Joillakin funktioilla f() muuttuu vain vähän, kun muuttuu vähän. Toisilla funktioilla taas f() hppää tai vaihtelee arvaamattomasti,
LisätiedotOminaisarvo-hajoitelma ja diagonalisointi
Ominaisarvo-hajoitelma ja a 1 Lause 1: Jos reaalisella n n matriisilla A on n eri suurta reaalista ominaisarvoa λ 1,λ 2,...,λ n, λ i λ j, kun i j, niin vastaavat ominaisvektorit x 1, x 2,..., x n muodostavat
Lisätiedotmissä on myös käytetty monisteen kaavaa 12. Pistä perustelut kohdilleen!
Matematiikan johdantokurssi Kertausharjoitustehtävien ratkaisuja/vastauksia/vihjeitä. Osoita todeksi logiikan lauseille seuraava: P Q (P Q). Ratkaisuohje. Väite tarkoittaa, että johdetut lauseet P Q ja
LisätiedotMatematiikan tukikurssi, kurssikerta 5
Matematiikan tukikurssi, kurssikerta 5 1 Jonoista Matematiikassa jono (x n ) on yksinkertaisesti järjestetty, päättymätön sarja numeroita Esimerkiksi (1,, 3, 4, 5 ) on jono Jonon i:ttä jäsentä merkitään
LisätiedotNumeeriset menetelmät TIEA381. Luento 12. Kirsi Valjus. Jyväskylän yliopisto. Luento 12 () Numeeriset menetelmät / 33
Numeeriset menetelmät TIEA381 Luento 12 Kirsi Valjus Jyväskylän yliopisto Luento 12 () Numeeriset menetelmät 25.4.2013 1 / 33 Luennon 2 sisältö Tavallisten differentiaaliyhtälöiden numeriikasta Rungen
Lisätiedot10. Esitys ja kuvaus
10. Esitys ja kuvaus Kun kuva on ensin segmentoitu alueisiin edellisen luvun menetelmin, segmentoidut pikselit kootaan esittämään ja kuvaamaan kohteita muodossa, joka sopii hyvin jatkokäsittelyä varten.
Lisätiedota k+1 = 2a k + 1 = 2(2 k 1) + 1 = 2 k+1 1. xxxxxx xxxxxx xxxxxx xxxxxx
x x x x x x x x Matematiikan johdantokurssi, syksy 08 Harjoitus, ratkaisuista Hanoin tornit -ongelma: Tarkastellaan kolmea pylvästä A, B ja C, joihin voidaan pinota erikokoisia renkaita Lähtötilanteessa
LisätiedotKoodausteoria, Kesä 2014
Koodausteoria, Kesä 2014 Topi Törmä Matemaattisten tieteiden laitos 6. Ryöppyvirheitä korjaavat koodit Topi Törmä Matemaattisten tieteiden laitos 2 / 34 6.1 Peruskäsitteitä Aiemmin on implisiittisesti
LisätiedotTestit laatueroasteikollisille muuttujille
Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit laatueroasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit laatueroasteikollisille muuttujille >> Laatueroasteikollisten
LisätiedotEstimointi. Vilkkumaa / Kuusinen 1
Estimointi Vilkkumaa / Kuusinen 1 Motivointi Tilastollisessa tutkimuksessa oletetaan jonkin jakauman generoineen tutkimuksen kohteena olevaa ilmiötä koskevat havainnot Tämän mallina käytettävän todennäköisyysjakauman
LisätiedotDatatähti 2019 loppu
Datatähti 2019 loppu task type time limit memory limit A Summa standard 1.00 s 512 MB B Bittijono standard 1.00 s 512 MB C Auringonlasku standard 1.00 s 512 MB D Binääripuu standard 1.00 s 512 MB E Funktio
LisätiedotHahmon etsiminen syotteesta (johdatteleva esimerkki)
Hahmon etsiminen syotteesta (johdatteleva esimerkki) Unix-komennolla grep hahmo [ tiedosto ] voidaan etsia hahmon esiintymia tiedostosta (tai syotevirrasta): $ grep Kisaveikot SM-tulokset.txt $ ps aux
LisätiedotReaalifunktioista 1 / 17. Reaalifunktioista
säilyy 1 / 17 säilyy Jos A, B R, niin funktiota f : A B sanotaan (yhden muuttujan) reaalifunktioksi. Tällöin karteesinen tulo A B on (aiempia esimerkkejä luonnollisemmalla tavalla) xy-tason osajoukko,
LisätiedotLineaarikuvausten. Lineaarikuvaus. Lineaarikuvauksia. Ydin. Matriisin ydin. aiheita. Aiheet. Lineaarikuvaus. Lineaarikuvauksen matriisi
Lineaarikuvaukset aiheita ten ten 1 Matematiikassa sana lineaarinen liitetään kahden lineaariavaruuden väliseen kuvaukseen. ten Määritelmä Olkoon (L, +, ) ja (M, ˆ+, ˆ ) reaalisia lineaariavaruuksia, ja
Lisätiedoton Abelin ryhmä kertolaskun suhteen. Tämän joukon alkioiden lukumäärää merkitään
5. Primitiivinen alkio 5.1. Täydennystä lukuteoriaan. Olkoon n Z, n 2. Palautettakoon mieleen, että kokonaislukujen jäännösluokkarenkaan kääntyvien alkioiden muodostama osajoukko Z n := {x Z n x on kääntyvä}
Lisätiedota) Sievennä lauseke 1+x , kun x 0jax 1. b) Aseta luvut 2, 5 suuruusjärjestykseen ja perustele vastauksesi. 3 3 ja
1 YLIOPPILASTUTKINTO- LAUTAKUNTA 1.10.2018 MATEMATIIKAN KOE PITKÄ OPPIMÄÄRÄ A-osa Ratkaise kaikki tämän osan tehtävät 1 4. Tehtävät arvostellaan pistein 0 6. Kunkin tehtävän ratkaisu kirjoitetaan tehtävän
LisätiedotMATEMATIIKKA 5 VIIKKOTUNTIA
EB-TUTKINTO 2008 MATEMATIIKKA 5 VIIKKOTUNTIA PÄIVÄMÄÄRÄ: 5. kesäkuuta 2008 (aamupäivä) KOKEEN KESTO: 4 tuntia (240 minuuttia) SALLITUT APUVÄLINEET: Europpa-koulun antama taulukkovihkonen Funktiolaskin,
Lisätiedot1.4 Funktion jatkuvuus
1.4 Funktion jatkuvuus Kun arkikielessä puhutaan jonkin asian jatkuvuudesta, mielletään asiassa olevan jonkinlaista yhtäjaksoisuutta, katkeamattomuutta. Tässä ei kuitenkaan käsitellä työasioita eikä ihmissuhteita,
LisätiedotMat Lineaarinen ohjelmointi
Mat-2.34 Lineaarinen ohjelmointi..27 Luento 5 Simplexin implementaatioita (kirja 3.2-3.5) Lineaarinen ohjelmointi - Syksy 27 / Luentorunko (/2) Simplexin implementaatiot Naiivi Revised Full tableau Syklisyys
LisätiedotAvainsanojen poimiminen Eeva Ahonen
Avainsanojen poimiminen 5.10.2004 Eeva Ahonen Sisältö Avainsanat Menetelmät C4.5 päätöspuut GenEx algoritmi Bayes malli Testit Tulokset Avainsanat Tiivistä tietoa dokumentin sisällöstä ihmislukijalle hakukoneelle
Lisätiedot1 + b t (i, j). Olkoon b t (i, j) todennäköisyys, että B t (i, j) = 1. Siis operaation access(j) odotusarvoinen kustannus ajanhetkellä t olisi.
Algoritmien DP ja MF vertaileminen tapahtuu suoraviivaisesti kirjoittamalla kummankin leskimääräinen kustannus eksplisiittisesti todennäköisyyksien avulla. Lause T MF ave = 1 + 2 1 i
LisätiedotMatriisilaskenta Luento 12: Vektoriavaruuden kannan olemassaolo
Matriisilaskenta Luento 12: Vektoriavaruuden kannan olemassaolo Antti Rasila 2016 Vektoriavaruuden kannan olemassaolo Jos {v 1, v 2,..., v k } on äärellisulotteisen vektoriavaruuden V lineaarisesti riippumaton
LisätiedotJohdatus matematiikkaan
Johdatus matematiikkaan Luento 5 Mikko Salo 5.9.2017 The natural development of this work soon led the geometers in their studies to embrace imaginary as well as real values of the variable.... It came
LisätiedotHY / Matematiikan ja tilastotieteen laitos Johdatus logiikkaan I, syksy 2018 Harjoitus 5 Ratkaisuehdotukset
HY / Matematiikan ja tilastotieteen laitos Johdatus logiikkaan I, syksy 2018 Harjoitus 5 Ratkaisuehdotukset 1. Päättele resoluutiolla seuraavista klausuulijoukoista: (a) {{p 0 }, {p 1 }, { p 0, p 2 },
LisätiedotJohdatus diskreettiin matematiikkaan Harjoitus 5, Ratkaise rekursioyhtälö
Johdatus diskreettiin matematiikkaan Harjoitus 5, 14.10.2015 1. Ratkaise rekursioyhtälö x n+4 2x n+2 + x n 16( 1) n, n N, alkuarvoilla x 1 2, x 2 14, x 3 18 ja x 4 42. Ratkaisu. Vastaavan homogeenisen
Lisätiedot2.3 Voiman jakaminen komponentteihin
Seuraavissa kappaleissa tarvitaan aina silloin tällöin taitoa jakaa voima komponentteihin sekä myös taitoa suorittaa sille vastakkainen operaatio eli voimien resultantin eli kokonaisvoiman laskeminen.
LisätiedotTalousmatematiikan perusteet: Luento 14. Rajoittamaton optimointi Hessen matriisi Ominaisarvot Ääriarvon laadun tarkastelu
Talousmatematiikan perusteet: Luento 14 Rajoittamaton optimointi Hessen matriisi Ominaisarvot Ääriarvon laadun tarkastelu Luennolla 6 Tarkastelimme yhden muuttujan funktion f(x) rajoittamatonta optimointia
LisätiedotYhtälöryhmä matriisimuodossa. MS-A0004/A0006 Matriisilaskenta. Tarkastellaan esimerkkinä lineaarista yhtälöparia. 2x1 x 2 = 1 x 1 + x 2 = 5.
2. MS-A4/A6 Matriisilaskenta 2. Nuutti Hyvönen, c Riikka Kangaslampi Matematiikan ja systeemianalyysin laitos Aalto-yliopisto 5.9.25 Tarkastellaan esimerkkinä lineaarista yhtälöparia { 2x x 2 = x + x 2
LisätiedotKesälukio 2000 PK2 Tauluharjoituksia I Mallivastaukset
Kesälukio 2000 PK2 Tauluharjoituksia I Mallivastaukset 2000-08-03T10:30/12:00 Huomaa, että joihinkin kysymyksiin on useampia oikeita vastauksia, joten nämä ovat todellakin vain mallivastaukset. 1 Logiikkaa
LisätiedotMääritelmä Olkoon T i L (V i, W i ), 1 i m. Yksikäsitteisen lineaarikuvauksen h L (V 1 V 2 V m, W 1 W 2 W m )
Määritelmä 519 Olkoon T i L V i, W i, 1 i m Yksikäsitteisen lineaarikuvauksen h L V 1 V 2 V m, W 1 W 2 W m h v 1 v 2 v m T 1 v 1 T 2 v 2 T m v m 514 sanotaan olevan kuvausten T 1,, T m indusoima ja sitä
Lisätiedot3 Raja-arvo ja jatkuvuus
3 Raja-arvo ja jatkuvuus 3. Raja-arvon käsite Raja-arvo kuvaa funktion kättätmistä jonkin lähtöarvon läheisdessä. Raja-arvoa tarvitaan toisinaan siksi, että funktion arvoa ei voida laskea kseisellä lähtöarvolla
LisätiedotInversio-ongelmien laskennallinen peruskurssi Luento 4
Inversio-ongelmien laskennallinen peruskurssi Luento 4 Kevät 20 Regularisointi Eräs keino yrittää ratkaista (likimääräisesti) huonosti asetettuja ongelmia on regularisaatio. Regularisoinnissa ongelmaa
LisätiedotMS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 6: Ääriarvojen luokittelu. Lagrangen kertojat.
MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 6: Ääriarvojen luokittelu. Lagrangen kertojat. Antti Rasila Matematiikan ja systeemianalyysin laitos Aalto-yliopisto Kevät 2016 Antti Rasila
LisätiedotPOHDIN - projekti. Funktio. Vektoriarvoinen funktio
POHDIN - projekti Funktio Funktio f joukosta A joukkoon B tarkoittaa sääntöä, joka liittää jokaiseen joukon A alkioon jonkin alkion joukosta B. Yleensä merkitään f : A B. Usein käytetään sanaa kuvaus synonyymina
LisätiedotNumeeriset menetelmät TIEA381. Luento 8. Kirsi Valjus. Jyväskylän yliopisto. Luento 8 () Numeeriset menetelmät / 35
Numeeriset menetelmät TIEA381 Luento 8 Kirsi Valjus Jyväskylän yliopisto Luento 8 () Numeeriset menetelmät 11.4.2013 1 / 35 Luennon 8 sisältö Interpolointi ja approksimointi Funktion approksimointi Tasainen
LisätiedotTehtävä 3. Määrää seuraavien jonojen raja-arvot 1.
Jonotehtävät, 0/9/005, sivu / 5 Perustehtävät Tehtävä. Muotoile matemaattiset vastineet seuraavien väitteiden negaatioille (ts. vastaohdat).. Jono (a n ) suppenee ohti luua a.. Jono (a n ) on asvava. 3.
LisätiedotMS-C1340 Lineaarialgebra ja
MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt Matriisinormi, häiriöalttius Riikka Kangaslampi Kevät 2017 Matematiikan ja systeemianalyysin laitos Aalto-yliopisto Matriisinormi Matriisinormi Matriiseille
Lisätiedot