14. Haku sisällön perusteella Johdanto

Koko: px
Aloita esitys sivulta:

Download "14. Haku sisällön perusteella 14.1. Johdanto"

Transkriptio

1 4. Haku sisällön perusteella 4.. Johdanto Tietokantojen yhteydessä perinteinen kyselyn käsite on hyvin määritelty. Tiedonlouhinnassa on kyse edellistä yleisimmistä, mutta vähemmän täsmällisistä kyselyistä. Olkoon esimerkkinä lääketieteellinen data, jossa on potilastietoa, kuten demografista (ikä, sukupuoli jne.), verikokeiden tuloksia ja muita fysiologisia testituloksia sekä biolääketieteellisiä aikasarjoja ja röntgenkuvia. Lääkäriä kiinnostaisi tietää, sisältääkö sairaalan tietokanta ketään samankaltaista potilasta ja myönteisessä tapauksessa tämän diagnoosit, hoidot ja tulokset. Ongelman vaikea osa on määritellä samanlaisuus potilaiden joukossa eri datatyyppeihin pohjautuen (tässä monimuuttujaiset, aikasarjat ja kuvadata). Tarkan täsmäyksen käsite on tällöin jokseenkin epätarkoituksenmukainen, koska on sangen epätodennäköistä, että olisi toista täsmälleen samanlaista potilasta käytettyjen mittausten suhteen. 4. luku 580 Tarkastellaan em. kaltaisia ongelmia ja varsinkin niihin liittyen teknisiä ongelmia, joihin on vastattava kyselyiden mahdollistamiseksi yleismuotoisista datajoukoista: Etsi datajoukosta k kohdetta, jotka ovat samanlaisimmat määrätyn kyselyn tai kohteen kanssa. Esimerkkejä voivat olla: Satelliittikuvatietokannasta etsitään maasta kuvia, jotka sisältävät todisteita tulivuorenpurkauksista Keski Amerikassa. Etsitään tietoverkosta dokumentteja, jotka käsittelevät tietoa Tampereen ravintoloista. 4. luku 58 Tällaista hakumuotoa pidetään vuorovaikutteisena tiedonlouhintana, koska käyttäjä vaikuttaa suoraan datan tutkimiseen määrittämällä kyselyjä ja tulkitsemalla tuloksia prosessin kuluessa. Tämä on vastakohtainen tilanne verrattuna moniin ennustavan ja kuvaavan tiedonlouhinnan tehtäviin. Tavallisesti on esimerkkitapaus sille, mitä pyritään etsimään, kyselyhahmo Q. Siitä johdetaan, mitkä tietokannan muut kohteet ovat samanlaisimmat sen kanssa. Lähestymistapa tunnetaan hakuna sisällön perusteella. Tunnetuin sovellus on tekstihaku. Kyselyhahmo Q on yleensä suppea (kyselysanojen lista) ja se täsmätään suuren dokumenttien joukon kanssa. 4. luku 582 Keskitytään lähinnä tekstidokumentteihin, koska tämä on tunnetuin ja kypsin sovellusalue. Yleisen ongelman voidaan ymmärtää käsittävän kolme peruskomponenttia: miten määritellään kohteiden välinen samanlaisuusmitta, miten toteutetaan laskennallisesti tehokas hakualgoritmi (tunnettaessa samanlaisuusmitta) ja miten sisällytetään käyttäjän palaute ja vuorovaikutus hakuprosessiin. Pohditaan pääasiassa ensimmäistä ja kolmatta kysymystä; toista tarkasteltiin luvussa luku 583

2 Haku sisällön perusteella nojautuu voimakkaasti samanlaisuuden tai sen vastakohdan etäisyyden käsitteeseen. Luvussa 2 käsiteltiin erilaisia etäisyyksiä. Näistä on hyvä huomata, esim. euklidisesta, että kysymys on matemaattisista etäisyysfunktioista, jotka eivät välttämättä vastaa intuitiota samanlaisuudesta ihmisen näkökulmasta. Esim. tekstidokumenttien yhteydessä semanttinen sisältö voi olla merkittävä. 4. luku Hakujärjestelmien arviointi Haun tehokkuuden arvioinnin vaikeus Luokittelussa ja regressiossa mallin suorituskykyä voidaan aina arvioida objektiivisesti estimoimalla sen tarkkuutta kokeellisesti. Haussa sisällön perusteella suorituskykyarvioinnin ongelma on vaikeampi. Perimmäinen vaikeus on se, että hakusysteemin hyvyys määrätään haetun informaation hyödyllisyydellä. Sovelluksissa tällainen mitta on luonteeltaan subjektiivinen. Haku on käyttäjäkeskeistä ja vuorovaikutteista, mikä tekee suorituskykyarvioinnista vaikeaa. Joitakin melko objektiivisia menetelmiä voidaan arviointia varten kuitenkin antaa tehtäessä ensin muutama yksinkertaistus. Oletetaan, että jokaiselle kyselylle on olemassa tieto (binääri luokitteluarvo), mikä kohde on relevantti kyseiselle kyselylle. Käytännön kannalta tällainen arvo on luonnollisesti yksinkertaistus, sekä arvon binäärisyys että oletus sen olemassaolosta jokaiselle tapaukselle. 4. luku Täsmällisyys vastaan palautus Arvioidaan jonkin hakualgoritmin suorituskykyä määrätyn kyselyn Q tilanteessa riippumattomalla datajoukolla. Tämän kohteet on luokiteltu etukäteen joko relevanteiksi tai epärelevanteiksi kyselyn Q suhteen. Oletetaan luonnollisesti, että testidataa ei ole käytetty hakualgoritmin suorituskyvyn säätämiseen. Voidaan siis ajatella algoritmin yksinkertaisesti luokittelevan kohteet kyselyn Q suhteen, jolloin todelliset luokka arvot ovat tietysti piilossa algoritmilta, mutta ovat käytettävissä testitulosten arvioimiseksi tavanomainen testaustilanne. Jos algoritmi käyttää etäisyysmittaa (kohteen ja kyselyn välillä) arvioidakseen joukon kohteet, se parametrisoidaan tavallisesti kynnysarvolla T. Algoritmi palauttaa K T lajiteltua kohdetta, jotka ovat lähempänä kuin kynnysarvon T verran kyselyä Q. 4. luku 586 Kynnysarvon muuttaminen mahdollistaa algoritmin suorituskyvyn muuttamisen. Kynnysarvon ollessa matala, luokitellaan kohteita säästeliäästi relevanteiksi, mutta joitakin ehkä relevantteja saatetaan menettää. Sen ollessa korkea palautetaan enemmän kohteita, mutta mahdollisuus kasvaa, että ne eivät ehkä ole relevantteja. Olkoon datajoukossa N kohdetta, ja hakualgoritmi palauttaa K T mahdollisesti relevanttia. Algoritmin suorituskyky on ilmaistavissa taulukon 4.. mukaisesti, jossa N = TP + FP + FN + TN on kohteiden kokonaismäärä, TP + FP = K T on algoritmin hakemien kohteiden määrä ja TP + FN on relevanteiksi leimattujen kohteiden määrä. Täsmällisyys (precision) määritellään niiden kohteiden osuutena haetuista, jotka ovat oikeasti relevantteja, ts. TP / (TP + FP). Palautus (recall) määritellään haettujen oikeasti relevanttien osuutena kaikista datajoukon relevanteista kohteista, ts. TP / (TP + FN). Näille käsitteille on olemassa muitakin nimikkeitä, mutta näitä käytetään tässä yhteydessä. 4. luku 587

3 todellisuus: relevantti todellisuus: epärelevantti algoritmi: relevantti algoritmi: epärelevantti TP FN Taulukko 4.. Kaavakuva neljästä mahdollisesta tuloksesta haulle, jossa dokumentteja nimetään relevanteiksi tai epärelevanteiksi kyselyn Q suhteen. Sarakkeet vastaavat todellista tilannetta ja rivit algoritmin päättelyä. Lyhenteet TP, FP, FN ja TN viittaavat oikeaan positiiviseen, väärään positiiviseen, väärään negatiiviseen ja oikeaan negatiiviseen päättelyyn. Täysin oikein toimiva algoritmi tuottaisi tuloksen halkaisijalta, jolloin olisi FP = FN = 0. FP TN Näiden kahden käsitteen välillä on vastakkainen vaikutus. Kun saatujen kohteiden lukumäärää K T nostetaan nostamalla kynnysarvoa, palautusarvon voidaan odottaa kasvavan (enimmillään tietysti ), kun taas täsmällisyysarvon voidaan odottaa vähenevän. Ajettaessa hakualgoritmia eri kynnysarvoilla T saadaan palautus ja täsmällisyysarvopareja. Nämä kuvataan käytännössä, ei yhden kyselyn suhteen, vaan keskimääräisenä suorituskykynä kyselyjen joukon suhteen (esim. kuva 4..). Tämä vastaa suoraan nk. ROC kuvausta (receiver operating characteristic), tosin akselit on nimetty eri tavoin. 4. luku luku täsmällisyys algoritmi C algoritmi A algoritmi B palautus Kuva 4.. Kuvitteellinen esimerkki täsmällisyys palautuskäyristä kolmen hypoteettisen algoritmin tapauksessa. Algoritmilla A on suurimmat täsmällisyysarvot muihin verrattuna pienillä palautusarvoilla, kun taas algoritmilla B on suurimmat täsmällisyysarvot suurilla palautusarvoilla. Algoritmi C on yleisesti huonompi kuin muut. Käyrät ovat tyypillisiä tekstidokumenttialgoritmien tapauksessa, missä 50 % täsmällisyys ja palautusarvo sattuvat algoritmille B. 4. luku Tekstihaku Tekstipohjainen informaation etsiminen on perinteisesti nimetty informaationhauksi (IR, information retrieval), ja se on käynyt entistäkin tärkeämmäksi tietoverkkojen ja näissä hakukoneiden tulon jälkeen. Tekstin katsotaan koostuvan kahdesta perusyksiköstä, nimittäin dokumentista ja termistä. Edellinen mielletään sekä perinteiseksi kirjaksi tai lehtiartikkeliksi että yleisemmin miksi tahansa rakenteiseksi tekstisegmentiksi, jossa on lukuja, osia, kappaleita, tai jopa sähköpostiviestiksi, wwwsivuksi, ohjelman lähdekoodiksi jne. Termi voi olla sana, sanapari tai fraasi dokumentissa, esim. tieto tai tiedonlouhinta. Tekstikyselyt ymmärretään informaationhaussa termien joukkona. Vaikka dokumentit ovat kyselyjä paljon pitempiä, voidaan molemmat mieltää ja esittää yksikköinä, joiden välinen etäisyys lasketaan. 4. luku 59

4 4.3.. Tekstin esitysmuotoja Merkittävissä määrin on tutkittu dokumenttien yleisiä esitysmuotoja, jotka tukevat kykyä säilyttää mahdollisimman paljon semanttista sisältöä datasta ja etäisyysmittojen laskentaa kyselyjen ja dokumenttien välillä tehokkaalla tavalla. Informaationhaussa ei lähdetä liikkeelle semantiikan käsittelystä tekoälyn tässä keskeisen alueen, luonnollisen kielen ymmärtämisen valossa, koska siinä törmättäisiin vaikeisiin kysymyksiin esim. homonyymeistä (samalla sanalla eri merkityksiä) ja synonyymeistä (eri sanoja saman käsitteen ilmaisemiseksi). Sitä vastoin tarkastellaan yksinkertaisia termien täsmäyksiä ja esiintymiä. 4. luku 592 Dokumentin sisältö kuvataan tavallaan termien esiintymismääriä esittävällä vektorilla. Oletetaan, että on etukäteen määrätty termien t j joukko, j =,,T, hakua varten. Joukon koko voi olla melko suuri (esim. T = termiä). Jokainen yksittäinen dokumentti D i, i =,, N, esitetään termivektorina D i = (d i, d i2,, d it ), missä d ij edustaa jotakin informaatiota j:nnen termin esiintymästä i:nnessä dokumentissa. Yksittäiset arvot d ij ovat termien painoarvoja (termivektorin komponentteja). Boolen esityksenä painoarvot ilmaisevat, esiintykö vai ei määrätyt termit dokumentissa (d ij =, jos esiintyy, ja d ij = 0, jos ei). Reaaliarvoisina ne voivat merkitä termien esiintymismääriä tai suhteellisia frekvenssejä dokumenteissa. 4. luku Kyselyjen ja dokumenttien täsmääminen Useimpia luvussa 2 esitettyjä etäisyysmittoja voidaan käyttää dokumenttienkin yhteydessä. Yksi laajasti sovellettu mitta tässä yhteydessä on kosinietäisyys, jossa kosinimitta d c vähennetään :stä. T dikd jk d (, ) = k= c Di D j. T T 2 2 d ik d jk k= k= Tämä on kahden vektorin välisen kulman kosini (ekvivalentisti niiden välinen pistetulo, kun vektorit on normoitu yksikkövektorin pituisiksi). Se kuvastaa samanlaisuutta termikomponenttien suhteellisen jakauman mielessä. Kysely on esitettävissä loogisena Boolen funktiona soveltuvalle termien osajoukolle. Tyypillinen kysely voisi olla data AND mining AND NOT(coal). Perushaku käsittää tällöin käänteistiedoston selaamisen dokumenttien löytämiseksi, jotka tarkasti täsmäävät kyselyn kanssa. Perustilanteeseen voidaan lisätä mm. painokertoimia osoittamaan joidenkin termien suhteellista tärkeyttä. Boolen esityksen puutteena on, ettei se mahdollista semantiikkaa käsitteelle etäisyys kyselyjen ja dokumenttien välille ja täten dokumenttien asettamista arvojärjestykseen niiden relevanttiuden suhteen. Toisinaan on myös vaikeaa esittää Boolen kyselyinä käyttäjän (ihmisen) esittämiä kysymyksiä. 4. luku luku 595

5 Vektoriavaruusesityksessä kysely ilmaistaan painoarvojen vektorina. Ne termit, jotka eivät esiinny kyselyssä, määrätään implisiittisesti nolliksi. Yksinkertaisin kyselymuoto asettaa yksikköpainon jokaiselle kyselyn termille. Käyttäjä voi antaa yleisemmän, termin suhteellisen tärkeyden osoittavan arvon (tyypillisesti väliltä [0,]). Käytännössä näiden asettaminen voi olla hankalaa, joten on muodostettu laskennallisia keinoja sellaisten arvojen asettamiseksi (esim. relevanssipalaute). Olkoon d ik painoarvo (komponentti), k =,,T, dokumentissa D i. Informaationhaussa on käytetty useita erilaisia (ad hoc) menettelyjä määrätä painoarvot niin, että relevantit dokumentit saisivat korkeamman sijan arvojärjestyksessä kuin epärelevantit. Boolen arvon käyttäminen dokumentissa esiintyvälle termille on taipuvainen suosimaan laajoja dokumentteja (relevanttien asemesta) yksinkertaisesti, koska laajat dokumentit todennäköisemmin sisältävät kyseisen termin. 4. luku 596 Eräs painoarvojen laskentatapa on osoittautunut erityisen hyväksi. Kyse on TF IDF painoarvoista, joissa TF tarkoittaa termin frekvenssiä, so. jokainen termivektorin komponentti kerrotaan termin esiintymisfrekvenssillä dokumentissa. Tämä lisää usein esiintyvien termien painoarvoa. Toisaalta, jos jokin termi esiintyy usein monessa dokumentissa, TF painoarvoilla saattaa olla vähän erottelukykyä haussa, ts. se kasvattaa palautusta, mutta saattaa aiheuttaa huonon täsmällisyyden. Käänteinen dokumenttifrekvenssi (IDF) painoarvo parantaa erottelukykyä. Se määritellään arvona log(n/n j ) eli termin j sisältävien dokumenttien (n j ) osuuden käänteisluvun logaritmina koko dokumenttijoukkoon N nähden. IDF painoarvot suosivat termejä, jotka esiintyvät melko harvoissa dokumenteissa, ts. sillä on erottelukykyä. Logaritmista IDF painoarvoa käytettäessä pelkän IDF:n asemesta tekee siitä epäherkän dokumenttien lukumäärälle N. 4. luku Automaattiset suosittelijajärjestelmät 4.5. Dokumenttien ja tekstin luokittelu Yhden käyttäjän mieltymysten mallintamisen sijasta voidaan yleistää tilanteeseen, missä tietokannassa on informaatiota useiden käyttäjien kiinnostuksesta suureen määrään kohteita. Yhteissuodatuksen menetelmä on yksinkertainen lähestymistapa. Olkoon esimerkkinä sovellus, jossa käyttäjä haluaa ostaa määrätyn musiikkityypin CD levyn tietoverkon kautta. Mahdollisesti lukuisat muut käyttäjät ovat ostaneet saman CD levyn ja on todennäköistä, että ainakin osalla heistä on samanlainen musiikkimaku. Tätä voidaan yleistää eri suuntiin. Pidetään käyttäjien kiinnostuksen kohteista ja ostoista vektoriesitystä yllä. Tällaisten välillä lasketaan sitten etäisyyksiä samanlaisuusmetriikoilla. Vertailemalla näiden tuloksia suosittelija algoritmi voi esittää suosituksia mahdollisesti käyttäjää kiinnostavista kohteista. Koska termivektorit ovat tavallisesti hyvin suuridimensioisia (esim termiä tai enemmän), luokittelumenetelminä tulevat kyseeseen pääasiassa valintamenetelmät. Luokittelupuut eivät ole tällöin tarpeeksi informatiivisia, puhumattakaan monikerroksisista perseptron neuroverkoista, jotka eivät ole käytännössä mahdollisiakaan suoritettaviksi niin suurille dimensioille. Bayesin luokittelijat tai erinäiset painoarvojen lineaarikombinaatiot toimivat melko hyvin dokumenttiesityksille, koska ne voivat yhdistää tietoa monesta piirteestä suhteellisen yksinkertaisella (lineaarilla) tavalla. 4. luku luku 599

6 4.6. Kuvanhaku Kuvien ymmärtäminen Kuva ja videodatan merkitys on kasvanut viime aikoina merkittävästi. Haku sellaisen datan yhteydessä on monesti erityisen hyödyllistä. Esim. voidaan tutkia lääketieteessä radiologisten kuvien samanlaisuutta. Ihminen oppii hämmästyttävän hyvin erottamaan ja muistamaankin kuvia. Algoritmisesti tämä on erittäin vaikea ongelma, mikä on todettu usean vuosikymmenen tutkimuksissa hahmontunnistuksessa ja konenäössä. Niinpä useimmat menetelmät perustuvat melko matalantason visuaalisiin vihjeisiin Kuvanesitysmuodot Alkuperäinen pikselidata voidaan abstrahoida piirre esityksiksi hakutarkoituksia varten. Piirteet esitetään primitiivien suhteen. Näitä ovat väri ja tekstuuripiirteet. Kuten dokumenteilla, alkuperäiset kuvat muunnetaan standardimaisempaan muotoon datamatriiseiksi, joissa rivit (kohteet) esittävät kuvia ja sarakkeet (muuttujat) kuvien piirteitä. Tällainen esitysmuoto on yleensä paljon epäherkempi skaalaukselle ja siirroille kuin välittömät pikseliesitykset. Toisaalta ne saattavat olla vain vähäisissä määrin invariantteja valon, varjon, katsomissuunnan jne. suhteen. Yleensä kuvien piirteet lasketaan ja talletetaan etukäteen kuvatietokantaan hakuja varten. Etäisyyslaskenta voidaan sitten suorittaa näiden piirreavaruuksien suhteen. Kuvien piirredata talletetaan näin N d datamatriisiin, jossa kukin kuva on esitetty d dimensioisena piirrevektorina. 4. luku luku Kuvakyselyt Tekstidatan tapaan kuvien abstraktin esityksen luonne (lasketut piirteet) määräävät olennaisesti, mitä kysely ja hakutyyppejä voidaan suorittaa. Kyselyt voivat olla kahdentyyppisiä. Kyselyssä esimerkin mukaan annetaan esimerkkikuva tai luonnos kiinnostavan kohteen muodoista. Piirteet lasketaan sitten näistä ja etsitään piirteiden avulla täsmääviä kuvia tietokannasta. Vaihtoehtoisesti kysely voidaan esittää suoraan piirreesityksenä. Esim. etsitään kuvia, joilla on 50 % alastaan punaista väriä ja jotka sisältävät määrätyntyyppistä tekstuuria. Tällöin vain piirteiden osajoukkoa on käytetty kyselyssä, joten vastaavia muuttujia on käytettävä etäisyyslaskennassakin. Piirrevektoreiden käyttö kuvilla on melko samantapaista kuin tekstihaussa. Nyt hyödynnetään kuitenkin usein reaaliarvoisia muuttujia. 4. luku Aikasarjat ja sekvenssien haku Hahmojen tehokas löytäminen aikasarjoista ja sekvenssidatasta on lukuisissa yhteyksissä tarpeellista, mutta vaikea ongelma. Esimerkkejä ovat asiakkaiden etsiminen, joiden kulutustottumukset ovat samanlaisia annetun ajan mittaan, samanlaisten epätyypillisten sensorisignaalien tapahtumien reaaliaikainen seuranta ja vikadiagnostiikka esim. lentokoneessa ja kohinainen (häiriöitä sisältävä) täsmäys proteiinisekvenssien osajonoista. Sekvenssidata voi olla yksidimensioista tai kaksidimensioista (kuvadataa). Aikasarjoissa dataa on mitattu ajan suhteen, jolloin jokainen havainto on indeksoitu aikamuuttujan t suhteen. Yleensä näytteiden välillä on vakiomittainen aikaintervalli, jolloin voidaan aika määrittää kokonaisluvuilla väliltä [,T]. Kukin mittaus voi olla myös monimuuttujainen. Sovellusaloja on lukemattomia, kuten talous, lääke, luonnon ja teknisistä tieteistä. Sekvenssidatan käsite on yleisempi kuin aikasarjojen riippuessaan muusta kuin ajasta. Esim. molekyylibiologiassa proteiineja indeksoidaan paikan mukaan sekvensseihin. 4. luku 603

7 Perinteinen aikasarjamallintaminen perustuu globaaleihin lineaareihin malleihin. Esimerkkinä on Box Jenkinsin autoregressiiviset mallit, joissa nykyinen arvo y(t) mallinnetaan aiempien arvojen y(t k) painotetulla lineaarikombinaatiolla sekä lisätyllä kohinalla seuraavasti y( t) = k αi y( t i) + e( t), i= missä α:t i ovat painokertoimia ja e(t) kohina (tavallisesti oletettu nollakeskiarvoisena normaalijakautuneeksi) ajanhetkellä t. Käsite autoregressio tulee regressiomenetelmän käytöstä saman muuttujan aiemmille arvoille. Luvun tekniikat soveltuvat parametrien α i estimointiin. Mallirakenteen (arvon k) määrääminen perustuu mm. ristiinvalidointiin. Tätä voidaan yleistää käyttäen epälineaarisuutta (g(.)) hyväksi muodolla k y( t) = g i y( t i) α + e( t). i= 4. luku 604

2.2. Kohteiden konstruktiivinen avaruusgeometrinen esitys

2.2. Kohteiden konstruktiivinen avaruusgeometrinen esitys .. Kohteiden konstruktiivinen avaruusgeometrinen esitys Avaruusgeometrinen esitys on käyttäjäriippuvainen ja vaati erikoismenetelmiä tai lopuksi konversion monikulmiomalliksi. Se on korkean tason esitys

Lisätiedot

1 Kannat ja kannanvaihto

1 Kannat ja kannanvaihto 1 Kannat ja kannanvaihto 1.1 Koordinaattivektori Oletetaan, että V on K-vektoriavaruus, jolla on kanta S = (v 1, v 2,..., v n ). Avaruuden V vektori v voidaan kirjoittaa kannan vektorien lineaarikombinaationa:

Lisätiedot

Relevanttien sivujen etsintä verkosta: satunnaiskulut verkossa Linkkikeskukset ja auktoriteetit (hubs and authorities) -algoritmi

Relevanttien sivujen etsintä verkosta: satunnaiskulut verkossa Linkkikeskukset ja auktoriteetit (hubs and authorities) -algoritmi Kurssin loppuosa Diskreettejä menetelmiä laajojen 0-1 datajoukkojen analyysiin Kattavat joukot ja niiden etsintä tasoittaisella algoritmilla Relevanttien sivujen etsintä verkosta: satunnaiskulut verkossa

Lisätiedot

Matematiikan tukikurssi

Matematiikan tukikurssi Matematiikan tukikurssi Kurssikerta 4 Jatkuvuus Jatkuvan funktion määritelmä Tarkastellaan funktiota f x) jossakin tietyssä pisteessä x 0. Tämä funktio on tässä pisteessä joko jatkuva tai epäjatkuva. Jatkuvuuden

Lisätiedot

Ongelma(t): Miten merkkijonoja voidaan hakea tehokkaasti? Millaisia hakuongelmia liittyy bioinformatiikkaan?

Ongelma(t): Miten merkkijonoja voidaan hakea tehokkaasti? Millaisia hakuongelmia liittyy bioinformatiikkaan? Ongelma(t): Miten merkkijonoja voidaan hakea tehokkaasti? Millaisia hakuongelmia liittyy bioinformatiikkaan? 2012-2013 Lasse Lensu 2 Ihmisen, eläinten ja kasvien hyvinvoinnin kannalta nykyaikaiset mittaus-,

Lisätiedot

MATEMATIIKKA 5 VIIKKOTUNTIA. PÄIVÄMÄÄRÄ: 8. kesäkuuta 2009

MATEMATIIKKA 5 VIIKKOTUNTIA. PÄIVÄMÄÄRÄ: 8. kesäkuuta 2009 EB-TUTKINTO 2009 MATEMATIIKKA 5 VIIKKOTUNTIA PÄIVÄMÄÄRÄ: 8. kesäkuuta 2009 KOKEEN KESTO: 4 tuntia (240 minuuttia) SALLITUT APUVÄLINEET: Eurooppa-koulun antama taulukkovihkonen Funktiolaskin, joka ei saa

Lisätiedot

Arkkitehtuurikuvaus. Ratkaisu ohjelmistotuotelinjan monikielisyyden hallintaan Innofactor Oy. Ryhmä 14

Arkkitehtuurikuvaus. Ratkaisu ohjelmistotuotelinjan monikielisyyden hallintaan Innofactor Oy. Ryhmä 14 Arkkitehtuurikuvaus Ratkaisu ohjelmistotuotelinjan monikielisyyden hallintaan Innofactor Oy Ryhmä 14 Muutoshistoria Versio Pvm Päivittäjä Muutos 0.4 1.11.2007 Matti Eerola 0.3 18.10.2007 Matti Eerola 0.2

Lisätiedot

Tehtävä 2: Loppuosataulukko

Tehtävä 2: Loppuosataulukko Tehtävä 2: Loppuosataulukko Tutustu tarkoin seuraavaan tekstiin ja vastaa sitä hyväksi käyttäen tehtävän loppuosassa esitettyihin viiteen kysymykseen. Annetun merkkijonon (ns. hahmo) esiintymän haku pidemmästä

Lisätiedot

10.2. Säteenjäljitys ja radiositeettialgoritmi. Säteenjäljitys

10.2. Säteenjäljitys ja radiositeettialgoritmi. Säteenjäljitys 10.2. Säteenjäljitys ja radiositeettialgoritmi Säteenjäljitys Säteenjäljityksessä (T. Whitted 1980) valonsäteiden kulkema reitti etsitään käänteisessä järjestyksessä katsojan silmästä takaisin kuvaan valolähteeseen

Lisätiedot

Tietorakenteet ja algoritmit Johdanto Lauri Malmi / Ari Korhonen

Tietorakenteet ja algoritmit Johdanto Lauri Malmi / Ari Korhonen Tietorakenteet ja algoritmit Johdanto Lauri Malmi / Ari 1 1. JOHDANTO 1.1 Määritelmiä 1.2 Tietorakenteen ja algoritmin valinta 1.3 Algoritmit ja tiedon määrä 1.4 Tietorakenteet ja toiminnot 1.5 Esimerkki:

Lisätiedot

Tietorakenteet ja algoritmit - syksy 2015 1

Tietorakenteet ja algoritmit - syksy 2015 1 Tietorakenteet ja algoritmit - syksy 2015 1 Tietorakenteet ja algoritmit - syksy 2015 2 Tietorakenteet ja algoritmit Johdanto Ari Korhonen Tietorakenteet ja algoritmit - syksy 2015 1. JOHDANTO 1.1 Määritelmiä

Lisätiedot

Aineistoista. Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin

Aineistoista. Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin Aineistoista 11.2.09 IK Laadulliset menetelmät: miksi tarpeen? Haastattelut, fokusryhmät, havainnointi, historiantutkimus, miksei videointikin Muotoilussa kehittyneet menetelmät, lähinnä luotaimet Havainnointi:

Lisätiedot

FUNKTIONAALIANALYYSIN PERUSKURSSI 1. 0. Johdanto

FUNKTIONAALIANALYYSIN PERUSKURSSI 1. 0. Johdanto FUNKTIONAALIANALYYSIN PERUSKURSSI 1. Johdanto Funktionaalianalyysissa tutkitaan muun muassa ääretönulotteisten vektoriavaruuksien, ja erityisesti täydellisten normiavaruuksien eli Banach avaruuksien ominaisuuksia.

Lisätiedot

9. Vektorit. 9.1 Skalaarit ja vektorit. 9.2 Vektorit tasossa

9. Vektorit. 9.1 Skalaarit ja vektorit. 9.2 Vektorit tasossa 9. Vektorit 9.1 Skalaarit ja vektorit Skalaari on koon tai määrän mitta. Tyypillinen esimerkki skalaarista on massa. Lukumäärä on toinen hyvä esimerkki skalaarista. Vektorilla on taas suuruus ja suunta.

Lisätiedot

Mat-2.3114 Investointiteoria Laskuharjoitus 3/2008, Ratkaisut 05.02.2008

Mat-2.3114 Investointiteoria Laskuharjoitus 3/2008, Ratkaisut 05.02.2008 Korko riippuu usein laina-ajan pituudesta ja pitkille talletuksille maksetaan korkeampaa korkoa. Spot-korko s t on se korko, joka kertyy lainatulle pääomalle hetkeen t (=kokonaisluku) mennessä. Spot-korot

Lisätiedot

Johdatus diskreettiin matematiikkaan Harjoitus 5, Ratkaise rekursioyhtälö

Johdatus diskreettiin matematiikkaan Harjoitus 5, Ratkaise rekursioyhtälö Johdatus diskreettiin matematiikkaan Harjoitus 5, 14.10.2015 1. Ratkaise rekursioyhtälö x n+4 2x n+2 + x n 16( 1) n, n N, alkuarvoilla x 1 2, x 2 14, x 3 18 ja x 4 42. Ratkaisu. Vastaavan homogeenisen

Lisätiedot

TIEDONHAKU INTERNETISTÄ

TIEDONHAKU INTERNETISTÄ TIEDONHAKU INTERNETISTÄ Internetistä löytyy hyvin paljon tietoa. Tietoa ei ole mitenkään järjestetty, joten tiedonhaku voi olla hankalaa. Tieto myös muuttuu jatkuvasti. Tänään tehty tiedonhaku ei anna

Lisätiedot

POHDIN - projekti. Funktio. Vektoriarvoinen funktio

POHDIN - projekti. Funktio. Vektoriarvoinen funktio POHDIN - projekti Funktio Funktio f joukosta A joukkoon B tarkoittaa sääntöä, joka liittää jokaiseen joukon A alkioon jonkin alkion joukosta B. Yleensä merkitään f : A B. Usein käytetään sanaa kuvaus synonyymina

Lisätiedot

MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 6: Ääriarvojen luokittelu. Lagrangen kertojat.

MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 6: Ääriarvojen luokittelu. Lagrangen kertojat. MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 6: Ääriarvojen luokittelu. Lagrangen kertojat. Antti Rasila Matematiikan ja systeemianalyysin laitos Aalto-yliopisto Kevät 2016 Antti Rasila

Lisätiedot

1 Raja-arvo. 1.1 Raja-arvon määritelmä. Raja-arvo 1

1 Raja-arvo. 1.1 Raja-arvon määritelmä. Raja-arvo 1 Raja-arvo Raja-arvo Raja-arvo kuvaa funktion f arvon f() kättätmistä, kun vaihtelee. Joillakin funktioilla f() muuttuu vain vähän, kun muuttuu vähän. Toisilla funktioilla taas f() hppää tai vaihtelee arvaamattomasti,

Lisätiedot

Probabilistiset mallit (osa 2) Matemaattisen mallinnuksen kurssi Kevät 2002, luento 10, osa 2 Jorma Merikoski Tampereen yliopisto

Probabilistiset mallit (osa 2) Matemaattisen mallinnuksen kurssi Kevät 2002, luento 10, osa 2 Jorma Merikoski Tampereen yliopisto Probabilistiset mallit (osa 2) Matemaattisen mallinnuksen kurssi Kevät 2002, luento 10, osa 2 Jorma Merikoski Tampereen yliopisto Esimerkki Tarkastelemme ilmiötä I, joka on a) tiettyyn kauppaan tulee asiakkaita

Lisätiedot

1 Aritmeettiset ja geometriset jonot

1 Aritmeettiset ja geometriset jonot 1 Aritmeettiset ja geometriset jonot Johdatus Johdatteleva esimerkki 1 Kasvutulille talletetaan vuoden jokaisen kuukauden alussa tammikuusta alkaen 100 euroa. Tilin nettokorkokanta on 6%. Korko lisätään

Lisätiedot

Testejä suhdeasteikollisille muuttujille

Testejä suhdeasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testejä suhdeasteikollisille muuttujille TKK (c) Ilkka Mellin (007) 1 Testejä suhdeasteikollisille muuttujille >> Testit normaalijakauman

Lisätiedot

Karteesinen tulo. Olkoot A = {1, 2, 3, 5} ja B = {a, b, c}. Näiden karteesista tuloa A B voidaan havainnollistaa kuvalla 1 / 21

Karteesinen tulo. Olkoot A = {1, 2, 3, 5} ja B = {a, b, c}. Näiden karteesista tuloa A B voidaan havainnollistaa kuvalla 1 / 21 säilyy Olkoot A = {1, 2, 3, 5} ja B = {a, b, c}. Näiden karteesista tuloa A B voidaan havainnollistaa kuvalla c b a 1 2 3 5 1 / 21 säilyy Esimerkkirelaatio R = {(1, b), (3, a), (5, a), (5, c)} c b a 1

Lisätiedot

LAUSELOGIIKKA (1) Sanalliset ilmaisut ovat usein epätarkkoja. On ilmaisuja, joista voidaan sanoa, että ne ovat tosia tai epätosia, mutta eivät molempia. Ilmaisuja, joihin voidaan liittää totuusarvoja (tosi,

Lisätiedot

3 Lineaariset yhtälöryhmät ja Gaussin eliminointimenetelmä

3 Lineaariset yhtälöryhmät ja Gaussin eliminointimenetelmä 3 Lineaariset yhtälöryhmät ja Gaussin eliminointimenetelmä Lineaarinen m:n yhtälön yhtälöryhmä, jossa on n tuntematonta x 1,, x n on joukko yhtälöitä, jotka ovat muotoa a 11 x 1 + + a 1n x n = b 1 a 21

Lisätiedot

Luku 7. Verkkoalgoritmit. 7.1 Määritelmiä

Luku 7. Verkkoalgoritmit. 7.1 Määritelmiä Luku 7 Verkkoalgoritmit Verkot soveltuvat monenlaisten ohjelmointiongelmien mallintamiseen. Tyypillinen esimerkki verkosta on tieverkosto, jonka rakenne muistuttaa luonnostaan verkkoa. Joskus taas verkko

Lisätiedot

Reaalifunktioista 1 / 17. Reaalifunktioista

Reaalifunktioista 1 / 17. Reaalifunktioista säilyy 1 / 17 säilyy Jos A, B R, niin funktiota f : A B sanotaan (yhden muuttujan) reaalifunktioksi. Tällöin karteesinen tulo A B on (aiempia esimerkkejä luonnollisemmalla tavalla) xy-tason osajoukko,

Lisätiedot

Ongelma(t): Miten mikro-ohjelmoitavaa tietokonetta voisi ohjelmoida kirjoittamatta binääristä (mikro)koodia? Voisiko samalla algoritmin esitystavalla

Ongelma(t): Miten mikro-ohjelmoitavaa tietokonetta voisi ohjelmoida kirjoittamatta binääristä (mikro)koodia? Voisiko samalla algoritmin esitystavalla Ongelma(t): Miten mikro-ohjelmoitavaa tietokonetta voisi ohjelmoida kirjoittamatta binääristä (mikro)koodia? Voisiko samalla algoritmin esitystavalla ohjelmoida useita komponenteiltaan ja rakenteeltaan

Lisätiedot

Hahmon etsiminen syotteesta (johdatteleva esimerkki)

Hahmon etsiminen syotteesta (johdatteleva esimerkki) Hahmon etsiminen syotteesta (johdatteleva esimerkki) Unix-komennolla grep hahmo [ tiedosto ] voidaan etsia hahmon esiintymia tiedostosta (tai syotevirrasta): $ grep Kisaveikot SM-tulokset.txt $ ps aux

Lisätiedot

ECDL Tietokannat. Copyright 2015 ECDL Foundation ECDL Tietokannat Sivu 1 / 7

ECDL Tietokannat. Copyright 2015 ECDL Foundation ECDL Tietokannat Sivu 1 / 7 ECDL Tietokannat Copyright 2015 ECDL Foundation ECDL Tietokannat Sivu 1 / 7 Tavoite Tässä esitellään tutkintovaatimukset moduulille ECDL Tietokannat, joka määrittelee tarvittavat tiedot ja taidot näyttökokeen

Lisätiedot

Kuvaus eli funktio f joukolta X joukkoon Y tarkoittaa havainnollisesti vastaavuutta, joka liittää joukon X jokaiseen alkioon joukon Y tietyn alkion.

Kuvaus eli funktio f joukolta X joukkoon Y tarkoittaa havainnollisesti vastaavuutta, joka liittää joukon X jokaiseen alkioon joukon Y tietyn alkion. Kuvaus eli funktio f joukolta X joukkoon Y tarkoittaa havainnollisesti vastaavuutta, joka liittää joukon X jokaiseen alkioon joukon Y tietyn alkion. Vastaavuus puolestaan on erikoistapaus relaatiosta.

Lisätiedot

Nimitys Symboli Merkitys Negaatio ei Konjuktio ja Disjunktio tai Implikaatio jos..., niin... Ekvivalenssi... jos ja vain jos...

Nimitys Symboli Merkitys Negaatio ei Konjuktio ja Disjunktio tai Implikaatio jos..., niin... Ekvivalenssi... jos ja vain jos... 2 Logiikkaa Tässä luvussa tutustutaan joihinkin logiikan käsitteisiin ja merkintöihin. Lisätietoja ja tarkennuksia löytyy esimerkiksi Jouko Väänäsen kirjasta Logiikka I 2.1 Loogiset konnektiivit Väitelauseen

Lisätiedot

Ovid Medline käyttöohjeita (10/2010)

Ovid Medline käyttöohjeita (10/2010) Ovid Medline käyttöohjeita (10/2010) Sisältö 1. Pikahaku - Basic Search:... - 1-2. Tarkennettu haku asiasanoilla - Advanced Ovid Search... - 1-3. Tulosjoukkojen yhdistely... - 5-4. Vapaasanahaku yksittäisellä

Lisätiedot

Matematiikan tukikurssi, kurssikerta 1

Matematiikan tukikurssi, kurssikerta 1 Matematiikan tukikurssi, kurssikerta 1 1 Joukko-oppia Matematiikassa joukko on mikä tahansa kokoelma objekteja. Esimerkiksi joukkoa A, jonka jäseniä ovat numerot 1, 2 ja 5 merkitään A = {1, 2, 5}. Joukon

Lisätiedot

Viikko 2: Ensimmäiset ennustajat Matti Kääriäinen matti.kaariainen@cs.helsinki.fi

Viikko 2: Ensimmäiset ennustajat Matti Kääriäinen matti.kaariainen@cs.helsinki.fi Viikko 2: Ensimmäiset ennustajat Matti Kääriäinen matti.kaariainen@cs.helsinki.fi Exactum C222, 5.-7.11.2008. 1 Tällä viikolla Sisältösuunnitelma: Ennustamisstrategioista Koneoppimismenetelmiä: k-nn (luokittelu

Lisätiedot

FiSMA 1.1 Toiminnallisen laajuuden mittausmenetelmä Ohje monikerrosarkkitehtuurin mittaamiseen

FiSMA 1.1 Toiminnallisen laajuuden mittausmenetelmä Ohje monikerrosarkkitehtuurin mittaamiseen FiSMA 1.1 Monikerrosarkkitehtuuri 1 (6) FiSMA 1.1 Toiminnallisen laajuuden mittausmenetelmä Ohje monikerrosarkkitehtuurin mittaamiseen 1. Yleiset periaatteet FiSMA 1.1 -menetelmässä mitataan sovellusperiaatteen

Lisätiedot

Outoja funktioita. 0 < x x 0 < δ ε f(x) a < ε.

Outoja funktioita. 0 < x x 0 < δ ε f(x) a < ε. Outoja funktioita Differentiaalilaskentaa harjoitettiin miltei 200 vuotta ennen kuin sen perustana olevat reaaliluvut sekä funktio ja sen raja-arvo määriteltiin täsmällisesti turvautumatta geometriseen

Lisätiedot

Solmu 3/2001 Solmu 3/2001. Kevään 2001 ylioppilaskirjoitusten pitkän matematiikan kokeessa oli seuraava tehtävä:

Solmu 3/2001 Solmu 3/2001. Kevään 2001 ylioppilaskirjoitusten pitkän matematiikan kokeessa oli seuraava tehtävä: Frégier n lause Simo K. Kivelä Kevään 2001 ylioppilaskirjoitusten pitkän matematiikan kokeessa oli seuraava tehtävä: Suorakulmaisen kolmion kaikki kärjet sijaitsevat paraabelilla y = x 2 ; suoran kulman

Lisätiedot

FiSMA 1.1 Toiminnallisen laajuuden mittausmenetelmä Ohje monikerrosarkkitehtuurin mittaamiseen

FiSMA 1.1 Toiminnallisen laajuuden mittausmenetelmä Ohje monikerrosarkkitehtuurin mittaamiseen FiSMA 1.1 Monikerrosarkkitehtuuri 1 (7) FiSMA 1.1 Toiminnallisen laajuuden mittausmenetelmä Ohje monikerrosarkkitehtuurin mittaamiseen 1. Yleiset periaatteet FiSMA 1.1 -menetelmässä mitataan sovellusperiaatteen

Lisätiedot

MATEMATIIKKA 5 VIIKKOTUNTIA

MATEMATIIKKA 5 VIIKKOTUNTIA EB-TUTKINTO 2008 MATEMATIIKKA 5 VIIKKOTUNTIA PÄIVÄMÄÄRÄ: 5. kesäkuuta 2008 (aamupäivä) KOKEEN KESTO: 4 tuntia (240 minuuttia) SALLITUT APUVÄLINEET: Europpa-koulun antama taulukkovihkonen Funktiolaskin,

Lisätiedot

Johdatus tekoälyyn. Luento 6.10.2011: Koneoppiminen. Patrik Hoyer. [ Kysykää ja kommentoikaa luennon aikana! ]

Johdatus tekoälyyn. Luento 6.10.2011: Koneoppiminen. Patrik Hoyer. [ Kysykää ja kommentoikaa luennon aikana! ] Johdatus tekoälyyn Luento 6.10.2011: Koneoppiminen Patrik Hoyer [ Kysykää ja kommentoikaa luennon aikana! ] Koneoppiminen? Määritelmä: kone = tietokone, tietokoneohjelma oppiminen = ongelmanratkaisukyvyn

Lisätiedot

Puumenetelmät. Topi Sikanen. S ysteemianalyysin. Laboratorio Aalto-yliopiston teknillinen korkeakoulu

Puumenetelmät. Topi Sikanen. S ysteemianalyysin. Laboratorio Aalto-yliopiston teknillinen korkeakoulu Puumenetelmät Topi Sikanen Puumenetelmät Periaate: Hajota ja hallitse Jaetaan havaintoavaruus alueisiin. Sovitetaan kuhunkin alueeseen yksinkertainen malli (esim. vakio) Tarkastellaan kolmea mallia Luokittelu-

Lisätiedot

n! k!(n k)! n = Binomikerroin voidaan laskea pelkästään yhteenlaskun avulla käyttäen allaolevia ns. palautuskaavoja.

n! k!(n k)! n = Binomikerroin voidaan laskea pelkästään yhteenlaskun avulla käyttäen allaolevia ns. palautuskaavoja. IsoInt Tietokoneiden muisti koostuu yksittäisistä muistisanoista, jotka nykyaikaisissa koneissa ovat 64 bitin pituisia. Muistisanan koko asettaa teknisen rajoituksen sille, kuinka suuria lukuja tietokone

Lisätiedot

ALGORITMIT & OPPIMINEN

ALGORITMIT & OPPIMINEN ALGORITMIT & OPPIMINEN Mitä voidaan automatisoida? Mikko Koivisto Avoimet aineistot tulevat Tekijä: Lauri Vanhala yhdistä, kuvita, selitä, ennusta! Tekijä: Logica Mitä voidaan automatisoida? Algoritmi

Lisätiedot

Epäeuklidista geometriaa

Epäeuklidista geometriaa Epäeuklidista geometriaa 7. toukokuuta 2006 Sisältö 1 Johdanto 1 1.1 Euklidinen geometria....................... 1 1.2 Epäeuklidinen geometria..................... 2 2 Poincarén kiekko 2 3 Epäeuklidiset

Lisätiedot

, c) x = 0 tai x = 2. = x 3. 9 = 2 3, = eli kun x = 5 tai x = 1. Näistä

, c) x = 0 tai x = 2. = x 3. 9 = 2 3, = eli kun x = 5 tai x = 1. Näistä Pitkä matematiikka 8.9.0, ratkaisut:. a) ( x + x ) = ( + x + x ) 6x + 6x = + 6x + 6x x = x =. b) Jos x > 0, on x = + x x = + x. Tällä ei ole ratkaisua. Jos x 0, on x = + x x = + x x =. c) x = x ( x) =

Lisätiedot

Harjoitus 3 (3.4.2014)

Harjoitus 3 (3.4.2014) Harjoitus 3 (3..) Tehtävä Olkoon kaaren paino c ij suurin sallittu korkeus tieosuudella (i, j). Etsitään reitti solmusta s solmuun t siten, että reitin suurin sallittu korkeus pienimmillään olisi mahdollisimman

Lisätiedot

Jatkuvat satunnaismuuttujat

Jatkuvat satunnaismuuttujat Jatkuvat satunnaismuuttujat Satunnaismuuttuja on jatkuva jos se voi ainakin periaatteessa saada kaikkia mahdollisia reaalilukuarvoja ainakin tietyltä väliltä. Täytyy ymmärtää, että tällä ei ole mitään

Lisätiedot

Algoritmit 1. Luento 10 Ke 11.2.2015. Timo Männikkö

Algoritmit 1. Luento 10 Ke 11.2.2015. Timo Männikkö Algoritmit 1 Luento 10 Ke 11.2.2015 Timo Männikkö Luento 10 Algoritminen ongelman ratkaisu Suunnittelumenetelmät Raaka voima Järjestäminen eli lajittelu Kuplalajittelu Väliinsijoituslajittelu Valintalajittelu

Lisätiedot

3 Raja-arvo ja jatkuvuus

3 Raja-arvo ja jatkuvuus 3 Raja-arvo ja jatkuvuus 3. Raja-arvon käsite Raja-arvo kuvaa funktion kättätmistä jonkin lähtöarvon läheisdessä. Raja-arvoa tarvitaan toisinaan siksi, että funktion arvoa ei voida laskea kseisellä lähtöarvolla

Lisätiedot

+ 3 2 5 } {{ } + 2 2 2 5 2. 2 kertaa jotain

+ 3 2 5 } {{ } + 2 2 2 5 2. 2 kertaa jotain Jaollisuustestejä (matematiikan mestariluokka, 7.11.2009, ohjattujen harjoitusten lopputuloslappu) Huom! Nämä eivät tietenkään ole ainoita jaollisuussääntöjä; ovatpahan vain hyödyllisiä ja ainakin osittain

Lisätiedot

Harjoitus 3 (31.3.2015)

Harjoitus 3 (31.3.2015) Harjoitus (..05) Tehtävä Olkoon kaaren paino c ij suurin sallittu korkeus tieosuudella (i,j). Etsitään reitti solmusta s solmuun t siten, että reitin suurin sallittu korkeus pienimmillään olisi mahdollisimman

Lisätiedot

Ensimmäisen ja toisen kertaluvun differentiaaliyhtälöistä

Ensimmäisen ja toisen kertaluvun differentiaaliyhtälöistä 1 MAT-1345 LAAJA MATEMATIIKKA 5 Tampereen teknillinen yliopisto Risto Silvennoinen Kevät 9 Ensimmäisen ja toisen kertaluvun differentiaaliyhtälöistä Yksi tavallisimmista luonnontieteissä ja tekniikassa

Lisätiedot

Viikko 1: Johdantoa Matti Kääriäinen matti.kaariainen@cs.helsinki.fi

Viikko 1: Johdantoa Matti Kääriäinen matti.kaariainen@cs.helsinki.fi Viikko 1: Johdantoa Matti Kääriäinen matti.kaariainen@cs.helsinki.fi Exactum C222, 29-31.10.2008. 1 Tällä viikolla 1. Käytännön järjestelyistä 2. Kurssin sisällöstä ja aikataulusta 3. Johdantoa Mitä koneoppiminen

Lisätiedot

(1) refleksiivinen, (2) symmetrinen ja (3) transitiivinen.

(1) refleksiivinen, (2) symmetrinen ja (3) transitiivinen. Matematiikassa ja muuallakin joudutaan usein tekemisiin sellaisten relaatioiden kanssa, joiden lakina on tietyn ominaisuuden samuus. Tietyn ominaisuuden samuus -relaatio on ekvivalenssi; se on (1) refleksiivinen,

Lisätiedot

Tiedonhallinnan perusteet. Viikko 1 Jukka Lähetkangas

Tiedonhallinnan perusteet. Viikko 1 Jukka Lähetkangas Tiedonhallinnan perusteet Viikko 1 Jukka Lähetkangas Kurssilla käytävät asiat Tietokantojen toimintafilosofian ja -tekniikan perusteet Tiedonsäilönnän vaihtoehdot Tietokantojen suunnitteleminen internetiä

Lisätiedot

Keltaisten sivujen palveluiden kuvaaminen ontologioiden avulla

Keltaisten sivujen palveluiden kuvaaminen ontologioiden avulla Keltaisten sivujen palveluiden kuvaaminen ontologioiden avulla - IWebS-projektin (2003-2005) kokemuksia FinnONTO-symposio, 16112005 Petri Lindgren (petrilindgren@helsinkifi) Kim Viljanen (kimviljanen@tkkfi)

Lisätiedot

Uudelleenkäytön jako kahteen

Uudelleenkäytön jako kahteen Uudelleenkäyttö Yleistä On pyritty pääsemään vakiokomponenttien käyttöön Kuitenkin vakiokomponentit yleistyneet vain rajallisilla osa-alueilla (esim. windows-käyttöliittymä) On arvioitu, että 60-80% ohjelmistosta

Lisätiedot

Matematiikan tukikurssi, kurssikerta 4

Matematiikan tukikurssi, kurssikerta 4 Matematiikan tukikurssi, kurssikerta 4 1 Raja-arvo äärettömyydessä Tietyllä funktiolla f() voi olla raja-arvo äärettömyydessä, jota merkitään f(). Tämä tarkoittaa, että funktio f() lähestyy jotain tiettyä

Lisätiedot

10. Globaali valaistus

10. Globaali valaistus 10. Globaali valaistus Globaalilla eli kokonaisvalaistuksella tarkoitetaan tietokonegrafiikassa malleja, jotka renderöivät kuvaa laskien pisteestä x heijastuneen valon ottamalla huomioon kaiken tähän pisteeseen

Lisätiedot

1.4 Funktion jatkuvuus

1.4 Funktion jatkuvuus 1.4 Funktion jatkuvuus Kun arkikielessä puhutaan jonkin asian jatkuvuudesta, mielletään asiassa olevan jonkinlaista yhtäjaksoisuutta, katkeamattomuutta. Tässä ei kuitenkaan käsitellä työasioita eikä ihmissuhteita,

Lisätiedot

2.2 Neliöjuuri ja sitä koskevat laskusäännöt

2.2 Neliöjuuri ja sitä koskevat laskusäännöt . Neliöjuuri ja sitä koskevat laskusäännöt MÄÄRITELMÄ 3: Lukua b sanotaan luvun a neliöjuureksi, merkitään a b, jos b täyttää kaksi ehtoa: 1o b > 0 o b a Esim.1 Määritä a) 64 b) 0 c) 36 a) Luvun 64 neliöjuuri

Lisätiedot

Järvitesti Ympäristöteknologia T571SA 7.5.2013

Järvitesti Ympäristöteknologia T571SA 7.5.2013 Hans Laihia Mika Tuukkanen 1 LASKENNALLISET JA TILASTOLLISET MENETELMÄT Järvitesti Ympäristöteknologia T571SA 7.5.2013 Sarkola Eino JÄRVITESTI Johdanto Järvien kuntoa tutkitaan monenlaisilla eri menetelmillä.

Lisätiedot

Ongelma 1: Ovatko kaikki tehtävät/ongelmat deterministisiä?

Ongelma 1: Ovatko kaikki tehtävät/ongelmat deterministisiä? Ongelma 1: Ovatko kaikki tehtävät/ongelmat deterministisiä? 2013-2014 Lasse Lensu 2 Ongelma 2: Milloin ongelmat muuttuvat oikeasti hankaliksi? 2013-2014 Lasse Lensu 3 Ongelma 3: Miten hankalia ongelmia

Lisätiedot

Suorista ja tasoista LaMa 1 syksyllä 2009

Suorista ja tasoista LaMa 1 syksyllä 2009 Viidennen viikon luennot Suorista ja tasoista LaMa 1 syksyllä 2009 Perustuu kirjan Poole: Linear Algebra lukuihin I.3 - I.4 Esko Turunen esko.turunen@tut.fi Aluksi hiukan 2 ja 3 ulotteisen reaaliavaruuden

Lisätiedot

Peliteoria luento 2. May 26, 2014. Peliteoria luento 2

Peliteoria luento 2. May 26, 2014. Peliteoria luento 2 May 26, 2014 Pelien luokittelua Peliteoriassa pelit voidaan luokitella yhteistoiminnallisiin ja ei-yhteistoiminnallisiin. Edellisissä kiinnostuksen kohde on eri koalitioiden eli pelaajien liittoumien kyky

Lisätiedot

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet VAASAN YLIOPISTO/AVOIN YLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia 1 KURSSIKYSELYAINEISTO: 1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka

Lisätiedot

811312A Tietorakenteet ja algoritmit 2015-2016. I Johdanto

811312A Tietorakenteet ja algoritmit 2015-2016. I Johdanto 811312A Tietorakenteet ja algoritmit 2015-2016 I Johdanto Sisältö 1. Algoritmeista ja tietorakenteista 2. Algoritmien analyysistä 811312A TRA, Johdanto 2 I.1. Algoritmeista ja tietorakenteista I.1.1. Algoritmien

Lisätiedot

Maksimit ja minimit 1/5 Sisältö ESITIEDOT: reaalifunktiot, derivaatta

Maksimit ja minimit 1/5 Sisältö ESITIEDOT: reaalifunktiot, derivaatta Maksimit ja minimit 1/5 Sisältö Funktion kasvavuus ja vähenevyys; paikalliset ääriarvot Jos derivoituvan reaalifunktion f derivaatta tietyssä pisteessä on positiivinen, f (x 0 ) > 0, niin funktion tangentti

Lisätiedot

Ongelma 1: Ovatko kaikki tehtävät/ongelmat deterministisiä?

Ongelma 1: Ovatko kaikki tehtävät/ongelmat deterministisiä? Ongelma 1: Ovatko kaikki tehtävät/ongelmat deterministisiä? 2012-2013 Lasse Lensu 2 Ongelma 2: Milloin ongelmat muuttuvat oikeasti hankaliksi? 2012-2013 Lasse Lensu 3 Ongelma 3: Miten hankalia ongelmia

Lisätiedot

Kombinatorinen optimointi

Kombinatorinen optimointi Kombinatorinen optimointi Sallittujen pisteiden lukumäärä on äärellinen Periaatteessa ratkaisu löydetään käymällä läpi kaikki pisteet Käytännössä lukumäärä on niin suuri, että tämä on mahdotonta Usein

Lisätiedot

CIRI Ontologiaperustainen tiedonhakuliittymä

CIRI Ontologiaperustainen tiedonhakuliittymä CIRI Ontologiaperustainen tiedonhakuliittymä Eija Airio, Kalervo Järvelin, Sari Suomela, Pirkko Saatsi ja Jaana Kekäläinen Tampereen yliopisto Informaatiotutkimuksen laitos Ontologian kolmitasomalli kehitetty

Lisätiedot

SQL-perusteet, SELECT-, INSERT-, CREATE-lauseet

SQL-perusteet, SELECT-, INSERT-, CREATE-lauseet SQL-perusteet, SELECT-, INSERT-, CREATE-lauseet A271117, Tietokannat Teemu Saarelainen teemu.saarelainen@kyamk.fi Lähteet: Leon Atkinson: core MySQL Ari Hovi: SQL-opas TTY:n tietokantojen perusteet-kurssin

Lisätiedot

Kiinnostuspohjainen topologian hallinta järjestämättömissä vertaisverkoissa

Kiinnostuspohjainen topologian hallinta järjestämättömissä vertaisverkoissa Kiinnostuspohjainen topologian hallinta järjestämättömissä vertaisverkoissa Lektio 20.12.2012, Annemari Soranto Tietotekniikan laitos annemari.k.soranto@jyu.fi 1 Agenda Vertaisverkon määritelmä Haku vertaisverkossa

Lisätiedot

5.3 Ensimmäisen asteen polynomifunktio

5.3 Ensimmäisen asteen polynomifunktio Yllä olevat polynomit P ( x) = 2 x + 1 ja Q ( x) = 2x 1 ovat esimerkkejä 1. asteen polynomifunktioista: muuttujan korkein potenssi on yksi. Yleisessä 1. asteen polynomifunktioissa on lisäksi vakiotermi;

Lisätiedot

Taso 1/5 Sisältö ESITIEDOT: vektori, koordinaatistot, piste, suora

Taso 1/5 Sisältö ESITIEDOT: vektori, koordinaatistot, piste, suora Taso 1/5 Sisältö Taso geometrisena peruskäsitteenä Kolmiulotteisen alkeisgeometrian peruskäsitteisiin kuuluu taso pisteen ja suoran lisäksi. Intuitiivisesti sitä voidaan ajatella joka suunnassa äärettömyyteen

Lisätiedot

Logistinen regressio, separoivat hypertasot

Logistinen regressio, separoivat hypertasot Logistinen regressio, separoivat hypertasot Topi Sikanen Logistinen regressio Aineisto jakautunut K luokkaan K=2 tärkeä erikoistapaus Halutaan mallintaa luokkien vedonlyöntikertoimia (odds) havaintojen

Lisätiedot

7. laskuharjoituskierros, vko 10, ratkaisut

7. laskuharjoituskierros, vko 10, ratkaisut 7. laskuharjoituskierros, vko 10, ratkaisut D1. a) Oletetaan, että satunnaismuuttujat X ja Y noudattavat kaksiulotteista normaalijakaumaa parametrein E(X) = 0, E(Y ) = 1, Var(X) = 1, Var(Y ) = 4 ja Cov(X,

Lisätiedot

2 k -faktorikokeet. Vilkkumaa / Kuusinen 1

2 k -faktorikokeet. Vilkkumaa / Kuusinen 1 2 k -faktorikokeet Vilkkumaa / Kuusinen 1 Motivointi 2 k -faktorikoe on k-suuntaisen varianssianalyysin erikoistapaus, jossa kaikilla tekijöillä on vain kaksi tasoa, matala (-) ja korkea (+). 2 k -faktorikoetta

Lisätiedot

Kommentteja Markku Halmetojan ops-ehdotuksesta

Kommentteja Markku Halmetojan ops-ehdotuksesta Jorma Merikoski 10.1.2015 Kommentteja Markku Halmetojan ops-ehdotuksesta Markku Halmetoja on laatinut ehdotuksen lukion pitkän matematiikan uudeksi opetussuunnitelmaksi. Hän esittelee sitä matematiikan

Lisätiedot

Helsingin seitsemäsluokkalaisten matematiikkakilpailu 7.2.2013 Ratkaisuita

Helsingin seitsemäsluokkalaisten matematiikkakilpailu 7.2.2013 Ratkaisuita Helsingin seitsemäsluokkalaisten matematiikkakilpailu..013 Ratkaisuita 1. Eräs kirjakauppa myy pokkareita yhdeksällä eurolla kappale, ja siellä on meneillään mainoskampanja, jossa seitsemän sellaista ostettuaan

Lisätiedot

SUDOKU - ratkaisuohjeet. Jarno Tuimala 18.9.2005

SUDOKU - ratkaisuohjeet. Jarno Tuimala 18.9.2005 SUDOKU - ratkaisuohjeet Jarno Tuimala 18.9.2005 Japanilainen sudoku Seuraavassa on esitetty ohjeet japanilaistyyppisten sudoku-ristikoiden ratkontaan. Japanilaisia ristikoita luonnehtivat seuraavat piirteet:

Lisätiedot

Todennäköisyyden ominaisuuksia

Todennäköisyyden ominaisuuksia Todennäköisyyden ominaisuuksia 0 P(A) 1 (1) P(S) = 1 (2) A B = P(A B) = P(A) + P(B) (3) P(A) = 1 P(A) (4) P(A B) = P(A) + P(B) P(A B) (5) Tapahtuman todennäköisyys S = {e 1,..., e N }. N A = A. Kun alkeistapaukset

Lisätiedot

Ongelma 1: Onko datassa tai informaatiossa päällekkäisyyttä?

Ongelma 1: Onko datassa tai informaatiossa päällekkäisyyttä? Ongelma 1: Onko datassa tai informaatiossa päällekkäisyyttä? 2012-2013 Lasse Lensu 2 Ongelma 2: Voidaanko dataa tai informaatiota tallettaa tiiviimpään tilaan koodaamalla se uudelleen? 2012-2013 Lasse

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KAKSIULOTTEISEN EMPIIRISEN JAKAUMAN TARKASTELU Jatkuvat muuttujat: hajontakuvio Koehenkilöiden pituus 75- ja 80-vuotiaana ID Pituus 75 Pituus 80 1 156

Lisätiedot

Matematiikan tukikurssi

Matematiikan tukikurssi Matematiikan tukikurssi Kurssikerta 1 1 Matemaattisesta päättelystä Matemaattisen analyysin kurssin (kuten minkä tahansa matematiikan kurssin) seuraamista helpottaa huomattavasti, jos opiskelija ymmärtää

Lisätiedot

Matematiikan tukikurssi

Matematiikan tukikurssi Matematiikan tukikurssi Kurssikerta 8 1 Suunnattu derivaatta Aluksi tarkastelemme vektoreita, koska ymmärrys vektoreista helpottaa alla olevien asioiden omaksumista. Kun liikutaan tasossa eli avaruudessa

Lisätiedot

Harjoitus 9: Excel - Tilastollinen analyysi

Harjoitus 9: Excel - Tilastollinen analyysi Harjoitus 9: Excel - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tutustuminen regressioanalyysiin

Lisätiedot

Kaikkia alla olevia kohtia ei käsitellä luennoilla kokonaan, koska osa on ennestään lukiosta tuttua.

Kaikkia alla olevia kohtia ei käsitellä luennoilla kokonaan, koska osa on ennestään lukiosta tuttua. 6 Alkeisfunktiot Kaikkia alla olevia kohtia ei käsitellä luennoilla kokonaan, koska osa on ennestään lukiosta tuttua. 6. Funktion määrittely Funktio f : A B on sääntö, joka liittää jokaiseen joukon A alkioon

Lisätiedot

VAATIMUSMÄÄRITTELY Virtuaaliyhteisöjen muodostaminen Versio 1.0 (luonnos 4)

VAATIMUSMÄÄRITTELY Virtuaaliyhteisöjen muodostaminen Versio 1.0 (luonnos 4) VAATIMUSMÄÄRITTELY Versio 1.0 (luonnos 4) Edited by Checked by Approved by Juha Parhankangas Luonnos 4 i Sisällysluettelo DOKUMENTIN VERSIOT 1 1. JOHDANTO 2 1.1. Projektin luonne 2 1.2. Tarkoitus ja kattavuus

Lisätiedot

Fakta- ja näytenäkökulmat. Pertti Alasuutari Tampereen yliopisto

Fakta- ja näytenäkökulmat. Pertti Alasuutari Tampereen yliopisto Fakta- ja näytenäkökulmat Pertti Alasuutari Tampereen yliopisto Mikä on faktanäkökulma? sosiaalitutkimuksen historia: väestötilastot, kuolleisuus- ja syntyvyystaulut. Myöhemmin kysyttiin ihmisiltä tietoa

Lisätiedot

2.3 Voiman jakaminen komponentteihin

2.3 Voiman jakaminen komponentteihin Seuraavissa kappaleissa tarvitaan aina silloin tällöin taitoa jakaa voima komponentteihin sekä myös taitoa suorittaa sille vastakkainen operaatio eli voimien resultantin eli kokonaisvoiman laskeminen.

Lisätiedot

A. Huutokaupat ovat tärkeitä ainakin kolmesta syystä. 1. Valtava määrä taloudellisia transaktioita tapahtuu huutokauppojen välityksellä.

A. Huutokaupat ovat tärkeitä ainakin kolmesta syystä. 1. Valtava määrä taloudellisia transaktioita tapahtuu huutokauppojen välityksellä. HUUTOKAUPOISTA A. Huutokaupat ovat tärkeitä ainakin kolmesta syystä 1. Valtava määrä taloudellisia transaktioita tapahtuu huutokauppojen välityksellä. 2. Huutokauppapelejä voidaan käyttää taloustieteen

Lisätiedot

Webforum. Version 15.1 uudet ominaisuudet. Päivitetty: 2015-03-28

Webforum. Version 15.1 uudet ominaisuudet. Päivitetty: 2015-03-28 Webforum Version 15.1 uudet ominaisuudet Päivitetty: 2015-03-28 Sisältö Tietoja tästä dokumentista... 3 Yleistä... 4 Dokumentit... 5 Uudet versiot dokumenttien katseluohjelmista ipadille... 5 Dokumenttien

Lisätiedot

031021P Tilastomatematiikka (5 op)

031021P Tilastomatematiikka (5 op) 031021P Tilastomatematiikka (5 op) Jukka Kemppainen Mathematics Division Yleinen todennäköisyys Kertausmateriaalissa esiteltiin koulusta tuttuja todennäköisyysmalleja. Tällä kurssilla todennäköisyys on

Lisätiedot

Reaaliluvut 1/7 Sisältö ESITIEDOT:

Reaaliluvut 1/7 Sisältö ESITIEDOT: Reaaliluvut 1/7 Sisältö Reaalilukujoukko Reaalilukujoukkoa voidaan luonnollisimmin ajatella lukusuorana, molemmissa suunnissa äärettömyyteen ulottuvana suorana, jonka pisteet ja reaaliluvut vastaavat toisiaan:

Lisätiedot

3.3 Paraabeli toisen asteen polynomifunktion kuvaajana. Toisen asteen epäyhtälö

3.3 Paraabeli toisen asteen polynomifunktion kuvaajana. Toisen asteen epäyhtälö 3.3 Paraabeli toisen asteen polynomifunktion kuvaajana. Toisen asteen epäyhtälö Yhtälön (tai funktion) y = a + b + c, missä a 0, kuvaaja ei ole suora, mutta ei ole yhtälökään ensimmäistä astetta. Funktioiden

Lisätiedot

INTERNET KYSELYN TOTEUTUS

INTERNET KYSELYN TOTEUTUS INTERNET KYSELYN TOTEUTUS 1. Tutkimuksen suunnittelu ja lomakkeen teko Kysymysten määrää ei ole rajoitettu. Kysymykset voivat olla luokiteltuja tai avovastauksisia. Luokitelluissa kysymyksissä voidaan

Lisätiedot

Ohjelmoinnin perusteet Y Python

Ohjelmoinnin perusteet Y Python Ohjelmoinnin perusteet Y Python T-106.1208 25.2.2009 T-106.1208 Ohjelmoinnin perusteet Y 25.2.2009 1 / 34 Syötteessä useita lukuja samalla rivillä Seuraavassa esimerkissä käyttäjä antaa useita lukuja samalla

Lisätiedot