Tiedon louhinnan teoria (ja käytäntö) OUGF kevätseminaari 2004 Hannu Toivonen
|
|
- Kristiina Pakarinen
- 7 vuotta sitten
- Katselukertoja:
Transkriptio
1 Tiedon louhinnan teoria (ja käytäntö) OUGF kevätseminaari 2004 Hannu Toivonen 1
2 2 A A A A A A A A B B B B B B B B
3 3 A A A A A A A A B B B B B B B B
4 4 yksilön osa yksilön tyyppi perimästä luettua dataa sairas sairas sairas sairas sairas sairas sairas sairas verrokki verrokki verrokki verrokki verrokki verrokki verrokki verrokki
5 Geenikartoitus 5 Sairaudelle altistavien geenien paikantaminen ihmisen perimässä Tautia aiheuttavien mekanismien tutkiminen ja ymmärtäminen Lääkkeiden suunnittelu Geenitestit mahdollistavat ennaltaehkäisevän ja räätälöidyn lääkityksen Tiedon louhinta Geenikartoitus perustuu perimästä luettavan datan analysointiin ja siitä löytyviin hahmoihin Menetelmän datan tuottamiseksi kehittyvät -> enemmän ja uudenlaista dataa -> uusia ongelmia ja mahdollisuuksia
6 Tiedon louhinta Tyypillinen tavoite: tuottaa datasta sellaisia havaintoja ja analyysejä, jotka auttavat tutkijaa ymmärtämään paremmin aineistoaan ja sen tuottanutta prosessia Uuden ja hyödyllisen tiedon päättelemistä datasta Mitä data kertoisi, jos siltä osaisi kysyä oikeat kysymykset? Tiedon louhinta työkaluna: tavoitteena tunnistaa datasta sellaisia ilmiöitä, joita voidaan hyödyntää edelleen komponentteina tarkemmassa mallinnuksessa tai analyysissä 6
7 Tiedon louhinta ja tilastotiede Ilmiöiden valinta käyttäjä ja kone yhdessä käyttäjä kuvailu ennustaminen selittäminen Monimutkaisuus 7
8 Tiedon louhinta ja tilastotiede Ilmiöiden valinta käyttäjä ja kone yhdessä käyttäjä Vis. DM DM perinteinen tilastotiede kuvailu ennustaminen selittäminen Monimutkaisuus 8
9 Tiedon louhinta ja OLAP Ilmiöiden valinta käyttäjä ja kone yhdessä käyttäjä DM DM Vis. OLAP perinteinen tilastotiede kuvailu ennustaminen selittäminen Monimutkaisuus 9
10 Data-analyysin tyypillisiä vaiheita Ilmiöiden valinta käyttäjä ja kone yhdessä 3. data mining 2. visualisointi 4. tilastollinen mallinnus käyttäjä 1. tunnusluvut kuvailu ennustaminen selittäminen Monimutkaisuus 10
11 Tyypillisiä tiedon louhintatehtäviä ennustaminen klusterointi poikkeusten havaitseminen toistuvien hahmojen etsintä Tiedon louhinta on laaja käsite, ei yksittäinen tekniikka 11
12 Ennustaminen sairas sairas sairas sairas sairas sairas sairas sairas verrokki verrokki verrokki verrokki verrokki verrokki verrokki verrokki sairas 12
13 Ennustaminen sairas sairas sairas sairas sairas sairas sairas sairas verrokki verrokki verrokki verrokki verrokki verrokki verrokki verrokki tai 2 6 sairas 13
14 Ennustaminen Opetusaineisto: joukko pareja (x i, f(x i )), i = 1,, n Tehtävä: opi funktio f (x i ) f(x i ) kohteena tapaukset i > n Mitä enemmän f:stä (tai f :stä) tiedetään ennalta, sen paremmin menetelmää voidaan ohjata Tyypilliset ratkaisut tuottavat yhden funktion f, joka on paras jonka menetelmä löysi Tuloksen testaaminen riippumattomalla testijoukolla, i = n+1,, n+m (aineisto jaetaan siis osiin, joiden koot n+m) Jos mallin valinta tehdään testijoukolla, pitää lopullinen malli testata vielä erillisellä validointijoukolla (aineisto osissa n+m+k) 14
15 Klusterointi
16 Klusterointi
17 Klusterointi
18 Klusterointi
19 Klusterointi Syöte: joukko datapisteitä x i Tulos esim: parit (x i, g(x i )) kaikilla i, missä g 1, 2,, k kertoo mihin k:sta klusterista kukin piste kuuluu pisteet kussakin klusterissa ovat keskenään mahdollisimman samankaltaisia eri klusterit ovat keskenään mahdollisimman erilaisia Paljon erilaisia variaatiota k annettu vai ei, hierarkkinen klusterointi, sumea klusterointi, Tavoitteen täsmällinen määritteleminen, esim. minimoidaan i dist(x i, mean(g(x i )) 2, missä dist(x, y) on pisteiden x, y välinen etäisyys ja mean(j) on klusteriin j kuuluvien pisteiden keskiarvo 19
20 Toistuvat hahmot sairas sairas sairas sairas sairas sairas sairas sairas verrokki verrokki verrokki verrokki verrokki verrokki verrokki verrokki
21 Toistuvat hahmot sairas sairas sairas sairas sairas sairas sairas sairas verrokki verrokki verrokki verrokki verrokki verrokki verrokki verrokki hahmo 1: (3)(4) 3 (7)(3)(2) 21
22 Toistuvat hahmot sairas sairas sairas sairas sairas sairas sairas sairas verrokki verrokki verrokki verrokki verrokki verrokki verrokki verrokki hahmo 1: (3)(4) 3 (7)(3)(2) -hahmo 2: (5)(2) 6 (2) 22
23 Toistuvien hahmojen etsintä Tehtävän kuvaus: Syöte: aineisto A joukko P aineistossa mahdollisesti olevia hahmoja minimiyleisyys k Tulos: kaikki sellaiset joukon P hahmot p, jotka esiintyvät vähintään k kertaa annetussa aineistossa A Tehtävän analyysi, esim.: jos joukon P hahmoilla on yleisyyshierarkia, toistuvien hahmojen haku voidaan tehdä tehokkaasti Algoritmit: yleinen ratkaisumalli, joka on sovitettavissa erilaisiin erikoistapauksiin 23
24 Toistuvia hahmoja Ostoskorianalyysi Jos vaippoja niin olutta (todennäköisyys 56 %, frekvenssi 12 %) Kurssi-ilmottautumiset Jos tietoliikenne ja C-ohjelmointi niin ei gradua Tekstidokumenttien analysointi Jos innovative ja Microsoft niin <piste> sanojen välissä Geenikartoitus Jos geneettinen hahmo niin sairas Ostoskorianalyysi on sovellusriippumaton tekniikka 24
25 Toistuvat hahmot työkaluna Yksinkertaiset hahmot ovat helposti ymmärrettäviä Etsintä on tehokasta Tarkasteltavat hahmotyypit voidaan räätälöidä sovelluksen mukaan Toistuvia hahmoja voidaan käyttää monimutkaisempien mallien rakennuspalikoina (mm. ennustuksessa tai klusteroinnissa) Hyvin harvinaiset hahmot ovat harvoin mielenkiintoisia 25
26 Toistuvien hahmojen etsintä Mahdollisia hahmoja voi olla valtavasti Jos perimästä tarkastellaan vaikkapa 100 kohtaa (attribuuttia), jossa kussakin esiintyy kahta alleelia (arvoa), niin erilaisia yhdistelmiä on yli Jos yhdistelmiä tutkitaan miljoona sekunnissa, niin aikaa kaikkien tutkimiseen kuluu vuotta. Kuitenkin vain murto-osa yhdistelmistä toistuu edes kaksi kertaa Yksi tiedon louhinnan ydinalueita on ollut tehokkaiden menetelmien kehittäminen toistuvien hahmojen etsintään 26
27 Tiedon louhinta tieteenalana Tutkimuskohteita: Louhinta-algoritmien suunnittelu ja analyysi miten annettu data-analyysitehtävä ratkaistaan? Tiedon louhinnan teoria millaisia tehtävätyyppejä ja millä edellytyksillä tietyllä algoritmilla voidaan ratkaista? millaisia ominaisuuksia eri tehtävätyypeillä on? miten tulosten laatua voidaan arvioida? Tehtävätyyppien muotoilu, hyvät kysymykset millaiset data-analyysitehtävät ovat yleiskäyttöisiä? Tiedon louhintaprosessi mitkä ovat ne toimintatavat, joilla uudelle ongelmalle löydetään hyvät kysymykset ja niille hyvät ratkaisut? 27
28 Menetelmäkehityksen tavoitteita Tavoitteita tiedon louhintamenetelmille automaattisuus: laajan etsintäavaruuden läpikäynti korkean tason kieli: ymmärrettävät tulokset hyödylliset tulokset: uutta, hyödynnettävää tulosteen tarkkuus: hyvä ja tarvittaessa arvioitavissa tehokkuus: analyysiajat kohtuullisia ja ennakoitavissa 28
29 Tiedon louhijan pitää tietää (1/3) mitä hän louhii Millaista data on? Miksi ja miten se on tuotettu? Miten se on kerätty? Miten sitä on jo käsitelty? Miksi dataa analysoidaan? Mihin tiedon louhinnalla pyritään? Minkä tyyppisistä tuloksista olisi hyötyä? Assosiaatiosäännöistä, klusteroinnista, luokittelijasta, trendeistä, poikkeuksista - vai jostain muuta? Millaisia hahmoja, sääntöjä tai piirteitä datasta voi ylipäätään etsiä? 29
30 Tiedon louhijan pitää tietää (2/3) miten louhia Mikä on louhintatehtävän abstrakti kuvaus? Mitkä menetelmät soveltuvat ongelmaan? Mitkä menetelmät ja niiden muunnelmat sopivat tavoitteisiin? Onko tehtävään valmiita työkaluja? Jos ei, miten muokata työkalua tai ongelmaa? 30
31 Tiedon louhijan pitää tietää (3/3) tekniikoiden tärkeimmät ominaisuudet Miksi työkalu (käytetty menetelmä ja käytetty ohjelma) tuotti tietyt tulokset? Millä perusteilla se valitsi mahdollisten tulosten joukosta juuri kyseiset? Mitkä ovat työkalun rajoitukset? Millaisia oletuksia työkalu tekee? Takaako se parhaan tuloksen löytymisen vai likimäärin parhaan? Kuinka herkkä se on käytetyille parametreille? Kertooko se myös muista lähes yhtä hyvistä (ja mahdollisesti täysin erilaisista) tuloksista? 31
32 Tekniikoiden eroja: etsittävän ilmiön rajaus Etsiikö menetelmä vain tiettyyn tai tiettyihin attribuutteihin liittyviä hahmoja? assosiaatiosäännöt, toistuvat ilmiöt klusterointi ennustaminen tilastollisen mallin sovitus löysä rajaus mielivaltaisten attribuuttien välisiä suhteita kohdeattribuutti on kiinnitettu tarkka rajaus kohde- ja selittävät muuttujat kiinnitetty 32
33 Tekniikoiden eroja: hahmojen ilmaisuvoima Kuinka monimutkaisia ilmiöitä hahmot voivat kuvata? assosiaatiosäännöt, toistuvat ilmiöt klusterointi ennustaminen tilastollisen mallin sovitus yksinkertaisia kuvaa vain asioiden liittymistä yhteen monimutkaisempia sääntöjä, puita monimutkaisia mielivaltaisia käyttäjän laatimia malleja 33
34 Tekniikoiden eroja: tuloksen koko Tuottaako menetelmä tuloksena yhden hahmon vai monta? assosiaatiosäännöt, toistuvat ilmiöt klusterointi ennustaminen tilastollisen mallin sovitus monta paljon, jossakin "paremmuusjärjestyksessä" tyypillisesti yksi tai muutamia vaihtoehtoja vähän paras sovitus 34
35 Tekniikoiden eroja: yhteenveto paljon yksinkertaisia tuloksia assosiaatiosäännöt, toistuvat ilmiöt klusterointi luokittelu, regressio tilastollisen mallin sovitus 35 tarkka rajaus, voimakkaat hahmot
36 9 askelta epäonnistumiseen Näin varmistat louhintaprojektin epäonnistumisen [D. Pyle, DB2 Magazine, 2004] 1. Ryhdy välittömästi louhintaan. Älä tuhlaa aikaa datan ja menetelmien valintaan tai tarpeiden selvittämiseen. 2. Muotoile ongelma datalähtöisesti. Muotoile tavoite sitten tekemiesi havaintojen mukaiseksi. 3. Keskity ilmeisimpään tapaan analysoida dataa. Luota ohjelmistosi tarjoamiin menetelmiin ja tarkkuusmittareihin. 4. Luota omaan harkintakykyysi, äläkä anna asiakkaiden johtaa harhaan. 36
37 9 askelta epäonnistumiseen 5. Etsi paras algoritmi. Tiedon louhinta on oleellisesti parhaan algoritmin etsimistä annetulle datalle. 6. Luota omaan muistiisi. Älä tuhlaa aikaa prosessin vaiheiden dokumentointiin, kyllä ne muistaa sitten myöhemmin. 7. Oma näkemys on tärkeämpi kuin vakioidut käytännöt, jotka ovat vain noviiseja varten. Jokainen tapaus ja data on yksilöllinen. 8. Minimoi tiedon louhijan ja asiakkaan vuorovaikutus. Hyvä louhija löytää työkaluillaan kaikki tärkeät, hyödylliset, yllättävät arvokkaat ilmiöt ilman asiakkaan opastusta. 9. Minimoi datan esikäsittely. Mielenkiintoisin osa tiedon louhintaa on algoritmien ja parametrien virittäminen. Sitä paitsi esiprosessointiin kuluu paljon aikaa. 37
38 Yhteenveto Tiedon louhinta ei toimi nappia painamalla Tiedon louhinta on prosessi (datan käsittely, analyysi, tulosten tulkinta)* Onnistunut tiedon louhinta edellyttää sovellusalueen, datan ja menetelmien tuntemista, käytännössä siis eri asioiden asiantuntijoiden yhteistyötä 38
Tiedonlouhinta rakenteisista dokumenteista (seminaarityö)
Tiedonlouhinta rakenteisista dokumenteista (seminaarityö) Miika Nurminen (minurmin@jyu.fi) Jyväskylän yliopisto Tietotekniikan laitos Kalvot ja seminaarityö verkossa: http://users.jyu.fi/~minurmin/gradusem/
Lisätiedot1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI
1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI 1 1.1 Funktion optimointiin perustuvat klusterointialgoritmit Klusteroinnin onnistumista mittaavan funktion J optimointiin perustuvissa klusterointialgoritmeissä
Lisätiedot1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI
1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI 1 1.1 Funktion optimointiin perustuvat klusterointialgoritmit Klusteroinnin onnistumista mittaavan funktion J optimointiin perustuvissa klusterointialgoritmeissä
LisätiedotNeuroverkkojen soveltaminen vakuutusdatojen luokitteluun
Neuroverkkojen soveltaminen vakuutusdatojen luokitteluun Sami Hokuni 12 Syyskuuta, 2012 1/ 54 Sami Hokuni Neuroverkkojen soveltaminen vakuutusdatojen luokitteluun Turun Yliopisto. Gradu tehty 2012 kevään
LisätiedotALGORITMIT & OPPIMINEN
ALGORITMIT & OPPIMINEN Mitä voidaan automatisoida? Mikko Koivisto Avoimet aineistot tulevat Tekijä: Lauri Vanhala yhdistä, kuvita, selitä, ennusta! Tekijä: Logica Mitä voidaan automatisoida? Algoritmi
LisätiedotMatemaatikot ja tilastotieteilijät
Matemaatikot ja tilastotieteilijät Matematiikka/tilastotiede ammattina Tilastotiede on matematiikan osa-alue, lähinnä todennäköisyyslaskentaa, mutta se on myös itsenäinen tieteenala. Tilastotieteen tutkijat
Lisätiedot3. Laskennan vaativuusteoriaa
3. Laskennan vaativuusteoriaa tähän asti puhuttu siitä, mitä on mahdollista laskea äärellisessä ajassa siirrytään tarkastelemaan laskemista kohtuullisessa ajassa vaihtoehtoisesti voidaan laskenta-ajan
LisätiedotMS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä.
MS-A0204 Differentiaali- ja integraalilaskenta 2 (ELEC2) Luento 7: Pienimmän neliösumman menetelmä ja Newtonin menetelmä. Antti Rasila Matematiikan ja systeemianalyysin laitos Aalto-yliopisto Kevät 2016
LisätiedotÄlykäs datan tuonti kuljetusongelman optimoinnissa. Antoine Kalmbach
Älykäs datan tuonti kuljetusongelman optimoinnissa Antoine Kalmbach ane@iki.fi Sisällys Taustaa Kuljetusongelma Datan tuominen vaikeaa Teoriaa Tiedostojen väliset linkit Mikä sarake on mikäkin? Ratkaisutoteutus
LisätiedotJohdatus tilastotieteeseen Estimointi. TKK (c) Ilkka Mellin (2005) 1
Johdatus tilastotieteeseen Estimointi TKK (c) Ilkka Mellin (2005) 1 Estimointi Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin ominaisuudet TKK (c) Ilkka Mellin (2005) 2 Estimointi:
LisätiedotTutkimustiedonhallinnan peruskurssi
Tutkimustiedonhallinnan peruskurssi Hannu Toivonen, Marko Salmenkivi, Inkeri Verkamo hannu.toivonen, marko.salmenkivi, inkeri.verkamo@cs.helsinki.fi Helsingin yliopisto Hannu Toivonen, Marko Salmenkivi,
LisätiedotEsimerkkejä vaativuusluokista
Esimerkkejä vaativuusluokista Seuraaville kalvoille on poimittu joitain esimerkkejä havainnollistamaan algoritmien aikavaativuusluokkia. Esimerkit on valittu melko mielivaltaisesti laitoksella tehtävään
LisätiedotUudelleenkäytön jako kahteen
Uudelleenkäyttö Yleistä On pyritty pääsemään vakiokomponenttien käyttöön Kuitenkin vakiokomponentit yleistyneet vain rajallisilla osa-alueilla (esim. windows-käyttöliittymä) On arvioitu, että 60-80% ohjelmistosta
LisätiedotAvainsanojen poimiminen Eeva Ahonen
Avainsanojen poimiminen 5.10.2004 Eeva Ahonen Sisältö Avainsanat Menetelmät C4.5 päätöspuut GenEx algoritmi Bayes malli Testit Tulokset Avainsanat Tiivistä tietoa dokumentin sisällöstä ihmislukijalle hakukoneelle
LisätiedotOngelma(t): Miten merkkijonoja voidaan hakea tehokkaasti? Millaisia hakuongelmia liittyy bioinformatiikkaan?
Ongelma(t): Miten merkkijonoja voidaan hakea tehokkaasti? Millaisia hakuongelmia liittyy bioinformatiikkaan? 2012-2013 Lasse Lensu 2 Ihmisen, eläinten ja kasvien hyvinvoinnin kannalta nykyaikaiset mittaus-,
LisätiedotRekisterit tutkimusaineistona: tieteenfilosofis-metodologiset lähtökohdat
Reijo Sund Rekisterit tutkimusaineistona: tieteenfilosofis-metodologiset lähtökohdat Rekisterit tutkimuksen apuvälineenä kurssi, Biomedicum, Helsinki 25.05.2009 Kevät 2009 Rekisterit tutkimusaineistona
LisätiedotJohnson, A Theoretician's Guide to the Experimental Analysis of Algorithms.
Kokeellinen algoritmiikka (3 ov) syventäviä opintoja edeltävät opinnot: ainakin Tietorakenteet hyödyllisiä opintoja: ASA, Algoritmiohjelmointi suoritus harjoitustyöllä (ei tenttiä) Kirjallisuutta: Johnson,
LisätiedotFoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. 9. luento. Pertti Palo
FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa 9. luento Pertti Palo 22.11.2012 Käytännön asioita Eihän kukaan paikallaolijoista tee 3 op kurssia? 2. seminaarin ilmoittautuminen. 2. harjoitustyön
LisätiedotMTTTP1 Tilastotieteen johdantokurssi Luento JOHDANTO
8.9.2016/1 MTTTP1 Tilastotieteen johdantokurssi Luento 8.9.2016 1 JOHDANTO Tilastotiede menetelmätiede, joka käsittelee - tietojen hankinnan suunnittelua otantamenetelmät, koejärjestelyt, kyselylomakkeet
Lisätiedottilastotieteen kertaus
tilastotieteen kertaus Keskiviikon 24.1. harjoitukset pidetään poikkeuksellisesti klo 14-16 luokassa Y228. Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla
Lisätiedot1. Tilastollinen malli??
1. Tilastollinen malli?? https://fi.wikipedia.org/wiki/tilastollinen_malli https://en.wikipedia.org/wiki/statistical_model http://projecteuclid.org/euclid.aos/1035844977 Tilastollinen malli?? Numeerinen
LisätiedotAlgoritmit 2. Luento 13 Ti Timo Männikkö
Algoritmit 2 Luento 13 Ti 30.4.2019 Timo Männikkö Luento 13 Simuloitu jäähdytys Merkkijonon sovitus Horspoolin algoritmi Ositus ja rekursio Rekursion toteutus Algoritmit 2 Kevät 2019 Luento 13 Ti 30.4.2019
LisätiedotHarjoitus 7: NCSS - Tilastollinen analyysi
Harjoitus 7: NCSS - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tilastollinen testaus Testaukseen
LisätiedotPoikkeavuuksien havainnointi (palvelinlokeista)
Poikkeavuuksien havainnointi (palvelinlokeista) TIES326 Tietoturva 2.11.2011 Antti Juvonen Sisältö IDS-järjestelmistä Datan kerääminen ja esiprosessointi Analysointi Esimerkki Lokidatan rakenne Esikäsittely,
LisätiedotTilastotiede ottaa aivoon
Tilastotiede ottaa aivoon kuinka aivoja voidaan mallintaa todennäköisyyslaskennalla, ja mitä yllättävää hyötyä siitä voi olla Aapo Hyvärinen Laskennallisen data-analyysin professori Matematiikan ja tilastotieteen
LisätiedotMatematiikan tukikurssi, kurssikerta 3
Matematiikan tukikurssi, kurssikerta 3 1 Epäyhtälöitä Aivan aluksi lienee syytä esittää luvun itseisarvon määritelmä: { x kun x 0 x = x kun x < 0 Siispä esimerkiksi 10 = 10 ja 10 = 10. Seuraavaksi listaus
LisätiedotTilastotieteen aihehakemisto
Tilastotieteen aihehakemisto hakusana ARIMA ARMA autokorrelaatio autokovarianssi autoregressiivinen malli Bayes-verkot, alkeet TILS350 Bayes-tilastotiede 2 Bayes-verkot, kausaalitulkinta bootstrap, alkeet
LisätiedotTilastotiede ottaa aivoon
Tilastotiede ottaa aivoon kuinka aivoja voidaan mallintaa todennäköisyyslaskennalla, ja mitä yllättävää hyötyä siitä voi olla Aapo Hyvärinen Laskennallisen data-analyysin professori Matematiikan ja tilastotieteen
LisätiedotTrichoderma reesein geenisäätelyverkoston ennustaminen Oskari Vinko
Trichoderma reesein geenisäätelyverkoston ennustaminen Oskari Vinko 04.11.2013 Ohjaaja: Merja Oja Valvoja: Harri Ehtamo Työn saa tallentaa ja julkistaa Aalto-yliopiston avoimilla verkkosivuilla. Muilta
LisätiedotLaadullinen tutkimus. KTT Riku Oksman
Laadullinen tutkimus KTT Riku Oksman Kurssin tavoitteet oppia ymmärtämään laadullisen tutkimuksen yleisluonnetta oppia soveltamaan keskeisimpiä laadullisia aineiston hankinnan ja analysoinnin menetelmiä
LisätiedotLogistinen regressio, separoivat hypertasot
Logistinen regressio, separoivat hypertasot Topi Sikanen Logistinen regressio Aineisto jakautunut K luokkaan K=2 tärkeä erikoistapaus Halutaan mallintaa luokkien vedonlyöntikertoimia (odds) havaintojen
LisätiedotLectio praecursoria. Satunnaistusalgoritmeja tiedonlouhinnan tulosten merkitsevyyden arviointiin. Markus Ojala. 12.
Lectio praecursoria Satunnaistusalgoritmeja tiedonlouhinnan tulosten merkitsevyyden arviointiin Markus Ojala 12. marraskuuta 2011 Käsitteet Satunnaistusalgoritmeja tiedonlouhinnan tulosten merkitsevyyden
LisätiedotTilastotieteen kertaus. Kuusinen/Heliövaara 1
Tilastotieteen kertaus Kuusinen/Heliövaara 1 Mitä tilastotiede on? Tilastotiede kehittää ja soveltaa menetelmiä, joiden avulla reaalimaailman ilmiöistä voidaan tehdä johtopäätöksiä tilanteissa, joissa
Lisätiedotjens 1 matti Etäisyydet 1: 1.1 2: 1.4 3: 1.8 4: 2.0 5: 3.0 6: 3.6 7: 4.0 zetor
T-1.81 Luonnollisten kielten tilastollinen käsittely Vastaukset 11, ti 8.4., 1:1-18: Klusterointi, Konekääntäminen. Versio 1. 1. Kuvaan 1 on piirretty klusteroinnit käyttäen annettuja algoritmeja. Sanojen
LisätiedotMatematiikan tukikurssi
Matematiikan tukikurssi Kurssikerta 4 Supremum ja inmum Tarkastellaan aluksi avointa väliä, Tämä on joukko, johon kuuluvat kaikki reaaliluvut miinus yhdestä yhteen Kuitenkaan päätepisteet eli luvut ja
LisätiedotIdentifiointiprosessi
Alustavia kokeita Identifiointiprosessi Koesuunnittelu, identifiointikoe Mittaustulosten / datan esikäsittely Ei-parametriset menetelmät: - Transientti-, korrelaatio-, taajuus-, Fourier- ja spektraalianalyysi
LisätiedotT Luonnollisen kielen tilastollinen käsittely Vastaukset 3, ti , 8:30-10:00 Kollokaatiot, Versio 1.1
T-61.281 Luonnollisen kielen tilastollinen käsittely Vastaukset 3, ti 10.2.2004, 8:30-10:00 Kollokaatiot, Versio 1.1 1. Lasketaan ensin tulokset sanaparille valkoinen, talo käsin: Frekvenssimenetelmä:
LisätiedotTilastotieteen kertaus. Vilkkumaa / Kuusinen 1
Tilastotieteen kertaus Vilkkumaa / Kuusinen 1 Motivointi Reaalimaailman ilmiöihin liittyy tyypillisesti satunnaisuutta ja epävarmuutta Ilmiöihin liittyvien havaintojen ajatellaan usein olevan peräisin
LisätiedotMS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016,
LisätiedotFoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. Luentokuulustelujen esimerkkivastauksia. Pertti Palo. 30.
FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa Luentokuulustelujen esimerkkivastauksia Pertti Palo 30. marraskuuta 2012 Saatteeksi Näiden vastausten ei ole tarkoitus olla malleja vaan esimerkkejä.
LisätiedotKaksiluokkainen tapaus, lineaarinen päätöspinta, lineaarisesti erottuvat luokat
1 Tukivektoriluokittelija Tukivektorikoneeseen (support vector machine) perustuva luoikittelija on tilastollisen koneoppimisen teoriaan perustuva lineaarinen luokittelija. Perusajatus on sovittaa kahden
LisätiedotLaskennallinen data-analyysi II
Laskennallinen data-analyysi II Ella Bingham, ella.bingham@cs.helsinki.fi Kevät 2008 Muuttujien valinta Kalvot perustuvat Saara Hyvösen kalvoihin 2007 Laskennallinen data-analyysi II, kevät 2008, Helsingin
LisätiedotTilastolliset ohjelmistot 805340A. Pinja Pikkuhookana
Tilastolliset ohjelmistot 805340A Pinja Pikkuhookana Sisältö 1 SPSS 1.1 Yleistä 1.2 Aineiston syöttäminen 1.3 Aineistoon tutustuminen 1.4 Kuvien piirtäminen 1.5 Kuvien muokkaaminen 1.6 Aineistojen muokkaaminen
LisätiedotTEEMU ROOS (KALVOT MUOKATTU PATRIK HOYERIN LUENTOMATERIAALISTA)
JOHDATUS TEKOÄLYYN TEEMU ROOS (KALVOT MUOKATTU PATRIK HOYERIN LUENTOMATERIAALISTA) KONEOPPIMISEN LAJIT OHJATTU OPPIMINEN: - ESIMERKIT OVAT PAREJA (X, Y), TAVOITTEENA ON OPPIA ENNUSTAMAAN Y ANNETTUNA X.
LisätiedotMONISTE 2 Kirjoittanut Elina Katainen
MONISTE 2 Kirjoittanut Elina Katainen TILASTOLLISTEN MUUTTUJIEN TYYPIT 1 Mitta-asteikot Tilastolliset muuttujat voidaan jakaa kahteen päätyyppiin: kategorisiin ja numeerisiin muuttujiin. Tämän lisäksi
LisätiedotIntroduction to Machine Learning
Introduction to Machine Learning Aki Koivu 27.10.2016 HUMAN HEALT H ENVIRONMENTAL HEALT H 2016 PerkinElmer Miten tietokone oppii ennustamaan tai tekemään päätöksiä? Historia tiivistettynä Machine Learning
LisätiedotEstimointi. Estimointi. Estimointi: Mitä opimme? 2/4. Estimointi: Mitä opimme? 1/4. Estimointi: Mitä opimme? 3/4. Estimointi: Mitä opimme?
TKK (c) Ilkka Mellin (2004) 1 Johdatus tilastotieteeseen TKK (c) Ilkka Mellin (2004) 2 Mitä opimme? 1/4 Tilastollisen tutkimuksen tavoitteena on tehdä johtopäätöksiä prosesseista, jotka generoivat reaalimaailman
LisätiedotSisällönanalyysi. Sisältö
Sisällönanalyysi Kirsi Silius 14.4.2005 Sisältö Sisällönanalyysin kohde Aineistolähtöinen sisällönanalyysi Teoriaohjaava ja teorialähtöinen sisällönanalyysi Sisällönanalyysi kirjallisuuskatsauksessa 1
LisätiedotRelevanttien sivujen etsintä verkosta: satunnaiskulut verkossa Linkkikeskukset ja auktoriteetit (hubs and authorities) -algoritmi
Kurssin loppuosa Diskreettejä menetelmiä laajojen 0-1 datajoukkojen analyysiin Kattavat joukot ja niiden etsintä tasoittaisella algoritmilla Relevanttien sivujen etsintä verkosta: satunnaiskulut verkossa
LisätiedotAureolis Oy. Analytiikka määrää myymälävalikoiman - Case Alkon myymäläuudistus 2015
Aureolis Oy Analytiikka määrää myymälävalikoiman - Case Alkon myymäläuudistus 2015 TDWI 18.10.2016 24.10.2016 Alkon valikoimanhallinnan uudistus Kesäkuussa 2015 käyttöönotettu uudistus, jonka myötä myymälöiden
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 8. marraskuuta 2007 Antti Rasila () TodB 8. marraskuuta 2007 1 / 18 1 Kertausta: momenttimenetelmä ja suurimman uskottavuuden menetelmä 2 Tilastollinen
LisätiedotDiplomi-insinööri- ja arkkitehtikoulutuksen yhteisvalinta 2017 Insinöörivalinnan matematiikan koe , Ratkaisut (Sarja A)
Diplomi-insinööri- ja arkkitehtikoulutuksen yhteisvalinta 017 Insinöörivalinnan matematiikan koe 30..017, Ratkaisut (Sarja A) 1. a) Lukujen 9, 0, 3 ja x keskiarvo on. Määritä x. (1 p.) b) Mitkä reaaliluvut
Lisätiedot805306A Johdatus monimuuttujamenetelmiin, 5 op
monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos K:n lähimmän naapurin menetelmä (K-Nearest neighbours) Tarkastellaan aluksi pientä (n = 9) kurjenmiekka-aineistoa, joka on seuraava:
LisätiedotSimulation and modeling for quality and reliability (valmiin työn esittely) Aleksi Seppänen
Simulation and modeling for quality and reliability (valmiin työn esittely) Aleksi Seppänen 16.06.2014 Ohjaaja: Urho Honkanen Valvoja: Prof. Harri Ehtamo Työn saa tallentaa ja julkistaa Aalto-yliopiston
LisätiedotEdistyksen päivät, Helsinki. Voiko tutkija muuttaa maailmaa? Humanistista meta-analyysiä merkitysneuvottelevien koneiden avulla.
Edistyksen päivät, Helsinki Voiko tutkija muuttaa maailmaa? Humanistista meta-analyysiä merkitysneuvottelevien koneiden avulla Timo Honkela timo.honkela@helsinki.fi 5.10.2017 Taustaa: Rauhankone-konsepti
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 22. marraskuuta 2007 Antti Rasila () TodB 22. marraskuuta 2007 1 / 17 1 Epäparametrisia testejä (jatkoa) χ 2 -riippumattomuustesti 2 Johdatus regressioanalyysiin
LisätiedotABHELSINKI UNIVERSITY OF TECHNOLOGY
Tilastollinen testaus Tilastollinen testaus Tilastollisessa testauksessa tutkitaan tutkimuskohteita koskevien oletusten tai väitteiden paikkansapitävyyttä havaintojen avulla. Testattavat oletukset tai
LisätiedotJatkuvat satunnaismuuttujat
Jatkuvat satunnaismuuttujat Satunnaismuuttuja on jatkuva jos se voi ainakin periaatteessa saada kaikkia mahdollisia reaalilukuarvoja ainakin tietyltä väliltä. Täytyy ymmärtää, että tällä ei ole mitään
LisätiedotViikko 1: Johdantoa Matti Kääriäinen matti.kaariainen@cs.helsinki.fi
Viikko 1: Johdantoa Matti Kääriäinen matti.kaariainen@cs.helsinki.fi Exactum C222, 29-31.10.2008. 1 Tällä viikolla 1. Käytännön järjestelyistä 2. Kurssin sisällöstä ja aikataulusta 3. Johdantoa Mitä koneoppiminen
LisätiedotTarvitseeko informaatioteknologia matematiikkaa?
Tarvitseeko informaatioteknologia matematiikkaa? Oulun yliopisto Matemaattisten tieteiden laitos 1 Kyllä kai IT matematiikkaa tarvitsee!? IT ja muu korkea teknologia on nimenomaan matemaattista teknologiaa.
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 30. lokakuuta 2007 Antti Rasila () TodB 30. lokakuuta 2007 1 / 23 1 Otos ja otosjakaumat (jatkoa) Frekvenssi ja suhteellinen frekvenssi Frekvenssien odotusarvo
LisätiedotTässä luvussa mietimme, kuinka paljon aineistossa on tarpeellista tietoa Sivuamme kysymyksiä:
4. Tyhjentyvyys Tässä luvussa mietimme, kuinka paljon aineistossa on tarpeellista tietoa Sivuamme kysymyksiä: Voidaanko päätelmät perustaa johonkin tunnuslukuun t = t(y) koko aineiston y sijasta? Mitä
LisätiedotMS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi 2016
LisätiedotOppimistavoitematriisi
Oppimistavoitematriisi Lineaarialgebra ja matriisilaskenta I Esitiedot Arvosanaan 1 2 riittävät Arvosanaan 3 4 riittävät Arvosanaan 5 riittävät Yhtälöryhmät (YR) Osaan ratkaista ensimmäisen asteen yhtälöitä
LisätiedotT Luonnollisten kielten tilastollinen käsittely
T-61.281 Luonnollisten kielten tilastollinen käsittely Vastaukset 3, ti 11.2.2003, 16:15-18:00 Kollokaatiot, Versio 1.1 1. Lasketaan ensin tulokset sanaparille valkoinen, talo käsin: Frekvenssimenetelmä:
LisätiedotMS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0503 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 3B Tilastolliset datajoukot Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Lukuvuosi 2016
Lisätiedot1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI
1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI Ohjaamattomassa oppimisessa on tavoitteena muodostaa hahmoista ryhmiä, klustereita, joiden sisällä hahmot ovat jossain mielessä samankaltaisia ja joiden välillä
LisätiedotYhteydettömän kieliopin jäsennysongelma
Yhteydettömän kieliopin jäsennysongelma Yhteydettömän kieliopin jäsennysongelmalla tarkoitetaan laskentaongelmaa Annettu: yhteydetön kielioppi G, merkkijono w Kysymys: päteekö w L(G). Ongelma voidaan periaatteessa
LisätiedotLajittelumenetelmät ilmakehän kaukokartoituksen laadun tarkkailussa (valmiin työn esittely)
Lajittelumenetelmät ilmakehän kaukokartoituksen laadun tarkkailussa (valmiin työn esittely) Viivi Halla-aho 30.9.2013 Ohjaaja: Dos. Johanna Tamminen Valvoja: Prof. Harri Ehtamo Työn saa tallentaa ja julkistaa
LisätiedotIlkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi
Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2006) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin
LisätiedotHarjoitus 9: Excel - Tilastollinen analyysi
Harjoitus 9: Excel - Tilastollinen analyysi Mat-2.2107 Sovelletun matematiikan tietokonetyöt Syksy 2006 Mat-2.2107 Sovelletun matematiikan tietokonetyöt 1 Harjoituksen aiheita Tutustuminen regressioanalyysiin
LisätiedotTiedonlouhinta (kl 2013) Kurssin kuvaus. Esitiedot. Kurssin arvostelu
Tiedonlouhinta (kl 2013) Kurssin kuvaus 00 11 00 11 00 11 01 01 01 01 11000 111 11000 111 00 11 joko kandidaatti- tai maisteritason valinnainen kurssi Toteutus pääasiassa ongelmalähtöisesti (tiedonlouhintaprosessin
Lisätiedot811312A Tietorakenteet ja algoritmit 2015-2016. I Johdanto
811312A Tietorakenteet ja algoritmit 2015-2016 I Johdanto Sisältö 1. Algoritmeista ja tietorakenteista 2. Algoritmien analyysistä 811312A TRA, Johdanto 2 I.1. Algoritmeista ja tietorakenteista I.1.1. Algoritmien
LisätiedotSanaluokkajäsennystä rinnakkaisilla transduktoreilla
Sanaluokkajäsennystä rinnakkaisilla transduktoreilla Nykykielten laitos FIN-CLARIN-seminaarissa 4. marraskuuta 2010 Sanaluokkajäsennys Mr. Gelbert also has fun with language. NNP NNP RB VBZ NN IN NN. Sanaluokkajäsennin
LisätiedotMuotoilumaailman hahmottaminen - Tuotesemantiikka
TUOTESEMANTIIKAN TEORIA kreik. semeion = merkki Tuotesemantiikka kiinnostaa tutkimusmielessä monia erilaisia tuotteiden kanssa tekemisiin joutuvia elämänalueita. Sellaisia ovat esimerkiksi Markkinointi,
LisätiedotMS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi
MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi 4A Parametrien estimointi Lasse Leskelä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2016, periodi
LisätiedotVerkon värittämistä hajautetuilla algoritmeilla
Verkon värittämistä hajautetuilla algoritmeilla 5 12 30 19 72 34 Jukka Suomela 15 77 18 4 9. tammikuuta 2012 19 2 68 Verkko 2 Verkko solmu 3 Verkko solmu kaari 4 Hajautettu järjestelmä solmu (tietokone)
LisätiedotVäliestimointi (jatkoa) Heliövaara 1
Väliestimointi (jatkoa) Heliövaara 1 Bernoulli-jakauman odotusarvon luottamusväli 1/2 Olkoon havainnot X 1,..., X n yksinkertainen satunnaisotos Bernoulli-jakaumasta parametrilla p. Eli X Bernoulli(p).
Lisätiedot2 Osittaisderivaattojen sovelluksia
2 Osittaisderivaattojen sovelluksia 2.1 Ääriarvot Yhden muuttujan funktiolla f(x) on lokaali maksimiarvo (lokaali minimiarvo) pisteessä a, jos f(x) f(a) (f(x) f(a)) kaikilla x:n arvoilla riittävän lähellä
LisätiedotEtsintä verkosta (Searching from the Web) T Datasta tietoon Heikki Mannila, Jouni Seppänen
Etsintä verkosta (Searching from the Web) T-61.2010 Datasta tietoon Heikki Mannila, Jouni Seppänen 12.12.2007 Webin lyhyt historia http://info.cern.ch/proposal.html http://browser.arachne.cz/screen/
LisätiedotRAMBOLL WATER TEKOÄLYN HYÖDYNTÄMINEN JÄTEVEDENPUHDISTAMON OPEROINNISSA
RAMBOLL WATER TEKOÄLYN HYÖDYNTÄMINEN JÄTEVEDENPUHDISTAMON OPEROINNISSA Anna Sipilä Vesihuolto 2019 16.5.2019 Jyväskylä 1 MIKSI TEKOÄLY? Vedenpuhdistamoilla mitataan nykyisin paljon eri asioita pelkästään
LisätiedotKoneoppimisen hyödyt arvopohjaisessa terveydenhuollossa. Kaiku Health
Koneoppimisen hyödyt arvopohjaisessa terveydenhuollossa Kaiku Health Petri Avikainen Kaiku Health Petri Avikainen @silputtelija @silppuri Kaiku Health Software Engineer Kaiku Health Software Engineer
LisätiedotTUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas
TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas LUENNOT Luento Paikka Vko Päivä Pvm Klo 1 L 304 8 Pe 21.2. 08:15-10:00 2 L 304 9 To 27.2. 12:15-14:00 3 L 304 9 Pe 28.2. 08:15-10:00 4 L 304 10 Ke 5.3.
LisätiedotTietorakenteet ja algoritmit
Tietorakenteet ja algoritmit Kurssin sisältö pääpiirteittäin Tarvittavat pohjatiedot Avainsanat Abstraktio Esimerkkiohjelman tehtäväkuvaus Abstraktion käyttö tehtävässä Abstrakti tietotyyppi Hyötyjä ADT:n
LisätiedotHELIA 1 (11) Outi Virkki Käyttöliittymät ja ohjelmiston suunnittelu
HELIA 1 (11) Luento 4 Käytettävyyden tuottaminen... 2 Käytettävyys ja systeemityöprosessi... 3 Määrittely... 3 Suunnittelu... 3 Toteutus ja testaus... 3 Seuranta... 3 Kriittiset tekijät käytettävyyden
LisätiedotMTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu
10.1.2019/1 MTTTA1 Tilastomenetelmien perusteet 5 op Luento 10.1.2019 1 Kokonaisuudet johon opintojakso kuuluu https://www10.uta.fi/opas/opintojakso.htm?rid=14600 &idx=1&uilang=fi&lang=fi&lvv=2018 10.1.2019/2
LisätiedotOsa 2: Otokset, otosjakaumat ja estimointi
Ilkka Mellin Tilastolliset menetelmät Osa 2: Otokset, otosjakaumat ja estimointi Estimointi TKK (c) Ilkka Mellin (2007) 1 Estimointi >> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin
LisätiedotSijainnin merkitys Itellassa GIS. Jakelun kehittämisen ajankohtaispäivä
Jakelun kehittämisen ajankohtaispäivä Karttajärjestelmällä havainnollisuutta, tehokkuutta ja parempaa asiakaspalvelua Käytännön kokemuksia pilotoinneista ja käytössä olevista karttajärjestelmistä Juha
LisätiedotAlgoritmit 1. Luento 3 Ti Timo Männikkö
Algoritmit 1 Luento 3 Ti 17.1.2017 Timo Männikkö Luento 3 Algoritmin analysointi Rekursio Lomituslajittelu Aikavaativuus Tietorakenteet Pino Algoritmit 1 Kevät 2017 Luento 3 Ti 17.1.2017 2/27 Algoritmien
LisätiedotOppimistavoitematriisi
Oppimistavoitematriisi Lineaarialgebra ja matriisilaskenta I Arvosanaan 1 2 riittävät Arvosanaan 5 riittävät Yhtälöryhmät (YR) Osaan ratkaista ensimmäisen asteen yhtälöitä ja yhtälöpareja Osaan muokata
LisätiedotKynä-paperi -harjoitukset. Taina Lehtinen Taina I Lehtinen Helsingin yliopisto
Kynä-paperi -harjoitukset Taina Lehtinen 43 Loput ratkaisut harjoitustehtäviin 44 Stressitestin = 40 s = 8 Kalle = 34 pistettä Ville = 5 pistettä Z Kalle 34 8 40 0.75 Z Ville 5 8 40 1.5 Kalle sijoittuu
LisätiedotTekoäly tukiäly. Eija Kalliala, Marjatta Ikkala
Tekoäly tukiäly Eija Kalliala, Marjatta Ikkala 29.11.2018 Mitä on tekoäly? Unelma koneesta, joka ajattelee kuin ihminen Hype-sana, jota kuulee joka paikassa Väärinymmärretty sana -> vääriä odotuksia, pelkoja
LisätiedotKun yhtälöä ei voi ratkaista tarkasti (esim yhtälölle x-sinx = 1 ei ole tarkkaa ratkaisua), voidaan sille etsiä likiarvo.
Kun yhtälöä ei voi ratkaista tarkasti (esim yhtälölle x-sinx = 1 ei ole tarkkaa ratkaisua), voidaan sille etsiä likiarvo. Iterointi on menetelmä, missä jollakin likiarvolla voidaan määrittää jokin toinen,
LisätiedotEpäyhtälöt ovat yksi matemaatikon voimakkaimmista
6 Epäyhtälöitä Epäyhtälöt ovat yksi matemaatikon voimakkaimmista työvälineistä. Yhtälö a = b kertoo sen, että kaksi ehkä näennäisesti erilaista asiaa ovat samoja. Epäyhtälö a b saattaa antaa keinon analysoida
LisätiedotReaalifunktioista 1 / 17. Reaalifunktioista
säilyy 1 / 17 säilyy Jos A, B R, niin funktiota f : A B sanotaan (yhden muuttujan) reaalifunktioksi. Tällöin karteesinen tulo A B on (aiempia esimerkkejä luonnollisemmalla tavalla) xy-tason osajoukko,
LisätiedotLuentorunko perjantaille
Luentorunko perjantaille 28.11.28 Eräitä ryvästyksen keskeisiä käsitteitä kustannusfunktio sisäinen vaihtelu edustajavektori etäisyysmitta/funktio Osittamiseen perustuva ryvästys (yleisesti) K:n keskiarvon
LisätiedotMat Tilastollisen analyysin perusteet, kevät 2007
Mat-2.2104 Tilastollisen analyysin perusteet, kevät 2007 2. luento: Tilastolliset testit Kai Virtanen 1 Tilastollinen testaus Tutkimuksen kohteena olevasta perusjoukosta esitetään väitteitä oletuksia joita
LisätiedotSovellettu todennäköisyyslaskenta B
Sovellettu todennäköisyyslaskenta B Antti Rasila 11. lokakuuta 2007 Antti Rasila () TodB 11. lokakuuta 2007 1 / 15 1 Johdantoa tilastotieteeseen Peruskäsitteitä Tilastollisen kuvailun ja päättelyn menetelmiä
LisätiedotReaalilukuvälit, leikkaus ja unioni (1/2)
Luvut Luonnolliset luvut N = {0, 1, 2, 3,... } Kokonaisluvut Z = {..., 2, 1, 0, 1, 2,... } Rationaaliluvut (jaksolliset desimaaliluvut) Q = {m/n m, n Z, n 0} Irrationaaliluvut eli jaksottomat desimaaliluvut
LisätiedotGeneettiset algoritmit
Geneettiset algoritmit Evoluution piirteitä laskennassa Optimoinnin perusteet - Kevät 2002 / 1 Sisältö Geneettisten algoritmien sovelluskenttä Peruskäsitteitä Esimerkkejä funktion ääriarvon etsintä vangin
Lisätiedot