T DATASTA TIETOON

Samankaltaiset tiedostot
Luku 1. Johdantoluento

Tämän luennon sisältö. Luku 1. Johdantoluento. Miksi tällainen kurssi? (2) Miksi tällainen kurssi? T Datasta tietoon, syksy 2011

HAHMONTUNNISTUKSEN PERUSTEET

TEEMU ROOS (KALVOT MUOKATTU PATRIK HOYERIN LUENTOMATERIAALISTA)

Kukin kurssi voi sisältyä vain yhteen alemman tai ylemmän perustutkinnon moduuliin.

Kukin kurssi voi sisältyä vain yhteen alemman tai ylemmän perustutkinnon moduuliin.

HAHMONTUNNISTUKSEN PERUSTEET

E. Oja ja H. Mannila Datasta Tietoon: Luku 2

Visualisointi informaatio- verkostojen opinto-oppaasta Informaatioverkostojen kilta Athene ry Opintovastaava Janne Käki 19.9.

Bioinformatics in Laboratory of Computer and Information Science

Tietojenkäsittelytieteen pääaine Pääaineinfo ke

Johdatus tekoälyyn. Luento : Koneoppiminen. Patrik Hoyer. [ Kysykää ja kommentoikaa luennon aikana! ]

ICS. T-61 (Informaatiotekniikka)

TFM-osaston tuottamat vain sivuaineet lv

PERUSTIETEIDEN LAAJA OPPIMÄÄRÄ Syksyn 2010 informaatiotilaisuudet: to 2.9. klo L-salissa / pe 3.9. klo F-salissa TERVETULOA!

PERUSAINEIDEN LAAJA OPPIMÄÄRÄ Syksyn 2007 informaatiotilaisuudet: MA 3.9. klo G-salissa/ TI 4.9. klo G-salissa TERVETULOA!

PERUSAINEIDEN LAAJA OPPIMÄÄRÄ Syksyn 2008 informaatiotilaisuudet: to 4.9. klo L-salissa/ pe 5.9. klo L-salissa TERVETULOA!

T Datasta tietoon, syksy 2011

Visualisointi informaatioverkostojen Opintoneuvoja Teemu Meronen (päivitys Janne Käen visualisoinnin pohjalta)

T-61 Informaatiotekniikka

Korvattava Korvaava Korvaava Korvaava Korvaava Korvaava T Tietokoneen arkkitehtuuri (3 ov)

Visualisointi informaatioverkostojen Opintoneuvoja Janne Käki

Geomatiikan tutkinto-ohjelman moduulirakenne

Aalto-yliopiston perustieteiden korkeakoulu Versio 2 Teknillisen fysiikan ja matematiikan koulutusohjelma tbh

T-61 Informaatiotekniikka

ELEC-C5210 Satunnaisprosessit tietoliikenteessä

NBE-E4510 Special Assignment in Biophysics and Biomedical Engineering AND NBE-E4500 Special Assignment in Human. NBE-E4225 Cognitive Neuroscience

Fysiikan opinnot Avoimen yliopiston opiskelijoille

Luku 2. Datasta tietoon: mitä dataa? mitä tietoa?

805306A Johdatus monimuuttujamenetelmiin, 5 op

Myös opettajaksi aikova voi suorittaa LuK-tutkinnon, mutta sillä ei saa opettajan kelpoisuutta.

OPETUSSUUNNITELMALOMAKE

Visualisointi informaatioverkostojen Opintoneuvoja Pekka Siika-aho (päivitys mm. Janne Käen visualisoinnin pohjalta)

JOITAKIN KOMMENTTEJA JA LISÄEHDOTUKSIA TIETEEN METODIIKKA MODUULIN YHTEISEEN KURSSILISTAAN Esitys KK

Visualisointi informaatio- verkostojen opinto-oppaasta Opintoneuvoja Teemu Meronen (päivitys Janne Käen visualisoinnin pohjalta)

Luku 1. Johdantoluento

Helsinki University of Technology

ti Tfy Termodynamiikka tentinvalvonta PHYS K215 Tfy Fysiologia Tfy Signal Processing in Biomedical Engineering

Aalto-yliopisto Kemian tekniikan korkeakoulu Kemian tekniikan lukujärjestys SYKSY 2012

Aalto-yliopiston perustieteiden korkeakoulu VERSIO 3 Teknillisen fysiikan ja matematiikan koulutusohjelma tbh

OT2 Puheteknologian opintokokonaisuuden suunnittelu Kalle Palomäki

Tilanne sekä MS-A0003/4* Matriisilaskenta 5 op

TIETOJENKÄSITTELYTEORIAN PÄÄAINEEN KORVAAVUUSPERIAATTEET

Tutkintovaatimukset suoraan DI-vaiheeseen valituille

Kirjallisuus 2 op Suoritus: Tentti (luennot ja kirjallisuus) ke klo salissa HU207.

Opintojen mallipolut

Talousmatematiikan perusteet: Johdanto. Kurssin tavoitteet Käytännön järjestelyt Suosituksia suorittamiseen


Kun datasta halutaan muodostaa malleja, ne ovat yleensä tilastollisia (esim. regressio, luokittelu, ryhmittely...) F(x 0 ) = P(x x 0 ) (1)

Opintosuunnitelma. Suunta: Tietoliikenneohjelmistot ja -sovellukset Pääaine: Tietoliikenneohjelmistot Sivuaine: Yritysturvallisuus

Palautekysely tilastollisen signaalinkäsittelyn kurssiin

Ajatellaan jotakin datajoukkoa joka on talletettu datamatriisiin X: n vectors. TKK, Informaatiotekniikan laboratorio 1

OPETUSSUUNNITELMALOMAKE

FYSIIKAN TENTTIJÄRJESTYS versio 2.2

JOHDATUS TEKOÄLYYN TEEMU ROOS

PERUSAINEIDEN LAAJA OPPIMÄÄRÄ

Matematiikka ja tilastotiede. Orientoivat opinnot /

Moderni biolääketieteellinen optiikka X - Optinen mittaaminen sekä valmistusmenetelmät X X X

213a. MS-A0503 Todennäköisyyslaskenna n ja tilastotieteen per; M (vkot 3-7)

Lisäykset, poistot ja muutokset lukuvuoden opetusohjelmaan Osastoneuvosto

E. Oja ja H. Mannila Datasta Tietoon: Luku 6

Historiatieteiden tervetulo- ja infotilaisuus (uudet opiskelijat), ke klo Sali ilm. myöhemmin.

PERUSTIETEIDEN LAAJA OPPIMÄÄRÄ Syksyn 2011 informaatiotilaisuudet: PE 2.9. klo L-salissa TERVETULOA!

Lukujärjestyksen laatiminen, kursseille ilmoittautuminen KTK/KTM-opiskelijat TkK/DI-opiskelijat

Tilastollinen päättely II (MAT22003), kevät 2018

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

KYMENLAAKSON AMMATTIKORKEAKOULU TEKNIIKKA Markku Huhtinen

Matematiikan ja systeemitieteiden pääaineen tupsut Mallilukujärjestys I periodi / viikot /

Tietojenkäsittelytieteen tutkintovaatimukset

AS Automaation käyttöliittymät L Opetussuunnitelma

Laskennallisten tieteiden tutkijakoulu FICS. Ella Bingham, TKK

Tietojenkäsittelytieteet Tutkinto-ohjelman info. Henrik Hedberg Heli Alatalo

Sähköinen matematiikan ja ohjelmoinnin opintopolku alakoulusta yliopistoon. Mikko Lujasmaa, Salon lukio Mikko-Jussi Laakso, Turun yliopisto

L pe D 1 perusteet Yhd Liikenne- ja tietekniikan perusteet

Lakkautetut vastavat opintojaksot: Mat Matematiikan peruskurssi P2-IV (5 op) Mat Sovellettu todennäköisyyslaskenta B (5 op)

Laaja-alainen, opiskelijalähtöinen ja projektiperusteinen opetussuunnitelma, case Monitori

031075P MATEMATIIKAN PERUSKURSSI II 5,0 op

JOHDATUS TEKOÄLYYN TEEMU ROOS

MS-C2128 Ennustaminen ja Aikasarja-analyysi, 5 op Esittely

Kurssin aloitus. AS XML-kuvauskielten perusteet Janne Kalliola

Teknillisen fysiikan pääaineen tupsut / Mallilukujärjestys I periodi / viikot /

Tieto- ja palvelujohtamisen erikoistumisalue opintojen suunnittelu

Syksy 2015 Opintojaksot ja tentit

Page 1 of 9. Ryhmä/group: L = luento, lecture H = harjoitus, exercises A, ATK = atk-harjoitukset, computer exercises

Additions, deletions and changes to courses for the academic year Mitä vanhoja kursseja uusi korvaa / kommentit

Ohjelmistotekniikan menetelmät, kesä 2008

HISTORIAN OPPIAINEEN OPETUSOHJELMA LUKUKAUSI

TYÖHARJOITTELU JA AHOT

TSSH-HEnet : Kansainvälistyvä opetussuunnitelma. CASE4: International Master s Degree Programme in Information Technology

Tfy Teoreettinen mekaniikka (5 op) Tfy Fysiikka IV alkuosa A ja Tfy Teoreettinen mekaniikka

Tilastollinen päättely II (MAT22003), kevät 2019

Johdatus ohjelmointiin C-kielellä P Ohjelmoinnin perusteet C-kielellä A Ohjelmointityö

LUKUJÄRJESTYS 1. VUOSI METSÄEKONOMIA JA MARKKINOINTI LUKUJÄRJESTYKSET LUKUVUODELLE , MEM-FUKSIEN 1. OPINTOVUOSI

PHYS-A0120 Termodynamiikka (TFM) Maanantai

Ohjelmistojen mallintaminen, kesä 2009

ABTEKNILLINEN KORKEAKOULU Tietoverkkolaboratorio

LUKUJÄRJESTYSPOHJA

Kurssin koodi ja nimi Ryhmä Päivä Aika Sali Viikot Henkilöt Course code and name Group Day Time Lecture Weeks Course staff

3.vsk Länsimaisen musiikin historia (1 b Barokki-Romantiikka)/Matti Huttunen Koodi A Keväällä 2013

TIETOJENKÄSITTELYTIEDE

Transkriptio:

TKK / Informaatiotekniikan laboratorio Syyslukukausi, periodi II, 2007 Erkki Oja, professori, ja Heikki Mannila, akatemiaprofessori: T-61.2010 DATASTA TIETOON TKK, Informaatiotekniikan laboratorio 1

JOHDANTO: Miksi tällainen kurssi? Uudessa tutkintorakenteessa on haluttu tarjota ohjelman yhteisissä opinnoissa (O-moduuli) kurssi, joka toimii johdatuksena Informaatiotekniikan opinnoille: perusmoduulille A1 (informaatiotekniikka I) sekä informaatiotekniikan pää- ja sivuainemoduuleille A2, A3 ja vastaaville bioinformatiikan ja kieliteknologian A3-moduuleille (kuvat) Muiden tutkinto-ohjelmien opiskelijoille (esim. TF, S, AS) kurssi sisältyy informaatiotekniikan sivuainemoduuliin B1, jonka jälkeen voi edetä A2-moduuliin Informaatiotekniikan laboratorio on hyvin tutkimusintensiivinen. TKK:lla toimivista valtakunnallisista tutkimuksen huippuyksiköistä 2 toimii info-labrassa (ainoat huippuyksiköt Tietotekniikan osastolla): 1. Adaptiivisen informatiikan tutkimusyksikkö (johtajana Erkki TKK, Informaatiotekniikan laboratorio 2

Oja); 2. Datasta tietoon - tutkimusyksikkö (johtajana TKK:lla Heikki Mannila) Haluamme antaa jo perusopiskelijoille tilaisuuden tutustua meillä tehtävään tutkimukseen Ne opiskelijat jotka eivät valitse informaatiotekniikkaa pää- tai sivuaineekseen saavat kuitenkin jonkinlaisen käsityksen siitä mitä ala pitää sisällään Ne opiskelijat jotka valitsevat informaatiotekniikan pää- tai sivuaineen saavat Datasta Tietoon - kurssissa katsauksen koko kenttään, joka sitten syvenee laboratorion muiden kurssien avulla ja esim. osallistumalla kesäteekkarina tutkimushankkeisiin Muut aiheeseen liittyvät kurssit (those with English names will be given totally in English): TKK, Informaatiotekniikan laboratorio 3

T-61.152 Informaatiotekniikan seminaari T-61.3010 Digitaalinen signaalinkäsittely ja suodatus T-61.3020 Hahmontunnistuksen perusteet T-61.3030 Neuraalilaskennan perusteet T-61.3040 Signaalien tilastollinen mallinnus T-61.3050 Machine learning: basic principles T-61.5010 Informaation visualisointi T-61.5020 Luonnollisen kielen tilastollinen mallinnus T-61.5030 Neuraalilaskennan jatkokurssi T-61.5050 Suurkapasiteettimittausten bioinformatiikka T-61.5060 Tiedon louhinnan algoritmiset menetelmät T-61.5070 Tietokonenäkö T-61.5080 Signal processing in neuroinformatics T-61.5090 Image analysis in neuroinformatics TKK, Informaatiotekniikan laboratorio 4

T-61.5100 Digitaalinen kuvankäsittely T-61.5110 Biologisten verkkojen mallintaminen T-61.5120 Laskennallinen genomiikka T-61.5130 Machine learning and neural networks T-61.5140 Machine learning: advanced probabilistic methods T-61.5900 Informaatiotekniikan erikoistyö T-61.6010 Informaatiotekniikan erikoiskurssi I T-61.6020 Informaatiotekniikan erikoiskurssi II T-61.6030 Informaatiotekniikan erikoiskurssi III T-61.6040 Informaatiotekniikan erikoiskurssi IV T-61.6050 Informaatiotekniikan erikoiskurssi V T-61.6060 Informaatiotekniikan erikoiskurssi VI T-61.6070 Bioinformatiikan erikoiskurssi I T-61.6080 Bioinformatiikan erikoiskurssi II TKK, Informaatiotekniikan laboratorio 5

T-61.6090 Kieliteknologian erikoiskurssi TKK, Informaatiotekniikan laboratorio 6

Käytäntöä Kurssin kotisivu http://www.cis.hut.fi/opinnot/t-61.2010/; täydentyy kurssin edetessä Ilmoittaudu TOPI:n kautta http://wwwtopi.hut.fi Luennot keskiviikkoisin ja torstaisin klo 14-16, sali T1 Laskuharjoitukset (2 h / viikko) Keskiviikkoisin klo 12-14 ja perjantaisin klo 14-16 salissa T1 (vaihtoehtoiset ryhmät). Laskuharjoitusten assistenttina toimii DI Ulpu Remes. Harjoitustehtävät suomeksi ja englanniksi löytyvät kurssin kotisivulta. Myös ratkaisut tulevat kotisivulle. Matlab-harjoitustyö (tehtävissä pienryhmissä tai yksin; arvioitu työmäärä 2 h/ viikko) on kiinteä osa kurssia ja sen voi tehdä itsenäisesti tai ohjatusti atk-keskuksen luokassa (DI Ville TKK, Informaatiotekniikan laboratorio 7

Viitaniemi). Harjoitustyöaiheita on kaksi vaihtoehtoista. Tarkemmat ohjeet Matlab-työstä hieman myöhemmin. Ensimmäinen tentti ke 19.12.07 klo 9-12 (sali M), toinen ma 14.1.08 klo 13-16 (salit DEL), sitten keväällä 2008 ja syksyllä 2008. Tenttivaatimukset ja luentomateriaali kotisivuilla. TKK, Informaatiotekniikan laboratorio 8

Kurssin sisältö 1. Johdanto Miksi tällainen kurssi? Käytäntöä Kurssin sisältö Kurssimateriaali 2. Datasta tietoon: mitä dataa, mitä tietoa? Data-analyysin ongelma Mallit ja oppiminen Esimerkkejä Case study: WEBSOM 3. Data vektorina Vektorit, matriisit, etäisyysmitat TKK, Informaatiotekniikan laboratorio 9

Datan piirreirrotus ja vektorointi Dimensionaalisuuden kirous Esimerkki piirrreirrotuksesta: PicSOM 4. Vektoridatan tiivistäminen ja dekorrelointi Pääkomponenttianalyysi PCA:n laskeminen on-line-algoritmilla Esimerkkejä DSS-menetelmä: halutunlaisten aikakomponenttien etsiminen 5. Estimointiteorian perusteita Perusjakaumat 1-ulotteisina Yleistys vektoridatalle, d:n muuttujan normaalijakauma Suurimman uskottavuuden periaate Bayes-estimointi TKK, Informaatiotekniikan laboratorio 10

Regressiosovitus Esimerkki regressiosta: neuroverkko Esimerkkejä 6. Hahmontunnistuksen perusteita Johdanto Hahmoalueet, erotinfunktio Lähimmän naapurin luokitin Bayes-optimaalinen luokitin Ryhmittelyanalyysi 7. Itseorganisoiva kartta Perusidea Yhteys biologiaan Suppenevuus 1-ulotteisessa tapauksessa TKK, Informaatiotekniikan laboratorio 11

Käytännön valintoja Mihin SOM:ia käytetään? Esimerkkejä 8. Hahmojen etsintä diskreetistä datasta Miten muodostetaan hyviä paikallisia kuvauksia datan osista 9. Web-etsintämenetelmien algoritmit Perusongelmat Merkkijonoetsintä Linkkirakenteen ottaminen huomioon 10. Sekvenssien rakenteen etsintä Segmentointiongelma, kustannusfunktiot Dynaamisen ohjelmoinnin periaate Esimerkkejä biologiasta TKK, Informaatiotekniikan laboratorio 12

Kurssimateriaali: Luentokalvot ja harjoitustehtävät ratkaisuineen Muu materiaali ilmoitetaan myöhemmin. Se tulee olemaan saatavilla salasanan takana, koska siihen sisältyy copyrightin alaisia sivuja, joita ei missään nimessä saa jakaa edelleen. TKK, Informaatiotekniikan laboratorio 13