Klusterointimenetelmät
|
|
- Martti Ahonen
- 8 vuotta sitten
- Katselukertoja:
Transkriptio
1 Klusterointimenetelmät Marko Tuononen Joensuun yliopisto, Tietojenkäsittelytiede Laudaturseminaariesityksen kirjallinen tukimateriaali 25. helmikuuta 2005 Tiivistelmä Klusterointi on menetelmä saada tietoa aineiston rakenteesta. Klusterointi on tärkeä työkalu muun muassa monilla tietojenkäsittelytieteen osa-alueilla sekä useiden empiiristen tieteiden parissa. Tässä työssä annetaan yleisesittely klusteroinnista sekä muutamia esimerkkejä mahdollisista sovelluksista. Lisäksi esitellään luokittelu klusterointimenetelmille ja luodaan yleiskatsaus klusterointimenetelmiin. ACM-luokat (ACM Computing Classification System, 1998 version): I.5.3 Avainsanat: klusterointi, klusterointimenetelmät, klusterointimenetelmien luokitus 1 Johdanto Annettujen aineellisten tai abstraktien alkioiden jaottelemista ryhmiin samankaltaisuuden perusteella kutsutaan klusteroinniksi (Han & Kamber, 2001). Asioiden ja ilmiöiden jaottelu ryhmiin on ihmisille erittäin luonteenomaista toimintaa. Ihminen oppii jo aikaisessa lapsuudessaan erottamaan kissan koirasta sekä löytämään eron kasvi- ja eläinkunnan väliltä jatkaen läpi elämänsä tämän alitajuisen jaottelun tarkentamista. Klusteroinnilla on pitkä historia useissa empiirisissä tieteissä, kuten esimerkiksi biologiassa, psykiatriassa, psykologiassa, lääketieteessä, arkeologiassa, geologiassa, sosiologiassa ja markkinoinnissa, joissa klusterointia usein käytetään datan analysointiin (Jain & al., 1999). Klusteroinnilla on useita sovelluksia myös tietojenkäsittelytieteen alalla, sillä klusterointi on tärkeä työkalu muun muassa hahmontunnistuksessa (pattern recognition), data analyysissä (data analysis), kuvankäsittelyssä (image processing) sekä tiedonlouhinnassa (data mining) (Han & Kamber, 2001). Seuraavassa on esitelty muutamia klusteroinnin sovelluksia biologian, psykiatrian sekä markkinoinnin aloilta: Biologiassa klusterointia on voitu käyttää kasvi- ja eläinluokittelujen muodostamisessa sekä populaatioiden sisäisen rakenteen tutkimisessa (Han & Kamber, 2001). Esimerkiksi Fränti ja muut (2000) ovat käyttäneet klusterointia bakteerien luokitteluun. Lisäksi geenien ekspressiodataa klusteroimalla on voitu löytää toiminnaltaan samankaltaiset geenit (Seal & al., 2005). Psykiatriassa on klusterointia käyttäen muun muassa pyritty luokittelemaan itsemurhaan taipuvaisia mielenterveyspotilaita. Koska mielenterveysongelmat ovat monimutkaisempia kuin muut terveyteen liittyvät ongelmat, on psykiatriassa yleisemminkin osoitettu mielenkiintoa klusteroinnin soveltamiseksi nykyisten ongelmaluokkien tarkentamiseksi tai jopa uudelleen määrittelemiseksi (Everitt, 1993). Markkinoinnissa voidaan kuluttajien ostokäyttäytymistä klusteroimalla löytää erilaisia kuluttajaryhmiä. Tätä tietoa voidaan hyödyntää suunniteltaessa täsmämainontaa (Han & Kamber, 2001). Markkinointitutkimuksissa halutaan yleensä kerätä tietoa erilaisilta kuluttajaryhmiltä. Klusteroimalla voidaan jakaa 1
2 kaupungit tai kaupunginosat samankaltaisiin ryhmiin, jolloin voidaan paremmin varmistua kyselyiden kohdistumisesta tasapuolisesti kaikkiin kuluttajaryhmiin (Everitt, 1993). 2 Klusterointi Olkoon annettu joukko aineellisia tai abstrakteja alkioita. Kutsumme jatkossa tätä annettujen alkioiden joukkoa aineistoksi. Klusteroinnissa (clustering) pyritään aineistosta löytämään ryhmiä ja jakamaan alkiot näihin ryhmiin siten, että alkiot kussakin ryhmässä ovat keskenään mahdollisimman samanlaisia mutta alkiot eri ryhmissä ovat keskenään mahdollisimman erilaisia (Kaufman & Rousseeuw, 1990; Everitt, 1993; Han & Kamber, 2001). Muodostettuja ryhmiä kutsutaan klustereiksi. Klusteri (cluster) määritellään aineiston epätyhjänä osajoukkona. Lisäksi vaaditaan, ettei millään kahdella klusterilla ole yhteisiä alkioita. Poikkeuksena tästä on sumeaan logiikkaan (fuzzy logic) perustuva klusterointi, jossa kukin alkio voi kuulua useampaan kuin yhteen klusteriin (Jain & al., 1999). Jätämme kuitenkin tässä työssä huomiotta sumeaan logiikkaan perustuvat klusterointimenetelmät. Klusteroitava aineisto voi olla esimerkiksi joukko kuvia, jotka halutaan järjestää sisältönsä mukaan (Chen & al., 2000) tai geenien ekspressiodataa, jota klusteroimalla halutaan löytää toiminnaltaan samankaltaiset geenit (Seal & al., 2005). Jotta klusterointi olisi mielekästä, oletamme, että klusteroitavalla aineistolla on jonkinlainen rakenne. Voidaksemme klusteroida tarvitsemme lisäksi keinon mitata aineiston alkioiden erilaisuutta tai samankaltaisuutta. Jatkossa oletamme aineiston olevan joukko tason pisteitä ja aineiston alkioiden erilaisuusmittana käytettävän euklidista etäisyyttä. Kuvassa 1 on esitetty esimerkki klusteroinnista, jossa klusteroitavana aineistona on 5000 tason pistettä. Muodostetut 15 klusteria on osoitettu rajaamalla syntyneet klusterit viivoilla. Rajaavat viivat on saatu piirtämällä Voronoin diagrammi klustereiden keskipisteiden suhteen (Aurenhammer, 1991). Kuva 1: Eräs aineisto ja sen klusterointi. Optimaalisen klusteroinnin muodostaminen on kombinatorisessa muodossaan NP-täydellinen ongelma (Garey & al., 1982), joten tehokkaimmatkin optimaalisen ratkaisun tuottavat menetelmät, kuten esimerkiksi Fräntin ja Virmajoen (2004) esittämä menetelmä, ovat aikavaativuudeltaan eksponentiaalisia. Näin ollen on käytännössä käytettävä klusterointimenetelmiä, jotka eivät tuota optimaalista ratkaisua. Todennäköisesti johtuen juuri tästä optimaalisen klusteroinnin muodostamisen vaikeudesta sekä klusteroinnin sovelluskentän laajuudesta, on olemassa hyvin monenlaisia lähestymistapoja ei-optimaalisen klusteroinnin muodostamiseksi. Klusterointimenetelmien luokittelemiseksi ei kirjallisuudesta löydy mitään yhtenäistä linjaa. Esimerkiksi Han ja Kamber (2001), Jain ja muut (1999), Ma ja Chow (2004) sekä Virmajoki (2004) esittävät kukin erilaisen luokittelun klusterointimenetelmille. Tässä työssä esitettävässä klusterointimenetelmien luokittelussa on käytetty soveltuvin osin edellä mainittuja luokitteluja. 2
3 Kirjallisuudessa on esitetty lukemattomia klusterointimenetelmiä. Klusterointimenetelmän valinnassa on otettava huomioon klusteroitavan aineiston tyyppi sekä klusteroinnin käyttötarkoitus (Han & Kamber, 2001). Mikäli klusterointia käytetään tutkivana menetelmänä (exploratory tool), voidaan aineistoa klusteroida useilla eri menetelmillä, jotta nähdään, mitä aineistosta paljastuu (Han & Kamber, 2001; Jain & al., 1999). Klusterointimenetelmät voidaan karkeasti jakaa hierarkkisiin ja osittaviin menetelmiin. 3 Hierarkkiset menetelmät Hierarkkiset menetelmät tuottavat aineistolle useita klusterointeja, jotka muodostavat puumaisen hierarkian. Muodostettu hierarkia voidaan esittää dendrogrammina (dendrogram). Hierarkkiset menetelmät jaetaan edelleen jakaviin ja yhdistäviin menetelmiin. Jakavissa menetelmissä (divisive) aineiston kaikki alkiot ovat aluksi samassa klusterissa. Tämän jälkeen klustereita jaetaan kahtia kunnes saavutetaan haluttu määrä klustereita tai kunnes kukin alkio on omana klusterinaan. Yhdistävissä menetelmissä (agglomerative) kukin aineiston alkio on aluksi omana klusterinaan. Tämän jälkeen klustereita yhdistellään kunnes saavutetaan haluttu määrä klustereita tai kunnes kaikki alkiot ovat samassa klusterissa. (Jain & al., 1999; Kaufmann & Rousseeuw, 1990; Everitt, 1993) Jakavien menetelmien tapauksessa on ratkaistava, miten valitaan jaettava klusteri sekä miten valittu klusteri jaetaan. Jaettava klusteri voidaan valita esimerkiksi ryhmän koon (Kaufmann & Rousseeuw, 1990) tai hajonnan (variance) (Wu & Zhang, 1991; Fränti & al., 1997) mukaan. Klusterin jakaminen voidaan suorittaa esimerkiksi pääakselia (principal axis) pitkin (Wu & Zhang, 1991). Yhdistävien menetelmien tapauksessa on yhdistettävien klustereiden valinta keskeisintä, sillä varsinainen klustereiden yhdistäminen on melkoisen suoraviivaista. Yhdistettävät klusterit voidaan valita esimerkiksi klustereiden lähimpien (single linkage; Sneath & Sokal, 1973) tai kauimpien (complete linkage; King, 1973) alkioiden perusteella. Yhdistettävät klusterit on myös mahdollista valita siten, että klustereiden yhdistäminen heikentää ratkaisua vähiten (Ward s method; Ward, 1963). Hierarkkisista menetelmistä yhdistävät menetelmät ovat yleisimmin käytettyjä ja helpompia toteuttaa kuin jakavat menetelmät (Everitt, 1993; Virmajoki, 2004). Hierarkkisten menetelmien hyvänä puolena on, että saamme tarvittaessa klusteroinnin kaikille mahdollisille klusterien määrille. Heikkoutena hierarkkisilla algoritmeilla on tietty ahneus, sillä klustereita yhdistellään/jaetaan sen mukaan, mikä juuri kyseisellä hetkellä vaikuttaa parhaalta ratkaisulta. Tehtyjä huonoja päätöksiä ei kuitenkaan pysty myöhemmin perumaan (Kaufman & Rousseeuw, 1990). 4 Osittavat menetelmät Osittavat menetelmät tuottavat aineistolle vain yhden klusteroinnin (Kaufmann & Rousseeuw, 1990). Osittavat menetelmät jaetaan edelleen optimointimenetelmiin sekä verkkoteoreettisiin, tiheysperustaisiin, ristikkoperustaisiin ja malliperustaisiin menetelmiin. Optimointimenetelmät jakavat annetun aineiston haluttuun määrään klustereita pyrkien tapauksesta riippuen minimoimaan tai maksimoimaan annetun tavoitefunktion (objective function) (Jain & al., 1999; Kaufmann & Rousseeuw, 1990; Everitt, 1993). Optimointimenetelmät vaativat siis syötteenään klustereiden lukumäärän, joten klustereiden määrän tulee olla tiedossa tai se on voitava arvioida hyvin etukäteen. Minimoitavana tavoitefunktiona käytetään yleensä keskineliövirhettä. Keskineliövirhe (MSE = mean square error) saadaan lasketuksi korottamalla aineiston pisteiden etäisyydet klustereiden keskipisteisiin toiseen potenssiin ja laskemalla niiden keskiarvo. Keskineliövirheen laskeminen on esitetty kaavassa (1), jossa on aineiston alkioiden lukumäärä, aineiston :s alkio, sen klusterin keskipiste, johon alkio kuuluu, ja on täten aineiston :nnen alkion ja klusterinsa keskipisteen välinen euklidinen etäisyys. (1) K-means (McQueen, 1967) on eräs tunnetuimpia klusterointimenetelmiä ja se kuuluu optimointimenetelmien 3
4 1. Valitse satunnaiset alkiot klustereiden keskipisteiksi. 2. TOISTA 3. Sijoita kukin aineiston alkio siihen klusteriin, jonka keskipiste on lähinnä. 4. Korvaa kunkin klusterin keskipiste klusterin alkioiden keskiarvovektorilla. 5. KUNNES (klustereiden keskipisteet eivät enää muutu) Kuva 2: K-means -algoritmi. luokkaan. K-means käyttää kahta optimaalisuuskriteeriä, joita vuorottelemalla sen onnistuu optimoida lokaalisti kaavan (1) tavoitefunktio. Algoritmi kuvataan useissa lähteissä (Han & Kamber, 2001; Jain & al., 1999; Kaufmann & Rousseeuw, 1990) ja sitä käytetään yleisesti myös toisten menetelmien osana, esimerkiksi Fränti ja Kivijärvi (2000) ovat käyttäneet sitä paikallishakuun (local search) pohjautuvan menetelmän osana. K-means -algoritmi on esitetty kuvassa 2. Verkkoteoreettiset menetelmät muodostavat alkuperäisestä aineistosta verkon ja sen jälkeen ratkaisevat ongelman käyttäen muodostettua verkkoa. Eräs mahdollinen tapa on muodostaa aineistosta pienin virittävä puu (minimal spanning tree), jossa solmuina on aineiston alkiot ja kaarten painoina aineiston alkioiden välimatkat (Jain & al., 1999). Tämän jälkeen poistamalla aina painavin kaari voidaan muodostaa klusterointeja eri klusterien lukumäärille, joten verkkoteoreettisilla menetelmillä on selkeitä yhtymäkohtia aiemmin esitettyihin hierarkkisiin menetelmiin. Tiheysperustaiset menetelmät käsittävät klusteroinnin harvojen alueiden erottamien tiheiden alueiden etsimiseksi (Ma & Chow, 2004). Tiheysperustaisissa menetelmissä aineiston alkiot pyritään jakamaan joukoiksi sellaisia tason alueita, joiden sisältämät alkiot ovat mahdollisimman tiheässä (Han & Kamber, 2001). Han ja Kamber (2001) mainitsevat tiheysperustaisten menetelmien hyvänä puolena, että menetelmät löytävät mielivaltaisen muotoisia ja kokoisia klustereita sekä menetelmien hyvän hälyn (noise) siedon. Tiheysperustaisten menetelmien huonona puolena mainitaan, että tiheyden käsitteen määrittely vaatii tuntemusta aineistosta. Ristikkoperustaiset menetelmät jakavat aineiston alkioiden muodostaman tason äärelliseen määrään neliöitä, jotka yhdessä muodostavat ristikkorakenteen (Han & Kamber, 2001). Tämän jälkeen kaikki klusterointitoimet tehdään ristikkorakenteessa. Han ja Kamber (2001) mainitsevat ristikkoperustaisten menetelmien hyvänä puolena nopean suoritusajan, sillä aikavaativuus on ristikkoperustaisissa menetelmissä tyypillisesti suhteessa solujen määrään, eikä suhteessa aineiston alkioiden määrään. Ma ja Chow (2004) antavat esimerkin tiheys- ja ristikkoperustaisista menetelmistä, sillä heidän esittämänsä menetelmä on yhdistelmä kummastakin menetelmästä. Malliperustaiset menetelmät pyrkivät hakemaan aineistolle mahdollisimman hyvän selityksen jonkin matemaattisen mallin avulla (Han & Kamber, 2001). Malli voi olla esimerkiksi tilastotieteellinen, jolloin aineisto on todennäköisyysjakaumien (propability distributions) tuottamaa, tai neuraaliverkkoon (neural network) pohjautuva. Kohosen (1982) esittämä itseorganisoituva kartta (self-organizing map) on eräs neuraaliverkkoon pohjautuva malliperustainen menetelmä. Tässä työssä esitetty klusterointimenetelmien luokitus ei ole mitenkään aukoton, sillä jotkin klusterointimenetelmät ovat yhdistelmiä edellä esitetyistä lähestymistavoista. Tästä esimerkkinä Kaukorannan ja muiden (1998) esittämä Split-and-merge-menetelmä, jossa vuoroin jaetaan ja yhdistellään klustereita hierarkkisten menetelmien tapaan, mutta varsinainen menetelmä on pikemminkin optimointimenetelmä. Vastakkaisen esimerkin tarjoaa Likasin ja muiden (2003) esittämä menetelmä, joka on hierarkkinen jakava menetelmä, jossa on käytetty K-meansia menetelmän osana. 4
5 Viitteet Aurenhammer, F. (1991) Voronoi Diagrams - A Survey of a Fundamental Geometric Data Structure. ACM Computing Surveys 23(3), Chen, J., Bouman, C.A., Dalton, J.C. (2000) Hierarchical Browsing and Search of Large Image Databases. IEEE Transactions on Image Processing 9(3), Everitt, B.S. (1993) Cluster Analysis, Third edition. Arnold, London. Fränti, P., Gyllenberg, H.G., Gyllenberg, M., Kivijärvi J., Koski T., Lund, T., Nevalainen, O. (2000) Minimizing stochastic complexity using local search and GLA with applications to classification of bacteria. Biosystems 57(1), Fränti, P., Kaukoranta, T., Nevalainen, O. (1997) On the splitting method for VQ codebook generation. Optical Engineering 36(11), Fränti, P., Kivijärvi, J. (2000) Randomized Local Search Algorithm for the Clustering Problem. Pattern Analysis and Applications 3(4), Fränti, P., Virmajoki, O. (2004) Optimal clustering by merge-based branch-and-bound. Submitted for publication Garey, M.R., Johnson, D.S., Witsenhausen, H.S. (1982) The complexity of the generalized Lloyd-Max problem. IEEE Transactions on Information Theory 28(2), Han, J., Kamber, M. (2001) Data Mining: Concepts and Techniques. Morgan Kaufmann Publishers, San Francisco. Jain, A.K., Murty, M.N., Flynn, P.J. (1999) Data Clustering: A Review. ACM Computing Surveys 31(3), Kaufman, L., Rousseeuw, P.J. (1990) Finding Groups in Data: An Introduction to Cluster Analysis. John Wiley & Sons, New York. Kaukoranta, T., Fränti, P., Nevalainen, O. (1998) Iterative split-and-merge algorithm for VQ codebook generation. Optical Engineering 37(10), King, B. (1967) Step-Wise Clustering Procedures. Journal of the American Statistical Association 62(317), Kohonen, T. (1982) Self-organized formation of topologically correct feature maps. Biological Cybernetics 43(1), Likas, A., Vlassis, N., Verbeek, J.J. (2003) The global k-means clustering algorithm. Pattern Recognition 36(2), Ma, E.W.M., Chow, T.W.S. (2004) A new shifting grid clustering algorithm. Pattern Recognition 37(3), McQueen, J.B. (1967) Some methods for classification and analysis of multivariate observations. Proceedings of the Fifth Berkeley Symposium on Mathematical Statistics and Probability, Seal, S., Komarina, S., Aluru, S. (2005) An optimal hierarchical clustering algorithm for gene expression data. Information Processing Letters 93(3), Sneath, P.H.A., Sokal, R.R. (1973) Numerical Taxonomy. Freeman, London. Virmajoki, O. (2004) Pairwise Nearest Neighbour Method Revisited. Väitöskirja, Joensuun yliopisto, Joensuu. Ward, J.H. (1963) Hierarchical Grouping to Optimize an Objective Function. Journal of the American Statistical Association 58(301),
6 Wu, X., Zhang, K. (1991) A Better Tree-Structured Vector Quantizer. Proceedings Data Compression Conference, Snowbird, Utah,
Hierarkkinen klusterointi
Hierarkkinen klusterointi Kari Lehmussaari kari.lehmussaari@helsinki.fi Klusterointimenetelmät-seminaari Helsingin yliopisto, tietojenkäsittelytieteen laitos Raportti C-2002-54, s. 76-85, marraskuu 2002
PAIKALLISHAKU KLUSTEROINTIMENETELMÄNÄ
PAIKALLISHAKU KLUSTEROINTIMENETELMÄNÄ Marko Tuononen 13.04.2006 Joensuun yliopisto Tietojenkäsittelytiede Pro gradu -tutkielma Tiivistelmä Klusterointi on menetelmä saada tietoa aineiston rakenteesta.
1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI
1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI Ohjaamattomassa oppimisessa on tavoitteena muodostaa hahmoista ryhmiä, klustereita, joiden sisällä hahmot ovat jossain mielessä samankaltaisia ja joiden välillä
805306A Johdatus monimuuttujamenetelmiin, 5 op
monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos Ryhmittelyn perusperiaate Tästä lähdetään liikkeelle: Tähän pyritään: a b c bc d e f de def bcdef abcdef monimuuttujamenetelmiin,
Luentorunko keskiviikolle Hierarkkinen ryvästäminen
Luentorunko keskiviikolle 3.12.2008 Hierarkkinen ryvästäminen Ryvästyshierarkia & dendrogrammi Hierarkkinen ryvästäminen tuottaa yhden ryvästyksen sijasta sarjan ryvästyksiä Tulos voidaan visualisoida
AIKASARJOJEN RYHMITTELY
AIKASARJOJEN RYHMITTELY Pekka Nykänen 12.6.2008 Joensuun yliopisto Tietojenkäsittelytiede Pro gradu -tutkielma Tiivistelmä Tiedon valtava lisääntyminen edellyttää yhä parempia tiedon analysointikeinoja.
Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 3: Frekvenssiaineistojen asetelmaperusteinen analyysi: Perusteita
Otanta-aineistojen analyysi (78136, 78405) Kevät 2010 TEEMA 3: Frekvenssiaineistojen asetelmaperusteinen analyysi: Perusteita risto.lehtonen@helsinki.fi OHC Survey Tilastollinen analyysi Kysymys: Millä
Luentorunko perjantaille
Luentorunko perjantaille 28.11.28 Eräitä ryvästyksen keskeisiä käsitteitä kustannusfunktio sisäinen vaihtelu edustajavektori etäisyysmitta/funktio Osittamiseen perustuva ryvästys (yleisesti) K:n keskiarvon
Klusterointi hierarkkisilla ja kombinatorisilla menetelmillä - sovelluksena tilastomenetelmien peruskurssiaineisto
Klusterointi hierarkkisilla ja kombinatorisilla menetelmillä - sovelluksena tilastomenetelmien peruskurssiaineisto Teemu Holopainen 23. maaliskuuta 2012 Tilastotieteen pro gradu -tutkielma Jyväskylän yliopisto
Hierarkkinen ryvästäminen
Hierarkkinen ryvästäminen Juho Rousu Laskennallinen Data-Analyysi I, 20.2.2008 Ryvästyshierarkia & dendrogrammi Hierakkiset ryvästysmenetelmien tulos voidaan visualisoida nk. dendrogrammipuuna Puun lehtinä
1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI
1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI 1 1.1 Funktion optimointiin perustuvat klusterointialgoritmit Klusteroinnin onnistumista mittaavan funktion J optimointiin perustuvissa klusterointialgoritmeissä
Tiedonlouhinta rakenteisista dokumenteista (seminaarityö)
Tiedonlouhinta rakenteisista dokumenteista (seminaarityö) Miika Nurminen (minurmin@jyu.fi) Jyväskylän yliopisto Tietotekniikan laitos Kalvot ja seminaarityö verkossa: http://users.jyu.fi/~minurmin/gradusem/
Laskennan vaativuus ja NP-täydelliset ongelmat
Laskennan vaativuus ja NP-täydelliset ongelmat TRAK-vierailuluento 13.4.2010 Petteri Kaski Tietojenkäsittelytieteen laitos Tietojenkäsittelytiede Tietojenkäsittelytiede tutkii 1. mitä tehtäviä voidaan
V. V. Vazirani: Approximation Algorithms, luvut 3-4 Matti Kääriäinen
V. V. Vazirani: Approximation Algorithms, luvut 3-4 Matti Kääriäinen Luento omatoimisen luennan tueksi algoritmiikan tutkimusseminaarissa 23.9.2002. 1 Sisältö Esitellään ongelmat Steiner-puu Kauppamatkustajan
Klusterointiongelma. Luento 6: Klusterointi. Usein suotavia ominaisuuksia. Usein suotavia ominaisuuksia
Luento 6: Klusterointi Klusterointiongelma etäisyys-/erilaisuusfunktiot dimensionaalisuuden kirous (curse of dimensionality) Menetelmien pääluokat 1. Osittavat 2. Hierarkiset 3. Malliperustaiset (tiheysfunktioihin
10. Painotetut graafit
10. Painotetut graafit Esiintyy monesti sovelluksia, joita on kätevä esittää graafeina. Tällaisia ovat esim. tietoverkko tai maantieverkko. Näihin liittyy erinäisiä tekijöitä. Tietoverkkoja käytettäessä
1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI
1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI 1 1.1 Funktion optimointiin perustuvat klusterointialgoritmit Klusteroinnin onnistumista mittaavan funktion J optimointiin perustuvissa klusterointialgoritmeissä
Määrittelydokumentti
Määrittelydokumentti Aineopintojen harjoitustyö: Tietorakenteet ja algoritmit (alkukesä) Sami Korhonen 014021868 sami.korhonen@helsinki. Tietojenkäsittelytieteen laitos Helsingin yliopisto 23. kesäkuuta
jens 1 matti Etäisyydet 1: 1.1 2: 1.4 3: 1.8 4: 2.0 5: 3.0 6: 3.6 7: 4.0 zetor
T-1.81 Luonnollisten kielten tilastollinen käsittely Vastaukset 11, ti 8.4., 1:1-18: Klusterointi, Konekääntäminen. Versio 1. 1. Kuvaan 1 on piirretty klusteroinnit käyttäen annettuja algoritmeja. Sanojen
Algoritmit 1. Luento 10 Ke Timo Männikkö
Algoritmit 1 Luento 10 Ke 14.2.2018 Timo Männikkö Luento 10 Algoritminen ongelmanratkaisu Suunnittelumenetelmät Raaka voima Järjestäminen eli lajittelu Kuplalajittelu Lisäyslajittelu Valintalajittelu Permutaatiot
Scheduling of Genetic Analysis Workflows on Grid Environments (valmiin työn esittely) Arttu Voutilainen
Scheduling of Genetic Analysis Workflows on Grid Environments (valmiin työn esittely) Arttu Voutilainen 20.4.2015 Ohjaaja: FT Lauri Eronen (Biocomputing Platforms Ltd.) Valvoja: Prof. Harri Ehtamo Työn
Introduction to Machine Learning
Introduction to Machine Learning Aki Koivu 27.10.2016 HUMAN HEALT H ENVIRONMENTAL HEALT H 2016 PerkinElmer Miten tietokone oppii ennustamaan tai tekemään päätöksiä? Historia tiivistettynä Machine Learning
Sama mutta density-based (saadaan jakaumat): (tuli aavistuksen eri klusterointi)
1 Teht.1 1.1 1-means, järjestetty data Within cluster sum of squared errors:.95 Clustered Instances 16 ( 13%) 1 33 ( 3%) 3798 ( 33%) 3 3 ( %) 5 ( %) 5 33 ( 9%) 6 37 ( %) 7 783 ( 7%) 8 ( %) 9 167 ( 15%)
Neuroverkkojen soveltaminen vakuutusdatojen luokitteluun
Neuroverkkojen soveltaminen vakuutusdatojen luokitteluun Sami Hokuni 12 Syyskuuta, 2012 1/ 54 Sami Hokuni Neuroverkkojen soveltaminen vakuutusdatojen luokitteluun Turun Yliopisto. Gradu tehty 2012 kevään
A ja B pelaavat sarjan pelejä. Sarjan voittaja on se, joka ensin voittaa n peliä.
Esimerkki otteluvoiton todennäköisyys A ja B pelaavat sarjan pelejä. Sarjan voittaja on se, joka ensin voittaa n peliä. Yksittäisessä pelissä A voittaa todennäköisyydellä p ja B todennäköisyydellä q =
TEEMU ROOS (KALVOT MUOKATTU PATRIK HOYERIN LUENTOMATERIAALISTA)
JOHDATUS TEKOÄLYYN TEEMU ROOS (KALVOT MUOKATTU PATRIK HOYERIN LUENTOMATERIAALISTA) KONEOPPIMISEN LAJIT OHJATTU OPPIMINEN: - ESIMERKIT OVAT PAREJA (X, Y), TAVOITTEENA ON OPPIA ENNUSTAMAAN Y ANNETTUNA X.
isomeerejä yhteensä yhdeksän kappaletta.
Tehtävä 2 : 1 Esitetään aluksi eräitä havaintoja. Jokaisella n Z + symbolilla H (n) merkitään kaikkien niiden verkkojen joukkoa, jotka vastaavat jotakin tehtävänannon ehtojen mukaista alkaanin hiiliketjua
Satunnaisalgoritmit. Topi Paavilainen. Laskennan teorian opintopiiri HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos
Satunnaisalgoritmit Topi Paavilainen Laskennan teorian opintopiiri HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos Helsinki, 23. helmikuuta 2014 1 Johdanto Satunnaisalgoritmit ovat algoritmeja, joiden
10. Painotetut graafit
10. Painotetut graafit Esiintyy monesti sovelluksia, joita on kätevä esittää graafeina. Tällaisia ovat esim. tietoverkko tai maantieverkko. Näihin liittyy erinäisiä tekijöitä. Tietoverkkoja käytettäessä
1. Johdanto Todennäköisyysotanta Yksinkertainen satunnaisotanta Ositettu otanta Systemaattinen otanta...
JHS 160 Paikkatiedon laadunhallinta Liite III: Otanta-asetelmat Sisällysluettelo 1. Johdanto... 2 2. Todennäköisyysotanta... 2 2.1 Yksinkertainen satunnaisotanta... 3 2.2 Ositettu otanta... 3 2.3 Systemaattinen
Simulation model to compare opportunistic maintenance policies
Simulation model to compare opportunistic maintenance policies Noora Torpo 31.08.18 Ohjaaja/Valvoja: Antti Punkka Työn saa tallentaa ja julkistaa Aalto-yliopiston avoimilla verkkosivuilla. Muilta osin
Kielitieteellisten aineistojen käsittely
Kielitieteellisten aineistojen käsittely 1 Johdanto...1 2 Aineistojen kommentointi, metadatan tyypit...1 3 Aineistojen käsittely...2 3.1 Rakenteisten kieliaineistojen kyselykielet...2 3.2 Tiedonlouhinta
Sovellusohjelmointi Matlab-ympäristössä: Vertaisverkon koneiden klusterointi
Sovellusohjelmointi Matlab-ympäristössä: Vertaisverkon koneiden klusterointi 28.4.2013 Annemari Auvinen (annauvi@st.jyu.fi) Anu Niemi (anniemi@st.jyu.fi) 1 Sisällysluettelo 1 JOHDANTO... 2 2 KÄYTETYT MENETELMÄT...
Algoritmi on periaatteellisella tasolla seuraava:
Algoritmi on periaatteellisella tasolla seuraava: Dijkstra(V, E, l, v 0 ): S := { v 0 } D[v 0 ] := 0 for v V S do D[v] := l(v 0, v) end for while S V do valitse v V S jolle D[v] on minimaalinen S := S
Graafin 3-värittyvyyden tutkinta T Graafiteoria, projektityö (eksakti algoritmi), kevät 2005
Graafin 3-värittyvyyden tutkinta T-79.165 Graafiteoria, projektityö (eksakti algoritmi), kevät 2005 Mikko Malinen, 36474R 29. maaliskuuta, 2005 Tiivistelmä Artikkelissa käydään läpi teoriaa, jonka avulla
Tiedonlouhinta ja sen mahdollisuudet
Tiedonlouhinta ja sen mahdollisuudet Henry Joutsijoki Sisältö Johdanto Tiedonlouhinta Koneoppiminen ja tiedonlouhinta Tiedonlouhinnan tulevaisuus Alustusta Nyky-yhteiskunnassamme käsitteet tehokkuus, nopeus,
Algoritmit 2. Luento 8 To Timo Männikkö
Algoritmit 2 Luento 8 To 4.4.2019 Timo Männikkö Luento 8 Algoritmien analysointi Algoritmien suunnittelu Rekursio Osittaminen Rekursioyhtälöt Rekursioyhtälön ratkaiseminen Master-lause Algoritmit 2 Kevät
Trichoderma reesein geenisäätelyverkoston ennustaminen Oskari Vinko
Trichoderma reesein geenisäätelyverkoston ennustaminen Oskari Vinko 04.11.2013 Ohjaaja: Merja Oja Valvoja: Harri Ehtamo Työn saa tallentaa ja julkistaa Aalto-yliopiston avoimilla verkkosivuilla. Muilta
Kaksiluokkainen tapaus, lineaarinen päätöspinta, lineaarisesti erottuvat luokat
1 Tukivektoriluokittelija Tukivektorikoneeseen (support vector machine) perustuva luoikittelija on tilastollisen koneoppimisen teoriaan perustuva lineaarinen luokittelija. Perusajatus on sovittaa kahden
Department of Mathematics, Hypermedia Laboratory Tampere University of Technology. Roolit Verkostoissa: HITS. Idea.
Roolit Tommi Perälä Department of Mathematics, Hypermedia Laboratory Tampere University of Technology 25.3.2011 J. Kleinberg kehitti -algoritmin (Hypertext Induced Topic Search) hakukoneen osaksi. n taustalla
Valitaan alkio x 1 A B ja merkitään A 1 = A { x 1 }. Perinnöllisyyden nojalla A 1 I.
Vaihto-ominaisuudella on seuraava intuition kannalta keskeinen seuraus: Olkoot A I ja B I samankokoisia riippumattomia joukkoja: A = B = m jollain m > 0. Olkoon vielä n = m A B, jolloin A B = B A = n.
DOB valmennus Data-analyysi. Koneoppiminen. CC by
DOB valmennus Data-analyysi Koneoppiminen CC by 4.0 30.08.2017 Datasta oivalluksia ja bisnestä Data-analytiikan menetelmien valmennusmateriaali Luentopäivän sisältö Johdanto Tiedonlouhinta Koneoppiminen
Jäsenyysverkostot Kytkökset ja limittyneet aliryhmät sosiaalisten verkostojen analyysissä
Jäsenyysverkostot Kytkökset ja limittyneet aliryhmät sosiaalisten verkostojen analyysissä Hypermedian jatko-opintoseminaari 2008-2009 20.3.2009 Jaakko Salonen TTY / Hypermedialaboratorio jaakko.salonen@tut.fi
y=-3x+2 y=2x-3 y=3x+2 x = = 6
MAA Koe, Arto Hekkanen ja Jussi Tyni 5.5.015 Loppukoe LASKE ILMAN LASKINTA. 1. Yhdistä kuvaaja ja sen yhtälö a) 3 b) 1 c) 5 d) Suoran yhtälö 1) y=3x ) 3x+y =0 3) x y 3=0 ) y= 3x 3 5) y= 3x 6) 3x y+=0 y=-3x+
Laskennallinen data-analyysi II
Laskennallinen data-analyysi II Ella Bingham, ella.bingham@cs.helsinki.fi Kevät 2008 Muuttujien valinta Kalvot perustuvat Saara Hyvösen kalvoihin 2007 Laskennallinen data-analyysi II, kevät 2008, Helsingin
Esimerkkejä vaativuusluokista
Esimerkkejä vaativuusluokista Seuraaville kalvoille on poimittu joitain esimerkkejä havainnollistamaan algoritmien aikavaativuusluokkia. Esimerkit on valittu melko mielivaltaisesti laitoksella tehtävään
Tiedonlouhinta: Klusterointi ja pienimmän leikkauksen virittävät
hyväksymispäivä arvosana arvostelija Tiedonlouhinta: Klusterointi ja pienimmän leikkauksen virittävät puut Hannu Maksimainen Helsinki 19.4.2009 Seminaari: Tiedonlouhinta HELSINGIN YLIOPISTO Tietojenkäsittelytieteen
Data-analyysi tieteenalana Professori, laitosjohtaja Sasu Tarkoma Tietojenkäsittelytieteen laitos Helsingin yliopisto
Data-analyysi tieteenalana Professori, laitosjohtaja Sasu Tarkoma Tietojenkäsittelytieteen laitos Helsingin yliopisto Faculty of Science Department of Computer Science www.cs.helsinki.fi 9.5.2017 1 Sisällys
OPINTOJAKSOJA KOSKEVAT MUUTOKSET/MATEMATIIKAN JA FYSIIKAN LAITOS/ LUKUVUOSI
OPINTOJAKSOJA KOSKEVAT MUUTOKSET/MATEMATIIKAN JA FYSIIKAN LAITOS/ LUKUVUOSI 2008-2009 Muutokset on hyväksytty teknillisen tiedekunnan tiedekuntaneuvostossa 13.2.2008 ja 19.3.2008. POISTUVAT OPINTOJAKSOT:
Algoritmit 1. Luento 13 Ma Timo Männikkö
Algoritmit 1 Luento 13 Ma 26.2.2018 Timo Männikkö Luento 13 Suunnittelumenetelmät Taulukointi Kapsäkkiongelma Ahne menetelmä Verkon lyhimmät polut Dijkstran menetelmä Verkon lyhin virittävä puu Kruskalin
Mallipohjainen klusterointi
Mallipohjainen klusterointi Marko Salmenkivi Johdatus koneoppimiseen, syksy 2008 Luentorunko perjantaille 5.12.2008 Johdattelua mallipohjaiseen klusterointiin, erityisesti gaussisiin sekoitemalleihin Uskottavuusfunktio
Rekursiolause. Laskennan teorian opintopiiri. Sebastian Björkqvist. 23. helmikuuta Tiivistelmä
Rekursiolause Laskennan teorian opintopiiri Sebastian Björkqvist 23. helmikuuta 2014 Tiivistelmä Työssä käydään läpi itsereplikoituvien ohjelmien toimintaa sekä esitetään ja todistetaan rekursiolause,
Algoritmit 1. Luento 10 Ke 11.2.2015. Timo Männikkö
Algoritmit 1 Luento 10 Ke 11.2.2015 Timo Männikkö Luento 10 Algoritminen ongelman ratkaisu Suunnittelumenetelmät Raaka voima Järjestäminen eli lajittelu Kuplalajittelu Väliinsijoituslajittelu Valintalajittelu
Kaupunkisuunnittelua
Kaupunkisuunnittelua Avainsanat: geometria, monikulmio, pinta-ala, tasogeometria, diagrammit Luokkataso: 6.-9. luokka, lukio Välineet: kynä, paperi, viivoitin, harppi tai kulmaviivain Kuvaus: Voronoi diagrammien
Geneettiset algoritmit
Geneettiset algoritmit Evoluution piirteitä laskennassa Optimoinnin perusteet - Kevät 2002 / 1 Sisältö Geneettisten algoritmien sovelluskenttä Peruskäsitteitä Esimerkkejä funktion ääriarvon etsintä vangin
Joonas Haapala Ohjaaja: DI Heikki Puustinen Valvoja: Prof. Kai Virtanen
Hävittäjälentokoneen reitin suunnittelussa käytettävän dynaamisen ja monitavoitteisen verkko-optimointitehtävän ratkaiseminen A*-algoritmilla (valmiin työn esittely) Joonas Haapala 8.6.2015 Ohjaaja: DI
Probabilistiset mallit (osa 1) Matemaattisen mallinnuksen kurssi Kevät 2002, luento 10, osa 1 Jorma Merikoski Tampereen yliopisto
Probabilistiset mallit (osa 1) Matemaattisen mallinnuksen kurssi Kevät 2002, luento 10, osa 1 Jorma Merikoski Tampereen yliopisto Mikä on probabilistinen malli? Kutsumme probabilistisiksi malleiksi kaikkia
Lentotiedustelutietoon perustuva tykistön tulenkäytön optimointi (valmiin työn esittely)
Lentotiedustelutietoon perustuva tykistön tulenkäytön optimointi (valmiin työn esittely) Tuukka Stewen 1.9.2017 Ohjaaja: DI Juho Roponen Valvoja: prof. Ahti Salo Työn saa tallentaa ja julkistaa Aalto-yliopiston
Bachelor level exams by date in Otaniemi
Bachelor level exams by date in Otaniemi 2015-2016 (VT1 means that the place of the exam will be announced later) YOU FIND INFORMATION ABOUT THE PLACE OF THE EXAM IN OTAKAARI 1 U-WING LOBBY (M DOOR) Day
Königsbergin sillat. Königsberg 1700-luvulla. Leonhard Euler ( )
Königsbergin sillat 1700-luvun Königsbergin (nykyisen Kaliningradin) läpi virtasi joki, jonka ylitti seitsemän siltaa. Sanotaan, että kaupungin asukkaat yrittivät löytää reittiä, joka lähtisi heidän kotoaan,
Bachelor level exams by subject in Otaniemi
Bachelor level exams by subject in Otaniemi 2015-2016 (VT1 means that the place of the exam will be announced later) YOU FIND INFORMATION ABOUT THE PLACE OF THE EXAM IN OTAKAARI 1 U-WING LOBBY (M DOOR)
TKT20001 Tietorakenteet ja algoritmit Erilliskoe , malliratkaisut (Jyrki Kivinen)
TKT0001 Tietorakenteet ja algoritmit Erilliskoe 5.1.01, malliratkaisut (Jyrki Kivinen) 1. [1 pistettä] (a) Esitä algoritmi, joka poistaa kahteen suuntaan linkitetystä järjestämättömästä tunnussolmullisesta
Viimeistely Ajourien huomiointi puutiedoissa ja lopullinen kuviointi. Metsätehon tuloskalvosarja 5/2018 LIITE 4 Timo Melkas Kirsi Riekki Metsäteho Oy
Viimeistely Ajourien huomiointi puutiedoissa ja lopullinen kuviointi Metsätehon tuloskalvosarja 5/2018 LIITE 4 Timo Melkas Kirsi Riekki Metsäteho Oy Viimeistely ajourien huomiointi ja lopullinen kuviointi
Luku 8. Aluekyselyt. 8.1 Summataulukko
Luku 8 Aluekyselyt Aluekysely on tiettyä taulukon väliä koskeva kysely. Tyypillisiä aluekyselyitä ovat, mikä on taulukon välin lukujen summa tai pienin luku välillä. Esimerkiksi seuraavassa taulukossa
C.C. McGeoch, Toward an experimental method for algorithm simulation. algorithm simulation = algoritmin testaus, experimental algorithmics
C.C. McGeoch, Toward an experimental method for algorithm simulation algorithm simulation = algoritmin testaus, experimental algorithmics testiparametrit, esim. tapauksen koko, erilaiset tietorakennevaihtoehdot,
Tietokannan eheysrajoitteet ja niiden määrittäminen SQL-kielellä
hyväksymispäivä arvosana arvostelija Tietokannan eheysrajoitteet ja niiden määrittäminen SQL-kielellä Tuomas Husu Helsinki 20.2.2010 HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos Sisältö i 1 Johdanto
= 5! 2 2!3! = = 10. Edelleen tästä joukosta voidaan valita kolme särmää yhteensä = 10! 3 3!7! = = 120
Tehtävä 1 : 1 Merkitään jatkossa kirjaimella H kaikkien solmujoukon V sellaisten verkkojen kokoelmaa, joissa on tasan kolme särmää. a) Jokainen verkko G H toteuttaa väitteen E(G) [V]. Toisaalta jokainen
Kombinatorinen optimointi
Kombinatorinen optimointi Sallittujen pisteiden lukumäärä on äärellinen Periaatteessa ratkaisu löydetään käymällä läpi kaikki pisteet Käytännössä lukumäärä on niin suuri, että tämä on mahdotonta Usein
58131 Tietorakenteet ja algoritmit (kevät 2014) Uusinta- ja erilliskoe, , vastauksia
58131 Tietorakenteet ja algoritmit (kevät 2014) Uusinta- ja erilliskoe, 10..2014, vastauksia 1. [9 pistettä] (a) Todistetaan 2n 2 + n + 5 = O(n 2 ): Kun n 1 on 2n 2 + n + 5 2n 2 + n 2 +5n 2 = 8n 2. Eli
Yhtenäisyydestä. Johdanto. Lähipisteavaruus. Tuomas Korppi
Solmu 2/2012 1 Yhtenäisyydestä Tuomas Korppi Johdanto Tarkastellaan kuvassa 1 näkyviä verkkoa 1 ja R 2 :n (eli tason) osajoukkoa. Kuvan 2 verkko voidaan jakaa kolmeen osaan niin, että osien välillä ei
TKHJ:ssä on yleensä komento create index, jolla taululle voidaan luoda hakemisto
Indeksin luonti ja hävitys TKHJ:ssä on yleensä komento create index, jolla taululle voidaan luoda hakemisto Komentoa ei ole standardoitu ja niinpä sen muoto vaihtelee järjestelmäkohtaisesti Indeksi voidaan
Bioinformatics in Laboratory of Computer and Information Science
HELSINKI UNIVERSITY OF TECHNOLOGY LABORATORY OF COMPUTER AND INFORMATION SCIENCE Bioinformatics in Laboratory of Computer and Information Science Samuel Kaski Research Two centers of excellence of the
MS-A0003/A0005 Matriisilaskenta Malliratkaisut 5 / vko 48
MS-A3/A5 Matriisilaskenta Malliratkaisut 5 / vko 48 Tehtävä (L): a) Onko 4 3 sitä vastaava ominaisarvo? b) Onko λ = 3 matriisin matriisin 2 2 3 2 3 7 9 4 5 2 4 4 ominaisvektori? Jos on, mikä on ominaisarvo?
Harjoitus 6 ( )
Harjoitus 6 (21.4.2015) Tehtävä 1 Määritelmän (ks. luentomoniste s. 109) mukaan yleisen, muotoa min f(x) s. t. g(x) 0 h(x) = 0 x X olevan optimointitehtävän Lagrangen duaali on missä max θ(u, v) s. t.
Tampereen yliopisto Tietokonegrafiikka 2013 Tietojenkäsittelytiede Harjoitus
Tampereen yliopisto Tietokonegrafiikka 201 Tietojenkäsittelytiede Harjoitus 6 1..201 1. Tarkastellaan Gouraudin sävytysmallia. Olkoon annettuna kolmio ABC, missä A = (0,0,0), B = (2,0,0) ja C = (1,2,0)
58131 Tietorakenteet Erilliskoe , ratkaisuja (Jyrki Kivinen)
58131 Tietorakenteet Erilliskoe 11.11.2008, ratkaisuja (Jyrki Kivinen) 1. (a) Koska halutaan DELETEMAX mahdollisimman nopeaksi, käytetään järjestettyä linkitettyä listaa, jossa suurin alkio on listan kärjessä.
Koheesiiviset alaryhmät
1 Koheesiiviset alaryhmät Hypermedian jatko-opintoseminaari 2008-09 11. luento - 6.3.2009 Joonas Meriläinen TTY / Hypermedialaboratorio http://eclectic.ss.uci.edu/~drwhite/cases/transparencies/clique.gif
Harjoitus 4 (7.4.2014)
Harjoitus 4 (7.4.2014) Tehtävä 1 Tarkastellaan Harjoituksen 1 nopeimman reitin ongelmaa ja etsitään sille lyhin virittävä puu käyttämällä kahta eri algoritmia. a) (Primin algoritmi) Lähtemällä solmusta
805306A Johdatus monimuuttujamenetelmiin, 5 op
monimuuttujamenetelmiin, 5 op syksy 2018 Matemaattisten tieteiden laitos K:n lähimmän naapurin menetelmä (K-Nearest neighbours) Tarkastellaan aluksi pientä (n = 9) kurjenmiekka-aineistoa, joka on seuraava:
ENY-C2001 Termodynamiikka ja lämmönsiirto TERVETULOA!
ENY-C2001 Termodynamiikka ja lämmönsiirto TERVETULOA! Luento 14.9.2015 / T. Paloposki / v. 03 Tämän päivän ohjelma: Aineen tilan kuvaaminen pt-piirroksella ja muilla piirroksilla, faasimuutokset Käsitteitä
monitavoitteisissa päätöspuissa (Valmiin työn esittely) Mio Parmi Ohjaaja: Prof. Kai Virtanen Valvoja: Prof.
Epätäydellisen preferenssiinformaation hyödyntäminen monitavoitteisissa päätöspuissa (Valmiin työn esittely) Mio Parmi 15.1.2018 Ohjaaja: Prof. Kai Virtanen Valvoja: Prof. Kai Virtanen Tausta Päätöspuu
Kaikkiin kysymyksiin vastataan kysymys paperille pyri pitämään vastaukset lyhyinä, voit jatkaa paperien kääntöpuolille tarvittaessa.
NIMI: OPPILASNUMERO: ALLEKIRJOITUS: tehtävä 1 2 3 4 yht pisteet max 25 25 25 25 100 arvosana Kaikkiin kysymyksiin vastataan kysymys paperille pyri pitämään vastaukset lyhyinä, voit jatkaa paperien kääntöpuolille
Algoritmit 2. Luento 11 Ti Timo Männikkö
Algoritmit 2 Luento 11 Ti 24.4.2018 Timo Männikkö Luento 11 Rajoitehaku Kapsäkkiongelma Kauppamatkustajan ongelma Paikallinen etsintä Lyhin virittävä puu Vaihtoalgoritmit Algoritmit 2 Kevät 2018 Luento
Osafaktorikokeet. Heliövaara 1
Osafaktorikokeet Heliövaara 1 Osafaktorikokeet Kun faktorien määrä 2 k -faktorikokeessa kasvaa, tarvittavien havaintojen määrä voi ylittää kokeentekijän resurssit. Myös estimoitavien korkean asteen yhdysvaikutustermien
Tieteen ja tutkimusalan opintoihin hyväksyttävät opintojaksot ovat (taulukossa A= aineopinnot, S=syventävät opinnot, J = jatko-opinnot):
Fotoniikka = jatkoopinnot): Opintojakso Koodi (op) A/S/J 2017 Moderni biolääketieteellinen optiikka 3313005 4 J X Optinen mittaaminen sekä valmistusmenetelmät 3313004 4 J X Korkean teknologian kaupallistaminen
TIES592 Monitavoiteoptimointi ja teollisten prosessien hallinta. Yliassistentti Jussi Hakanen syksy 2010
TIES592 Monitavoiteoptimointi ja teollisten prosessien hallinta Yliassistentti Jussi Hakanen jussi.hakanen@jyu.fi syksy 2010 Evoluutiopohjainen monitavoiteoptimointi MCDM ja EMO Monitavoiteoptimointi kuuluu
Optimoinnin sovellukset
Optimoinnin sovellukset Timo Ranta Tutkijatohtori TTY Porin laitos OPTIMI 4.12.2014 Mitä optimointi on? Parhaan ratkaisun systemaattinen etsintä kaikkien mahdollisten ratkaisujen joukosta Tieteellinen
Jäsenyysverkostot ominaisuudet, toimijoiden ja tapahtumien samanaikainen analyysi. Sisältö ja tavoitteet. Osallistujien ja tapahtumien ominaisuudet
Jäsenyysverkostot, toimijoiden ja tapahtumien samanaikainen anal Hypermedian jatko-opintoseminaari 2008-2009 3.4.2009 Antti Syvänen TaY / antti.syvanen@uta.fi 1 Sisältö ja tavoitteet Esitellään jäsenyysverkostojen,
58131 Tietorakenteet ja algoritmit (syksy 2015) Toinen välikoe, malliratkaisut
Tietorakenteet ja algoritmit (syksy 0) Toinen välikoe, malliratkaisut. (a) Alussa puu näyttää tältä: Lisätään 4: 4 Tasapaino rikkoutuu solmussa. Tehdään kaksoiskierto ensin oikealle solmusta ja sitten
verkkojen G ja H välinen isomorfismi. Nyt kuvaus f on bijektio, joka säilyttää kyseisissä verkoissa esiintyvät särmät, joten pari
Tehtävä 9 : 1 Merkitään kirjaimella G tehtäväpaperin kuvan vasemmanpuoleista verkkoa sekä kirjaimella H tehtäväpaperin kuvan oikeanpuoleista verkkoa. Kuvan perusteella voidaan havaita, että verkko G on
ImageRecognition toteutus
ImageRecognition toteutus Simo Korkolainen 27 kesäkuuta 2016 Projektin tarkoituksena on tehdä ohjelma, joka opettaa neuroverkon tunnistamaan kuvia backpropagation-algoritmin avulla Neuroverkon opetuksessa
v 8 v 9 v 5 C v 3 v 4
Verkot Verkko on (äärellinen) matemaattinen malli, joka koostuu pisteistä ja pisteitä toisiinsa yhdistävistä viivoista. Jokainen viiva yhdistää kaksi pistettä, jotka ovat viivan päätepisteitä. Esimerkiksi
OPINTOJAKSOJA KOSKEVAT MUUTOKSET/MATEMATIIKAn JA FYSIIKAN LAITOS LUKUVUOSI
OPINTOJAKSOJA KOSKEVAT MUUTOKSET/MATEMATIIKAn JA FYSIIKAN LAITOS LUKUVUOSI 007-008 POISTUVAT OPINTOJAKSOT: Ti41010 Matematiikka EnA1 op Ti41010 Matematiikka KeA1 op Ti410170 Matematiikka SäA1 op Ti410140
Kun yhtälöä ei voi ratkaista tarkasti (esim yhtälölle x-sinx = 1 ei ole tarkkaa ratkaisua), voidaan sille etsiä likiarvo.
Kun yhtälöä ei voi ratkaista tarkasti (esim yhtälölle x-sinx = 1 ei ole tarkkaa ratkaisua), voidaan sille etsiä likiarvo. Iterointi on menetelmä, missä jollakin likiarvolla voidaan määrittää jokin toinen,
Algoritmit 2. Luento 6 Ke Timo Männikkö
Algoritmit 2 Luento 6 Ke 29.3.2017 Timo Männikkö Luento 6 B-puun operaatiot B-puun muunnelmia Nelipuu Trie-rakenteet Standarditrie Pakattu trie Algoritmit 2 Kevät 2017 Luento 6 Ke 29.3.2017 2/31 B-puu
pitkittäisaineistoissa
Puuttuvan tiedon ongelma p. 1/18 Puuttuvan tiedon ongelma pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto mtl.uta.fi/tilasto/sekamallit/puupitkit.pdf
Algoritmit 2. Luento 14 Ke Timo Männikkö
Algoritmit 2 Luento 14 Ke 3.5.2017 Timo Männikkö Luento 14 Ositus ja rekursio Rekursion toteutus Kertaus ja tenttivinkit Algoritmit 2 Kevät 2017 Luento 14 Ke 3.5.2017 2/30 Ositus Tehtävän esiintymä ositetaan
Joukot metrisissä avaruuksissa
TAMPEREEN YLIOPISTO Pro gradu -tutkielma Saara Lahtinen Joukot metrisissä avaruuksissa Informaatiotieteiden yksikkö Matematiikka Elokuu 2013 Sisältö 1 Johdanto 1 2 Metriset avaruudet 1 2.1 Tarvittavia
Kuinka paljon dataa on tarpeeksi?
Kuinka paljon dataa on tarpeeksi? Tiekartta hallitun datalammen rakennukseen Mikko Toivonen Manager, Systems Engineering Dell Technologies Finland Tekoälyn (koneoppimisen) kolme pilaria Tekoälyalgoritmit