Assosiaatiosäännöt ja niiden etsintä datasta

Koko: px
Aloita esitys sivulta:

Download "Assosiaatiosäännöt ja niiden etsintä datasta"

Transkriptio

1 Assosiaatiosäännöt ja niiden etsintä datasta Wilhelmiina Hämäläinen 6. helmikuuta Mitä on tiedon louhinta? Tiedonlouhinnan (Data mining) tavoitteena on löytää kiinnostavia hahmoja datasta. hahmo=osittaismalli (kuvaa vain osan datasta) vs. (globaali) malli=kuvaa koko dataa esim. Useimmat opiskelijat, jotka ovat hyviä Tietorakenteissa, ovat hyviä myös Laskennateoriassa. Ei kerro mitään opiskelijoista, jotka huonoja Tietorakenteissa. Juuret tilastotieteessä (erit. Exploratory data analysis) ja koneoppimisessa (Machine learning). Menetelmiä algoritmiikasta ja tietokannoista. Nykyisin alan asiantuntijat puhuvat mieluummin tietämyksen muodostuksesta (Knowledge discovery, KDD), joka on laajempi prosessi: 1. Understanding domain 2. Preprocessing data 3. Discovering patterns 4. Postprocessing results 5. Application (3. askel = varsinainen data mining) 1

2 Data mining vs. Machine learning Klassisia eroja: Data mining Machine learning Oletus: Data ensisijaista, ei sisällä Data on allaolevan mallin välttämättä mitään tuottamaa rakennetta Tavoite: Löytää kaikki kiinnostavat Oppia yksi malli, jolla voidaan hahmot, jotka kuvaavat dataa ennustaa tulevaisuuden tapahtumia Mallit: Yksinkertaisia malleja tai Melko monimutkaisia, globaaleja paikallisia hahmoja malleja Korostus: Koko KDD prosessi Vain oppimisaskel Datan alkuperä: Usein jonkun toisen projektin Valittu kyseistä tehtävää sivutuotteena varten (opetusjoukko) Datan määrä: Valtavan suuria, jopa miljoonia Vain satoja tai tuhansia rivejä. rivejä Nykyisin raja hämärtynyt! Käyttävät samoja mallinnusparadigmoja, mutta eri tavoite: DM: datan kuvaus, uuden informaation löytyminen ML: globaalin mallin oppiminen ennustustarkoituksiin Ennemmin kannattaisi puhua deskriptiivisestä ja prediktiivisestä mallinnuksesta! 2

3 2 Notaatiot A Attribuutin eli muuttujan nimi Dom(A) Attribuutin arvoalue. Esim. Dom(A 1 ) = {0, 1}. A i = a i Attribuutin arvo R = {A 1,..., A k } Relaatioskeema kertoo attribuuttien nimet. Näihin liittyvät arvoalueet Dom(A 1 ),..., Dom(A k ). t = [t(a 1 ), t(a 2 ),..., t(a k )] Monikko eli rivi, joka kiinnittää attribuuttien arvot. t(a i ) = a i Attribuutin A i arvo monikossa t. r = {t 1,..., t n } Relaatio, joukko rivejä skeeman R mukaan. r Dom(A 1 )... Dom(A k ). r = n Relaation koko, sen rivien lukumäärä. m(a i = a i ) Rivien lukumäärä, joilla A i = a i. Ts. (A i = a i ):n absoluuttinen frekvenssi. P (A i = a i ) = m(a i=a i ) (A n i = a i ):n suhteellinen frekvenssi relaatiossa, sen estimoitu todennäköisyys. Huom! Assosiaatiosäännöissä tarkastelemme usein attribuuttijoukkoa X R, X = {A i1, A i2,...a il }, l k. A i1 = a i1,..., A il = a vastaa loogista konjunktiolauseketta, jossa kukin A ij = a ij on propositio (pilkku vastaa konjunktiota ). Nyt m(a i1 = a i1,..., A il = a il ) = {t r t(a i1 ) = a i1... t(a il ) = a il }. Huom.2: Jos kaikki attribuutit ovat binaarisia ts. Dom(A i ) = {0, 1} i = 1,..., k, voimme käyttää loogisia merkintöjä A (A = 1) ja A (A = 0). 3 Assosiaatiosäännöt Muotoa Asiakkaat, jotka ostavat olutta ja makkaraa, ostavat yleensä myös sinappia olevia osittaisriippuvuuksia. Alkujaan [AIS93], hyvä esitys [Toi96] Määritelmä 1 (Assosiaatiosääntö) Olkoon R joukko kategorisia muuttujia ja r R:n mukainen relaatio. Olkoon X = {X 1,..., X l } R ja Y R, Y / X. Merkitään arvokombinaatiota (X 1 = x 1 ),..., (X l = x l ), x i Dom(X i ), X = x:llä. Tällöin säännön (X = x) (Y = y) kondenssi on cf(x = x Y = y) = P (X = x, Y = y) P (X = x) 3 = P (Y = y X = x)

4 ja sen frekvenssi on fr(x = x Y = y) = P (X = x, Y = y). Annettuna raja-arvot min cf, min fr [0, 1], sääntö (X = x) (Y = y) on assosiaatiosääntö r:ssä, jos (i) cf(x = x Y = y) min cf, ja (ii) fr(x = x Y = y) min fr. Ehto (i) edellyttää, että sääntö on tarpeeksi vahva ja ehto (ii), että se on tarpeeksi yleinen. Huom! Kun kaikki attribuutit ovat binäärisiä eikä olla kiinnostuneita attribuuttien negaatioita, merkitään sääntöä (X 1 = 1, X 2 = 1,..., X l = 1) Y = 1 usein lyhyesti X 1 X 2... X l Y. Esimerkki 1 Olkoon TKTL:n kurssisuoritustietokannassa 1000 opiskelijaa. Löydämme assosiaatiosäännön 90% opiskelijoista, jotka ovat suorittaneet Tiedonlouhinta-kurssin, on suorittanut myös Opetusteknologia-kurssin. Säännön kondenssi on siis Jos vain 10 oppilasta 1000:sta on suorittanut Tiedonlouhinta-kurssin, on 9 suorittanut Opetusteknologia-kurssin ja sääntö hyvin harvinainen (frekvenssillä 9/1000 = 0.009). Jos sen sijaan 600 oppilasta on suorittanut Tiedonlouhintakurssin, on 540 oppilasta suorittanut myös Opetusteknologia-kurssin, mikä on jo merkittävä havainto (frekvenssillä 540/1000 = 0.54). Täytyy siis huomioida sekä säännön yleisyys (frekvenssi) että voimakkuus (kondenssi)! Huom.2! Tietokantojen yhteydessä puhutaan usein funktionaalisista riippuvuuksista, joita merkitään samaan tapaan X Y. Funktionaalinen riippuvuus merkitsee kuitenkin eri asiaa: X Y on funktionaalinen riippuvuus relaatiossa r jos ja vain jos t 1 [Y ] = t 2 [Y ] kaikilla t 1, t 2 r, joilla t 1 [X] = t 2 [X]. Riippuvuus pätee kaikkien X:n ja Y :n arvojen välillä. Riippuvuutta vastaa siis joukko assosiaatiosääntöjä! (Jos X = 1, Y = 1 ja X ja Y binäärisiä, niin kaksi sääntöä: X = 0 Y = y 1 ja X = 1 Y = y 2, missä y 1, y 2 {0, 1}.) Kunkin säännön kondenssi on aina cf = 1, mutta frekvenssistä ei olla kiinnostuneita. 4

5 4 Sovelluksia 4.1 Ostoskoridatan analyysi Assosiaatiosääntöjen tunnetuin sovellus on asiakkaiden ostotottumusten analysointi ostoskoridatasta. Tulosten perusteella kauppias voi esim. päättää, miten tuotteet kannattaa sijoitella kaupassa. Ostoskoridatan attribuutit A 1,..., A k ovat tuotenimiä. Koska tuotteita on valtavasti, voi k olla useita tuhansia. Kukin A i on binaarinen: tuote joko esiintyy ostoskorissa tai ei esiinny. Relaation rivit vastaavat ostoskoreja (kokoelma tuotteita, jotka on maksettu kassalla). Data on hyvin harvaa! Usein alle 5% ostoskorin attribuuteista on 1-arvoisia. Tavallisesti tutkitaan vain korissa esiintyviä tuotteita, ei niistä puuttuvia (joita on valtavasti!) Samaan tapaan voi analysoida esim. opintosuoritusrekisteristä kurssien välisisä osittaisriippuvuuksia ( suositukset, missä järjestyksessä suorittaa kursseja) tai etsiä tekstistä yhdessä esiintyviä sanoja (kukin lause vastaa riviä ja sana attribuuttia). Huom! Omissa kokeiluissasi voit käyttää esim. weka-ohjelmaa [Wek]. 4.2 Assosiaatiosäännöt luokittelun apuna Luokittelusääntö on assosiaatiosääntö X = x C = c, missä C on luokkamuuttuja. Esimerkki 2 Mushroom-datajoukossa [NHBM98] jokainen sieni on luokiteltu joko syötäväksi (edible) tai myrkylliseksi (poisonous). Muut attribuutit kuvaavat mm. sienen hatun muotoa, pintaa ja väriä, varren muotoa, renkaiden lukumäärää jne. Joukosta löytyvät mm. seuraavat luokittelusäännöt: Odor=none,Gill-size=broad,Stalk-shape=tapering Edible f r = 0.31, cf = 1.00 Odor=none,Gill-size=broad,Stalk-surface-above-ring=smooth Edible f r = 0.33, cf =

6 Bruises=false,Population=several Poisonous f r = 0.31, cf = 0.92 Luokittelussa käytettävä päätöspuu (decision tree on vanhempi keksintö (ks. esim. [Mit97][52-80], [HMS02][ ]), mutta voidaan kuvata joukkona assosiaatiosääntöjä. Esimerkki 3 Ohjelmointi1-kurssin harjoitustehtävät on jaettu kolmeen ryhmään: A=Ohjelmoinnin perusrakenteet B=Silmukat ja taulukot C=Appletit Kussakin ryhmässä opiskelija on saanut joko vähän (little) tai paljon (lot) pisteitä. Näiden perusteella on pyritty ennustamaan kurssin lopputulokset F R1 {0, 1} ts. läpäiseekö opiskelija kurssin. B lot little FR1=1 little A lot FR1=0 little C lot FR1=0 FR1=1 Rule Freq. Conf. B = lot F R1 = 1 73/125= B = little A = little F R1 = 0 12/125= B = little A = lot C = little F R1 = 0 18/125= B = little A = lot C = lot F R1 = 1 2/125= Huom! Päätöspuu on globaali malli! Ei voida aettaa minimifrekvenssiä, sillä katettava kaikki mahdolliset tapaukset. 6

7 Päätöspuun oppimiseen omat algoritmit (esim. C4.5 [Qui93]). Varoitus: Päätöspuut tuottavat epäluotettavia tuloksia, ellei mallia ole opittu tarpeeksi suuresta datajoukosta (useita tuhansia rivejä, riippuen attribuuttien lkm:stä ja arvoalueiden koosta). Monia päätöspuun hyvyysmittoja sovellettu assosiaatiosääntöjen kiinnostavuuden arviointiin. Huom! Assosiaatiosääntöjä voi käyttää apuna myös Bayes-verkon rakenteen määrittelyssä tai niiden avulla voi suorittaa suoraan luokittelua (huomioiden myös frekvenssit) [LHM98]. 4.3 Kokonaistodennäköisyysjakauman johtaminen Säännöllisistä joukoista voi johtaa datan kokonaistodennäköisyysjakauman. Idea [PMS00]: 1. säännölliset joukot muodostavat joukon eheysehtoja 2. käydään läpi kaikki yhteensopivat kokonaistodennäköisyysjakaumat ja valitaan se, jolla maksimientropia Raskas algoritmi! Toimii vain, kun attribuuttien lukumäärä suhteellisen pieni. 5 Assosiaatiosääntöjen etsintä Tavallisesti assosiaatiosäännöt etsitään kahdessa vaiheessa 1 : 1. Etsitään kaikki säännölliset joukot (frequent sets) X = x, X R, joilla fr(x = x) min fr. 2. Käydään läpi kaikki säännölliset joukot X = x ja testataan kaikilla (X i = x i ) ( X i X, x i Dom(X i )), onko cf((x 1 = x 1 ),..., (X i 1 = x i 1 ), (X i+1 = x i+1 ),..., (X l = x l ) (X i = x i )) min cf. 1Muistutus: attribuuttien arvokombinaatiota X 1 = x 1,..., X l = x l merkittiin X = x:lla 7

8 5.1 Apriori-algoritmi Säännölliset joukot voidaan löytää klassisella Apriori-algoritmilla (ks. tarkemmin esim. [Toi96]). kehitetty alkujaan ostoskoridatalle oletus: binääridataa, eikä attribuuttien negaatioista olla kiinnostuneita. tehokas kun hyvin harvaa dataa, mutta ei toimi tiheällä datalla Idea: etsitään ensin säännölliset yhden attribuutin joukot, sitten näiden pohjalta kaikki säännölliset kahden attribuutin joukot, jne. Haussa hyödynnetään frekvenssin monotonisuutta! Jos joukko X on frekventti, myös kaikki Y X ovat frekventtejä. Jos jokin Y X ei ole frekventti, ei X voi olla frekventti. A B C D AB AC AD BC CD BD ABC ABD ACD BCD ABCD 5.2 Laskennallinen vaativuus Laskenta on hyvin raskasta, jos tutkimme myös negaatiot tai jos attribuutit ovat moniarvoisia! 8

9 Jos kaikilla attribuuteilla X i R, i = 1,..., k, on v arvoa, niin pahimmillaan voi olla (1 + v) k frekventtiä arvokombinaatiota (frekventtiä joukkoa). Jos v = 2 ja emme ole kiinnostuneita negaatioista, on säännöllisiä joukkoja maksimissaan 2 k = 2 8 = 256. Esimerkkejä säännöllisten joukkojen maksimilukumääristä: k v Rajoitus S-joukkojen lkm 8 2 Ei negaatioita 2 8 = = = Ei negaatioita = > Assosiaatiosääntöjen muodostus säännöllisistä joukoista paljon kevyempää: Säännöllisestä joukosta X, X = l voi muodostaa maksimissaan l erilaista assosiaatiosääntöä. 5.3 Laajennokset Apriorista erilaisia variaatioita, jotka esim. hyödyntävät erilaisia tietorakenteita välitulosten tehokkaaseen talletukseen. Käytännössä ei isoja eroja! Apriori-algoritmi soveltuu sellaisenaan myös negaatioita sisältävien joukkojen sekä moniarvoisista attribuuteista koostuvien joukkojen etsintään. Rajoitus: laskennallinen raskaus! Numeerinen data on ensin diskretoitava jollain tavalla ks. esim. [RS01, SA96] Disjunktioita sisältävät säännöt esim. Henkilö, joka ostaa olutta tai siideriä, ostaa yleensä myös tupakkaa tai Lääke A aiheuttaa tavallisesti pahoinvointia tai huimausta kiinnostavia mutta vaikeita etsiä! (ks. esim. [NCJK01]) Ongelma: frekvenssin monotonisuusominaisuus ei päde disjunktioille! Joukko A B on aina frekventti, jos A tai B on frekventti. Ei-frekventin joukon lisäys saattaa kuitenkin kasvattaa kondenssia ja tuottaa kiinnostavia sääntöjä. 9

10 Esim. Laske sääntöjen A C, B C ja (A B) C frekvenssit ja kondenssit annetusta relaatiosta! Rivien lukumäärä on n = 100. X m(x) A, B, C 10 A, B, C 0 A, B, C 10 A, B, C 0 A, B, C 10 A, B, C 20 A, B, C 40 A, B, C 10 6 Kiinnostavien sääntöjen valinta Apriorin ongelma: kaikilla säännöllisillä joukoilla sama minimifrekvenssi riippumatta attribuuttien lukumäärästä. Jos min fr liian pieni, löytyy valtavasti triviaaleja sääntöjä. Jos min fr suuri, ei löydetä spesifejä sääntöjä, vaikka olisivat tilastollisesti merkittäviä. Kuinka valita kiinnostavat tai tilastollisesti merkittävät säännöt?? Kiinnostavuus on subjektiivinen ominaisuus! Useita heuristisia mittoja kiinnostavien sääntöjen valitsemiseen. Mitat perustuvat yleensä säännön frekvenssiin ja kondenssiin (valitsevat assosiaatiosäännöt, joilla suuri frekvenssi ja poikkeuksellisen suuri/pieni kondenssi). (ks. esim. [RBA99]) Tilastollisten merkittävyystestien ongelma: DM:ssa testataan systemaattisesti kaikki mahdolliset säännöt. Jos merkittävyystaso esim ja testataan 1000 sääntöä, niin löydetään keskimäärin 10 virheellisesti merkittävää sääntöä. 6.1 Informaatioteoreettiset mitat Mutual information (ks. esim. [DHS00][632]) I(X, Y ) mittaa, kuinka paljon informaatiota muuttujat X ja Y jakavat. Jos X ja Y ovat riippumattomia, ei X sisällä lainkaan informaatiota Y :stä ja päinvastoin, ja I(X, Y ) = 0. 10

11 Jos X ja Y ovat identtiset, ne jakavat kaiken informaation. Määritelmä 2 (Mutual information) Olkoon R joukko attribuutteja ja X R ja Y R kategorisia muuttujia. X:n ja Y :n mutual information on I(X, Y ) = Σ x Σ y P (X = x, Y = y) log P (X = x, Y = y) P (X = x)p (Y = y). Huom! Saman voi ilmaista ekvivalentisti entropian avulla: missä H(Z) on Z:n entropia: H(Z) = z Dom(Z) I(X, Y ) = H(X) + H(Y ) H(X, Y ), P (Z = z) log P (Z = z) = z Dom(Z) P (Z = z) log Jos X ja Y jakavat kaiken informaation, on I(X, Y ) = H(X) = H(Y ). 1 P (Z = z). Säännön X Y J-mitta [SG92] on sääntöjen X Y and X Y informaatiosisältöjen summa. (Muistutus: P ( Y X) = 1 P (Y X)) [ P (Y X) J(X Y ) = P (X) P (Y X) log + P ( Y ) log P (Y ) = fr(x Y ) log cf(x Y ) fr(y ) + fr(x Y ) log ] P ( Y X) = P ( Y ) cf(x Y ) fr( Y ) Huomioi sekä säännön että sen komplementtisäännön frekvenssin että kondenssin! Alkujaan luokittelusäännöille toimiiko yhtä hyvin assosiaatiosäännöillä? 6.2 χ 2 -mitta Assosiaatiosäännöt voidaan pistää kiinnostavuusjärjestykseen niiden χ 2 -arvojen perusteella [BMS97]. Säännön X Y χ 2 -arvo on χ 2 = 1 1 (m(x = i, Y = j) m(x = i)m(y = j)/n) 2 i=0 j=0 m(x = i)m(y = j)/n 11

12 Rajoitus: frekvenssien oletusarvojen tulee olla riittävän suuria, jotta esioletukset täyttyisivät. Esim. ostoskoridata liian harvaa! Ongelma: Mittaa X:n ja Y :n välistä riippuvuutta, mutta assosiaatiosäännöt ovat osittaisriippuvuuksia. Ei välttämättä havaita kiinnostavaa sääntöä, jos pätee vain tiettyjen arvojen välillä? Ehdotus: huomioidaan vain sääntöä vastaava termi Viitteet (m(x,y ) m(x)m(y )/n)2 m(x)m(y )/n. [AIS93] R. Agrawal, T. Imielinski, and A.N. Swami. Mining association rules between sets of items in large databases. In P. Buneman and S. Jajodia, editors, Proceedings of the 1993 ACM SIGMOD International Conference on Management of Data, pages , Washington, D.C., [BMS97] S. Brin, R. Motwani, and C. Silverstein. Beyond market baskets: Generalizing association rules to correlations. In J. Peckham, editor, Proceedings ACM SIGMOD International Conference on Management of Data, pages ACM Press, [DHS00] R.O. Duda, P.E. Hart, and D.G. Stork. Pattern Classication. Wiley-Interscience Publication, New Yor, 2nd edition, [HMS02] D. Hand, H. Mannila, and P. Smyth. Principles of Data Mining. MIT Press, Cambridge, Massachussetts, USA, [LHM98] B. Liu, W. Hsu, and Y. Ma. Integrating classication and association rule mining. In Proceedings of Fourth International Conference on Knowledge Discovery and Data Mining (KDD- 98), pages AAAI Press, [Mit97] T.M. Mitchell. Machine Learning. McGraw-Hill Companies, New York, NY, USA, [NCJK01] A.A. Nanavati, K.P. Chitrapura, S. Joshi, and R. Krishnapuram. Mining generalised disjunctive association rules. In Proceedings of the tenth International Conference on Information and Knowledge Management (CIKM'01), pages , New York, NY, USA, ACM Press. [NHBM98] D.J. Newman, S. Hettich, C.L. Blake, and C.J. Merz. UCI repository of machine learning databases, uci.edu/~mlearn/mlrepository.html. 12

13 [PMS00] [Qui93] [RBA99] [RS01] [SA96] [SG92] [Toi96] [Wek] D. Pavlov, H. Mannila, and P. Smyth. Probabilistic models for query approximation with large sparse binary data sets. In Proceedings of the 16th Conference on Uncertainty in Articial Intelligence (UAI'00), pages , San Francisco, CA, USA, Morgan Kaufmann Publishers Inc. J.R. Quinlan. C4.5: programs for machine learning. Morgan Kaufmann, Jr. R.J. Bayardo and R. Agrawal. Mining the most interesting rules. In Proceedings of the fth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD'99), pages , New York, NY, USA, ACM Press. R. Rastogi and K. Shim. Mining optimized support rules for numeric attributes. Information Systems, 26(6):425444, R. Srikant and R. Agrawal. Mining quantitative association rules in large relational tables. In H.V. Jagadish and I.S. Mumick, editors, Proceedings of the 1996 ACM SIGMOD International Conference on Management of Data, pages 112, Montreal, Quebec, Canada, P. Smyth and R.M. Goodman. An information theoretic approach to rule induction from databases. IEEE Transactions on Knowledge and Data Engineering, 4(4):301316, H. Toivonen. Discovery of Frequent Patterns in Large Data Collections. PhD thesis, Department of Computer Science, University of Helsinki, Weka3. Data mining software in java. ac.nz/ml/weka/. Retrieved

arvostelija Assosiaatiosäännöt sekvensseissä Jarmo Hakala Vantaa 20.10.2005 HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos

arvostelija Assosiaatiosäännöt sekvensseissä Jarmo Hakala Vantaa 20.10.2005 HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos hyväksymispäivä arvosana arvostelija Assosiaatiosäännöt sekvensseissä Jarmo Hakala Vantaa 20.10.2005 HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos Tiivistelmä Assosiaatiosäännöt sekvensseissä on

Lisätiedot

Esimerkkejä vaativuusluokista

Esimerkkejä vaativuusluokista Esimerkkejä vaativuusluokista Seuraaville kalvoille on poimittu joitain esimerkkejä havainnollistamaan algoritmien aikavaativuusluokkia. Esimerkit on valittu melko mielivaltaisesti laitoksella tehtävään

Lisätiedot

Tietokannan eheysrajoitteet ja niiden määrittäminen SQL-kielellä

Tietokannan eheysrajoitteet ja niiden määrittäminen SQL-kielellä hyväksymispäivä arvosana arvostelija Tietokannan eheysrajoitteet ja niiden määrittäminen SQL-kielellä Tuomas Husu Helsinki 20.2.2010 HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos Sisältö i 1 Johdanto

Lisätiedot

Tiedonlouhinta (kl 2013) Kurssin kuvaus. Esitiedot. Kurssin arvostelu

Tiedonlouhinta (kl 2013) Kurssin kuvaus. Esitiedot. Kurssin arvostelu Tiedonlouhinta (kl 2013) Kurssin kuvaus 00 11 00 11 00 11 01 01 01 01 11000 111 11000 111 00 11 joko kandidaatti- tai maisteritason valinnainen kurssi Toteutus pääasiassa ongelmalähtöisesti (tiedonlouhintaprosessin

Lisätiedot

2 k -faktorikokeet. Vilkkumaa / Kuusinen 1

2 k -faktorikokeet. Vilkkumaa / Kuusinen 1 2 k -faktorikokeet Vilkkumaa / Kuusinen 1 Motivointi 2 k -faktorikoe on k-suuntaisen varianssianalyysin erikoistapaus, jossa kaikilla tekijöillä on vain kaksi tasoa, matala (-) ja korkea (+). 2 k -faktorikoetta

Lisätiedot

Kirjoita jokaiseen erilliseen vastauspaperiin kurssin nimi, tenttipäivä, oma nimesi (selkeästi), opiskelijanumerosi ja nimikirjoituksesi

Kirjoita jokaiseen erilliseen vastauspaperiin kurssin nimi, tenttipäivä, oma nimesi (selkeästi), opiskelijanumerosi ja nimikirjoituksesi Helsingin yliopisto, Tietojenkäsittelytieteen laitos Tietokantojen perusteet, kurssikoe 29.2.2012 (vastauksia) Liitteenä on tiivistelmä SQL-syntaksista Kirjoita jokaiseen erilliseen vastauspaperiin kurssin

Lisätiedot

(1) refleksiivinen, (2) symmetrinen ja (3) transitiivinen.

(1) refleksiivinen, (2) symmetrinen ja (3) transitiivinen. Matematiikassa ja muuallakin joudutaan usein tekemisiin sellaisten relaatioiden kanssa, joiden lakina on tietyn ominaisuuden samuus. Tietyn ominaisuuden samuus -relaatio on ekvivalenssi; se on (1) refleksiivinen,

Lisätiedot

Matematiikassa ja muuallakin joudutaan usein tekemisiin sellaisten relaatioiden kanssa, joiden lakina on tietyn ominaisuuden samuus.

Matematiikassa ja muuallakin joudutaan usein tekemisiin sellaisten relaatioiden kanssa, joiden lakina on tietyn ominaisuuden samuus. Matematiikassa ja muuallakin joudutaan usein tekemisiin sellaisten relaatioiden kanssa, joiden lakina on tietyn ominaisuuden samuus. Matematiikassa ja muuallakin joudutaan usein tekemisiin sellaisten relaatioiden

Lisätiedot

Kielitieteellisten aineistojen käsittely

Kielitieteellisten aineistojen käsittely Kielitieteellisten aineistojen käsittely 1 Johdanto...1 2 Aineistojen kommentointi, metadatan tyypit...1 3 Aineistojen käsittely...2 3.1 Rakenteisten kieliaineistojen kyselykielet...2 3.2 Tiedonlouhinta

Lisätiedot

Tehostettu kisällioppiminen tietojenkäsittelytieteen ja matematiikan opetuksessa yliopistossa Thomas Vikberg

Tehostettu kisällioppiminen tietojenkäsittelytieteen ja matematiikan opetuksessa yliopistossa Thomas Vikberg Tehostettu kisällioppiminen tietojenkäsittelytieteen ja matematiikan opetuksessa yliopistossa Thomas Vikberg Matematiikan ja tilastotieteen laitos Tietojenkäsittelytieteen laitos Kisällioppiminen = oppipoikamestari

Lisätiedot

E. Oja ja H. Mannila Datasta Tietoon: Luku 2

E. Oja ja H. Mannila Datasta Tietoon: Luku 2 2. DATASTA TIETOON: MITÄ DATAA; MITÄ TIETOA? 2.1. Data-analyysin ongelma Tulevien vuosien valtava haaste on digitaalisessa muodossa talletetun datan kasvava määrä Arvioita: Yhdysvaltojen kongressin kirjasto

Lisätiedot

Relevanttien sivujen etsintä verkosta: satunnaiskulut verkossa Linkkikeskukset ja auktoriteetit (hubs and authorities) -algoritmi

Relevanttien sivujen etsintä verkosta: satunnaiskulut verkossa Linkkikeskukset ja auktoriteetit (hubs and authorities) -algoritmi Kurssin loppuosa Diskreettejä menetelmiä laajojen 0-1 datajoukkojen analyysiin Kattavat joukot ja niiden etsintä tasoittaisella algoritmilla Relevanttien sivujen etsintä verkosta: satunnaiskulut verkossa

Lisätiedot

MS-A0402 Diskreetin matematiikan perusteet

MS-A0402 Diskreetin matematiikan perusteet MS-A040 Diskreetin matematiikan perusteet Osa : Relaatiot ja funktiot Riikka Kangaslampi 017 Matematiikan ja systeemianalyysin laitos Aalto-yliopisto Relaatiot Relaatio Määritelmä 1 Relaatio joukosta A

Lisätiedot

Salausmenetelmät LUKUTEORIAA JA ALGORITMEJA. Veikko Keränen, Jouko Teeriaho (RAMK, 2006) 3. Kongruenssit. à 3.4 Kongruenssien laskusääntöjä

Salausmenetelmät LUKUTEORIAA JA ALGORITMEJA. Veikko Keränen, Jouko Teeriaho (RAMK, 2006) 3. Kongruenssit. à 3.4 Kongruenssien laskusääntöjä Salausmenetelmät Veikko Keränen, Jouko Teeriaho (RAMK, 2006) LUKUTEORIAA JA ALGORITMEJA 3. Kongruenssit à 3.4 Kongruenssien laskusääntöjä Seuraavassa lauseessa saamme kongruensseille mukavia laskusääntöjä.

Lisätiedot

TEEMU ROOS (KALVOT MUOKATTU PATRIK HOYERIN LUENTOMATERIAALISTA)

TEEMU ROOS (KALVOT MUOKATTU PATRIK HOYERIN LUENTOMATERIAALISTA) JOHDATUS TEKOÄLYYN TEEMU ROOS (KALVOT MUOKATTU PATRIK HOYERIN LUENTOMATERIAALISTA) KONEOPPIMISEN LAJIT OHJATTU OPPIMINEN: - ESIMERKIT OVAT PAREJA (X, Y), TAVOITTEENA ON OPPIA ENNUSTAMAAN Y ANNETTUNA X.

Lisätiedot

Ortogonaalinen ja ortonormaali kanta

Ortogonaalinen ja ortonormaali kanta Ortogonaalinen ja ortonormaali kanta Määritelmä Kantaa ( w 1,..., w k ) kutsutaan ortogonaaliseksi, jos sen vektorit ovat kohtisuorassa toisiaan vastaan eli w i w j = 0 kaikilla i, j {1, 2,..., k}, missä

Lisätiedot

-Matematiikka on aksiomaattinen järjestelmä. -uusi tieto voidaan perustella edellisten tietojen avulla, tätä kutsutaan todistamiseksi

-Matematiikka on aksiomaattinen järjestelmä. -uusi tieto voidaan perustella edellisten tietojen avulla, tätä kutsutaan todistamiseksi -Matematiikka on aksiomaattinen järjestelmä -uusi tieto voidaan perustella edellisten tietojen avulla, tätä kutsutaan todistamiseksi -mustavalkoinen: asia joko on tai ei (vrt. humanistiset tieteet, ei

Lisätiedot

Matriisien tulo. Matriisit ja lineaarinen yhtälöryhmä

Matriisien tulo. Matriisit ja lineaarinen yhtälöryhmä Matriisien tulo Lause Olkoot A, B ja C matriiseja ja R Tällöin (a) A(B + C) =AB + AC, (b) (A + B)C = AC + BC, (c) A(BC) =(AB)C, (d) ( A)B = A( B) = (AB), aina, kun kyseiset laskutoimitukset on määritelty

Lisätiedot

Reaalilukuvälit, leikkaus ja unioni (1/2)

Reaalilukuvälit, leikkaus ja unioni (1/2) Luvut Luonnolliset luvut N = {0, 1, 2, 3,... } Kokonaisluvut Z = {..., 2, 1, 0, 1, 2,... } Rationaaliluvut (jaksolliset desimaaliluvut) Q = {m/n m, n Z, n 0} Irrationaaliluvut eli jaksottomat desimaaliluvut

Lisätiedot

811120P Diskreetit rakenteet

811120P Diskreetit rakenteet 811120P Diskreetit rakenteet 2016-2017 4. Joukot, relaatiot ja funktiot Osa 2: Relaatiot 4.2 Relaatiot Relaatioilla mallinnetaan joukkojen alkioiden välisiä suhteita Joukkojen S ja T välinen binaarirelaatio

Lisätiedot

Johnson, A Theoretician's Guide to the Experimental Analysis of Algorithms.

Johnson, A Theoretician's Guide to the Experimental Analysis of Algorithms. Kokeellinen algoritmiikka (3 ov) syventäviä opintoja edeltävät opinnot: ainakin Tietorakenteet hyödyllisiä opintoja: ASA, Algoritmiohjelmointi suoritus harjoitustyöllä (ei tenttiä) Kirjallisuutta: Johnson,

Lisätiedot

Tiedonlouhinta rakenteisista dokumenteista (seminaarityö)

Tiedonlouhinta rakenteisista dokumenteista (seminaarityö) Tiedonlouhinta rakenteisista dokumenteista (seminaarityö) Miika Nurminen (minurmin@jyu.fi) Jyväskylän yliopisto Tietotekniikan laitos Kalvot ja seminaarityö verkossa: http://users.jyu.fi/~minurmin/gradusem/

Lisätiedot

Hilbertin aksioomat ja tarvittavat määritelmät Tiivistelmä Geometria-luentomonisteesta Heikki Pitkänen

Hilbertin aksioomat ja tarvittavat määritelmät Tiivistelmä Geometria-luentomonisteesta Heikki Pitkänen Hilbertin aksioomat ja tarvittavat määritelmät Tiivistelmä Geometria-luentomonisteesta Heikki Pitkänen 1. Hilbertin aksioomat 1-3 Oletetaan tunnetuiksi peruskäsitteet: piste, suora ja suora kulkee pisteen

Lisätiedot

Ryhmäfaktorianalyysi neurotiedesovelluksissa (Valmiin työn esittely) Sami Remes Ohjaaja: TkT Arto Klami Valvoja: Prof.

Ryhmäfaktorianalyysi neurotiedesovelluksissa (Valmiin työn esittely) Sami Remes Ohjaaja: TkT Arto Klami Valvoja: Prof. Ryhmäfaktorianalyysi neurotiedesovelluksissa (Valmiin työn esittely) Sami Remes 11.06.2012 Ohjaaja: TkT Arto Klami Valvoja: Prof. Harri Ehtamo Työn saa tallentaa ja julkistaa Aalto-yliopiston avoimilla

Lisätiedot

T Datasta tietoon, syksy 2005 Laskuharjoitus 8.12., ratkaisuja Jouni Seppänen

T Datasta tietoon, syksy 2005 Laskuharjoitus 8.12., ratkaisuja Jouni Seppänen T-1.1 Datasta tietoo, syksy 5 Laskuharjoitus.1., ratkaisuja Joui Seppäe 1. Simuloidaa tasoittaista algoritmia. Esimmäisessä vaiheessa ehdokkaia ovat kaikki yhde muuttuja joukot {a}, {b}, {c} ja {d}. Aaltosulkeide

Lisätiedot

Kurssikoe on maanantaina Muista ilmoittautua kokeeseen viimeistään 10 päivää ennen koetta! Ilmoittautumisohjeet löytyvät kurssin kotisivuilla.

Kurssikoe on maanantaina Muista ilmoittautua kokeeseen viimeistään 10 päivää ennen koetta! Ilmoittautumisohjeet löytyvät kurssin kotisivuilla. HY / Avoin ylioisto Johdatus yliopistomatematiikkaan, kesä 05 Harjoitus 6 Ratkaisut palautettava viimeistään tiistaina.6.05 klo 6.5. Huom! Luennot ovat salissa CK maanantaista 5.6. lähtien. Kurssikoe on

Lisätiedot

Yhteenlaskun ja skalaarilla kertomisen ominaisuuksia

Yhteenlaskun ja skalaarilla kertomisen ominaisuuksia Yhteenlaskun ja skalaarilla kertomisen ominaisuuksia Voidaan osoittaa, että avaruuden R n vektoreilla voidaan laskea tuttujen laskusääntöjen mukaan. Huom. Lause tarkoittaa väitettä, joka voidaan perustella

Lisätiedot

Jarkko Peltomäki. Aliryhmän sentralisaattori ja normalisaattori

Jarkko Peltomäki. Aliryhmän sentralisaattori ja normalisaattori Jarkko Peltomäki Aliryhmän sentralisaattori ja normalisaattori Matematiikan aine Turun yliopisto Syyskuu 2009 Sisältö 1 Johdanto 2 2 Määritelmiä ja perusominaisuuksia 3 2.1 Aliryhmän sentralisaattori ja

Lisätiedot

Nimitys Symboli Merkitys Negaatio ei Konjuktio ja Disjunktio tai Implikaatio jos..., niin... Ekvivalenssi... jos ja vain jos...

Nimitys Symboli Merkitys Negaatio ei Konjuktio ja Disjunktio tai Implikaatio jos..., niin... Ekvivalenssi... jos ja vain jos... 2 Logiikkaa Tässä luvussa tutustutaan joihinkin logiikan käsitteisiin ja merkintöihin. Lisätietoja ja tarkennuksia löytyy esimerkiksi Jouko Väänäsen kirjasta Logiikka I 2.1 Loogiset konnektiivit Väitelauseen

Lisätiedot

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking)

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking) 7. Lohkominen ja sulautus 2 k kokeissa Lohkominen (Blocking) Lohkotekijät muodostuvat faktoreista, joiden suhteen ei voida tehdä (täydellistä) satunnaistamista. Esimerkiksi faktorikokeessa raaka-aine-erät

Lisätiedot

Matematiikka B2 - Avoin yliopisto

Matematiikka B2 - Avoin yliopisto 6. elokuuta 2012 Opetusjärjestelyt Luennot 9:15-11:30 Harjoitukset 12:30-15:00 Tentti Kurssin sisältö (1/2) Matriisit Laskutoimitukset Lineaariset yhtälöryhmät Gaussin eliminointi Lineaarinen riippumattomuus

Lisätiedot

TAMPEREEN YLIOPISTO Pro gradu -tutkielma. Roosa Niemi. Riippuvuuslogiikkaa

TAMPEREEN YLIOPISTO Pro gradu -tutkielma. Roosa Niemi. Riippuvuuslogiikkaa TAMPEREEN YLIOPISTO Pro gradu -tutkielma Roosa Niemi Riippuvuuslogiikkaa Informaatiotieteiden yksikkö Matematiikka Syyskuu 2011 Tampereen yliopisto Informaatiotieteiden yksikkö ROOSA NIEMI: Riippuvuuslogiikkaa

Lisätiedot

Opetuksen ja opiskelun tehokas ja laadukas havainnointi verkkooppimisympäristössä

Opetuksen ja opiskelun tehokas ja laadukas havainnointi verkkooppimisympäristössä Opetuksen ja opiskelun tehokas ja laadukas havainnointi verkkooppimisympäristössä Jukka Paukkeri (projektitutkija) Tampereen Teknillinen Yliopisto Matematiikan laitos Intelligent Information Systems Laboratory

Lisätiedot

Salausmenetelmät. Veikko Keränen, Jouko Teeriaho (RAMK, 2006)

Salausmenetelmät. Veikko Keränen, Jouko Teeriaho (RAMK, 2006) Salausmenetelmät Veikko Keränen, Jouko Teeriaho (RAMK, 2006) LUKUTEORIAA JA ALGORITMEJA 3. Kongruenssit à 3.1 Jakojäännös ja kongruenssi Määritelmä 3.1 Kaksi lukua a ja b ovat keskenään kongruentteja (tai

Lisätiedot

Tietorakenteet ja algoritmit - syksy 2015 1

Tietorakenteet ja algoritmit - syksy 2015 1 Tietorakenteet ja algoritmit - syksy 2015 1 Tietorakenteet ja algoritmit - syksy 2015 2 Tietorakenteet ja algoritmit Johdanto Ari Korhonen Tietorakenteet ja algoritmit - syksy 2015 1. JOHDANTO 1.1 Määritelmiä

Lisätiedot

MS-A0402 Diskreetin matematiikan perusteet Esimerkkejä ym., osa I

MS-A0402 Diskreetin matematiikan perusteet Esimerkkejä ym., osa I MS-A040 Diskreetin matematiikan perusteet Esimerkkejä ym., osa I G. Gripenberg Aalto-yliopisto. maaliskuuta 05 G. Gripenberg (Aalto-yliopisto) MS-A040 Diskreetin matematiikan perusteet Esimerkkejä. ym.,

Lisätiedot

Loogiset konnektiivit

Loogiset konnektiivit Loogiset konnektiivit Tavallisimmat loogiset konnektiivit ovat negaatio ei konjunktio ja disjunktio tai implikaatio jos..., niin... ekvivalenssi... jos ja vain jos... Sulkeita ( ) käytetään selkeyden vuoksi

Lisätiedot

TAPAUS-VERROKKITUTKIMUS

TAPAUS-VERROKKITUTKIMUS TAPAUS-VERROKKI TUTKIMUKSEN TYYPIT JA TULOSTEN ANALYYSI Simo Näyhä Jari Jokelainen Kansanterveystieteen ja yleislääketieteen laitoksen jatkokoulutusmeeting.3.4.2007 TAPAUS-VERROKKITUTKIMUS Idea Tutkimusryhmät

Lisätiedot

Johdatus lukuteoriaan Harjoitus 2 syksy 2008 Eemeli Blåsten. Ratkaisuehdotelma

Johdatus lukuteoriaan Harjoitus 2 syksy 2008 Eemeli Blåsten. Ratkaisuehdotelma Johdatus lukuteoriaan Harjoitus 2 syksy 2008 Eemeli Blåsten Ratkaisuehdotelma Tehtävä 1 1. Etsi lukujen 4655 ja 12075 suurin yhteinen tekijä ja lausu se kyseisten lukujen lineaarikombinaationa ilman laskimen

Lisätiedot

1. Logiikan ja joukko-opin alkeet

1. Logiikan ja joukko-opin alkeet 1. Logiikan ja joukko-opin alkeet 1.1. Logiikkaa 1. Osoita totuusarvotauluja käyttäen, että implikaatio p q voidaan kirjoittaa muotoon p q, ts. että propositio (p q) ( p q) on identtisesti tosi. 2. Todista

Lisätiedot

Käyttäjäkeskeisen suunnittelun periaatteet ja prosessit

Käyttäjäkeskeisen suunnittelun periaatteet ja prosessit Käyttäjäkeskeisen suunnittelun periaatteet ja prosessit Kurssilla: Johdatus käyttäjäkeskeiseen tuotekehitykseen 23.1.2008 Johanna Viitanen johanna.viitanen@soberit.hut.fi Luennon aiheet Tuotekehityksen

Lisätiedot

Tekijä Pitkä matematiikka On osoitettava, että jana DE sivun AB kanssa yhdensuuntainen ja sen pituus on 4 5

Tekijä Pitkä matematiikka On osoitettava, että jana DE sivun AB kanssa yhdensuuntainen ja sen pituus on 4 5 Tekijä Pitkä matematiikka 6..06 8 On osoitettava, että jana DE sivun AB kanssa yhdensuuntainen ja sen pituus on 5 sivun AB pituudesta. Pitää siis osoittaa, että DE = AB. 5 Muodostetaan vektori DE. DE =

Lisätiedot

kaikille a R. 1 (R, +) on kommutatiivinen ryhmä, 2 a(b + c) = ab + ac ja (b + c)a = ba + ca kaikilla a, b, c R, ja

kaikille a R. 1 (R, +) on kommutatiivinen ryhmä, 2 a(b + c) = ab + ac ja (b + c)a = ba + ca kaikilla a, b, c R, ja Renkaat Tarkastelemme seuraavaksi rakenteita, joissa on määritelty kaksi binääristä assosiatiivista laskutoimitusta, joista toinen on kommutatiivinen. Vaadimme muuten samat ominaisuudet kuin kokonaisluvuilta,

Lisätiedot

Tietorakenteet ja algoritmit Johdanto Lauri Malmi / Ari Korhonen

Tietorakenteet ja algoritmit Johdanto Lauri Malmi / Ari Korhonen Tietorakenteet ja algoritmit Johdanto Lauri Malmi / Ari 1 1. JOHDANTO 1.1 Määritelmiä 1.2 Tietorakenteen ja algoritmin valinta 1.3 Algoritmit ja tiedon määrä 1.4 Tietorakenteet ja toiminnot 1.5 Esimerkki:

Lisätiedot

T kevät 2007 Laskennallisen logiikan jatkokurssi Laskuharjoitus 1 Ratkaisut

T kevät 2007 Laskennallisen logiikan jatkokurssi Laskuharjoitus 1 Ratkaisut T-79.5101 kevät 2007 Laskennallisen logiikan jatkokurssi Laskuharjoitus 1 Ratkaisut 1. Jokaiselle toteutuvalle lauselogiikan lauseelle voidaan etsiä malli taulumenetelmällä merkitsemällä lause taulun juureen

Lisätiedot

Tiedon louhinnan teoria (ja käytäntö) OUGF kevätseminaari 2004 Hannu Toivonen

Tiedon louhinnan teoria (ja käytäntö) OUGF kevätseminaari 2004 Hannu Toivonen Tiedon louhinnan teoria (ja käytäntö) OUGF kevätseminaari 2004 Hannu Toivonen hannu.toivonen@cs.helsinki.fi 1 2 A 1 4 8 2 2 1 2 6 2 A 2 4 3 7 3 2 8 4 2 A 4 5 2 4 5 5 2 6 4 A 7 2 3 7 5 4 5 2 2 A 5 2 4 6

Lisätiedot

Lukion matematiikkakilpailun alkukilpailu 2015

Lukion matematiikkakilpailun alkukilpailu 2015 Lukion matematiikkakilpailun alkukilpailu 015 Avoimen sarjan tehtävät ja niiden ratkaisuja 1. Olkoot a ja b peräkkäisiä kokonaislukuja, c = ab ja d = a + b + c. a) Osoita, että d on kokonaisluku. b) Mitä

Lisätiedot

MAT Algebra 1(s)

MAT Algebra 1(s) 8. maaliskuuta 2012 Esipuhe Tämä luentokalvot sisältävät kurssin keskeiset asiat. Kalvoja täydennetään luennolla esimerkein ja todistuksin. Materiaali perustuu Jyväskylän, Helsingin ja Turun yliopistojen

Lisätiedot

f(n) = Ω(g(n)) jos ja vain jos g(n) = O(f(n))

f(n) = Ω(g(n)) jos ja vain jos g(n) = O(f(n)) Määritelmä: on O(g(n)), jos on olemassa vakioarvot n 0 > 0 ja c > 0 siten, että c g(n) kun n > n 0 O eli iso-o tai ordo ilmaisee asymptoottisen ylärajan resurssivaatimusten kasvun suuruusluokalle Samankaltaisia

Lisätiedot

1.1. Määritelmiä ja nimityksiä

1.1. Määritelmiä ja nimityksiä 1.1. Määritelmiä ja nimityksiä Luku joko reaali- tai kompleksiluku. R = {reaaliluvut}, C = {kompleksiluvut} R n = {(x 1, x 2,..., x n ) x 1, x 2,..., x n R} C n = {(x 1, x 2,..., x n ) x 1, x 2,..., x

Lisätiedot

pitkittäisaineistoissa

pitkittäisaineistoissa Puuttuvan tiedon käsittelystä p. 1/18 Puuttuvan tiedon käsittelystä pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto Puuttuvan tiedon

Lisätiedot

Yhtälöryhmä matriisimuodossa. MS-A0004/A0006 Matriisilaskenta. Tarkastellaan esimerkkinä lineaarista yhtälöparia. 2x1 x 2 = 1 x 1 + x 2 = 5.

Yhtälöryhmä matriisimuodossa. MS-A0004/A0006 Matriisilaskenta. Tarkastellaan esimerkkinä lineaarista yhtälöparia. 2x1 x 2 = 1 x 1 + x 2 = 5. 2. MS-A4/A6 Matriisilaskenta 2. Nuutti Hyvönen, c Riikka Kangaslampi Matematiikan ja systeemianalyysin laitos Aalto-yliopisto 5.9.25 Tarkastellaan esimerkkinä lineaarista yhtälöparia { 2x x 2 = x + x 2

Lisätiedot

pitkittäisaineistoissa

pitkittäisaineistoissa Puuttuvan tiedon ongelma p. 1/18 Puuttuvan tiedon ongelma pitkittäisaineistoissa Tapio Nummi tan@uta.fi Matematiikan, tilastotieteen ja filosofian laitos Tampereen yliopisto mtl.uta.fi/tilasto/sekamallit/puupitkit.pdf

Lisätiedot

Evolutiivisesti stabiilin strategian oppiminen

Evolutiivisesti stabiilin strategian oppiminen Evolutiivisesti stabiilin strategian oppiminen Janne Laitonen 8.10.2008 Maynard Smith: s. 54-60 Johdanto Käytös voi usein olla opittua perityn sijasta Tyypillistä käytöksen muuttuminen ja riippuvuus aikaisemmista

Lisätiedot

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas

TUTKIMUSAINEISTON ANALYYSI. LTKY012 Timo Törmäkangas TUTKIMUSAINEISTON ANALYYSI LTKY012 Timo Törmäkangas KURSSIN SISÄLTÖ Johdanto Mittaaminen ja aineiston hankinta Mitta-asteikot Otanta Aineiston esittäminen ja data-analyysi Havaintomatriisi Yksiulotteisen

Lisätiedot

[a] ={b 2 A : a b}. Ekvivalenssiluokkien joukko

[a] ={b 2 A : a b}. Ekvivalenssiluokkien joukko 3. Tekijälaskutoimitus, kokonaisluvut ja rationaaliluvut Tässä luvussa tutustumme kolmanteen tapaan muodostaa laskutoimitus joukkoon tunnettujen laskutoimitusten avulla. Tätä varten määrittelemme ensin

Lisätiedot

SELECT-lauseen perusmuoto

SELECT-lauseen perusmuoto SQL: Tiedonhaku SELECT-lauseen perusmuoto SELECT FROM WHERE ; määrittää ne sarakkeet, joiden halutaan näkyvän kyselyn vastauksessa sisältää

Lisätiedot

Dynaamiset regressiomallit

Dynaamiset regressiomallit MS-C2128 Ennustaminen ja Aikasarja-analyysi, Heikki Seppälä Matematiikan ja systeemianalyysin laitos Perustieteiden korkeakoulu Aalto-yliopisto Syksy 2015 Viikko 6: 1 Kalmanin suodatin Aiemmin käsitellyt

Lisätiedot

Sovellettu todennäköisyyslaskenta B

Sovellettu todennäköisyyslaskenta B Sovellettu todennäköisyyslaskenta B Antti Rasila 16. marraskuuta 2007 Antti Rasila () TodB 16. marraskuuta 2007 1 / 15 1 Epäparametrisia testejä χ 2 -yhteensopivuustesti Homogeenisuuden testaaminen Antti

Lisätiedot

Lukumäärän laskeminen 1/7 Sisältö ESITIEDOT:

Lukumäärän laskeminen 1/7 Sisältö ESITIEDOT: Lukumäärän laskeminen 1/7 Sisältö Samapituisten merkkijonojen lukumäärä I Olkoon tehtävänä muodostaa annetuista merkeistä (olioista, alkioista) a 1,a 2,a 3,..., a n jonoja, joissa on p kappaletta merkkejä.

Lisätiedot

Tiedonlouhinta 2013/L3 p. 1. Data-avaruus. Olk. muuttujat A 1,...,A k, joiden arvoalueet. Dom(A 1 ),...,Dom(A k ). Silloin D = Dom(A 1 )...

Tiedonlouhinta 2013/L3 p. 1. Data-avaruus. Olk. muuttujat A 1,...,A k, joiden arvoalueet. Dom(A 1 ),...,Dom(A k ). Silloin D = Dom(A 1 )... Luento 3: 1 Yleiset mallinnusperiaatteet ja 2 Riippuvuusanalyysi Yleiset mallinnusperiaatteet 1. Ongelman määrittely datan ja taustateorian ymmärtäminen 2. siprosessointi datan siivous, piirteiden eristys

Lisätiedot

Department of Mathematics, Hypermedia Laboratory Tampere University of Technology. Roolit Verkostoissa: HITS. Idea.

Department of Mathematics, Hypermedia Laboratory Tampere University of Technology. Roolit Verkostoissa: HITS. Idea. Roolit Tommi Perälä Department of Mathematics, Hypermedia Laboratory Tampere University of Technology 25.3.2011 J. Kleinberg kehitti -algoritmin (Hypertext Induced Topic Search) hakukoneen osaksi. n taustalla

Lisätiedot

Laskennan mallit (syksy 2010) Harjoitus 8, ratkaisuja

Laskennan mallit (syksy 2010) Harjoitus 8, ratkaisuja 582206 Laskennan mallit (syksy 2010) Harjoitus 8, ratkaisuja 1. Tarkastellaan yhteydetöntä kielioppia S SAB ε A aa a B bb ε Esitä merkkijonolle aa kaksi erilaista jäsennyspuuta ja kummallekin siitä vastaava

Lisätiedot

LAUSELOGIIKKA (1) Sanalliset ilmaisut ovat usein epätarkkoja. On ilmaisuja, joista voidaan sanoa, että ne ovat tosia tai epätosia, mutta eivät molempia. Ilmaisuja, joihin voidaan liittää totuusarvoja (tosi,

Lisätiedot

Suunnittelumallien käyttö ja web-navimallit

Suunnittelumallien käyttö ja web-navimallit Käyttöliittymät II Luento 7 Suunnittelumallien käyttö ja web-navimallit Harjoitus 1: Asuntohaku-sovellus Harjoitus 2: Groups and Items Esimerkkejä muista kälisuunnittelumalleista Web-navigoinnin suunnittelumallit

Lisätiedot

1 Lineaariavaruus eli Vektoriavaruus

1 Lineaariavaruus eli Vektoriavaruus 1 Lineaariavaruus eli Vektoriavaruus 1.1 Määritelmä ja esimerkkejä Olkoon K kunta, jonka nolla-alkio on 0 ja ykkösalkio on 1 sekä V epätyhjä joukko. Oletetaan, että joukossa V on määritelty laskutoimitus

Lisätiedot

T Syksy 2004 Logiikka tietotekniikassa: perusteet Laskuharjoitus 2 (opetusmoniste, lauselogiikka )

T Syksy 2004 Logiikka tietotekniikassa: perusteet Laskuharjoitus 2 (opetusmoniste, lauselogiikka ) T-79.144 Syksy 2004 Logiikka tietotekniikassa: perusteet Laskuharjoitus 2 opetusmoniste, lauselogiikka 2.1-3.5) 21 24.9.2004 1. Määrittele lauselogiikan konnektiivit a) aina epätoden lauseen ja implikaation

Lisätiedot

Luku 2. Datasta tietoon: mitä dataa? mitä tietoa?

Luku 2. Datasta tietoon: mitä dataa? mitä tietoa? 1 / 14 Luku 2. Datasta tietoon: mitä dataa? mitä tietoa? T-61.2010 Datasta tietoon, syksy 2011 professori Erkki Oja Tietojenkäsittelytieteen laitos, Aalto-yliopisto 31.10.2011 2 / 14 Tämän luennon sisältö

Lisätiedot

HELIA 1 (17) Outi Virkki Tiedonhallinta 4.11.2000

HELIA 1 (17) Outi Virkki Tiedonhallinta 4.11.2000 HELIA 1 (17) Luento 4.5 Normalisointi... 2 Tavoitteet... 2 Attribuuttien väliset riippuvuudet... 4 Funktionaalinen / moniarvoinen riippuvuus... 4 Transitiivinen / suora riippuvuus... 6 Täydellinen / osittainen

Lisätiedot

Etsintä verkosta (Searching from the Web) T Datasta tietoon Heikki Mannila, Jouni Seppänen

Etsintä verkosta (Searching from the Web) T Datasta tietoon Heikki Mannila, Jouni Seppänen Etsintä verkosta (Searching from the Web) T-61.2010 Datasta tietoon Heikki Mannila, Jouni Seppänen 12.12.2007 Webin lyhyt historia http://info.cern.ch/proposal.html http://browser.arachne.cz/screen/

Lisätiedot

1 Logiikkaa. 1.1 Logiikan symbolit

1 Logiikkaa. 1.1 Logiikan symbolit 1 Logiikkaa Tieteessä ja jokapäiväisessä elämässä joudutaan tekemään päätelmiä. Logiikassa tutkimuskohteena on juuri päättelyt. Sen sijaan päätelmien sisältöön ei niinkäään kiinnitetä huomiota. Päätelmät

Lisätiedot

HELIA 1 (17) Outi Virkki Tiedonhallinta

HELIA 1 (17) Outi Virkki Tiedonhallinta HELIA 1 (17) Luento 4.1 Looginen suunnittelu... 2 Relaatiomalli... 3 Peruskäsitteet... 4 Relaatio... 6 Relaatiokaava (Relation schema)... 6 Attribuutti ja arvojoukko... 7 Monikko... 8 Avaimet... 10 Avain

Lisätiedot

CS-A1150 Tietokannat CS-A1150 Tietokannat / 43

CS-A1150 Tietokannat CS-A1150 Tietokannat / 43 CS-A1150 Tietokannat 14.3.2017 CS-A1150 Tietokannat 14.3.2017 1 / 43 Oppimistavoitteet: tämän luennon jälkeen Osaat muuttaa huonon tietokantakaavion paremmaksi: Tiedät mitä tarkoitetaan sillä, että relaatio

Lisätiedot

Graafin 3-värittyvyyden tutkinta T Graafiteoria, projektityö (eksakti algoritmi), kevät 2005

Graafin 3-värittyvyyden tutkinta T Graafiteoria, projektityö (eksakti algoritmi), kevät 2005 Graafin 3-värittyvyyden tutkinta T-79.165 Graafiteoria, projektityö (eksakti algoritmi), kevät 2005 Mikko Malinen, 36474R 29. maaliskuuta, 2005 Tiivistelmä Artikkelissa käydään läpi teoriaa, jonka avulla

Lisätiedot

3 Lineaariset yhtälöryhmät ja Gaussin eliminointimenetelmä

3 Lineaariset yhtälöryhmät ja Gaussin eliminointimenetelmä 1 3 Lineaariset yhtälöryhmät ja Gaussin eliminointimenetelmä Lineaarinen m:n yhtälön yhtälöryhmä, jossa on n tuntematonta x 1,, x n on joukko yhtälöitä, jotka ovat muotoa a 11 x 1 + + a 1n x n = b 1 a

Lisätiedot

CSE-A1200 Tietokannat

CSE-A1200 Tietokannat CSE-A1200 Tietokannat 15.3.2016 CSE-A1200 Tietokannat 15.3.2016 1 / 45 Oppimistavoitteet: tämän luennon jälkeen Osaat muuttaa huonon tietokantakaavion paremmaksi: Tiedät mitä tarkoitetaan sillä, että relaatio

Lisätiedot

Rinnakkaistietokoneet luento S

Rinnakkaistietokoneet luento S Rinnakkaistietokoneet luento 3 521475S Rinnakkaiset Numeeriset Algoritmit Silmukattomat algoritmit Eivät sisällä silmukka lauseita kuten DO,FOR tai WHILE Nopea suorittaa Yleisimmässä muodossa koostuu peräkkäisistä

Lisätiedot

3 Lineaariset yhtälöryhmät ja Gaussin eliminointimenetelmä

3 Lineaariset yhtälöryhmät ja Gaussin eliminointimenetelmä 3 Lineaariset yhtälöryhmät ja Gaussin eliminointimenetelmä Lineaarinen m:n yhtälön yhtälöryhmä, jossa on n tuntematonta x 1,, x n on joukko yhtälöitä, jotka ovat muotoa a 11 x 1 + + a 1n x n = b 1 a 21

Lisätiedot

HELIA 1 (21) Outi Virkki Tietokantasuunnittelu 20.9.2005

HELIA 1 (21) Outi Virkki Tietokantasuunnittelu 20.9.2005 HELIA 1 (21) Luento 7 Relaatiomallin kertausta... 2 Peruskäsitteet... 2 Relaatio... 4 Määritelmä... 4 Relaatiokaava (Relation schema)... 4 Relaatioinstanssi (Relation instance)... 4 Attribuutti ja arvojoukko...

Lisätiedot

Lineaariset kongruenssiyhtälöryhmät

Lineaariset kongruenssiyhtälöryhmät Lineaariset kongruenssiyhtälöryhmät LuK-tutkielma Jesse Salo 2309369 Matemaattisten tieteiden laitos Oulun yliopisto Sisältö Johdanto 2 1 Kongruensseista 3 1.1 Kongruenssin ominaisuuksia...................

Lisätiedot

Esimerkkejä polynomisista ja ei-polynomisista ongelmista

Esimerkkejä polynomisista ja ei-polynomisista ongelmista Esimerkkejä polynomisista ja ei-polynomisista ongelmista Ennen yleisempiä teoriatarkasteluja katsotaan joitain tyypillisiä esimerkkejä ongelmista ja niiden vaativuudesta kaikki nämä ongelmat ratkeavia

Lisätiedot

11.4. Context-free kielet 1 / 17

11.4. Context-free kielet 1 / 17 11.4. Context-free kielet 1 / 17 Määritelmä Tyypin 2 kielioppi (lauseyhteysvapaa, context free): jos jokainenp :n sääntö on muotoa A w, missäa V \V T jaw V. Context-free kielet ja kieliopit ovat tärkeitä

Lisätiedot

Globaali optimonti haastaa lokaalit menetelmät: luotettavampia riippuvuuksia tehosta tinkimättä

Globaali optimonti haastaa lokaalit menetelmät: luotettavampia riippuvuuksia tehosta tinkimättä Tietojenkäsittelytiede 34 (Huhtikuu 2012) sivut 6 16 Toimittaja: Jorma Tarhio c kirjoittaja(t) Globaali optimonti haastaa lokaalit menetelmät: luotettavampia riippuvuuksia tehosta tinkimättä Wilhelmiina

Lisätiedot

Matematiikan tukikurssi, kurssikerta 3

Matematiikan tukikurssi, kurssikerta 3 Matematiikan tukikurssi, kurssikerta 3 1 Epäyhtälöitä Aivan aluksi lienee syytä esittää luvun itseisarvon määritelmä: { x kun x 0 x = x kun x < 0 Siispä esimerkiksi 10 = 10 ja 10 = 10. Seuraavaksi listaus

Lisätiedot

n! k!(n k)! n = Binomikerroin voidaan laskea pelkästään yhteenlaskun avulla käyttäen allaolevia ns. palautuskaavoja.

n! k!(n k)! n = Binomikerroin voidaan laskea pelkästään yhteenlaskun avulla käyttäen allaolevia ns. palautuskaavoja. IsoInt Tietokoneiden muisti koostuu yksittäisistä muistisanoista, jotka nykyaikaisissa koneissa ovat 64 bitin pituisia. Muistisanan koko asettaa teknisen rajoituksen sille, kuinka suuria lukuja tietokone

Lisätiedot

v 8 v 9 v 5 C v 3 v 4

v 8 v 9 v 5 C v 3 v 4 Verkot Verkko on (äärellinen) matemaattinen malli, joka koostuu pisteistä ja pisteitä toisiinsa yhdistävistä viivoista. Jokainen viiva yhdistää kaksi pistettä, jotka ovat viivan päätepisteitä. Esimerkiksi

Lisätiedot

Kurssikoe on maanantaina 29.6. Muista ilmoittautua kokeeseen viimeistään 10 päivää ennen koetta! Ilmoittautumisohjeet löytyvät kurssin kotisivuilla.

Kurssikoe on maanantaina 29.6. Muista ilmoittautua kokeeseen viimeistään 10 päivää ennen koetta! Ilmoittautumisohjeet löytyvät kurssin kotisivuilla. HY / Avoin ylioisto Johdatus yliopistomatematiikkaan, kesä 201 Harjoitus 7 Ratkaisut palautettava viimeistään perjantaina 26.6.201 klo 16.00. Huom! Luennot ovat salissa CK112 maanantaista 1.6. lähtien.

Lisätiedot

Insinöörimatematiikka IA

Insinöörimatematiikka IA Isiöörimatematiikka IA Harjoitustehtäviä. Selvitä oko propositio ( p q r ( p q r kotradiktio. Ratkaisu: Kirjoitetaa totuustaulukko: p q r ( p q r p q r ( p q r ( p q r 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

Lisätiedot

Algoritmit 1. Luento 3 Ti Timo Männikkö

Algoritmit 1. Luento 3 Ti Timo Männikkö Algoritmit 1 Luento 3 Ti 17.1.2017 Timo Männikkö Luento 3 Algoritmin analysointi Rekursio Lomituslajittelu Aikavaativuus Tietorakenteet Pino Algoritmit 1 Kevät 2017 Luento 3 Ti 17.1.2017 2/27 Algoritmien

Lisätiedot

Täydentäviä muistiinpanoja jäsennysalgoritmeista

Täydentäviä muistiinpanoja jäsennysalgoritmeista äydentäviä muistiinpanoja jäsennysalgoritmeista Antti-Juhani Kaijanaho 7. helmikuuta 2012 1 simerkki arleyn algoritmin soveltamisesta arkastellaan kielioppia G : + () c ja sovelletaan arleyn algoritmia

Lisätiedot

4.5 Kaksivaiheinen menetelmä simplex algoritmin alustukseen

4.5 Kaksivaiheinen menetelmä simplex algoritmin alustukseen 4.5 Kaksivaiheinen menetelmä simplex algoritmin alustukseen Käypä kantaratkaisu löytyy helposti, esimerkiksi tapauksessa Ax b, b 0 x 0 jolloin sen määräävät puutemuuttujat. Tällöin simplex-menetelmän alustus

Lisätiedot

Pikapaketti logiikkaan

Pikapaketti logiikkaan Pikapaketti logiikkaan Tämän oppimateriaalin tarkoituksena on tutustua pikaisesti matemaattiseen logiikkaan. Oppimateriaalin asioita tarvitaan projektin tekemisessä. Kiinnostuneet voivat lukea lisää myös

Lisätiedot

Satunnaisalgoritmit. Topi Paavilainen. Laskennan teorian opintopiiri HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos

Satunnaisalgoritmit. Topi Paavilainen. Laskennan teorian opintopiiri HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos Satunnaisalgoritmit Topi Paavilainen Laskennan teorian opintopiiri HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos Helsinki, 23. helmikuuta 2014 1 Johdanto Satunnaisalgoritmit ovat algoritmeja, joiden

Lisätiedot

Laskennan vaativuus ja NP-täydelliset ongelmat

Laskennan vaativuus ja NP-täydelliset ongelmat Laskennan vaativuus ja NP-täydelliset ongelmat TRAK-vierailuluento 13.4.2010 Petteri Kaski Tietojenkäsittelytieteen laitos Tietojenkäsittelytiede Tietojenkäsittelytiede tutkii 1. mitä tehtäviä voidaan

Lisätiedot

MS-A0402 Diskreetin matematiikan perusteet Esimerkkejä, todistuksia ym., osa I

MS-A0402 Diskreetin matematiikan perusteet Esimerkkejä, todistuksia ym., osa I MS-A0402 Diskreetin matematiikan perusteet Esimerkkejä, todistuksia ym., osa I G. Gripenberg Aalto-yliopisto 3. huhtikuuta 2014 G. Gripenberg (Aalto-yliopisto) MS-A0402 Diskreetin matematiikan perusteetesimerkkejä,

Lisätiedot

Mat Optimointiopin seminaari

Mat Optimointiopin seminaari Lähde: Preferenssi-informaatio DEA-malleissa: Value Efficiency Analysis (VEA) -menetelmä Mat-2.4142 Optimointiopin seminaari 23.3.2011 Halme, M., Joro, T., Korhonen, P., Wallenius, J., 1999. A Value Efficiency

Lisätiedot

rm + sn = d. Siispä Proposition 9.5(4) nojalla e d.

rm + sn = d. Siispä Proposition 9.5(4) nojalla e d. 9. Renkaat Z ja Z/qZ Tarkastelemme tässä luvussa jaollisuutta kokonaislukujen renkaassa Z ja todistamme tuloksia, joita käytetään jäännösluokkarenkaan Z/qZ ominaisuuksien tarkastelussa. Jos a, b, c Z ovat

Lisätiedot

Lectio praecursoria. Satunnaistusalgoritmeja tiedonlouhinnan tulosten merkitsevyyden arviointiin. Markus Ojala. 12.

Lectio praecursoria. Satunnaistusalgoritmeja tiedonlouhinnan tulosten merkitsevyyden arviointiin. Markus Ojala. 12. Lectio praecursoria Satunnaistusalgoritmeja tiedonlouhinnan tulosten merkitsevyyden arviointiin Markus Ojala 12. marraskuuta 2011 Käsitteet Satunnaistusalgoritmeja tiedonlouhinnan tulosten merkitsevyyden

Lisätiedot

Paikkaontologiat. Tomi Kauppinen ja Jari Väätäinen Aalto-yliopiston teknillinen korkeakoulu tomi.j.kauppinen at gmail.com

Paikkaontologiat. Tomi Kauppinen ja Jari Väätäinen Aalto-yliopiston teknillinen korkeakoulu tomi.j.kauppinen at gmail.com Paikkaontologiat Tomi Kauppinen ja Jari Väätäinen Aalto-yliopiston teknillinen korkeakoulu tomi.j.kauppinen at gmail.com Mihin tarvitaan paikkaontologioita? Jokainen meistä liittyy paikkoihin Esimerkkejä:

Lisätiedot

MS-A0402 Diskreetin matematiikan perusteet Esimerkkejä, todistuksia ym., osa I

MS-A0402 Diskreetin matematiikan perusteet Esimerkkejä, todistuksia ym., osa I MS-A040 Diskreetin matematiikan perusteet Esimerkkejä, todistuksia ym., osa I G. Gripenberg Aalto-yliopisto 3. huhtikuuta 014 G. Gripenberg (Aalto-yliopisto) MS-A040 Diskreetin matematiikan perusteetesimerkkejä,

Lisätiedot