Assosiaatiosäännöt ja niiden etsintä datasta

Koko: px
Aloita esitys sivulta:

Download "Assosiaatiosäännöt ja niiden etsintä datasta"

Transkriptio

1 Assosiaatiosäännöt ja niiden etsintä datasta Wilhelmiina Hämäläinen 6. helmikuuta Mitä on tiedon louhinta? Tiedonlouhinnan (Data mining) tavoitteena on löytää kiinnostavia hahmoja datasta. hahmo=osittaismalli (kuvaa vain osan datasta) vs. (globaali) malli=kuvaa koko dataa esim. Useimmat opiskelijat, jotka ovat hyviä Tietorakenteissa, ovat hyviä myös Laskennateoriassa. Ei kerro mitään opiskelijoista, jotka huonoja Tietorakenteissa. Juuret tilastotieteessä (erit. Exploratory data analysis) ja koneoppimisessa (Machine learning). Menetelmiä algoritmiikasta ja tietokannoista. Nykyisin alan asiantuntijat puhuvat mieluummin tietämyksen muodostuksesta (Knowledge discovery, KDD), joka on laajempi prosessi: 1. Understanding domain 2. Preprocessing data 3. Discovering patterns 4. Postprocessing results 5. Application (3. askel = varsinainen data mining) 1

2 Data mining vs. Machine learning Klassisia eroja: Data mining Machine learning Oletus: Data ensisijaista, ei sisällä Data on allaolevan mallin välttämättä mitään tuottamaa rakennetta Tavoite: Löytää kaikki kiinnostavat Oppia yksi malli, jolla voidaan hahmot, jotka kuvaavat dataa ennustaa tulevaisuuden tapahtumia Mallit: Yksinkertaisia malleja tai Melko monimutkaisia, globaaleja paikallisia hahmoja malleja Korostus: Koko KDD prosessi Vain oppimisaskel Datan alkuperä: Usein jonkun toisen projektin Valittu kyseistä tehtävää sivutuotteena varten (opetusjoukko) Datan määrä: Valtavan suuria, jopa miljoonia Vain satoja tai tuhansia rivejä. rivejä Nykyisin raja hämärtynyt! Käyttävät samoja mallinnusparadigmoja, mutta eri tavoite: DM: datan kuvaus, uuden informaation löytyminen ML: globaalin mallin oppiminen ennustustarkoituksiin Ennemmin kannattaisi puhua deskriptiivisestä ja prediktiivisestä mallinnuksesta! 2

3 2 Notaatiot A Attribuutin eli muuttujan nimi Dom(A) Attribuutin arvoalue. Esim. Dom(A 1 ) = {0, 1}. A i = a i Attribuutin arvo R = {A 1,..., A k } Relaatioskeema kertoo attribuuttien nimet. Näihin liittyvät arvoalueet Dom(A 1 ),..., Dom(A k ). t = [t(a 1 ), t(a 2 ),..., t(a k )] Monikko eli rivi, joka kiinnittää attribuuttien arvot. t(a i ) = a i Attribuutin A i arvo monikossa t. r = {t 1,..., t n } Relaatio, joukko rivejä skeeman R mukaan. r Dom(A 1 )... Dom(A k ). r = n Relaation koko, sen rivien lukumäärä. m(a i = a i ) Rivien lukumäärä, joilla A i = a i. Ts. (A i = a i ):n absoluuttinen frekvenssi. P (A i = a i ) = m(a i=a i ) (A n i = a i ):n suhteellinen frekvenssi relaatiossa, sen estimoitu todennäköisyys. Huom! Assosiaatiosäännöissä tarkastelemme usein attribuuttijoukkoa X R, X = {A i1, A i2,...a il }, l k. A i1 = a i1,..., A il = a vastaa loogista konjunktiolauseketta, jossa kukin A ij = a ij on propositio (pilkku vastaa konjunktiota ). Nyt m(a i1 = a i1,..., A il = a il ) = {t r t(a i1 ) = a i1... t(a il ) = a il }. Huom.2: Jos kaikki attribuutit ovat binaarisia ts. Dom(A i ) = {0, 1} i = 1,..., k, voimme käyttää loogisia merkintöjä A (A = 1) ja A (A = 0). 3 Assosiaatiosäännöt Muotoa Asiakkaat, jotka ostavat olutta ja makkaraa, ostavat yleensä myös sinappia olevia osittaisriippuvuuksia. Alkujaan [AIS93], hyvä esitys [Toi96] Määritelmä 1 (Assosiaatiosääntö) Olkoon R joukko kategorisia muuttujia ja r R:n mukainen relaatio. Olkoon X = {X 1,..., X l } R ja Y R, Y / X. Merkitään arvokombinaatiota (X 1 = x 1 ),..., (X l = x l ), x i Dom(X i ), X = x:llä. Tällöin säännön (X = x) (Y = y) kondenssi on cf(x = x Y = y) = P (X = x, Y = y) P (X = x) 3 = P (Y = y X = x)

4 ja sen frekvenssi on fr(x = x Y = y) = P (X = x, Y = y). Annettuna raja-arvot min cf, min fr [0, 1], sääntö (X = x) (Y = y) on assosiaatiosääntö r:ssä, jos (i) cf(x = x Y = y) min cf, ja (ii) fr(x = x Y = y) min fr. Ehto (i) edellyttää, että sääntö on tarpeeksi vahva ja ehto (ii), että se on tarpeeksi yleinen. Huom! Kun kaikki attribuutit ovat binäärisiä eikä olla kiinnostuneita attribuuttien negaatioita, merkitään sääntöä (X 1 = 1, X 2 = 1,..., X l = 1) Y = 1 usein lyhyesti X 1 X 2... X l Y. Esimerkki 1 Olkoon TKTL:n kurssisuoritustietokannassa 1000 opiskelijaa. Löydämme assosiaatiosäännön 90% opiskelijoista, jotka ovat suorittaneet Tiedonlouhinta-kurssin, on suorittanut myös Opetusteknologia-kurssin. Säännön kondenssi on siis Jos vain 10 oppilasta 1000:sta on suorittanut Tiedonlouhinta-kurssin, on 9 suorittanut Opetusteknologia-kurssin ja sääntö hyvin harvinainen (frekvenssillä 9/1000 = 0.009). Jos sen sijaan 600 oppilasta on suorittanut Tiedonlouhintakurssin, on 540 oppilasta suorittanut myös Opetusteknologia-kurssin, mikä on jo merkittävä havainto (frekvenssillä 540/1000 = 0.54). Täytyy siis huomioida sekä säännön yleisyys (frekvenssi) että voimakkuus (kondenssi)! Huom.2! Tietokantojen yhteydessä puhutaan usein funktionaalisista riippuvuuksista, joita merkitään samaan tapaan X Y. Funktionaalinen riippuvuus merkitsee kuitenkin eri asiaa: X Y on funktionaalinen riippuvuus relaatiossa r jos ja vain jos t 1 [Y ] = t 2 [Y ] kaikilla t 1, t 2 r, joilla t 1 [X] = t 2 [X]. Riippuvuus pätee kaikkien X:n ja Y :n arvojen välillä. Riippuvuutta vastaa siis joukko assosiaatiosääntöjä! (Jos X = 1, Y = 1 ja X ja Y binäärisiä, niin kaksi sääntöä: X = 0 Y = y 1 ja X = 1 Y = y 2, missä y 1, y 2 {0, 1}.) Kunkin säännön kondenssi on aina cf = 1, mutta frekvenssistä ei olla kiinnostuneita. 4

5 4 Sovelluksia 4.1 Ostoskoridatan analyysi Assosiaatiosääntöjen tunnetuin sovellus on asiakkaiden ostotottumusten analysointi ostoskoridatasta. Tulosten perusteella kauppias voi esim. päättää, miten tuotteet kannattaa sijoitella kaupassa. Ostoskoridatan attribuutit A 1,..., A k ovat tuotenimiä. Koska tuotteita on valtavasti, voi k olla useita tuhansia. Kukin A i on binaarinen: tuote joko esiintyy ostoskorissa tai ei esiinny. Relaation rivit vastaavat ostoskoreja (kokoelma tuotteita, jotka on maksettu kassalla). Data on hyvin harvaa! Usein alle 5% ostoskorin attribuuteista on 1-arvoisia. Tavallisesti tutkitaan vain korissa esiintyviä tuotteita, ei niistä puuttuvia (joita on valtavasti!) Samaan tapaan voi analysoida esim. opintosuoritusrekisteristä kurssien välisisä osittaisriippuvuuksia ( suositukset, missä järjestyksessä suorittaa kursseja) tai etsiä tekstistä yhdessä esiintyviä sanoja (kukin lause vastaa riviä ja sana attribuuttia). Huom! Omissa kokeiluissasi voit käyttää esim. weka-ohjelmaa [Wek]. 4.2 Assosiaatiosäännöt luokittelun apuna Luokittelusääntö on assosiaatiosääntö X = x C = c, missä C on luokkamuuttuja. Esimerkki 2 Mushroom-datajoukossa [NHBM98] jokainen sieni on luokiteltu joko syötäväksi (edible) tai myrkylliseksi (poisonous). Muut attribuutit kuvaavat mm. sienen hatun muotoa, pintaa ja väriä, varren muotoa, renkaiden lukumäärää jne. Joukosta löytyvät mm. seuraavat luokittelusäännöt: Odor=none,Gill-size=broad,Stalk-shape=tapering Edible f r = 0.31, cf = 1.00 Odor=none,Gill-size=broad,Stalk-surface-above-ring=smooth Edible f r = 0.33, cf =

6 Bruises=false,Population=several Poisonous f r = 0.31, cf = 0.92 Luokittelussa käytettävä päätöspuu (decision tree on vanhempi keksintö (ks. esim. [Mit97][52-80], [HMS02][ ]), mutta voidaan kuvata joukkona assosiaatiosääntöjä. Esimerkki 3 Ohjelmointi1-kurssin harjoitustehtävät on jaettu kolmeen ryhmään: A=Ohjelmoinnin perusrakenteet B=Silmukat ja taulukot C=Appletit Kussakin ryhmässä opiskelija on saanut joko vähän (little) tai paljon (lot) pisteitä. Näiden perusteella on pyritty ennustamaan kurssin lopputulokset F R1 {0, 1} ts. läpäiseekö opiskelija kurssin. B lot little FR1=1 little A lot FR1=0 little C lot FR1=0 FR1=1 Rule Freq. Conf. B = lot F R1 = 1 73/125= B = little A = little F R1 = 0 12/125= B = little A = lot C = little F R1 = 0 18/125= B = little A = lot C = lot F R1 = 1 2/125= Huom! Päätöspuu on globaali malli! Ei voida aettaa minimifrekvenssiä, sillä katettava kaikki mahdolliset tapaukset. 6

7 Päätöspuun oppimiseen omat algoritmit (esim. C4.5 [Qui93]). Varoitus: Päätöspuut tuottavat epäluotettavia tuloksia, ellei mallia ole opittu tarpeeksi suuresta datajoukosta (useita tuhansia rivejä, riippuen attribuuttien lkm:stä ja arvoalueiden koosta). Monia päätöspuun hyvyysmittoja sovellettu assosiaatiosääntöjen kiinnostavuuden arviointiin. Huom! Assosiaatiosääntöjä voi käyttää apuna myös Bayes-verkon rakenteen määrittelyssä tai niiden avulla voi suorittaa suoraan luokittelua (huomioiden myös frekvenssit) [LHM98]. 4.3 Kokonaistodennäköisyysjakauman johtaminen Säännöllisistä joukoista voi johtaa datan kokonaistodennäköisyysjakauman. Idea [PMS00]: 1. säännölliset joukot muodostavat joukon eheysehtoja 2. käydään läpi kaikki yhteensopivat kokonaistodennäköisyysjakaumat ja valitaan se, jolla maksimientropia Raskas algoritmi! Toimii vain, kun attribuuttien lukumäärä suhteellisen pieni. 5 Assosiaatiosääntöjen etsintä Tavallisesti assosiaatiosäännöt etsitään kahdessa vaiheessa 1 : 1. Etsitään kaikki säännölliset joukot (frequent sets) X = x, X R, joilla fr(x = x) min fr. 2. Käydään läpi kaikki säännölliset joukot X = x ja testataan kaikilla (X i = x i ) ( X i X, x i Dom(X i )), onko cf((x 1 = x 1 ),..., (X i 1 = x i 1 ), (X i+1 = x i+1 ),..., (X l = x l ) (X i = x i )) min cf. 1Muistutus: attribuuttien arvokombinaatiota X 1 = x 1,..., X l = x l merkittiin X = x:lla 7

8 5.1 Apriori-algoritmi Säännölliset joukot voidaan löytää klassisella Apriori-algoritmilla (ks. tarkemmin esim. [Toi96]). kehitetty alkujaan ostoskoridatalle oletus: binääridataa, eikä attribuuttien negaatioista olla kiinnostuneita. tehokas kun hyvin harvaa dataa, mutta ei toimi tiheällä datalla Idea: etsitään ensin säännölliset yhden attribuutin joukot, sitten näiden pohjalta kaikki säännölliset kahden attribuutin joukot, jne. Haussa hyödynnetään frekvenssin monotonisuutta! Jos joukko X on frekventti, myös kaikki Y X ovat frekventtejä. Jos jokin Y X ei ole frekventti, ei X voi olla frekventti. A B C D AB AC AD BC CD BD ABC ABD ACD BCD ABCD 5.2 Laskennallinen vaativuus Laskenta on hyvin raskasta, jos tutkimme myös negaatiot tai jos attribuutit ovat moniarvoisia! 8

9 Jos kaikilla attribuuteilla X i R, i = 1,..., k, on v arvoa, niin pahimmillaan voi olla (1 + v) k frekventtiä arvokombinaatiota (frekventtiä joukkoa). Jos v = 2 ja emme ole kiinnostuneita negaatioista, on säännöllisiä joukkoja maksimissaan 2 k = 2 8 = 256. Esimerkkejä säännöllisten joukkojen maksimilukumääristä: k v Rajoitus S-joukkojen lkm 8 2 Ei negaatioita 2 8 = = = Ei negaatioita = > Assosiaatiosääntöjen muodostus säännöllisistä joukoista paljon kevyempää: Säännöllisestä joukosta X, X = l voi muodostaa maksimissaan l erilaista assosiaatiosääntöä. 5.3 Laajennokset Apriorista erilaisia variaatioita, jotka esim. hyödyntävät erilaisia tietorakenteita välitulosten tehokkaaseen talletukseen. Käytännössä ei isoja eroja! Apriori-algoritmi soveltuu sellaisenaan myös negaatioita sisältävien joukkojen sekä moniarvoisista attribuuteista koostuvien joukkojen etsintään. Rajoitus: laskennallinen raskaus! Numeerinen data on ensin diskretoitava jollain tavalla ks. esim. [RS01, SA96] Disjunktioita sisältävät säännöt esim. Henkilö, joka ostaa olutta tai siideriä, ostaa yleensä myös tupakkaa tai Lääke A aiheuttaa tavallisesti pahoinvointia tai huimausta kiinnostavia mutta vaikeita etsiä! (ks. esim. [NCJK01]) Ongelma: frekvenssin monotonisuusominaisuus ei päde disjunktioille! Joukko A B on aina frekventti, jos A tai B on frekventti. Ei-frekventin joukon lisäys saattaa kuitenkin kasvattaa kondenssia ja tuottaa kiinnostavia sääntöjä. 9

10 Esim. Laske sääntöjen A C, B C ja (A B) C frekvenssit ja kondenssit annetusta relaatiosta! Rivien lukumäärä on n = 100. X m(x) A, B, C 10 A, B, C 0 A, B, C 10 A, B, C 0 A, B, C 10 A, B, C 20 A, B, C 40 A, B, C 10 6 Kiinnostavien sääntöjen valinta Apriorin ongelma: kaikilla säännöllisillä joukoilla sama minimifrekvenssi riippumatta attribuuttien lukumäärästä. Jos min fr liian pieni, löytyy valtavasti triviaaleja sääntöjä. Jos min fr suuri, ei löydetä spesifejä sääntöjä, vaikka olisivat tilastollisesti merkittäviä. Kuinka valita kiinnostavat tai tilastollisesti merkittävät säännöt?? Kiinnostavuus on subjektiivinen ominaisuus! Useita heuristisia mittoja kiinnostavien sääntöjen valitsemiseen. Mitat perustuvat yleensä säännön frekvenssiin ja kondenssiin (valitsevat assosiaatiosäännöt, joilla suuri frekvenssi ja poikkeuksellisen suuri/pieni kondenssi). (ks. esim. [RBA99]) Tilastollisten merkittävyystestien ongelma: DM:ssa testataan systemaattisesti kaikki mahdolliset säännöt. Jos merkittävyystaso esim ja testataan 1000 sääntöä, niin löydetään keskimäärin 10 virheellisesti merkittävää sääntöä. 6.1 Informaatioteoreettiset mitat Mutual information (ks. esim. [DHS00][632]) I(X, Y ) mittaa, kuinka paljon informaatiota muuttujat X ja Y jakavat. Jos X ja Y ovat riippumattomia, ei X sisällä lainkaan informaatiota Y :stä ja päinvastoin, ja I(X, Y ) = 0. 10

11 Jos X ja Y ovat identtiset, ne jakavat kaiken informaation. Määritelmä 2 (Mutual information) Olkoon R joukko attribuutteja ja X R ja Y R kategorisia muuttujia. X:n ja Y :n mutual information on I(X, Y ) = Σ x Σ y P (X = x, Y = y) log P (X = x, Y = y) P (X = x)p (Y = y). Huom! Saman voi ilmaista ekvivalentisti entropian avulla: missä H(Z) on Z:n entropia: H(Z) = z Dom(Z) I(X, Y ) = H(X) + H(Y ) H(X, Y ), P (Z = z) log P (Z = z) = z Dom(Z) P (Z = z) log Jos X ja Y jakavat kaiken informaation, on I(X, Y ) = H(X) = H(Y ). 1 P (Z = z). Säännön X Y J-mitta [SG92] on sääntöjen X Y and X Y informaatiosisältöjen summa. (Muistutus: P ( Y X) = 1 P (Y X)) [ P (Y X) J(X Y ) = P (X) P (Y X) log + P ( Y ) log P (Y ) = fr(x Y ) log cf(x Y ) fr(y ) + fr(x Y ) log ] P ( Y X) = P ( Y ) cf(x Y ) fr( Y ) Huomioi sekä säännön että sen komplementtisäännön frekvenssin että kondenssin! Alkujaan luokittelusäännöille toimiiko yhtä hyvin assosiaatiosäännöillä? 6.2 χ 2 -mitta Assosiaatiosäännöt voidaan pistää kiinnostavuusjärjestykseen niiden χ 2 -arvojen perusteella [BMS97]. Säännön X Y χ 2 -arvo on χ 2 = 1 1 (m(x = i, Y = j) m(x = i)m(y = j)/n) 2 i=0 j=0 m(x = i)m(y = j)/n 11

12 Rajoitus: frekvenssien oletusarvojen tulee olla riittävän suuria, jotta esioletukset täyttyisivät. Esim. ostoskoridata liian harvaa! Ongelma: Mittaa X:n ja Y :n välistä riippuvuutta, mutta assosiaatiosäännöt ovat osittaisriippuvuuksia. Ei välttämättä havaita kiinnostavaa sääntöä, jos pätee vain tiettyjen arvojen välillä? Ehdotus: huomioidaan vain sääntöä vastaava termi Viitteet (m(x,y ) m(x)m(y )/n)2 m(x)m(y )/n. [AIS93] R. Agrawal, T. Imielinski, and A.N. Swami. Mining association rules between sets of items in large databases. In P. Buneman and S. Jajodia, editors, Proceedings of the 1993 ACM SIGMOD International Conference on Management of Data, pages , Washington, D.C., [BMS97] S. Brin, R. Motwani, and C. Silverstein. Beyond market baskets: Generalizing association rules to correlations. In J. Peckham, editor, Proceedings ACM SIGMOD International Conference on Management of Data, pages ACM Press, [DHS00] R.O. Duda, P.E. Hart, and D.G. Stork. Pattern Classication. Wiley-Interscience Publication, New Yor, 2nd edition, [HMS02] D. Hand, H. Mannila, and P. Smyth. Principles of Data Mining. MIT Press, Cambridge, Massachussetts, USA, [LHM98] B. Liu, W. Hsu, and Y. Ma. Integrating classication and association rule mining. In Proceedings of Fourth International Conference on Knowledge Discovery and Data Mining (KDD- 98), pages AAAI Press, [Mit97] T.M. Mitchell. Machine Learning. McGraw-Hill Companies, New York, NY, USA, [NCJK01] A.A. Nanavati, K.P. Chitrapura, S. Joshi, and R. Krishnapuram. Mining generalised disjunctive association rules. In Proceedings of the tenth International Conference on Information and Knowledge Management (CIKM'01), pages , New York, NY, USA, ACM Press. [NHBM98] D.J. Newman, S. Hettich, C.L. Blake, and C.J. Merz. UCI repository of machine learning databases, uci.edu/~mlearn/mlrepository.html. 12

13 [PMS00] [Qui93] [RBA99] [RS01] [SA96] [SG92] [Toi96] [Wek] D. Pavlov, H. Mannila, and P. Smyth. Probabilistic models for query approximation with large sparse binary data sets. In Proceedings of the 16th Conference on Uncertainty in Articial Intelligence (UAI'00), pages , San Francisco, CA, USA, Morgan Kaufmann Publishers Inc. J.R. Quinlan. C4.5: programs for machine learning. Morgan Kaufmann, Jr. R.J. Bayardo and R. Agrawal. Mining the most interesting rules. In Proceedings of the fth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD'99), pages , New York, NY, USA, ACM Press. R. Rastogi and K. Shim. Mining optimized support rules for numeric attributes. Information Systems, 26(6):425444, R. Srikant and R. Agrawal. Mining quantitative association rules in large relational tables. In H.V. Jagadish and I.S. Mumick, editors, Proceedings of the 1996 ACM SIGMOD International Conference on Management of Data, pages 112, Montreal, Quebec, Canada, P. Smyth and R.M. Goodman. An information theoretic approach to rule induction from databases. IEEE Transactions on Knowledge and Data Engineering, 4(4):301316, H. Toivonen. Discovery of Frequent Patterns in Large Data Collections. PhD thesis, Department of Computer Science, University of Helsinki, Weka3. Data mining software in java. ac.nz/ml/weka/. Retrieved

arvostelija Assosiaatiosäännöt sekvensseissä Jarmo Hakala Vantaa 20.10.2005 HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos

arvostelija Assosiaatiosäännöt sekvensseissä Jarmo Hakala Vantaa 20.10.2005 HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos hyväksymispäivä arvosana arvostelija Assosiaatiosäännöt sekvensseissä Jarmo Hakala Vantaa 20.10.2005 HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos Tiivistelmä Assosiaatiosäännöt sekvensseissä on

Lisätiedot

Tiedonlouhinta (kl 2013) Kurssin kuvaus. Esitiedot. Kurssin arvostelu

Tiedonlouhinta (kl 2013) Kurssin kuvaus. Esitiedot. Kurssin arvostelu Tiedonlouhinta (kl 2013) Kurssin kuvaus 00 11 00 11 00 11 01 01 01 01 11000 111 11000 111 00 11 joko kandidaatti- tai maisteritason valinnainen kurssi Toteutus pääasiassa ongelmalähtöisesti (tiedonlouhintaprosessin

Lisätiedot

2 k -faktorikokeet. Vilkkumaa / Kuusinen 1

2 k -faktorikokeet. Vilkkumaa / Kuusinen 1 2 k -faktorikokeet Vilkkumaa / Kuusinen 1 Motivointi 2 k -faktorikoe on k-suuntaisen varianssianalyysin erikoistapaus, jossa kaikilla tekijöillä on vain kaksi tasoa, matala (-) ja korkea (+). 2 k -faktorikoetta

Lisätiedot

Kirjoita jokaiseen erilliseen vastauspaperiin kurssin nimi, tenttipäivä, oma nimesi (selkeästi), opiskelijanumerosi ja nimikirjoituksesi

Kirjoita jokaiseen erilliseen vastauspaperiin kurssin nimi, tenttipäivä, oma nimesi (selkeästi), opiskelijanumerosi ja nimikirjoituksesi Helsingin yliopisto, Tietojenkäsittelytieteen laitos Tietokantojen perusteet, kurssikoe 29.2.2012 (vastauksia) Liitteenä on tiivistelmä SQL-syntaksista Kirjoita jokaiseen erilliseen vastauspaperiin kurssin

Lisätiedot

(1) refleksiivinen, (2) symmetrinen ja (3) transitiivinen.

(1) refleksiivinen, (2) symmetrinen ja (3) transitiivinen. Matematiikassa ja muuallakin joudutaan usein tekemisiin sellaisten relaatioiden kanssa, joiden lakina on tietyn ominaisuuden samuus. Tietyn ominaisuuden samuus -relaatio on ekvivalenssi; se on (1) refleksiivinen,

Lisätiedot

E. Oja ja H. Mannila Datasta Tietoon: Luku 2

E. Oja ja H. Mannila Datasta Tietoon: Luku 2 2. DATASTA TIETOON: MITÄ DATAA; MITÄ TIETOA? 2.1. Data-analyysin ongelma Tulevien vuosien valtava haaste on digitaalisessa muodossa talletetun datan kasvava määrä Arvioita: Yhdysvaltojen kongressin kirjasto

Lisätiedot

Relevanttien sivujen etsintä verkosta: satunnaiskulut verkossa Linkkikeskukset ja auktoriteetit (hubs and authorities) -algoritmi

Relevanttien sivujen etsintä verkosta: satunnaiskulut verkossa Linkkikeskukset ja auktoriteetit (hubs and authorities) -algoritmi Kurssin loppuosa Diskreettejä menetelmiä laajojen 0-1 datajoukkojen analyysiin Kattavat joukot ja niiden etsintä tasoittaisella algoritmilla Relevanttien sivujen etsintä verkosta: satunnaiskulut verkossa

Lisätiedot

Reaalilukuvälit, leikkaus ja unioni (1/2)

Reaalilukuvälit, leikkaus ja unioni (1/2) Luvut Luonnolliset luvut N = {0, 1, 2, 3,... } Kokonaisluvut Z = {..., 2, 1, 0, 1, 2,... } Rationaaliluvut (jaksolliset desimaaliluvut) Q = {m/n m, n Z, n 0} Irrationaaliluvut eli jaksottomat desimaaliluvut

Lisätiedot

Matriisien tulo. Matriisit ja lineaarinen yhtälöryhmä

Matriisien tulo. Matriisit ja lineaarinen yhtälöryhmä Matriisien tulo Lause Olkoot A, B ja C matriiseja ja R Tällöin (a) A(B + C) =AB + AC, (b) (A + B)C = AC + BC, (c) A(BC) =(AB)C, (d) ( A)B = A( B) = (AB), aina, kun kyseiset laskutoimitukset on määritelty

Lisätiedot

Hilbertin aksioomat ja tarvittavat määritelmät Tiivistelmä Geometria-luentomonisteesta Heikki Pitkänen

Hilbertin aksioomat ja tarvittavat määritelmät Tiivistelmä Geometria-luentomonisteesta Heikki Pitkänen Hilbertin aksioomat ja tarvittavat määritelmät Tiivistelmä Geometria-luentomonisteesta Heikki Pitkänen 1. Hilbertin aksioomat 1-3 Oletetaan tunnetuiksi peruskäsitteet: piste, suora ja suora kulkee pisteen

Lisätiedot

Matematiikka B2 - Avoin yliopisto

Matematiikka B2 - Avoin yliopisto 6. elokuuta 2012 Opetusjärjestelyt Luennot 9:15-11:30 Harjoitukset 12:30-15:00 Tentti Kurssin sisältö (1/2) Matriisit Laskutoimitukset Lineaariset yhtälöryhmät Gaussin eliminointi Lineaarinen riippumattomuus

Lisätiedot

TAPAUS-VERROKKITUTKIMUS

TAPAUS-VERROKKITUTKIMUS TAPAUS-VERROKKI TUTKIMUKSEN TYYPIT JA TULOSTEN ANALYYSI Simo Näyhä Jari Jokelainen Kansanterveystieteen ja yleislääketieteen laitoksen jatkokoulutusmeeting.3.4.2007 TAPAUS-VERROKKITUTKIMUS Idea Tutkimusryhmät

Lisätiedot

Jarkko Peltomäki. Aliryhmän sentralisaattori ja normalisaattori

Jarkko Peltomäki. Aliryhmän sentralisaattori ja normalisaattori Jarkko Peltomäki Aliryhmän sentralisaattori ja normalisaattori Matematiikan aine Turun yliopisto Syyskuu 2009 Sisältö 1 Johdanto 2 2 Määritelmiä ja perusominaisuuksia 3 2.1 Aliryhmän sentralisaattori ja

Lisätiedot

kaikille a R. 1 (R, +) on kommutatiivinen ryhmä, 2 a(b + c) = ab + ac ja (b + c)a = ba + ca kaikilla a, b, c R, ja

kaikille a R. 1 (R, +) on kommutatiivinen ryhmä, 2 a(b + c) = ab + ac ja (b + c)a = ba + ca kaikilla a, b, c R, ja Renkaat Tarkastelemme seuraavaksi rakenteita, joissa on määritelty kaksi binääristä assosiatiivista laskutoimitusta, joista toinen on kommutatiivinen. Vaadimme muuten samat ominaisuudet kuin kokonaisluvuilta,

Lisätiedot

Nimitys Symboli Merkitys Negaatio ei Konjuktio ja Disjunktio tai Implikaatio jos..., niin... Ekvivalenssi... jos ja vain jos...

Nimitys Symboli Merkitys Negaatio ei Konjuktio ja Disjunktio tai Implikaatio jos..., niin... Ekvivalenssi... jos ja vain jos... 2 Logiikkaa Tässä luvussa tutustutaan joihinkin logiikan käsitteisiin ja merkintöihin. Lisätietoja ja tarkennuksia löytyy esimerkiksi Jouko Väänäsen kirjasta Logiikka I 2.1 Loogiset konnektiivit Väitelauseen

Lisätiedot

TAMPEREEN YLIOPISTO Pro gradu -tutkielma. Roosa Niemi. Riippuvuuslogiikkaa

TAMPEREEN YLIOPISTO Pro gradu -tutkielma. Roosa Niemi. Riippuvuuslogiikkaa TAMPEREEN YLIOPISTO Pro gradu -tutkielma Roosa Niemi Riippuvuuslogiikkaa Informaatiotieteiden yksikkö Matematiikka Syyskuu 2011 Tampereen yliopisto Informaatiotieteiden yksikkö ROOSA NIEMI: Riippuvuuslogiikkaa

Lisätiedot

Tietorakenteet ja algoritmit - syksy 2015 1

Tietorakenteet ja algoritmit - syksy 2015 1 Tietorakenteet ja algoritmit - syksy 2015 1 Tietorakenteet ja algoritmit - syksy 2015 2 Tietorakenteet ja algoritmit Johdanto Ari Korhonen Tietorakenteet ja algoritmit - syksy 2015 1. JOHDANTO 1.1 Määritelmiä

Lisätiedot

Opetuksen ja opiskelun tehokas ja laadukas havainnointi verkkooppimisympäristössä

Opetuksen ja opiskelun tehokas ja laadukas havainnointi verkkooppimisympäristössä Opetuksen ja opiskelun tehokas ja laadukas havainnointi verkkooppimisympäristössä Jukka Paukkeri (projektitutkija) Tampereen Teknillinen Yliopisto Matematiikan laitos Intelligent Information Systems Laboratory

Lisätiedot

Tietorakenteet ja algoritmit Johdanto Lauri Malmi / Ari Korhonen

Tietorakenteet ja algoritmit Johdanto Lauri Malmi / Ari Korhonen Tietorakenteet ja algoritmit Johdanto Lauri Malmi / Ari 1 1. JOHDANTO 1.1 Määritelmiä 1.2 Tietorakenteen ja algoritmin valinta 1.3 Algoritmit ja tiedon määrä 1.4 Tietorakenteet ja toiminnot 1.5 Esimerkki:

Lisätiedot

Käyttäjäkeskeisen suunnittelun periaatteet ja prosessit

Käyttäjäkeskeisen suunnittelun periaatteet ja prosessit Käyttäjäkeskeisen suunnittelun periaatteet ja prosessit Kurssilla: Johdatus käyttäjäkeskeiseen tuotekehitykseen 23.1.2008 Johanna Viitanen johanna.viitanen@soberit.hut.fi Luennon aiheet Tuotekehityksen

Lisätiedot

LAUSELOGIIKKA (1) Sanalliset ilmaisut ovat usein epätarkkoja. On ilmaisuja, joista voidaan sanoa, että ne ovat tosia tai epätosia, mutta eivät molempia. Ilmaisuja, joihin voidaan liittää totuusarvoja (tosi,

Lisätiedot

Tiedon louhinnan teoria (ja käytäntö) OUGF kevätseminaari 2004 Hannu Toivonen

Tiedon louhinnan teoria (ja käytäntö) OUGF kevätseminaari 2004 Hannu Toivonen Tiedon louhinnan teoria (ja käytäntö) OUGF kevätseminaari 2004 Hannu Toivonen hannu.toivonen@cs.helsinki.fi 1 2 A 1 4 8 2 2 1 2 6 2 A 2 4 3 7 3 2 8 4 2 A 4 5 2 4 5 5 2 6 4 A 7 2 3 7 5 4 5 2 2 A 5 2 4 6

Lisätiedot

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking)

7. Lohkominen ja sulautus 2 k kokeissa. Lohkominen (Blocking) 7. Lohkominen ja sulautus 2 k kokeissa Lohkominen (Blocking) Lohkotekijät muodostuvat faktoreista, joiden suhteen ei voida tehdä (täydellistä) satunnaistamista. Esimerkiksi faktorikokeessa raaka-aine-erät

Lisätiedot

Lukion matematiikkakilpailun alkukilpailu 2015

Lukion matematiikkakilpailun alkukilpailu 2015 Lukion matematiikkakilpailun alkukilpailu 015 Avoimen sarjan tehtävät ja niiden ratkaisuja 1. Olkoot a ja b peräkkäisiä kokonaislukuja, c = ab ja d = a + b + c. a) Osoita, että d on kokonaisluku. b) Mitä

Lisätiedot

1 Logiikkaa. 1.1 Logiikan symbolit

1 Logiikkaa. 1.1 Logiikan symbolit 1 Logiikkaa Tieteessä ja jokapäiväisessä elämässä joudutaan tekemään päätelmiä. Logiikassa tutkimuskohteena on juuri päättelyt. Sen sijaan päätelmien sisältöön ei niinkäään kiinnitetä huomiota. Päätelmät

Lisätiedot

Tiedonlouhinta 2013/L3 p. 1. Data-avaruus. Olk. muuttujat A 1,...,A k, joiden arvoalueet. Dom(A 1 ),...,Dom(A k ). Silloin D = Dom(A 1 )...

Tiedonlouhinta 2013/L3 p. 1. Data-avaruus. Olk. muuttujat A 1,...,A k, joiden arvoalueet. Dom(A 1 ),...,Dom(A k ). Silloin D = Dom(A 1 )... Luento 3: 1 Yleiset mallinnusperiaatteet ja 2 Riippuvuusanalyysi Yleiset mallinnusperiaatteet 1. Ongelman määrittely datan ja taustateorian ymmärtäminen 2. siprosessointi datan siivous, piirteiden eristys

Lisätiedot

n! k!(n k)! n = Binomikerroin voidaan laskea pelkästään yhteenlaskun avulla käyttäen allaolevia ns. palautuskaavoja.

n! k!(n k)! n = Binomikerroin voidaan laskea pelkästään yhteenlaskun avulla käyttäen allaolevia ns. palautuskaavoja. IsoInt Tietokoneiden muisti koostuu yksittäisistä muistisanoista, jotka nykyaikaisissa koneissa ovat 64 bitin pituisia. Muistisanan koko asettaa teknisen rajoituksen sille, kuinka suuria lukuja tietokone

Lisätiedot

HELIA 1 (17) Outi Virkki Tiedonhallinta 4.11.2000

HELIA 1 (17) Outi Virkki Tiedonhallinta 4.11.2000 HELIA 1 (17) Luento 4.5 Normalisointi... 2 Tavoitteet... 2 Attribuuttien väliset riippuvuudet... 4 Funktionaalinen / moniarvoinen riippuvuus... 4 Transitiivinen / suora riippuvuus... 6 Täydellinen / osittainen

Lisätiedot

Suunnittelumallien käyttö ja web-navimallit

Suunnittelumallien käyttö ja web-navimallit Käyttöliittymät II Luento 7 Suunnittelumallien käyttö ja web-navimallit Harjoitus 1: Asuntohaku-sovellus Harjoitus 2: Groups and Items Esimerkkejä muista kälisuunnittelumalleista Web-navigoinnin suunnittelumallit

Lisätiedot

Injektio (1/3) Funktio f on injektio, joss. f (x 1 ) = f (x 2 ) x 1 = x 2 x 1, x 2 D(f )

Injektio (1/3) Funktio f on injektio, joss. f (x 1 ) = f (x 2 ) x 1 = x 2 x 1, x 2 D(f ) Injektio (1/3) Määritelmä Funktio f on injektio, joss f (x 1 ) = f (x 2 ) x 1 = x 2 x 1, x 2 D(f ) Seurauksia: Jatkuva injektio on siis aina joko aidosti kasvava tai aidosti vähenevä Injektiolla on enintään

Lisätiedot

Globaali optimonti haastaa lokaalit menetelmät: luotettavampia riippuvuuksia tehosta tinkimättä

Globaali optimonti haastaa lokaalit menetelmät: luotettavampia riippuvuuksia tehosta tinkimättä Tietojenkäsittelytiede 34 (Huhtikuu 2012) sivut 6 16 Toimittaja: Jorma Tarhio c kirjoittaja(t) Globaali optimonti haastaa lokaalit menetelmät: luotettavampia riippuvuuksia tehosta tinkimättä Wilhelmiina

Lisätiedot

rm + sn = d. Siispä Proposition 9.5(4) nojalla e d.

rm + sn = d. Siispä Proposition 9.5(4) nojalla e d. 9. Renkaat Z ja Z/qZ Tarkastelemme tässä luvussa jaollisuutta kokonaislukujen renkaassa Z ja todistamme tuloksia, joita käytetään jäännösluokkarenkaan Z/qZ ominaisuuksien tarkastelussa. Jos a, b, c Z ovat

Lisätiedot

Esimerkkejä polynomisista ja ei-polynomisista ongelmista

Esimerkkejä polynomisista ja ei-polynomisista ongelmista Esimerkkejä polynomisista ja ei-polynomisista ongelmista Ennen yleisempiä teoriatarkasteluja katsotaan joitain tyypillisiä esimerkkejä ongelmista ja niiden vaativuudesta kaikki nämä ongelmat ratkeavia

Lisätiedot

11.4. Context-free kielet 1 / 17

11.4. Context-free kielet 1 / 17 11.4. Context-free kielet 1 / 17 Määritelmä Tyypin 2 kielioppi (lauseyhteysvapaa, context free): jos jokainenp :n sääntö on muotoa A w, missäa V \V T jaw V. Context-free kielet ja kieliopit ovat tärkeitä

Lisätiedot

v 8 v 9 v 5 C v 3 v 4

v 8 v 9 v 5 C v 3 v 4 Verkot Verkko on (äärellinen) matemaattinen malli, joka koostuu pisteistä ja pisteitä toisiinsa yhdistävistä viivoista. Jokainen viiva yhdistää kaksi pistettä, jotka ovat viivan päätepisteitä. Esimerkiksi

Lisätiedot

3 Lineaariset yhtälöryhmät ja Gaussin eliminointimenetelmä

3 Lineaariset yhtälöryhmät ja Gaussin eliminointimenetelmä 3 Lineaariset yhtälöryhmät ja Gaussin eliminointimenetelmä Lineaarinen m:n yhtälön yhtälöryhmä, jossa on n tuntematonta x 1,, x n on joukko yhtälöitä, jotka ovat muotoa a 11 x 1 + + a 1n x n = b 1 a 21

Lisätiedot

Matematiikan tukikurssi, kurssikerta 3

Matematiikan tukikurssi, kurssikerta 3 Matematiikan tukikurssi, kurssikerta 3 1 Epäyhtälöitä Aivan aluksi lienee syytä esittää luvun itseisarvon määritelmä: { x kun x 0 x = x kun x < 0 Siispä esimerkiksi 10 = 10 ja 10 = 10. Seuraavaksi listaus

Lisätiedot

Kurssikoe on maanantaina 29.6. Muista ilmoittautua kokeeseen viimeistään 10 päivää ennen koetta! Ilmoittautumisohjeet löytyvät kurssin kotisivuilla.

Kurssikoe on maanantaina 29.6. Muista ilmoittautua kokeeseen viimeistään 10 päivää ennen koetta! Ilmoittautumisohjeet löytyvät kurssin kotisivuilla. HY / Avoin ylioisto Johdatus yliopistomatematiikkaan, kesä 201 Harjoitus 7 Ratkaisut palautettava viimeistään perjantaina 26.6.201 klo 16.00. Huom! Luennot ovat salissa CK112 maanantaista 1.6. lähtien.

Lisätiedot

Insinöörimatematiikka IA

Insinöörimatematiikka IA Isiöörimatematiikka IA Harjoitustehtäviä. Selvitä oko propositio ( p q r ( p q r kotradiktio. Ratkaisu: Kirjoitetaa totuustaulukko: p q r ( p q r p q r ( p q r ( p q r 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

Lisätiedot

7.11.2006. Helsingin yliopisto/tktl Kyselykielet, s 2006 Relaatiokalkyylit. Harri Laine 1

7.11.2006. Helsingin yliopisto/tktl Kyselykielet, s 2006 Relaatiokalkyylit. Harri Laine 1 perusteita - relaatiokalkyylit perusteita - relaatiokalkyylit Relaatioalgebra on luonteeltaan proseduraalinen tapa käsitellä tietoa. Tiedon haetaan sarjaksi järjestettyjen operaatioiden avulla. Edellä

Lisätiedot

Pikapaketti logiikkaan

Pikapaketti logiikkaan Pikapaketti logiikkaan Tämän oppimateriaalin tarkoituksena on tutustua pikaisesti matemaattiseen logiikkaan. Oppimateriaalin asioita tarvitaan projektin tekemisessä. Kiinnostuneet voivat lukea lisää myös

Lisätiedot

Luku 2. Datasta tietoon: mitä dataa? mitä tietoa?

Luku 2. Datasta tietoon: mitä dataa? mitä tietoa? 1 / 14 Luku 2. Datasta tietoon: mitä dataa? mitä tietoa? T-61.2010 Datasta tietoon, syksy 2011 professori Erkki Oja Tietojenkäsittelytieteen laitos, Aalto-yliopisto 31.10.2011 2 / 14 Tämän luennon sisältö

Lisätiedot

DBN Mitä sillä tekee? Dynaamisten Bayes-verkkojen määrittely aikasarja-analyysissä Janne Toivola jtoivola@iki.fi

DBN Mitä sillä tekee? Dynaamisten Bayes-verkkojen määrittely aikasarja-analyysissä Janne Toivola jtoivola@iki.fi DBN Mitä sillä tekee? Dynaamisten Bayes-verkkojen määrittely aikasarja-analyysissä Janne Toivola jtoivola@iki.fi Historiaa Bayesin kaavan hyödyntäminen BN-ohjelmistoja ollut ennenkin Tanskalaisten Hugin

Lisätiedot

Funktion raja-arvo ja jatkuvuus Reaali- ja kompleksifunktiot

Funktion raja-arvo ja jatkuvuus Reaali- ja kompleksifunktiot 3. Funktion raja-arvo ja jatkuvuus 3.1. Reaali- ja kompleksifunktiot 43. Olkoon f monotoninen ja rajoitettu välillä ]a,b[. Todista, että raja-arvot lim + f (x) ja lim x b f (x) ovat olemassa. Todista myös,

Lisätiedot

Paikkaontologiat. Tomi Kauppinen ja Jari Väätäinen Aalto-yliopiston teknillinen korkeakoulu tomi.j.kauppinen at gmail.com

Paikkaontologiat. Tomi Kauppinen ja Jari Väätäinen Aalto-yliopiston teknillinen korkeakoulu tomi.j.kauppinen at gmail.com Paikkaontologiat Tomi Kauppinen ja Jari Väätäinen Aalto-yliopiston teknillinen korkeakoulu tomi.j.kauppinen at gmail.com Mihin tarvitaan paikkaontologioita? Jokainen meistä liittyy paikkoihin Esimerkkejä:

Lisätiedot

Lectio praecursoria. Satunnaistusalgoritmeja tiedonlouhinnan tulosten merkitsevyyden arviointiin. Markus Ojala. 12.

Lectio praecursoria. Satunnaistusalgoritmeja tiedonlouhinnan tulosten merkitsevyyden arviointiin. Markus Ojala. 12. Lectio praecursoria Satunnaistusalgoritmeja tiedonlouhinnan tulosten merkitsevyyden arviointiin Markus Ojala 12. marraskuuta 2011 Käsitteet Satunnaistusalgoritmeja tiedonlouhinnan tulosten merkitsevyyden

Lisätiedot

Laskennan vaativuus ja NP-täydelliset ongelmat

Laskennan vaativuus ja NP-täydelliset ongelmat Laskennan vaativuus ja NP-täydelliset ongelmat TRAK-vierailuluento 13.4.2010 Petteri Kaski Tietojenkäsittelytieteen laitos Tietojenkäsittelytiede Tietojenkäsittelytiede tutkii 1. mitä tehtäviä voidaan

Lisätiedot

Oppijan saama palaute määrää oppimisen tyypin

Oppijan saama palaute määrää oppimisen tyypin 281 5. KONEOPPIMINEN Älykäs agentti voi joutua oppimaan mm. seuraavia seikkoja: Kuvaus nykytilan ehdoilta suoraan toiminnolle Maailman relevanttien ominaisuuksien päätteleminen havaintojonoista Maailman

Lisätiedot

Talousmatematiikan perusteet, L3 Prosentti, yhtälöt Aiheet

Talousmatematiikan perusteet, L3 Prosentti, yhtälöt Aiheet Talousmatematiikan perusteet, L3 Prosentti, t Toisen Prosentti 1 Jos b on p% luvusta a, eli niin b = p 100 a a = perusarvo (Mihin verrataan?) (Minkä sadasosista on kysymys.) p = prosenttiluku (Miten monta

Lisätiedot

Assosiaatiosääntöjen johtaminen epäyhtenäisellä minimituella

Assosiaatiosääntöjen johtaminen epäyhtenäisellä minimituella Assosiaatiosääntöjen johtaminen epäyhtenäisellä minimituella Tina Willner 19.12.2003 Joensuun yliopisto Tietojenkäsittelytiede Pro gradu -tutkielma TIIVISTELMÄ Tietämyksen etsimisellä tarkoitetaan monivaiheista

Lisätiedot

HELIA 1 (21) Outi Virkki Tietokantasuunnittelu 20.9.2005

HELIA 1 (21) Outi Virkki Tietokantasuunnittelu 20.9.2005 HELIA 1 (21) Luento 7 Relaatiomallin kertausta... 2 Peruskäsitteet... 2 Relaatio... 4 Määritelmä... 4 Relaatiokaava (Relation schema)... 4 Relaatioinstanssi (Relation instance)... 4 Attribuutti ja arvojoukko...

Lisätiedot

Algebra I Matematiikan ja tilastotieteen laitos Ratkaisuehdotuksia harjoituksiin 6 (8 sivua) OT. 1. a) Määritä seuraavat summat:

Algebra I Matematiikan ja tilastotieteen laitos Ratkaisuehdotuksia harjoituksiin 6 (8 sivua) OT. 1. a) Määritä seuraavat summat: Algebra I Matematiikan ja tilastotieteen laitos Ratkaisuehdotuksia harjoituksiin 6 (8 sivua) 21.2.-25.2.2011 OT 1. a) Määritä seuraavat summat: [2] 4 + [3] 4, [2] 5 + [3] 5, [2] 6 + [2] 6 + [2] 6, 7 [3]

Lisätiedot

Lineaarialgebra ja matriisilaskenta I

Lineaarialgebra ja matriisilaskenta I Lineaarialgebra ja matriisilaskenta I 29.5.2013 HY / Avoin yliopisto Jokke Häsä, 1/26 Kertausta: Kanta Määritelmä Oletetaan, että w 1, w 2,..., w k W. Vektorijono ( w 1, w 2,..., w k ) on aliavaruuden

Lisätiedot

Preliminäärikoe Pitkä Matematiikka 3.2.2009

Preliminäärikoe Pitkä Matematiikka 3.2.2009 Preliminäärikoe Pitkä Matematiikka..9 x x a) Ratkaise yhtälö =. 4 b) Ratkaise epäyhtälö x > x. c) Sievennä lauseke ( a b) (a b)(a+ b).. a) Osakkeen kurssi laski aamupäivällä,4 % ja keskipäivällä 5,6 %.

Lisätiedot

Sanomme, että kuvaus f : X Y on injektio, jos. x 1 x 2 f (x 1 ) f (x 2 ) eli f (x 1 ) = f (x 2 ) x 1 = x 2.

Sanomme, että kuvaus f : X Y on injektio, jos. x 1 x 2 f (x 1 ) f (x 2 ) eli f (x 1 ) = f (x 2 ) x 1 = x 2. Sanomme, että kuvaus f : X Y on injektio, jos x 1 x 2 f (x 1 ) f (x 2 ) eli f (x 1 ) = f (x 2 ) x 1 = x 2. Siis kuvaus on injektio, jos eri alkiot kuvautuvat eri alkioille eli maalijoukon jokainen alkio

Lisätiedot

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet

1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet VAASAN YLIOPISTO/AVOIN YLIOPISTO TILASTOTIETEEN PERUSTEET Harjoituksia 1 KURSSIKYSELYAINEISTO: 1. Työpaikan työntekijöistä laaditussa taulukossa oli mm. seuraavat rivit ja sarakkeet Nimi Ikä v. Asema Palkka

Lisätiedot

Relaation ominaisuuksia. Ominaisuuksia koskevia lauseita Sulkeumat. Joukossa X määritelty relaatio R on. (ir) irrefleksiivinen, jos x Rx kaikilla x X,

Relaation ominaisuuksia. Ominaisuuksia koskevia lauseita Sulkeumat. Joukossa X määritelty relaatio R on. (ir) irrefleksiivinen, jos x Rx kaikilla x X, Relaation Joukossa X määritelty relaatio R on (r) refleksiivinen, jos xrx kaikilla x X, (ir) irrefleksiivinen, jos x Rx kaikilla x X, Relaation Joukossa X määritelty relaatio R on (r) refleksiivinen, jos

Lisätiedot

Ontologiakirjasto ONKI-Paikka

Ontologiakirjasto ONKI-Paikka Ontologiakirjasto ONKI-Paikka Tomi Kauppinen, Robin Lindroos, Riikka Henriksson, Eero Hyvönen Semantic Computing Research Group (SeCo) and University of Helsinki and Helsinki University of Technology (TKK)

Lisätiedot

SQL-perusteet, SELECT-, INSERT-, CREATE-lauseet

SQL-perusteet, SELECT-, INSERT-, CREATE-lauseet SQL-perusteet, SELECT-, INSERT-, CREATE-lauseet A271117, Tietokannat Teemu Saarelainen teemu.saarelainen@kyamk.fi Lähteet: Leon Atkinson: core MySQL Ari Hovi: SQL-opas TTY:n tietokantojen perusteet-kurssin

Lisätiedot

Matemaatikot ja tilastotieteilijät

Matemaatikot ja tilastotieteilijät Matemaatikot ja tilastotieteilijät Matematiikka/tilastotiede ammattina Tilastotiede on matematiikan osa-alue, lähinnä todennäköisyyslaskentaa, mutta se on myös itsenäinen tieteenala. Tilastotieteen tutkijat

Lisätiedot

Tiedonhallinnan perusteet. Viikko 1 Jukka Lähetkangas

Tiedonhallinnan perusteet. Viikko 1 Jukka Lähetkangas Tiedonhallinnan perusteet Viikko 1 Jukka Lähetkangas Kurssilla käytävät asiat Tietokantojen toimintafilosofian ja -tekniikan perusteet Tiedonsäilönnän vaihtoehdot Tietokantojen suunnitteleminen internetiä

Lisätiedot

Johdatus tekoälyyn. Luento 6.10.2011: Koneoppiminen. Patrik Hoyer. [ Kysykää ja kommentoikaa luennon aikana! ]

Johdatus tekoälyyn. Luento 6.10.2011: Koneoppiminen. Patrik Hoyer. [ Kysykää ja kommentoikaa luennon aikana! ] Johdatus tekoälyyn Luento 6.10.2011: Koneoppiminen Patrik Hoyer [ Kysykää ja kommentoikaa luennon aikana! ] Koneoppiminen? Määritelmä: kone = tietokone, tietokoneohjelma oppiminen = ongelmanratkaisukyvyn

Lisätiedot

Matriisit, kertausta. Laskutoimitukset. Matriisikaavoja. Aiheet. Määritelmiä ja merkintöjä. Laskutoimitukset. Matriisikaavoja. Matriisin transpoosi

Matriisit, kertausta. Laskutoimitukset. Matriisikaavoja. Aiheet. Määritelmiä ja merkintöjä. Laskutoimitukset. Matriisikaavoja. Matriisin transpoosi Matriisit, kertausta Merkintöjä 1 Matriisi on suorakulmainen lukukaavio. Matriiseja ovat esimerkiksi: ( 2 0.4 8 0 2 1 ) ( 0, 4 ), ( ) ( 1 4 2, a 11 a 12 a 21 a 22 ) Kaavio kirjoitetaan kaarisulkujen väliin

Lisätiedot

Computing Curricula 2001 -raportin vertailu kolmeen suomalaiseen koulutusohjelmaan

Computing Curricula 2001 -raportin vertailu kolmeen suomalaiseen koulutusohjelmaan Computing Curricula 2001 -raportin vertailu kolmeen suomalaiseen koulutusohjelmaan CC1991:n ja CC2001:n vertailu Tutkintovaatimukset (degree requirements) Kahden ensimmäisen vuoden opinnot Ohjelmistotekniikan

Lisätiedot

Täydentäviä muistiinpanoja jäsennysalgoritmeista

Täydentäviä muistiinpanoja jäsennysalgoritmeista äydentäviä muistiinpanoja jäsennysalgoritmeista Antti-Juhani Kaijanaho 7. helmikuuta 2012 1 simerkki arleyn algoritmin soveltamisesta arkastellaan kielioppia G : + () c ja sovelletaan arleyn algoritmia

Lisätiedot

Relaatioista TIETOJENKÄSITTELYTIETEIDEN LAITOS, JUHA IISAKKA 11-14

Relaatioista TIETOJENKÄSITTELYTIETEIDEN LAITOS, JUHA IISAKKA 11-14 Relaatioista Sarakenimistä relaation kaava tulisi olla yksiselitteinen attribuutin roolinimen tulisi auttaa ymmärtämään attribuutin tarkoituksen OSASTO(NIMI,NRO, TNRO, SIJAINTI) mitä tarkoittaa TNRO? viiteavaimella

Lisätiedot

T Syksy 2006 Tietojenkäsittelyteorian perusteet T Harjoitus 7 Demonstraatiotehtävien ratkaisut

T Syksy 2006 Tietojenkäsittelyteorian perusteet T Harjoitus 7 Demonstraatiotehtävien ratkaisut T-79.1001 Syksy 2006 Tietojenkäsittelyteorian perusteet T Harjoitus 7 Demonstraatiotehtävien ratkaisut Lemma (Säännöllisten kielten pumppauslemma). Olkoon A säännöllinen kieli. Tällöin on olemassa n 1

Lisätiedot

T Syksy 2004 Logiikka tietotekniikassa: perusteet Laskuharjoitus 7 (opetusmoniste, kappaleet )

T Syksy 2004 Logiikka tietotekniikassa: perusteet Laskuharjoitus 7 (opetusmoniste, kappaleet ) T-79144 Syksy 2004 Logiikka tietotekniikassa: perusteet Laskuharjoitus 7 (opetusmoniste, kappaleet 11-22) 26 29102004 1 Ilmaise seuraavat lauseet predikaattilogiikalla: a) Jokin porteista on viallinen

Lisätiedot

Funktiot. funktioita f : A R. Yleensä funktion määrittelyjoukko M f = A on jokin väli, muttei aina.

Funktiot. funktioita f : A R. Yleensä funktion määrittelyjoukko M f = A on jokin väli, muttei aina. Funktiot Tässä luvussa käsitellään reaaliakselin osajoukoissa määriteltyjä funktioita f : A R. Yleensä funktion määrittelyjoukko M f = A on jokin väli, muttei aina. Avoin väli: ]a, b[ tai ]a, [ tai ],

Lisätiedot

Nopea kertolasku, Karatsuban algoritmi

Nopea kertolasku, Karatsuban algoritmi Nopea kertolasku, Karatsuban algoritmi Mikko Männikkö 16.8.2004 Lähde: ((Gathen and Gerhard 1999) luku II.8) Esityksen kulku Algoritmien analysointia (1), (2), (3), (4) Klassinen kertolasku Parempi tapa

Lisätiedot

Sisällys. 11. Javan toistorakenteet. Laskurimuuttujat. Yleistä

Sisällys. 11. Javan toistorakenteet. Laskurimuuttujat. Yleistä Sisällys 11. Javan toistorakenteet Laskuri- ja lippumuuttujat.. Tyypillisiä ohjelmointivirheitä: Silmukan rajat asetettu kierroksen verran väärin. Ikuinen silmukka. Silmukoinnin lopettaminen break-lauseella.

Lisätiedot

BOOTSTRAPPING? Jukka Nyblom Jyväskylän yliopisto. Metodifestivaali

BOOTSTRAPPING? Jukka Nyblom Jyväskylän yliopisto. Metodifestivaali BOOTSTRAPPING? Jukka Nyblom Jyväskylän yliopisto Metodifestivaali 28.5.2009 1 1 Mitä ihmettä on bootstrap? Webster: 1. a loop of leather or cloth sewn at the top rear, or sometimes on each side of a boot

Lisätiedot

Tärkeää huomioitavaa:

Tärkeää huomioitavaa: Siirtymäohjeistus tietotekniikan kandivaiheen opiskelijoille 2005 tutkintorakenteesta 2013 Teknistieteellisen kandidaattiohjelman tietotekniikan pääaineeseen Tärkeää huomioitavaa: Yli 7 vuotta vanhoilla

Lisätiedot

TIETOJENKÄSITTELYTIEDE

TIETOJENKÄSITTELYTIEDE TIETOJENKÄSITTELYTIEDE Tietojenkäsittelytieteen laitos Exactum (Kumpulan kampus) PL 68 (Gustaf Hällströmin katu 2b) 00014 Helsingin yliopisto Puhelinnumero 02941 911 (vaihde), ohivalinta 02941... http://www.cs.helsinki.fi/

Lisätiedot

CSE-A1200 Tietokannat

CSE-A1200 Tietokannat CSE-A1200 Tietokannat 29.3.2016 CSE-A1200 Tietokannat 29.3.2016 1 / 40 Oppimistavoitteet: tämän luennon jälkeen Tiedät, miten tietokannan relaatioiden (taulujen) määrittelyt kirjoitetaan SQL:llä. Osaat

Lisätiedot

Testit järjestysasteikollisille muuttujille

Testit järjestysasteikollisille muuttujille Ilkka Mellin Tilastolliset menetelmät Osa 3: Tilastolliset testit Testit järjestysasteikollisille muuttujille TKK (c) Ilkka Mellin (2007) 1 Testit järjestysasteikollisille muuttujille >> Järjestysasteikollisten

Lisätiedot

renkaissa. 0 R x + x =(0 R +1 R )x =1 R x = x

renkaissa. 0 R x + x =(0 R +1 R )x =1 R x = x 8. Renkaat Tarkastelemme seuraavaksi rakenteita, joissa on määritelty kaksi assosiatiivista laskutoimitusta, joista toinen on kommutatiivinen. Vaadimme näiltä kahdella laskutoimituksella varustetuilta

Lisätiedot

Pyramidi 9 Trigonometriset funktiot ja lukujonot 15.4.2011 HK1-1. Dsin3 x. 3cos3x. Dsinx. u( x) sinx ja u ( x) cosx. Dsin. Dsin

Pyramidi 9 Trigonometriset funktiot ja lukujonot 15.4.2011 HK1-1. Dsin3 x. 3cos3x. Dsinx. u( x) sinx ja u ( x) cosx. Dsin. Dsin Pyramidi 9 Trigonometriset funktiot ja lukujonot 5.4.0 HK- a) Dsin3 us ( ) cos3 3 us( ) s( ) 3cos3 s( ) 3 ja s( ) 3 u( ) sin ja u( ) cos b) Dsin 3 3 Dsin us ( ) s( ) sin ja s( ) cos 3 u( ) ja u( ) 3 3sin

Lisätiedot

Probabilistiset mallit (osa 2) Matemaattisen mallinnuksen kurssi Kevät 2002, luento 10, osa 2 Jorma Merikoski Tampereen yliopisto

Probabilistiset mallit (osa 2) Matemaattisen mallinnuksen kurssi Kevät 2002, luento 10, osa 2 Jorma Merikoski Tampereen yliopisto Probabilistiset mallit (osa 2) Matemaattisen mallinnuksen kurssi Kevät 2002, luento 10, osa 2 Jorma Merikoski Tampereen yliopisto Esimerkki Tarkastelemme ilmiötä I, joka on a) tiettyyn kauppaan tulee asiakkaita

Lisätiedot

LAUSEKKEET JA NIIDEN MUUNTAMINEN

LAUSEKKEET JA NIIDEN MUUNTAMINEN LAUSEKKEET JA NIIDEN MUUNTAMINEN 1 LUKULAUSEKKEITA Ratkaise seuraava tehtävä: Retkeilijät ajoivat kahden tunnin ajan polkupyörällä maantietä pitkin 16 km/h nopeudella, ja sitten vielä kävelivät metsäpolkua

Lisätiedot

Ohjelmoinnin perusteet Y Python

Ohjelmoinnin perusteet Y Python Ohjelmoinnin perusteet Y Python T-106.1208 25.2.2009 T-106.1208 Ohjelmoinnin perusteet Y 25.2.2009 1 / 34 Syötteessä useita lukuja samalla rivillä Seuraavassa esimerkissä käyttäjä antaa useita lukuja samalla

Lisätiedot

Todennäköisyyden ominaisuuksia

Todennäköisyyden ominaisuuksia Todennäköisyyden ominaisuuksia 0 P(A) 1 (1) P(S) = 1 (2) A B = P(A B) = P(A) + P(B) (3) P(A) = 1 P(A) (4) P(A B) = P(A) + P(B) P(A B) (5) Tapahtuman todennäköisyys S = {e 1,..., e N }. N A = A. Kun alkeistapaukset

Lisätiedot

Käyttökokemuksen evaluoinnista käyttökokemuksen ohjaamaan suunnitteluun. ecommunication & UX SUMMIT 18.9.2013 Eija Kaasinen, VTT

Käyttökokemuksen evaluoinnista käyttökokemuksen ohjaamaan suunnitteluun. ecommunication & UX SUMMIT 18.9.2013 Eija Kaasinen, VTT Käyttökokemuksen evaluoinnista käyttökokemuksen ohjaamaan suunnitteluun ecommunication & UX SUMMIT 18.9.2013 Eija Kaasinen, VTT 2 Hyvä käyttökokemus Laadukas käyttökokemus Ylivoimainen käyttäjäkokemus

Lisätiedot

= true C = true) θ i2. = true C = false) Näiden arvot löydetään kuten edellä Kun verkko on opetettu, niin havainto [x 1

= true C = true) θ i2. = true C = false) Näiden arvot löydetään kuten edellä Kun verkko on opetettu, niin havainto [x 1 35 Naiivi Bayes Luokkamuuttua C o Bayes-verko uuri a attribuutit X i ovat se lehtiä Naiivi oletus o, että attribuutit ovat ehdollisesti riippumattomia toisistaa aettua luokka Ku käytössä o Boole muuttuat,

Lisätiedot

Maksimit ja minimit 1/5 Sisältö ESITIEDOT: reaalifunktiot, derivaatta

Maksimit ja minimit 1/5 Sisältö ESITIEDOT: reaalifunktiot, derivaatta Maksimit ja minimit 1/5 Sisältö Funktion kasvavuus ja vähenevyys; paikalliset ääriarvot Jos derivoituvan reaalifunktion f derivaatta tietyssä pisteessä on positiivinen, f (x 0 ) > 0, niin funktion tangentti

Lisätiedot

1. (a) Seuraava algoritmi tutkii, onko jokin luku taulukossa monta kertaa:

1. (a) Seuraava algoritmi tutkii, onko jokin luku taulukossa monta kertaa: Tietorakenteet, laskuharjoitus 10, ratkaisuja 1. (a) Seuraava algoritmi tutkii, onko jokin luku taulukossa monta kertaa: SamaLuku(T ) 2 for i = 1 to T.length 1 3 if T [i] == T [i + 1] 4 return True 5 return

Lisätiedot

Tähtitieteen käytännön menetelmiä Kevät 2009

Tähtitieteen käytännön menetelmiä Kevät 2009 Tähtitieteen käytännön menetelmiä Kevät 2009 2009-01-12 Yleistä Luennot Luennoija hannu.p.parviainen@helsinki.fi Aikataulu Observatoriolla Maanantaisin 10.00-12.00 Ohjattua harjoittelua maanantaisin 9.00-10.00

Lisätiedot

Luonnollisen kielen tilastollinen käsittely. T-61.281 (3 ov) L. Luento 2, 21.1.2003. Luentokalvot: Krista Lagus ja Timo Honkela

Luonnollisen kielen tilastollinen käsittely. T-61.281 (3 ov) L. Luento 2, 21.1.2003. Luentokalvot: Krista Lagus ja Timo Honkela Luonnollisen kielen tilastollinen käsittely T-61.281 (3 ov) L Luento 2, 21.1.2003 Luennot: Laskuharjoitukset: Timo Honkela Vesa Siivola Luentokalvot: Krista Lagus ja Timo Honkela 0.1 Laskuharjoitukset

Lisätiedot

Parinmuodostuksesta tietojenkäsittelytieteen silmin. Petteri Kaski Tietojenkäsittelytieteen laitos Aalto-yliopisto

Parinmuodostuksesta tietojenkäsittelytieteen silmin. Petteri Kaski Tietojenkäsittelytieteen laitos Aalto-yliopisto Parinmuodostuksesta tietojenkäsittelytieteen silmin Petteri Kaski Tietojenkäsittelytieteen laitos Aalto-yliopisto Suomalainen Tiedeakatemia Nuorten Akatemiaklubi 18.10.2010 Sisältö Mitä tietojenkäsittelytieteessä

Lisätiedot

Äärettömät sanat. Aleksi Saarela. Matematiikan ja tilastotieteen laitos ja FUNDIM-keskus, Turun yliopisto. A. Saarela (TY) Äärettömät sanat 1 / 28

Äärettömät sanat. Aleksi Saarela. Matematiikan ja tilastotieteen laitos ja FUNDIM-keskus, Turun yliopisto. A. Saarela (TY) Äärettömät sanat 1 / 28 Äärettömät sanat Aleksi Saarela Matematiikan ja tilastotieteen laitos ja FUNDIM-keskus, Turun yliopisto A. Saarela (TY) Äärettömät sanat 1 / 28 1 Sanojen kombinatoriikan taustaa 2 Esimerkkejä äärettömistä

Lisätiedot

Tutki ja kirjoita -kurssi, s-2005

Tutki ja kirjoita -kurssi, s-2005 Teoreettisen tutkimuksen raportoinnista Tutki ja kirjoita -kurssi, s-2005 Pekka Kilpeläinen Kuopion yliopisto Tietojenkäsittelytieteen laitos Teoreettisen tutkimuksen raportoinnista p.1/14 Sisältö Algoritmisten

Lisätiedot

SUDOKU - ratkaisuohjeet. Jarno Tuimala 18.9.2005

SUDOKU - ratkaisuohjeet. Jarno Tuimala 18.9.2005 SUDOKU - ratkaisuohjeet Jarno Tuimala 18.9.2005 Japanilainen sudoku Seuraavassa on esitetty ohjeet japanilaistyyppisten sudoku-ristikoiden ratkontaan. Japanilaisia ristikoita luonnehtivat seuraavat piirteet:

Lisätiedot

Tutkimusmenetelmät-kurssi, s-2004

Tutkimusmenetelmät-kurssi, s-2004 Algoritmitutkimuksen menetelmistä Tutkimusmenetelmät-kurssi, s-2004 Pekka Kilpeläinen Kuopion yliopisto Tietojenkäsittelytieteen laitos Algoritmitutkimuksen menetelmistä p.1/20 Sisällys Tänään Tietojenkäsittelytiede

Lisätiedot

VETUMA-PALVELUN PALVELINVARMENTEET

VETUMA-PALVELUN PALVELINVARMENTEET Sivu 1 Versio: 3.4, 19.12.2014 VETUMA-PALVELUN PALVELINVARMENTEET 1 (18) Sivu 2 Versio: 3.4, 19.12.2014 Sisällysluettelo 1. Johdanto... 3 2. Testiympäristö... 3 2.1 Vetuma-palvelun testiympäristö... 3

Lisätiedot

a b c d + + + + + + + + +

a b c d + + + + + + + + + 28. 10. 2010!"$#&%(')'+*(#-,.*/1032/465$*784 /(9:*;9."$ *;5> *@9 a b c d 1. + + + 2. 3. 4. 5. 6. + + + + + + + + + + P1. Valitaan kannaksi sivu, jonka pituus on 4. Koska toinen jäljelle jäävistä sivuista

Lisätiedot

Kansainväliset matematiikkaolympialaiset 2008

Kansainväliset matematiikkaolympialaiset 2008 Kansainväliset matematiikkaolympialaiset 2008 Tehtävät ja ratkaisuhahmotelmat 1. Teräväkulmaisen kolmion ABC korkeusjanojen leikkauspiste on H. Pisteen H kautta kulkeva ympyrä, jonka keskipiste on sivun

Lisätiedot

Teema 4. Homomorfismeista Ihanne ja tekijärengas. Teema 4 1 / 32

Teema 4. Homomorfismeista Ihanne ja tekijärengas. Teema 4 1 / 32 1 / 32 Esimerkki 4A.1 Esimerkki 4A.2 Esimerkki 4B.1 Esimerkki 4B.2 Esimerkki 4B.3 Esimerkki 4C.1 Esimerkki 4C.2 Esimerkki 4C.3 2 / 32 Esimerkki 4A.1 Esimerkki 4A.1 Esimerkki 4A.2 Esimerkki 4B.1 Esimerkki

Lisätiedot

Kombinatorinen optimointi

Kombinatorinen optimointi Kombinatorinen optimointi Sallittujen pisteiden lukumäärä on äärellinen Periaatteessa ratkaisu löydetään käymällä läpi kaikki pisteet Käytännössä lukumäärä on niin suuri, että tämä on mahdotonta Usein

Lisätiedot

Talousmatematiikan perusteet ORMS.1030

Talousmatematiikan perusteet ORMS.1030 orms.1030 Vaasan yliopisto / kevät 2015 Talousmatematiikan perusteet Matti Laaksonen Matemaattiset tieteet, Vaasan yliopisto Vastaanotto to 11-12 huone D110/Tervahovi Sähköposti: matti.laaksonen@uva.fi

Lisätiedot

Matematiikan ja tilastotieteen laitos Algebra I - Kesä 2009 Ratkaisuehdoituksia harjoituksiin 8 -Tehtävät 3-6 4 sivua Heikki Koivupalo ja Rami Luisto

Matematiikan ja tilastotieteen laitos Algebra I - Kesä 2009 Ratkaisuehdoituksia harjoituksiin 8 -Tehtävät 3-6 4 sivua Heikki Koivupalo ja Rami Luisto Matematiikan ja tilastotieteen laitos Algebra I - Kesä 2009 Ratkaisuehdoituksia harjoituksiin 8 -Tehtävät 3-6 4 sivua Heikki Koivupalo ja Rami Luisto 3. Oletetaan, että kunnan K karakteristika on 3. Tutki,

Lisätiedot