Helsingin yliopisto, TKTL Tietokantojen perusteet, k 2000 Tietokannan suunnittelusta Harri Laine 1

Samankaltaiset tiedostot
Tietokantasuunnittelun pääperiaatteena on tiedon toiston välttäminen. Tiedon toistumiseen liittyy monenlaisia ongelmia.

Helsingin yliopisto, TKTL Tietokantojen perusteet, k 2004 Tietokannan suunnittelusta. Harri Laine 1

Tietokantasuunnittelun pääperiaatteena on tiedon toiston välttäminen. Tiedon toistumiseen liittyy monenlaisia ongelmia.

Tietokantojen perusteet k2004helsingin yliopisto/tktl Tietokantojen perusteet, k 2006 relaatioalgebra. Harri Laine 1

Tietokantasuunnittelun pääperiaatteena on tiedon toiston välttäminen. Tiedon toistumiseen liittyy monenlaisia ongelmia

Tietokantasuunnittelun pääperiaatteena on tiedon toiston välttäminen. Tiedon toistumiseen liittyy monenlaisia ongelmia

Relaatiotietokantojen perusteista. Harri Laine Helsingin yliopisto

Helsingin yliopisto, Tietojenkäsittelytieteen laitos Tietokantojen perusteet, , H.Laine

TIEDONHALLINNAN PERUSTEET - SYKSY 2013

Ohjelmistojen mallintamisen ja tietokantojen perusteiden yhteys

HELIA 1 (17) Outi Virkki Tiedonhallinta

Kirjoita jokaiseen erilliseen vastauspaperiin kurssin nimi, tenttipäivä, oma nimesi (selkeästi), opiskelijanumerosi ja nimikirjoituksesi

Tietokantojen suunnittelu, relaatiokantojen perusteita

Helsingin yliopisto/tktl DO Tietokantojen perusteet, s 2000 Relaatiomallin peruskäsitteet Harri Laine 1. Relaatiotietokannat DONOTP

Helsingin yliopisto Tietojenkäsittelytieteen laitos (H.Laine) Tietokantojen perusteet. Liitteenä: Tiivistelmä SQL-syntaksista

Tietokantojen perusteet k2004helsingin yliopisto/tktl Tietokantojen perusteet, s 2005 relaatiomalli Harri Laine 1.

Tietokannan suunnittelu

On autoja, henkilöitä, Henkilöllä on nimi Autolla on omistaja, joka on henkilö. Taulu AUTO(rekno, malli) Taulu HENKILO(nimi, )

Tietomallit. Näkökulmat tietoon. Näkökulmat tietoon. Mitä malleja olisi tarjolla? Abstraktiotasot tiedon käsittelyssä

Relaatiomalli ja -tietokanta

TIETOKANNAN NORMALISOINTI JA NORMAALIMUODOT

Insert lauseella on kaksi muotoa: insert into taulu [(sarakenimet)] values (arvot)

Kirjoita kuhunkin erilliseen vastauspaperiin kurssin nimi, tentin päiväys, oma nimesi, syntymäaikasi ja nimikirjoituksesi.

TIEDONHALLINTA - SYKSY Luento 7. Pasi Ranne /10/17 Helsinki Metropolia University of Applied Sciences

Ohjelmistojen mallintaminen Luokkakaaviot Harri Laine 1

HELIA 1 (17) Outi Virkki Tiedonhallinta

Ohjelmistojen mallintaminen luokkamallin lisäpiirteitä

Esimerkki. pankkien talletus- ja lainatietokanta: Yhdiste, leikkaus, erotus ym. Leikkaus (intersect) Yhdiste (Union) Erotus (except/minus) Leikkaus

HELIA TIKO-05 1 (20) ICT03D Tieto ja tiedon varastointi O.Virkki

3. Käsiteanalyysi ja käsitekaavio

Yhdiste, leikkaus, erotus ym.

SQL-perusteet, SELECT-, INSERT-, CREATE-lauseet

NORMALISOINTI TIETOJEN MALLINNUS JOUNI HUOTARI & ARI HOVI

2. Käsiteanalyysi ja relaatiomalli

Johdatus sovellussuunnitteluun, s99, osa3 Helsingin yliopisto;/tktl Harri Laine 1. Olioiden väliset yhteydet. Olioiden väliset yhteydet

Nimi: Henkilötunnus: {id} {+id}

Luokkakaavion laatiminen

TIEDONHALLINTA - SYKSY Luento 2. Pasi Ranne /8/17 Helsinki Metropolia University of Applied Sciences

Yhteydelle voi antaa nimen kumpaankin suuntaan Sille ei tarvise antaa lainkaan nimeä Yhteysnimen asemasta tai lisäksi voidaan käyttää roolinimiä

Helsingin yliopisto/tktl Tietokantojen perusteet, k 2003 Relaatiomallin peruskäsitteet Harri Laine 1. Tietomallit. Näkökulmat tietoon

Ohjelmistotekniikan menetelmät, luokkamallin laatiminen

Johdatus sovellussuunnitteluun, s99, osa3 Helsingin yliopisto;/tktl Harri Laine 1. Olioiden väliset yhteydet. Olioiden väliset yhteydet

FROM-lausekkeessa voidaan määritellä useampi kuin yksi taulu, josta tietoja haetaan: Tuloksena on taululistassa lueteltujen taulujen rivien

Relaatioalgebra. Kyselyt:

Tietomallit. Näkökulmat tietoon. Näkökulmat tietoon. Näkökulmat tietoon. Abstraktiotasot tiedon käsittelyssä

HAAGA-HELIA Heti-09 1 (12) ICT05 Tiedonhallinta ja Tietokannat O.Virkki Näkymät

HELIA 1 (21) Outi Virkki Tietokantasuunnittelu

Tietokannat II -kurssin harjoitustyö

TIEDONHALLINTA - SYKSY Luento 10. Hannu Markkanen /10/12 Helsinki Metropolia University of Applied Sciences

TIEDONHALLINTA - SYKSY Luento 11. Hannu Markkanen /10/12 Helsinki Metropolia University of Applied Sciences

Relaatioalgebra. Relaatioalgebra. Relaatioalgebra. Relaatioalgebra - erotus (set difference) Kyselyt:

HELIA 1 (11) Outi Virkki Tiedonhallinta

Tiedonhallinnan perusteet. Viikko 1 Jukka Lähetkangas

POLKU LUOKKAKAAVIOISTA TAULUJEN TOTEUTUKSEEN

Johdatus sovellussuunnitteluun, s 2001, osa 4b Helsingin yliopisto / TKTL Harri Laine / Inkeri Verkamo 1. Luokkakaavion tarkoitus

HELIA 1 (20) Outi Virkki Tiedonhallinta

Kyselyt: Lähtökohtana joukko lukuja Laskukaava kertoo miten luvuista lasketaan tulos soveltamalla laskentaoperaatioita

UML - unified modeling language

millainen on se kohde, jota tiedoilla pitäisi kuvata asiat, joita pitäisi esittää Mitä tietoelementtien arvot tarkoittavat

Luento 3 Tietokannan tietosisällön suunnittelu

HELIA 1 (12) Outi Virkki Tiedonhallinta

Oliotietokannat. Nääsvillen Oliopäivät Pekka Kähkipuro Kehitysjohtaja, FT

Tietokantakurssit / TKTL

SELECT-lauseen perusmuoto

HOJ Haja-aiheita. Ville Leppänen. HOJ, c Ville Leppänen, IT, Turun yliopisto, 2012 p.1/10

Kyselyn yleisrakenne:

Ohjelmistotekniikan menetelmät Luokkamallit ohjelmiston mallintamisessa Harri Laine 1

Analyysi, staattinen mallintaminen, kohdealueen malli ja luokkakaavio

Tietokannan hallinta. Kevät 2004 Jan Lindström R&G Chapter 1

1. Tarkastellaan seuraavaa kaaviota

Haaga-Helia / TIKO-05 1 (12) Tietokannan suunnittelu ja Toteutus Outi Virkki

Lisätään avainarvo 1, joka mahtuu lehtitasolle:

Helsingin yliopisto/ tktl D Tietokantojen perusteet, s 2000 Relaatioalgebra. Harri Laine 1. Relaatioalgebra.

Tietokantojen perusteet k2004helsingin yliopisto/tktl Tietokantojen perusteet, s 2007 ER-mallin peruskäsitteet.

Jouni Huotari & Ari Hovi. Käsitemallinnuksesta relaatiokantaan KÄSITEMALLI. LOOGINEN MALLI: tietomalli valittu. FYYSINEN MALLI: DBMS valittu

Helsingin yliopisto/ tktl DO Tietokantojen perusteet, s 2000 Relaatioalgebra Harri Laine 1. Relaatioalgebra

HAAGA-HELIA Heti-09 1 (27) ICT05 Tiedonhallinta ja Tietokannat O.Virkki

HELIA 1 (14) Outi Virkki Tiedonhallinta

Normalisointi. Jouni Huotari & Ari Hovi. kirjan Hovi, Huotari, Lahdenmäki: Tietokantojen suunnittelu & indeksointi, Docendo (2003, 2005) luku 5

Ohjelmistojen mallintaminen kertausta Harri Laine 1

Tietokantojen perusteet, syksy 1999 SQL- osa Harri Laine 1. SQL-valintaehto. SQL-valintaehto. Opettajien nimet: Opiskelijoiden pääaineet

Helsingin yliopisto, TKTL Tietokantojen perusteet, k 2000 SQL- osa Harri Laine 1. SQL-valintaehto. SQL-valintaehto.

HARJOITUS 2. Kasvattamot ja mittaukset

HAAGA-HELIA heti09 1 (27) ICT05 Tiedonhallinta ja tietokannat O.Virkki Relaatiomalli

YHTEYSSUHDE (assosiation)

PALKKA-AINEISTON SIIRTOTIEDOSTO

SQL:N PERUSTEET MARKKU SUNI

Ohjelmistojen mallintaminen luokkamallin lisäpiirteitä

HELIA 1 (8) Outi Virkki Tietokantasuunnittelu

CSE-A1200 Tietokannat

Johdatus sovellussuunnitteluun, s2000, osa5 Helsingin yliopisto;/tktl. Harri Laine 1. Luokkakaavion tarkoitus. Luokkakaavion tarkoitus

Tietokannan suunnittelu

joukko operaatioita, joilla relaatioista voidaan muodostaa uusia relaatioita joukko opin perusoperaatiot yhdiste, erotus, ristitulo, leikkaus

HELIA TIKO-05 1 (28) ICT03D Tieto ja tiedon varastointi O.Virkki

2. Haet työntekijöiden tiedot etunimen mukaan nousevasti järjestettyinä. (ORDER BY) SELECT * FROM employees ORDER BY firstname ASC;

Opintopiiritehtävä 3: Verkkohuutokauppa

CS-A1150 Tietokannat CSE-A1150 Tietokannat / 29

Liitokset - haut useaan tauluun

SQL - STRUCTURED QUERY LANGUAGE

CSE-A1200 Tietokannat

Transkriptio:

Tietokantasuunnittelun pääperiaatteena on tiedon toiston välttäminen. Tiedon toistumiseen liittyy monenlaisia ongelmia toistuva tieto vie tilaa ylläpito muodostuu hankalaksi ylläpito-operaatioilla voi olla odottamattomia sivuvaikutuksia. Esimerkki taulusta, joka ei käyttäydy hyvin: EMP_DEPT: E_no E_name E_bdate D_no D_name D_location M.Seppä.3.59 3 Myynti Helsinki 2 D.Leivo 4.0.40 3 Myynti Helsinki 3 K.Koivu 30..66 4 Hallinto Lahti 4 B.Oja 2.5.65 4 Hallinto Lahti 5 O.Itä 0.2.55 6 Tuotanto Helsinki Avain: E_no Jos O.Itä poistetaan, häviää tieto tuotantoosastosta Toistettava jokaisen osaston tt:n kohdalla Jos Hallinto muuttaa Espooseen om muutettava useita rivejä Tietokannan suunnittelun vaiheita ovat tietosisällön kartoitus luokkakaaviona (Johdatus sovellussuunnitteluun) kartoittamalla attribuutit ja niiden väliset riippuvuudet loogisten rakenteiden suunnittelu ja teknisten rakenteiden suunnittelu. Loogisen rakenteen suunnittelun tavoite on sijoittaa yhteenkuuluvat tiedot samaan tauluun Muunnos luokkakaaviosta relaatiokaavioon Järjestelmän määrittelyn yhteydessä järjestelmän tietosisältö voidaan määrittellä luokkakaavion avulla Luokkakaavio kuvaa tällöin kuvaa järjestelmän pysyväisluonteisia (persistent) tietoja - tietojen on säilyttävä ohjelman suorituskertojen välillä Luonteva paikka säilyttää olioiden tila on tietokanta: oliorakenteinen tietokanta (oliotietokanta) relaatiotietokanta Muunnos luokkakaaviosta relaatiokaavioon Muunnos luokkakaaviosta relaatiokaavioon relaatiotietokanta standardoitu SQL ja liittymät perinteisiin ohjelmointikieliin ei suoraa tukea olioiden välisille yhteyksille ei luokkahierarkiaa e periytymistä vain data ei toimintoja uusimmissa tkhj:ssä mukana oliopiirteitä edellyyttää muunnosta oliorakenteista relaatiorakenteiksi Lähtökohtana normalisoitu luokkakaavio = tiettyjä sääntöjä noudattava kaavio Yhteydet näkyviä, ei attribuuteiksi piilotettuja Kukin asia esitetään vain kertaalleen Ei johdettavissa / pääteltävissä olevaa tietoja Yhteydet määritelty oikeiden osapuolten välillä Harri Laine

Yhteydet piilotettu Olioiden välinen kytkentä esitetään aina yhteytenä, sitä ei piiloteta ominaisuudeksi (attribuutiksi) Yhteyden piilotus Olioiden välinen kytkentä esitetään aina yhteytenä, sitä ei piiloteta ominaisuudeksi (attribuutiksi) Opettajan_ Opettaja Nimi Opettajan_ Opettaja Nimi Kytkentä on piilotettuna kurssin attribuuttiin opettajan_ opetus Asiat esitetään vain kertaalleen Samaa asiaa ei pidä esittää sekä yhteytenä että ominaisuutena Tilaus Tilaajan_ tilaaja Asiakas Nimi Ei esitetä johdettavissa olevaa tietoa tulisi selvittää mitkä tiedot ovat perustietoja ja mitkä voidaan päätellä (laskea) muiden tietojen perusteella attribuutin tai yhteyden olemassaolo voi olla pääteltävissä ilmoittautunut ilmoittautuneiden_lkm Opiskelija. laskettavissa Ei esitetä johdettavissa olevaa tietoa kurssilla Harjoitusryhmä Opiskelija ryhmässä lla-yhteys on pääteltävissä, jos jokaisen kursillaolijan on oltava jossain ryhmässä Muunnoksen perussäännöt: Kutakin olioluokkaa vastaa samannen taulu Kullakin luokan yksiisella attribuutilla on samannen vastinsarake luokkaa vastaavassa taulussa Luokan tunnistavia attribuutteja vastaavat sarakkeet kuuluvat luokkaa vastaavan taulun avaimeen Harri Laine 2

Luokkakaavio: Vippi oy Relaatiorakenteen ydin - jokaista luokkaa vastaa taulu {id} {id} kuitti{id}..* pvm {id}..* arvioija hyväksyjä {id} {id}..* {+id} {id}..* kuitti pvm Kokoelma-attribuutit Kokoelma-attribuutit Kutakin kokoelma-attribuuttia (moniista) vastaa taulu, jonka sarakkeina ovat viiteavain kokoelmasen attribuutin sisältävää luokkaa vastaavaan tauluun, sarake attribuutin a varten. Taulun kaikki sarakkeet kuuluvat avaimeen Vippi oy:n esimerkissä ei ole kokoelmaattribuutteja esim: (id) oppi [ ] moniinen viiteavain oppi oppi Monen suhde moneen yhteydet Monen suhde moneen yhteydet Kutakin monen suhde moneen yhteyttä vastaa taulu Taulun = yhteyden Taulun sarakkeina ovat yhteyden osapuoliin osoittavat viiteavaimet. Taulun kaikki sarakkeet kuuluvat taulun pääavaimeen monen suhde moneen yhteys on yhteys, jossa kummankin osapuolen maksimiosallistumisrajoite on suurempi kuin. (id)..* arvioija kuitti (id) Harri Laine 3

Monen suhde moneen yhteydet Yhden suhde moneen yhteydet kuitti arvioija kuitti _ pvm Vaihtoehto : Lisää yhteyskumppaniin osoittava viiteavain sitä osapuolta vastaavaan tauluun, jolla on korkeintaan yksi kumppani Jos kookoonpanoyhteydessä kokoonpanon osien tunnistamiseen tarvitaan tieto kokonaisuudesta, niin lisätty viiteavain kuuluu taulun avaimeen. Tällaisessa tilanteessa ei ole muita vaihtoehtoja. Yhden suhde moneen yhteydet Yhden suhde moneen yhteydet Vaihtoehto 2: Toimi kuten monen suhde moneen yhteyksien kohdalla ja tee yhteyttä varten erillinen taulu Taulujen määrän minimoimiseksi vaihtoehtoa tulisi suosia, ellei siitä seuraa epäedullisia viittaussyklejä taulujen välille. (id) (id) arvioija kuitti (id) hyväksyjä pvm (id*) (id) (id*) Yhden suhde yhteen yhteydet kuitti arvioija kuitti _ hyväksyjä pvm Vaihtoehtoja: Lisää yhteyskumppaniin osoittava viiteavain yhteyden toista osapuolta vastaavaan tauluun ensisijaisesti sille, jolle yhteys on pakollinen jos yhteys on pakollinen molemmille, valitse kumpi tahansa Tee erillinen taulu, kuten monen suhde moneen tapauksessa. jos yhteys on molemmille osapuolille valinnainen Harri Laine 4

Yhden suhde yhteen yhteydet (id) naimisissa vaimo aviomies 0.. vaimo 0.. naimisissa 0.. aviomies ajokortti ajokortti (id)... ajokortti ajokortti... Vaihtoehto : Taulu sekä ala- että yläluokalle. Alaluokan tauluun sijoitetaan yläluokan tauluun osoittava viiteavain. Jos yläluokalla on käyttäjän määrittelemiä tunnistavia attribuutteja otetaan viiteavain alaluokan taulun avaimeksi. Jos yläluokan taululla ei ole käyttäjän määrittämää tunnistavaa attribuuttia, joudutaan sille luomaan keinotekoinen avain. Tätä ei oteta alaluokan taulun avaimeksi, jos alaluokalle on määritelty tunnistavia attribuutteja. käytetty keinotekoista avainta oik_ omist. osake nippu (id) oik_ oh_ omist. osake rekno nippu (id) yritys rekno (id) oh_ yritys rekno oh_ pienyritys upotettu yläluokan avain pienyritys rekno Vaihtoehto 2: Alaluokalle ei tehdä omaa taulua, vaan alaluokan tauluun loogisti kuuluvat sarakkeet upotetaan yläluokan tauluun. työntekijä (id) johtaja alaisten lukumäärä työntekijä alaisten_lukumäärä Relaatiomalliin liittyvässä suunnitteluteoriassa yhteenkuuluvuus määritellään riippuvuuksien avulla Keskeinen riippuvuus: funktionaalinen riippuvuus Attribuutti B on funktionaalisesti riippuva attribuutista A (A määrää funktionaalisesti B:n), jos ja vain jos kaikissa relaatiokaavion R ilmentymissä kuvaus A:n joukolta B:n joukolle on funktionaalinen. Harri Laine 5

Kuvaus f:v(a)->v(b) on funktionaalinen, jos jokainen A:n kuvautuu yhdelle B:n lle eli, jos riveillä r ja s attribuutilla A on sama (r.a=s.a), niin näillä riveillä täytyy myös B- attribuuteilla olla keskenään sama (r.b=s.b). Funtionaalinen riippuvuus tarkoittaa sitä, että attribuutin B on ykssitteisesti selvitettävissä kun tiedetään attribuutin A. Selvittäminen voisi tapahtua kyselyllä select distinct B from R where A=a; Funktionaalista riippuvuutta, jossa A määrää B:n merkitään A B. Attribuuttia A kutsutaan määrääjäksi. Yksittäisen attribuutin A tilalla voi olla myös attribuuttiyhdistelmä. Tavoitteena on kuitenkin löytää yhdistelmät, joissa on minimaalinen määrä attribuutteja, Jos A B, voidaan määrääjään lisätä m tahansa attribuutti x ja pätee Ax B. Tarkastellaan relaatiokaaviota lainen( koodi, Hetu, OpiskelijaNimi, Nimi, TehtavaLkm). Oletetaan että relaatio sisältää tietoja useista opiskelijoista ja useista kursseista. Hetu-->OpiskelijaNimi select distinct OpiskelijaNimi from lainen where Hetu= a; (max rivi) koodi Nimi select distinct Nimi from lainen where koodi= a; (max rivi) Hetu, koodi --> TehtäväLkm select distinct TehtavaLkm from lainen where Hetu=a; (monta riviä) select distinct TehtavaLkm from lainen where koodi=b; (monta riviä) select distinct TehtavaLkm from lainen where koodi=b and Hetu=a; (max rivi) yhteenkuuluvuussääntönä, ns. Boyce-Codd normaalimuodon sääntö: relaatiokaavion R attribuutit kuuluvat yhteen, jos ja vain jos relaatiokaavioon R ei liity yhtään sellaista funktionaalista riippuvuutta, jossa määrääjä ei sisältäisi relaation avainta. lainen relaation avain on pari koodi, Hetu Uudelleenjärjesteltävä relaatiokaavioiksi, joissa yhteenkuuluvuussäännöt ovat voimassa. päädytään relaatiokaavioihin Opiskelija(Hetu, OpiskelijaNimi) (koodi, Nimi) Osallistuminen(Hetu, koodi, TehtäväLkm). => Kaikki attribuutit eiväy kuulu yhteen koska Hetu-->OpiskelijaNimi ja koodi Nimi rikkovat sääntöä Harri Laine 6

Tilauslomaketta analysoitaessa löydettiin seuraavat attribuutit: lomakenumero, tilaajan tunnus, tilaajan, tilaajan, tilaajan puhelinnumero, toimitus, rivinumero, tavaran koodi, tavaran, tilattu määrä, ja tilauspäivä. lomakenumero tilaajan tunnus (lomakkeella voidaan ilmoittaa vain yksi tilaaja) tilaajan tunnus tilaajan (tunnus identifioi tilaajan, joten sen perusteella saamme selville kaikki tilaajaan liittyvät tiedot) tilaajan tunnus tilaajan, tilaajan tunnus tilaajan puhelinnumero, lomakenumero toimitus (lomakkeella voidaan tilata tavaroita vain yhteen paikkaan ja sama tilaaja voi tilata eri paikkoihin) tavaran koodi tavaran (tavaran koodi on tavaran tunniste, jonka kautta päästään kaikkiin tavaran tietoihin) lomakenumero, rivinumero tavaran koodi (lomakkeen rivillä voi ilmoittaa yhden tilattavan tavaran koodin) lomakenumero, rivinumero tilattu määrä (lomakkeen rivillä voi ilmoittaa yhden tilattavan tavaran määrän) lomakenumero tilauspäivä Jako relaatioihin yhteisen määrääjän perusteella: X(tilaajan tunnus, tilaajan, tilaajan, tilaajan puhlinumero) Y(tavaran koodi, tavaran ) Z(lomakenumero,tilauspäivä) T(lomakenumero, rivinumero, tavaran koodi, tilattu määrä) Jos kaavioille löytyy kuvaava jako on onnistunut: tilaaja(tilaajan tunnus, tilaajan, tilaajan, tilaajan puhlinumero) tavara(tavaran koodi, tavaran ) tilaus(lomakenumero,tilauspäivä) tilausrivi(lomakenumero, rivinumero, tavaran koodi, tilattu määrä) Harri Laine 7