ETL-DEMO. Esimerkki ETL-kuvauskielen käyttöstä



Samankaltaiset tiedostot
T Testiraportti TR-3. ETL-työkalu

T Testiraportti TR-2. ETL-työkalu

Tekninen määrittely. ETL-työkalu. ExtraTerrestriaLs / Aureolis Oy

Tekninen määrittely. ETL-työkalu. ExtraTerrestriaLs / Aureolis Oy

Kehitysohje. ETL-työkalu. ExtraTerrestriaLs / Aureolis Oy

Tekninen määrittely. ETL-työkalu. ExtraTerrestriaLs / Aureolis Oy

2 Eläinlistan kautta voidaan tallentaa tietoja kuolleille eläimille

Opettajana Mika Sorsa, HAMK:n ammatillisen opettajakoulutuksen opetusharjoittelija

OPM taloushallinnon työpaja yliopistoille Kokonaiskustannusmalli ja viranomaistarpeet

Data, informaatio, tieto, ymmärtäminen ja viisaus

Fakta versio Forecast versio

SQLite selvitysraportti. Juha Veijonen, Ari Laukkanen, Matti Eronen. Maaliskuu 2010

Kehitysohje. ETL-työkalu. ExtraTerrestriaLs / Aureolis Oy

T Testitapaukset TC-1

Automatisoinnilla tehokkuutta mittaamiseen

KANSALLINEN MAASTOTIETOKANTA

Tiedonhallinnan perusteet. Viikko 1 Jukka Lähetkangas

HAME PostGIS-tietokanta

Tällä viikolla. Kotitehtävien läpikäynti Aloitetaan Pelifirman tietovaraston suunnittelu Jatketaan SQL-harjoituksia

Tietokannat. CREATE TABLE table(col1,col2,... ); Luo uuden taulun. CREATE TABLE opiskelijat(opnumero,etunimi,sukunimi);

KIRJANPITO JA RESKONTRA

Käännös, linkitys ja lataus

SAS sovellusten hallinnointi helpoksi Turbo Charge -menetelmällä Tapio Kalmi, SAS Institute Oy

Tietokannat. CREATE TABLE table(col1,col2,... ); Luo uuden taulun. CREATE TABLE opiskelijat(opnumero,etunimi,sukunimi);

16 IMPROMPTU-RAPORTOINTI HISTORIA-TAULUSTA

Paytrail lisäosa WooCommerce alustalle (c) Webbisivut.org

RADAR - RANDOM DATA GENERATOR

Keskellä ruutua kuvan yläpuolella linkki on call diabeteksen hallintaohjelmisto. Klikkaa sitä

DOORSin Spreadsheet export/import

JHS 183 Julkisen hallinnon palvelujen tietomalli ja ryhmittely verkkopalveluissa Liite 3 XML-skeeman kuvaus ja esimerkit

ASENNUS- JA KÄYTTÖOHJE

Attribuutti-kyselypalvelu

TIETOVARASTOJEN SUUNNITTELU

YTHS Raportointijärjestelmähankkeen

Hyödyt irti XDW:stä. Kim Johnsson Projektipäällikkö/Cerion Solutions Oy

Työkalujen merkitys mittaamisessa

Koordinaattimuunnospalvelu

Visual Case 2. Miika Kasnio (C9767)

Tietokannat. CREATE TABLE table(col1,col2,... ); Luo uuden taulun. CREATE TABLE opiskelijat(opnumero,etunimi,sukunimi);

REKISTERI- JA TIETOKANTA-AINEISTOJEN SIIRTÄMINEN VAPA-PALVELUUN

TERADATAN JA SAS DI STUDION YHTEISELO CASE LÄHITAPIOLA

Maiju Mykkänen Susanna Sällinen

Tietueiden etsiminen:

FinFamily PostgreSQL installation ( ) FinFamily PostgreSQL

Tietovarastointiratkaisut massaräätälöinnin konfiguraattoreiden tukena. DI Mika Aho BI/DW Specialist

WINDOWSIN ASENTAMINEN

SYÖTTÖPOHJA LUKUJEN SYÖTTÖÖN ERI TARKOITUKSIIN

Selvitysraportti. MySQL serverin asennus Windows ympäristöön

Oracle ebs versionvaihto OUGF seminaari / Jyrki Koski Oy Abase Consulting Ab

Written by Administrator Monday, 05 September :14 - Last Updated Thursday, 23 February :36

Helsingin yliopisto Tietojenkäsittelytieteen laitos (H.Laine) Tietokantojen perusteet. Liitteenä: Tiivistelmä SQL-syntaksista

Työasemien hallinta Microsoft System Center Configuration Manager Jarno Mäki Head of Training Operations M.Eng, MCT, MCSE:Security, MCTS

FLEXnet lisenssipalvelun määritys/päivitys serverille (LMTOOLS) ja verkkolisenssimäärittelyt työasemalle

Laiska laskenta, korekursio ja äärettömyys. TIEA341 Funktio ohjelmointi Syksy 2005

Maksuturva-palvelun rajapintakuvaus verkkokaupalle / MAKSUN PERUUTUS

TIETOKANNAT JOHDANTO

Taulukkolaskennan perusteet Taulukkolaskentaohjelmat

SQL Buddy JAMK Labranet Wiki

Järjestelmäarkkitehtuuri (TK081702) Hajautettu tietokanta. Hajautuksen hyötyjä

KÄYTTÄJÄKOULUTUS HARJOITUKSET IMS 2010

Maastotietokannan torrent-jakelun shapefile-tiedostojen purkaminen zip-arkistoista Windows-komentojonoilla

MySQL Maestro. Aleksi Korpela IST4SO Markus Lamminaho IST4SO

Datanhaku www-käyttöliittymästä Mikko Parviainen, Ilmatieteen laitos / tietojärjestelmät mikko.parviainen@fmi.fi

HELIA 1 (16) Outi Virkki Tietokantasuunnittelu

Asennusohje. Sahara-ryhmä. Helsinki Ohjelmistotuotantoprojekti HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos

Health Intelligence - Parempaa informaatiota terveydenhuollon päätöksentekoon. Terveydenhuollon ATK päivät Sibelius Talo, Lahti

Tietovarastojen suunnittelu

Ohjelmistojen mallintaminen Tietovuokaaviot Harri Laine 1

Mammutti vai elefantti?

Mittaustietojen SAF-aineistokuvaus kaasudatahubiin

Site Data Manager Käyttöohje

Täysautomatisoitu raportointiympäristö. Joni-Petteri Paavilainen Jani Alatalo

HAME-maakuntakaavatyökalun ohjeet LUONNOS MMK MK, LL

Kyselyn yleisrakenne:

Teoriatausta. Mallinnuksen vaiheet. CAD työkalut harjoituksessa. Uppokipinätyöstön elektrodi

HELIA 1 (11) Outi Virkki Tiedonhallinta

Luento 7 Taulukkolaskennan edistyneempiä piirteitä Aulikki Hyrskykari

1. a) Laadi suoraviivaisesti kyselyä vastaava optimoimaton kyselypuu.

Excel-lomakkeen (syöttötaulukko) käyttäminen talousarvio- ja suunnitelmatietojen toimittamisen testaamisessa Kuntatalouden tietopalvelussa

Tietokanta.java Luokka tarjoaa välineet tietokannan lukemiseen. Haetuista tiedoista muodostetaan kurssi- ja opetus-olioita.

18 LIITTYMÄT MUIHIN JÄRJESTELMIIN

1 Tivax Professional 4.5

Paikkatiedon tulevaisuus

Haaga-Helia/IltaTiko ict2tcd005: Ohjelmiston suunnittelutaito 1/7 Anne Benson. Tällä opintojaksolla käytämme VS:n kolmen kokonaisuuden luomiseen:

KÄYTTÖOMAISUUSKIRJANPITO

Visma Liikkuvan työn ratkaisut Päivitysohje. Pääkäyttäjän opas

Luento 3. Timo Savola. 7. huhtikuuta 2006

SQL-perusteet, SELECT-, INSERT-, CREATE-lauseet

2) Aliohjelma, jonka toiminta perustuu sivuvaikutuksiin: aliohjelma muuttaa parametrejaan tai globaaleja muuttujia, tulostaa jotakin jne.

Aditro Tikon versio SP1

CVS. Kätevä väline usein päivitettävien tiedostojen, kuten lähdekoodin, hallitsemiseen

Taulukkolaskennan perusteet Taulukkolaskentaohjelmat

Tietojen lataaminen SOTE-organisaatiorekisteristä omiin tietojärjestelmiin

PATA TUNTIKIRJAUS. Jokainen pääsee näkemään ja muokkaamaan omia sekä alaistensa tunteja.

Aditro Tikon versio SP1

CLASSIC WINTIME - TOIMITTAJAN ENNAKKOPERINTÄREKISTERIPÄIVÄ

Add-In:n asennus tehdään omalle koneelle (ArcGIS asennettu omalle koneelle). HUOM! Verkkolevyltä asennus ei onnistu!

Ohjelmistoarkkitehtuurit

DI Studion käyttökokemuksia. Kaisu Ikonen, Tilastokeskus

Miten voin selvittää säästömahdollisuuteni ja pääsen hyötymään niistä?

Transkriptio:

ETL-DEMO Esimerkki ETL-kuvauskielen käyttöstä

Lähtötilanne Organisaation operatiivisessa kannassa dataa, jota halutaan varastoida ja jalostaa Päätetään mihin muotoon jalostettu data halutaan tietovarastossa Luodaan tältä pohjalta ETL-prosessi, joka tuottaa tietovarastoon halutunlaista informaatiota

Esimerkki Myymäläketjulla on seuraavanlainen operatiivinen kanta: Tuote(tkoodi, kuvaus, hinta) ; Jokaisesta tuotteesta kuvaus ja hinta Myymala(mtunnus, osoite) ; Jokaisen myymälän tunnus ja osoite Myynti(tkoodi, mtunnus, ajankohta) ; Jokaista myytyä tuotetta kohden yksi rivi Myymäläketjun johto haluaa päivittäiset myyntitiedot myymälöittäin ja tuotteittain Laskenta tulee tapahtua joka yö kello 24:00 Ohjelmistoarkkitehti suunnittelee ETL-prosessin (Skeema SD-1)

Esimerkki: Extract Haetaan prosessoitavat tiedot operationaalisesta tietokannasta työskentelykantaan <etl xmlns:xsi="http://wwww3org/2001/xmlschema-instance" xsi:nonamespaceschemalocation="skema stromxsd"> <etlprocess name="myynnit1" workingdatabaseid="tyokanta"> <operations> <!-- Haetaan aluksi kopiot tauluista "snapshotmaisesti" operationaalisesta kannasta --> <importsql name="tuotteet" sourcetable="tuote" sourcedatabaseid="kirjanpito"/> <importsql name="myymalat" sourcetable="myymala" sourcedatabaseid="kirjanpito"/> <importsql name="myynnit" sourcetable="myynti" sourcedatabaseid="kirjanpito"/>

Esimerkki: Transform <!-- Suodatetaan viimeisimmän vuorokauden aikana myydyt tuotteet --> <filter name="viimeisimmat" source="myynnit" where="ajankohta >= (now() - INTERVAL 1 DAY)"/> <!-- Tehdään liitos, jossa tuotteet --> <join name="liitos"> <table source="tuotteet"/> <table source="myymalat"/> <table source="viimeisimmat"/> </join> <!-- Lasketaan myynnit tuotteittain ja myymälöittäin --> <aggregate source="liitos" name="myyntituotteittain" groupby="tkoodi"> <column expression="kuvaus" name="kuvaus"/> <column expression="sum(hinta)" name="summa"/> </aggregate> <aggregate source="liitos" name="myyntimyymaloittain" groupby="mkoodi"> <column expression="mtunnus" name="mtunnus"/> <column expression="sum(hinta)" name="summa"/> </aggregate>

Esimerkki: Load Lopuksi muodostunut taulu viedään työtilasta tietovarastoon <!-- Viedään lasketut taulut tietovarastoon --> <export source="myyntituotteittain" destinationdatabaseid="tietovarasto" destinationtable="paivanmyyntituotteittain"/> <export source="myyntimyymaloittain" destinationdatabaseid="tietovarasto" destinationtable="paivanmyyntimyymaloittain"/> </operations> </etlprocess>

Asennus Asentaja luo konfiguraatiotiedoston (Skeema SA-1) Määritetään ETLprosessissa käytettävät tietokannat Käytettäville kannoille määritetään tunnus, johon prosessikuvauksesta viitataan <?xml version="10" encoding="utf-8"?> <etl xmlns:xsi="http://wwww3org/2001/xmlschema-instance" xsi:nonamespaceschemalocation="skema stromxsd"> <!-- Määritellään ETL-prosessissa käytettävät tietokannat --> <configuration> <database id="kirjanpito"> <url>jdbc:mysql://databasefirmacom/kirjanpito</url> <type>mysql</type> <username>teemu</username> <password>d3f0lrpbmq</password> </database> </configuration> </etl>

Ajastus Asentaja ajastaa prosessit käynnistymään haluttuina ajankohtina (Skeema SA-2) Ajastus UNIXin cronin tyyliin Viittaus prosessikuvaustiedostossa käytettävään prosessin nimeen <?xml version="10" encoding="utf-8"?> <etl xmlns:xsi="http://wwww3org/2001/xmlschema-instance" xsi:nonamespaceschemalocation="skema stromxsd"> <configuration> <!-- Määritellään prosessien ajastus - tämä voisi olla käytännössä eri tiedostossa --> <timing> <timedprocess processname="myynnit1"> <parameters/> <!-- Arkipäivien päätteeksi --> <weekday range="1-5"/> <!-- Keskiyöllä --> <hour range="0"/> </timedprocess> </timing> <configuration> </etl>

Aliprosessit Prosessikuvauksessa on mahdollista kutsua toisia prosesseita Kutsuttaville prosesseille voidaan antaa tauluja parametreina Prosessiin voidaan myös määritellä aliprosesseja Aliprosessille voidaan määrittää eri työskentelykanta kuin emoprosessille <call name="myynnit" file="esimerkki3_subxml"> <!-- source taas viittaa tässä tiedostossa olevaan toimenpiteen nimeen, argumentin nimeä taas käytetään aliprosessitiedostossa --> <argument name="tuot" source="tuotteet"/> <argument name="myym" source="myymalat"/> <argument name="myyn" source="myynnit"/> </call>