Älykäs datan tuonti kuljetusongelman optimoinnissa. Antoine Kalmbach

Samankaltaiset tiedostot
TEEMU ROOS (KALVOT MUOKATTU PATRIK HOYERIN LUENTOMATERIAALISTA)

Oppijan saama palaute määrää oppimisen tyypin

Johdatus tekoälyyn. Luento : Koneoppiminen. Patrik Hoyer. [ Kysykää ja kommentoikaa luennon aikana! ]

Viikko 1: Johdantoa Matti Kääriäinen

Tekoäly ja alustatalous. Miten voit hyödyntää niitä omassa liiketoiminnassasi

Tiedonlouhinta rakenteisista dokumenteista (seminaarityö)

Neuroverkkojen soveltaminen vakuutusdatojen luokitteluun

Tekoäly tukiäly. Eija Kalliala, Marjatta Ikkala

2. Käsiteanalyysi ja relaatiomalli

Geneettiset algoritmit

Algoritmit 1. Luento 14 Ke Timo Männikkö

Työasema- ja palvelinarkkitehtuurit IC Storage. Storage - trendit. 5 opintopistettä. Petri Nuutinen

Webforum. Version 14.2 uudet ominaisuudet. Viimeisin päivitys:

Asiakastietojen tuominen toisesta tietokannasta etaika-ohjelmistoon. Kuinka yhdistän tietoja eri asiakastietokantojen välillä

Tiedon louhinnan teoria (ja käytäntö) OUGF kevätseminaari 2004 Hannu Toivonen

S09 04 Kohteiden tunnistaminen 3D datasta

Demo 1: Simplex-menetelmä

Lataa Pelko - osa elämää - Isaac M. Marks. Lataa

RADAR - RANDOM DATA GENERATOR

Servus-ohjelmiston versio 14.3 on julkaistu Alla esitellään joitakin uusia ominaisuuksia.

Lataa Radiologinen tutkimus- ja toimenpideluokitus Lataa

+LISÄTEHTÄVIÄ päättely

Tekoäly ja sen soveltaminen yrityksissä. Mika Rantonen

Toiminnanohjaus ja reittien optimointi LogiAppsilla. Jukka Toivanen Tuotekehityspäällikkö

Toimitusketjun hallinnasta vähittäiskaupan kokonaisvaltaiseen suunnitteluun ja optimointiin

Sisällysluettelo ESIPUHE KIRJAN 1. PAINOKSEEN...3 ESIPUHE KIRJAN 2. PAINOKSEEN...3 SISÄLLYSLUETTELO...4

HELIA 1 (16) Outi Virkki Tietokantasuunnittelu

Tehtäväsarja I Seuraavat tehtävät liittyvät kurssimateriaalin lukuun 7 eli vapauden käsitteeseen ja homogeenisiin

805306A Johdatus monimuuttujamenetelmiin, 5 op

Mitä varautumissuunnitelmilta odotetaan? Tarvo Siukola

Kieli merkitys ja logiikka. 2: Helpot ja monimutkaiset. Luento 2. Monimutkaiset ongelmat. Monimutkaiset ongelmat

1 Rajoittamaton optimointi

HELIA 1 (12) Outi Virkki Tiedonhallinta

Tie- ja puustotietojen käsittely paikkatietosovelluksilla

Lataa Jäljillä julistepaketti (2 kpl) Lataa

Avoin data Avoin kirjasto Kuvailupäivät

CABAS. Release Notes 5.4. Uusi kuvien ja dokumenttien käsittely

Matematiikan tukikurssi, kurssikerta 2

Lataa Maanmittauslaskennan perusteet - Pasi Rantanen. Lataa

Koodistoeditorin tavoitteet ja tilannekatsaus

Booking, Dispatch and Tracking system. birssi.net

PALKKA-AINEISTON SIIRTOTIEDOSTO

Talousmatematiikan perusteet: Luento 12. Lineaarinen optimointitehtävä Graafinen ratkaisu Ratkaisu Excel Solverilla

ALGORITMIT & OPPIMINEN

Sijainnin merkitys Itellassa GIS. Jakelun kehittämisen ajankohtaispäivä

Tekoäly muuttaa arvoketjuja

1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI

Tietokannan eheysrajoitteet ja niiden määrittäminen SQL-kielellä

Lataa Bongaa lintu - Rob Hume. Lataa

Lataa Troijan hevonen 2. Lataa

Lataa Hauska matematiikkakirja - Carol Vorderman. Lataa

Relaatiomalli ja -tietokanta

KOMPLEKSISET PÄÄTÖKSET

STEFAN KARKULAHTI HARJOITTELUN JA OPPIMISEN OPTIMOINTI. - case Black Knights korkeakoulujoukkue

Lataa Koko perheen värikasvio - Juha Laaksonen. Lataa

Lataa Kakurokirja 2 - Mauno Hepola. Lataa

oheishakemistoja voi tiedostoon liittyä useita eri perustein muodostettuja

Lataa Suomen luonnon sata vuotta. Lataa

Lataa Pystytkö sanomaan perkele? - Annika Rentola. Lataa

Logistiikan optimointi- ja ohjausjärjestelmä TCS-Opti

Bayesin pelit. Kalle Siukola. MS-E2142 Optimointiopin seminaari: Peliteoria ja tekoäly

Relaatiotietokantojen perusteista. Harri Laine Helsingin yliopisto

Lataa Onko siellä ketään - Markus Hotakainen. Lataa

Johdantoa. Jokaisen matemaatikon olisi syytä osata edes alkeet jostakin perusohjelmistosta, Java MAPLE. Pascal MathCad

MS-A0402 Diskreetin matematiikan perusteet

Reitinoptimointiongelma, sen variantit ja ratkaisumenetelmät. FT Tuukka Puranen TIEA

Attribuuttikieliopit

Tiedonhallinnan perusteet. Viikko 1 Jukka Lähetkangas

TIEA382 Lineaarinen ja diskreetti optimointi

1 Kertaus. Lineaarinen optimointitehtävä on muotoa:

Orio Portaali Käyttäjäopas v1.0

Helsingin yliopisto/tktl Kyselykielet, s 2006 Optimointi Harri Laine 1. Kyselyn optimointi. Kyselyn optimointi

Aimo-ohjauspaneelin käyttöohje Sisällys

Lataa Ekokehitystä etsimässä - Pirjo Suomela. Lataa

Matematiikan tukikurssi, kurssikerta 3

EDUTOOL 2010 graduseminaari

Lataa Rajatilat - Pertti Luukkonen. Lataa

811120P Diskreetit rakenteet

Lataa Nuoret luonnontutkijat: Metsä. Lataa

Matematiikan tukikurssi

Tekoäly ja koneoppiminen metsävaratiedon apuna

TUOTTAVUUTTA LOUHINTAAN PROSESSIN TUKIOMINAISUUKSILLA

1. OHJAAMATON OPPIMINEN JA KLUSTEROINTI

Lataa Apu-a - Bev Cobain. Lataa

Lataa Todennäköisyyslaskenta 1 - Pekka Tuominen. Lataa

Mat Investointiteoria Laskuharjoitus 4/2008, Ratkaisut

Trichoderma reesein geenisäätelyverkoston ennustaminen Oskari Vinko

Lataa Lasten eläinatlas. Lataa

Lataa Suden kanssa. Lataa

1. Lineaarinen optimointi

2017/11/21 17:28 1/2 Tilitapahtumat. Tilitapahtumat... 1 Käyttö:... 1 Asiakirjan kentät:... 1

3.3 Paraabeli toisen asteen polynomifunktion kuvaajana. Toisen asteen epäyhtälö

Excel 2016 Power Pivot

Lataa Kuuopas - Lambert Spix. Lataa

811120P Diskreetit rakenteet

Avainsanojen poimiminen Eeva Ahonen

TIEA241 Automaatit ja kieliopit, syksy Antti-Juhani Kaijanaho. 8. syyskuuta 2016

VEHO ONLINE- PÄÄLLIRAKENNEPALVELU. Päällirakentajan ohje Veho Oy Ab

Introduction to Machine Learning

MIKROTEORIA 1, HARJOITUS 1 BUDJETTISUORA, PREFERENSSIT, HYÖTYFUNKTIO JA VALINTA

Transkriptio:

Älykäs datan tuonti kuljetusongelman optimoinnissa Antoine Kalmbach ane@iki.fi

Sisällys Taustaa Kuljetusongelma Datan tuominen vaikeaa Teoriaa Tiedostojen väliset linkit Mikä sarake on mikäkin? Ratkaisutoteutus laivaston päättely Tähänastiset tulokset

Kuljetusongelma, datan tuominen TAUSTAA

Kuljetusongelma

varikko Kuin kauppamatkustajan ongelma, mutta n eri kauppamatkustajaa, ja kaikki palaavat varikolle.

Kuljetusongelmasta

Kuljetusongelmasta NP-vaikea ongelma. Tarkan ratkaisun etsintä isoissa tapauksissa toivotonta. Avuksi heuristiikat ja metaheuristiikat. Algoritmien pyörityksen hoitaa laskentaohjelmisto (engl. solver)

Tilanne: optimointia palveluna Haluamme myydä optimointia palveluna. Asiakkaat lähettävät ongelmadatan, takaisin ratkaistuna. Esim. Rekka-Pena Oy haluaa optimoida kuljetusfirmansa reittejä. Rekka-Pena Oy lähettää datan jossain muodossa, yleensä ennalta sovittu Exceltiedosto.

Mahdollisuus: löysä formaatti Esitäytetyn Excel-mallin täyttäminen ankeaa. Asiakkaalla data yleensä eri muodossa. Helppoa olisi, jos voisimme lukea mitä tahansa dataa. Datan tuontiongelma. Halutaan tukea monta formaattia, joita emme edes etukäteen tunne täysin. Tarvitaan automaattista päättelyä. Miten tämä tehdään?

Datan tuontiongelma, liitospäättely, attribuuttiluokittelu, laivastontuonti TEORIAA

Datan tuontiongelma Tai, pelkoa ja inhoa relaatioviidakossa

TAVOITE: Päättele datasta asiakkaan ajoneuvot ja sijainnit, eli laivasto.

Ajoneuvo Yleinen termi. Voi olla rekka, bussi, henkilöauto, helikopteri, laiva, panssarivaunu, tähtilaiva, taisteluplaneetta... Datassa seuraavat asiat: Tunniste (esim. rekisterinumero) Kapasiteetti (jos kapasitoitu VRP) Yleisesti, tunniste i ja rajoitteet.

Sijainti Jokin paikka kartalla. Esimerkiksi osoite tai koordinaatti. Sisältää kapasitoidun VRP:n tapauksessa positiivisen tai negatiivisen kuormamäärän, eli tilattu tavara (tai noudettava). Aikaikkuna-rajoitetun VRP:n tapauksessa sisältää aikaikkunan, minkä aikana sijainnissa pitää käydä, sekä käyntiajan.

DATA

Datan formaatti Tähänastiset asiakastilaukset ovat olleet Excelmuodossa. Toisin sanoen, taulukot, eli CSV. Abstraktimmin: relaatiot. Jokainen sarake on attribuutti, jolla on tietotyyppi.

Relaatioiden väliset yhteydet Ensimmäinen ongelma. Dokumentissa monta relaatioita, jotka ovat kytköksissä toisiinsa. Tietokantamaailmasta tuttu primary ja foreign key tapaus. Yksi sarake sisältää rekisterinumeron. Tätä käytetään kahdessa relaatiossa tunnisteena. Yksi relaatio sisältää valmistajan ja kapasiteetin, toinen sisältää huoltotiedot (esim.)

Relaatioiden väliset yhteydet Tavoite: Sulauta relaatiot yhdeksi etsimällä sopivat avaintunnisteet. Niin ettei dataa katoa ja tärkeä tieto säilyy. Nimi: join inference eli liitospäättely. Muodostettu relaatio sisältää nyt koko laivaston nätissä paketissa. Mikä attribuutti on mikäkin?

Attribuuttien luokittelu Tiedämme, mitä attribuutteja etsitään. Ajoneuvojen kapasiteetteja, osoitteita, tilauksia, tunnisteita Ratkaisu: päätellään attribuuttien datasta, mikä on mikäkin. Esim. kapasiteettiattribuutille tuskin kuuluu sarake jonka tiedot ovat muotoa hevonen tai Mörkökuja 1Y 2B.

RATKAISU: Koneoppiminen

Koneoppiminen lyhyesti Opetellaan datasta malli ja käytetään sitä ennustamiseen. Käyttötarkoituksena esimerkiksi luokittelu, regressio, suosittelu, klusterointi Oppimistilanteita: Valvottu (supervised learning) Ei-valvottu (unsupervised) Osittain valvottu (semi-supervised) Jatkuva (online) Palautepohjainen (reinforcement)

Konseptit & Hypoteesit Tavoite: opettele jokin konsepti. Esimerkiksi mikä on spämmiä ja mikä ei. Yleisesti jokin funktio esimerkeistä X luokkiin Y. Binäärisessä luokitteluongelmassa Y = {0, 1}. Algoritmin tehtävä on muodostaa hypoteesi, joka vastaa opeteltavaa konseptia.

Laivastopäättelyn oppiminen 1. Opettele tunnistamaan, mikä sarake linkittää relaatiot toisiinsa. Yksi luokittelija, joka tietää mitä etsiä. 2. Opettele tunnistamaan, mikä sarake vastaa mitäkin laivastotietuetta. Yksi luokittelija per tietue, joista yksi aina antaa positiivisen tuloksen.

Menetelmä Päätöspuut. Jakavat avaruuden rekursiivisesti osiin. Päätöspuun oppiminen: Muodosta päätöspuu katselemalla dataa. Edut: nopeita ja intuitiivisia. Ongelmat: saattavat kasvaa liian isoksi.

tilannekatsaus TÄHÄNASTISET TULOKSET

Liitospäättelyn luokittelija Päätöspuilla tehty. Opetusdataa paljon, koska yleinen ongelma. IMDB, MovieLens, Last.fm, Delicious datasetit opetusdatana (http://ir.ii.uam.es/hetrec2011/datasets.html) Kokeiltu omaan testidataan asiakkaille ja se Toimii.

Attribuuttien luokittelija Työn alla. Kaksi tietuetta seitsemästä jo rakennettu luokittelijoineen. Opetusdatana esim. kapasiteettien tapauksessa asiakkaiden data, osoitteiden kanssa postin osoitetietokannat.

Tehtävää Attribuuttien luokituksen viimeistely ja yhtenäistäminen. Käytettyjen piirteiden listaaminen. Uusia kehitetty. Testaaminen ja tuloksien raportointi. Vertailu. Tämä siis konstruktiivisen osan loppu.

Lopuksi Gradun teoriaosasta valmiina 90%. Koodauksen valmistuttua seuraa konstruktiivisen osion dokumentointi. Lopullinen sivumäärä noin sata (nyt 50). Painoarvoa tuloksilla ja menetelmän dokumentoinnilla. Kysymyksiä?