Tekoäly liiketoiminnassa Tuomas Ritola CEO, selko.io
Selko.io Automaattista teknisen tekstin luokittelua ja analysointia, eli tekoälyä tekstidatalle.
Päivän agenda: Tekoäly.
Muotisana?
Strategia?
Uhka?
Työkalu.
Tietokoneen tekemää, ihmisen kaltaista, ympäristöä havainnoivaa, oppivaa, tavoitteellista päätöksentekoa. Tekoäly - Artificial Intelligence, AI
KISS - Keep it simple, stupid. Konenäkö Kielen ymmärrys Koneoppiminen
Miksi? Automatisointi Laatu Tehokkuus
Haaste: Vaihtuvat projektit vs. tuotekehitys Perusteltu investointi? Tarve: Vaihtuva sisältö Vaihtuva ympäristö Vaihtuvat ihmiset Tiedon kertyminen, pysyvät patternit? Tekoäly & projektiliiketoiminta
1. Data 2. Ongelmat 3. Menetelmät 4. Esimerkkejä 5. Lessons learned Agenda Tekoäly liiketoiminnassa
Tekoäly & data.
Data & tekoäly. Kuva Video Kuvantaminen Anturidata Prosessidata Sijaintidata Numeerinen data Luonnollinen kieli, teksti Puhe à teksti Kuva à teksti
Hankkeiden määritykset = tekstiä. Vaatimukset = tekstiä. Kommunikaatio = tekstiä. Päätöksenteko = tekstiä. Raportointi = tekstiä. Tekstidata & Projektit
Mittaukset, anturidata, prosessidata, jne, yleensä lähtökohtaisesti numeroita. Kuvat à Matriisi pikseleitä, pikseleillä numeeriset arvot. Ääni à Ääniaallot taajuusdataa 20 20 000 Hz Teksti à Sanat monidimensioisia vektoreita. Tekoäly toimii numeroilla.
Käytössä olevan datan parempi hyödyntäminen. Datan tehokkaampi, kattavampi kerääminen. Datasta tiedoksi, tiedosta kilpailueduksi. Tekoäly, data & päämäärät
Tekoäly & ongelmat.
Toistuvat ongelmat. Tylsät ongelmat. Vaikeat ongelmat. Monitahoiset ongelmat. Nopeat ongelmat. Soveltuvat ongelmat?
Vaatimukset Riippuvuussuhteet selvillä vähintään tietolähdetasolla Toistuva kannattava investointi Määritettävissä oleva, lopputuloksen hyvyys arvioitavissa
Ohje ihmiselle. Päätös tai sen osa. Uusi tai muokattu tuotos jopa luovuutta? Lopputulos
Edmond de Belamy by Obvious sold for $432.500 (!)
Tekoäly & menetelmät.
Pattern recognition Luokittelu Ennustaminen Generatiiviset mallit Jne Esimerkkejä menetelmistä yleisellä tasolla
Luokittelu soveltuu moniin ongelmiin!
Sääntöpohjaiset menetelmät, good old fashioned AI.
Kokoelma sääntöjä, päätöspuut, -hierarkiat. Sääntöpohjaiset menetelmät, good old fashioned AI.
Tilastolliset menetelmät. Kokoelma sääntöjä, päätöspuut, -hierarkiat. Sääntöpohjaiset menetelmät, good old fashioned AI.
Koneoppiminen. Tilastolliset menetelmät. Kokoelma sääntöjä, päätöspuut, -hierarkiat. Sääntöpohjaiset menetelmät, good old fashioned AI.
Koneoppiminen, ohjattu & ohjaamaton.
Ohjaamaton koneoppiminen.
Ohjattu koneoppiminen. = Oikeiden vastausten antaminen koneelle. Kone oppii tunnistamaan piirteitä, jotka erottavat oikeat ja väärät vastaukset.
Input-kerros Mitä on analysoitava data? Määrämittainen input N x piilotettu kerros This is where the magic happens. Output-kerros Mitä halutaan ulos? Neuroverkot yksinkertaistettuna
Neuroverkot kuvan tunnistus
Input: The heatsink shall fulfill the 72-hour selfsufficiency criterion Sanat esitettävä numeroina neuroverkolle! Neuroverkot kieli/tekstidata The heatsink 8 sanaa shall fulfill the 72-hour self-sufficiency criterion 5 dimensiota [0,01; 0,015; 0,0; 0,1; 0,003] [0,1; 0,0215; 0,4; 0,01; 0,001] [0,001; 0,45; 0,1; 0,31; 0,04] [0,031; 0,015; 0,0; 0,1; 0,003] [0,01; 0,55; 0,011; 0,0; 0,03] [0,14; 0,01; 0,0; 0,1; 0,1] [0,181; 0,1; 0,13; 0,31; 0,05] [0,21; 0,1; 0,0; 0,14; 0,008]
Input: The heatsink shall fulfill the 72-hour selfsufficiency criterion Sanat esitettävä numeroina neuroverkolle! Neuroverkot kieli/tekstidata The heatsink 8 sanaa shall fulfill the 72-hour self-sufficiency criterion 400 dimensiota [0,01; 0,015; 0,0; 0,1; 0,003; 0,05; 0 [0,1; 0,0215; 0,4; 0,01; 0,001; 0,1; 0 [0,001; 0,45; 0,1; 0,31; 0,04; 0,02; 0 [0,031; 0,015; 0,0; 0,1; 0,003; 0,00 [0,01; 0,55; 0,011; 0,0; 0,03; 0,1; 0,2 [0,14; 0,01; 0,0; 0,1; 0,1; 0,3; 0,003; [0,181; 0,1; 0,13; 0,31; 0,05; 0,1; 0,4 [0,21; 0,1; 0,0; 0,14; 0,008; 0,03; 0,
Syötetään mallille inputit. Koneoppimisprosessi - koulutus.
Verkko laskee arvot piilokerroksessa. Koneoppimisprosessi - koulutus.
Neuroverkko laskee outputin. Koneoppimisprosessi - koulutus.
Outputia verrataan koulutusdatan oikeaan vastaukseen. Correct answer Koneoppimisprosessi - koulutus.
Neuroverkon painoarvoja säädetään hieman kohti oikeita vastauksia. - + + - Koneoppimisprosessi - koulutus.
Toistetaan. Koneoppimisprosessi - koulutus.
Syötetään analysoitavaa dataa. Koneoppimisprosessi koulutetun mallin käyttö.
?
Tekoäly & ratkaisut.
Huollontarpeen ennakointi
Sairauksien diagnosointi, hoidon kohdistaminen
Recommendation systems Spotify, Netflix, Amazon
Käyttäytymisen ennakointi verkkokaupassa à Vaikuttaminen?
Keskusteleva AI
Tiedonhaku, assistentit
Laatu, poikkeavuudet.
Tekstin automaattinen kategorisointi. Kiinnostavien tekstinosien tunnistaminen. Tekstin riippuvuuksien analysointi.
Miten päästä alkuun?
Laaja ymmärrys.
Kyky keskustella tekoälystä.
Kirjallisuus, blogit Kurssit - Coursera Palveluita kartoittamiseen Toteutettuja caseja teollisuudesta Tutkimus, open source Miten lisätä ymmärrystä tekoälystä?
Miten alkuun tekoälyprojektin kanssa?
i. a. b. j. f. e. c. h. g. d.
Case Selko Analytics
+ < Koulutusdataa kiinnostavista tekstinosista >
Entä jos ei ole koulutusdataa? à Säännöt, avainsanat.
Päivittäisestä dokumenttianalyysissä luodaan tulevaisuuden koulutusdataa.
Koulutusdatasta kohti automaatiota.
Avainsanat à Sääntöpohjaiset mallit à Syväoppimismallit Aloita yksinkertaisesta ratkaisusta.
Päätöspuu Syväoppimismalli: Sekunti per dokumentti CPU Laskenta omalla läppärillä 1 sekunti per lause. GPU - Google Cloud /tunti. Ratkaisun monimutkaisuus vs. hinta
Rules of Machine Learning Rule #1: Don t be afraid to launch a product without machine learning.
Tekoälyprojektin aloitus:
Miten alkuun? Mikä ongelma voidaan ratkaista? Mikä päätöksentekoprosessi voidaan automatisoida? Kohde / ongelma Kohteen arviointi Datan lähde Datan laatu Ratkaisun arviointi Mitä voidaan ennustaa?
Miten alkuun? Mikä on ratkaisun arvo? Mikä on vaadittu investointi? Kohde / ongelma Mitä muita vaikutuksia ratkaisulla on? Kohteen arviointi Datan lähde Datan laatu Ratkaisun arviointi
Miten alkuun? Mitä dataa on olemassa tai saatavilla - sisäisesti, ulkoisesti? Mitä dataa voisi kerätä? Kohde / ongelma Kohteen arviointi Datan lähde Datan laatu Ratkaisun arviointi Mitä infraa kerääminen vaatisi?
Miten alkuun? Kuinka hyvälaatuista data on? Kuinka paljon dataa on? Kohde / ongelma Kohteen arviointi Datan lähde Datan laatu Ratkaisun arviointi Kuinka hyvin se edustaa ratkaistavaa ongelmaa?
Miten alkuun? Miten toteutusta arvioidaan? Mitä voidaan mitata? Kohde / ongelma Kohteen arviointi Datan lähde Datan laatu Ratkaisun arviointi Miten tuloksia voidaan parantaa?
Aloita ymmärryksen levittämisestä organisaatioon. Aloita pienestä. Hyväksy oppimiskäyrä myös AI:n hyödyntämisessä. Hyväksytään huonot tulokset - odotusten hallinta! Etene pitkäjänteisesti. Yhteenveto - Tekoälyn hyödyntäminen.
Aloita opiskelu tänään! Googlaa: Machine learning resources https://www.coursera.org/learn/machine-learning http://colah.github.io/ https://medium.com/@karpathy https://openai.com/ https://deepmind.com/ https://ai.googleblog.com/ https://research.fb.com/category/facebook-ai-research/ Etc. etc.!
Kiitos! PROJEKTIPÄIVÄT 2018 tuomas.ritola @ selko.io