Tulevaisuuden tutkimuksen seura Studia Generalia -esitelmä. Tekoälyn ja koneoppimisen uhat ja mahdollisuudet. Timo Honkela.

Tulevaisuuden tutkimuksen seura Studia Generalia -esitelmä Tekoälyn ja koneoppimisen uhat ja mahdollisuudet Timo Honkela timo.honkela@helsinki.fi 27.10.2016

Lyhyesti omasta taustasta Perustutkinto systemoinnista Oulun yliopistosta 1989 (yhdistelmä tietojenkäsittelyä, tietojärjestelmäsuunnittelua, matematiikkaa, filosofiaa, psykologiaa ja muita ihmis- ja sosiaalitieteitä) Sitran kielikoneprojekti, VTT Tietotekniikka, TKK:n neuroverkkojen tutkimusyksikkö (akateemikko Kohonen), Fil.tri (TKK) 1998 Suomen tekoälyseuran pj 1990-luvulla Prof. Taideteollinen korkeakoulu (Medialaboratorio), Teknillinen korkeakoulu (informaatiotekniikka, pro tem), Helsingin yliopisto, Nykykielten laitos (2014-) Tj Gurusoft Oy (2000-2001)

Tekoäly Kehitetään järjestelmiä, joiden toivotaan matkivan ihmisen älykkääksi katsottuja toimintoja Tällaisia toimintoja ovat Kielen käyttö (puhuminen, kuullun ymmärtäminen, kirjoittaminen, lukeminen) Hahmontunnistus (näkö, kuulo, ym.) Päättely, ongelmanratkaisu ja tunteiden hyödyntäminen Oppiminen Liikkuminen ja maailman muokkaaminen

Tekoälytutkimuksen tavoitteista Tekoälytutkimuksessa voidaan erottaa kaksi päätavoitetta Älykkäiden järjestelmien kehittäminen käytännön sovelluksiin Ymmärryksen lisääminen kognitiivisista ja sosiokognitiivisista ilmiöistä mallintamisen avulla (likeinen yhteys kognitiotieteeseen, filosofiaan, kielitieteisiin, psykologiaan, jne.)

Tekoälyn kehittämisen paradigmat (tieteenfilosofia) Teoria- ja käsitelähtöinen tutkimus Aineisto- ja ilmiölähtöinen tutkimus

Muutoksen aika? Tekoälyä ja koneoppimista on tutkittu ja kehitetty jo yli 50 vuotta Miksi juuri näinä aikoina jotakin olennaista on ehkä kehittymässä?

Tietokoneiden ohjelmoinnista oppiviin koneisiin Suomi on ollut yksi edelläkävijä koneoppimisen ja erityisestä keinotekoisten neuroverkkojen alueella Uranuurtaja on ollut akateemikko Teuvo Kohonen, joka muotoili vuonna 1981 maailmanmenestyksen saavuttaneen itseorganisoiva kartta (Self-Organizing Map, SOM) -menetelmänsä

Koneoppiminen ja tiedon louhinta Tilastollisen koneoppimisen avulla matkitaan ihmisen oppimista Kone käy läpi sille annettuja esimerkkejä Annetun datan perusteella kone oppii esimerkiksi luokittelemaan, järjestämään, ryhmittelemään, hahmottamaan, käsitteistämään tai laittamaan paremmuusjärjestykseen erilaisia tietoalkioita

Tilastollisen koneoppimisen muotoja Ohjattu oppiminen (esimerkiksi luokittelu) Ohjaamaton oppiminen (vrt. tilastollinen klusterointi eli syvästäminen) Oikea vastaus annetaan konetta opetettaessa Ei anneta oikeita vastauksia vaan kone päättelee asioita datassa olevan säännönmukaisuuden ja asioiden välisten suhteiden pohjalta Vahvistusoppiminen Kone saa palautetta siitä, kuinka onnistuneesti se toimii eri tilanteissa saamatta oikeita vastauksia Vrt. aivot

Tekoäly ja koneoppiminen muutosvoimana

Analogia: konevoima / tekoäly Tekoälyn ja koneoppimisen potentiaali on kehittynyt tasolle, jolla on yhteiskunnallista relevanssia https://www.pinterest.com/pin/509680882801748515/

Muutoksia tuottaneet/ tuottavat tekijät Laskentakapasiteetti kasvaa Muistitila kasvaa Saatavilla olevat aineistot ( Big Data, Open Data ), määrä ja koko kasvavat Uusia menetelmiä kehitetään ja otetaan käyttöön (erityisesti koneoppiminen); vanhat menetelmät otettavissa käyttöön Ilmiöitä koskeva ymmärrys kasvaa (monitieteisyys, tieteidenvälisyys)

Valtavat ohjelmistomassat yhteiskunnan peruspilarina Ohjelmat ja algoritmit Ohjelmarivejä: - Unix 1.0 ~ 10.000 - Windows 3.1 ~ 2.000.000 - Firefox ~ 10.000.000 Suomalaislähtöisiä: - MySQL ~ 13.000.000 - Facebook ~ 60.000.000 - Googlen palvelut ~ 2.000.000.000 - Linux 3.1 ~ 15.000.000 http://www.informationisbeautiful.net/visualizations/million-lines-of-code/

Miksi laskenta- ja muistikapasiteetilla on merkitystä? Voidaan tarkastella digitaalisessa muodossa olevan puheen, musiikin tai kuva- ja videomateriaalinen laatua, jos käytettävissä on niukasti tai runsaasti tietokoneen muistia

Laskenta- ja muistikapasiteetti Tekoälyä ja koneoppimista toteuttavat koneet http://yle.fi/uutiset/3-6467338 ovat paljon useammin tällaisia kuin robotin kaavussa CSC Tieteen tietotekniikan keskus https://www.csc.fi/ http://yle.fi/uutiset/3-6467338

Kone ei ole ihminen Koneet eivät ole ihmisiä eivätkä ihmiset koneita Lisääntyvässä määrin voidaan kuitenkin simuloida (matkia) ihmisen erilaisia kykyjä tietokoneita käyttäen

Tekoäly ja kieli

Koneille opetetaan kieltä Koneet oppivat kieltä Perinteisesti koneet on pyritty saamaan kielitaitoisiksi kirjoittamalla kielen sääntöjä koneen ymmärtämään muotoon Tämän on kuitenkin osoittautunut ongelmalliseksi Nykyisin hyödynnetään koneoppimismenetelmiä

Sanojen suhteet paljastuvat niiden käytöstä Kun käytettävissä on suuria tekstiaineistoja, mielivaltaisen kielen sanojen välisiä suhteita voidaan selvittää tilastollisesti Perusidea on se, että kahta sanaa käytetään tyypillisesti samaan tapaan (samanlaisessa lauseyhteydessä), jos niiden merkitykset ja/tai kieliopillinen rooli on samankaltainen

Klassikkoesimerkki: Grimmin satujen analyysi (1995) Honkela, Pulkki & Kohonen 1995

Klassikkoesimerkki: Grimmin satujen analyysi (1995) Huom: Suomessa tehtiin tällaista työtä jo ennen kuin esimerkiksi Googlea oli olemassa Akateemikko Teuvo Kohonen on ollut yksi neuroverkko- ja hahmontunnistusalan perustajahahmoista http://www.aka.fi/fi/akatemia/tutkimuksen-tekijoita/tieteen-akateemikot/suomalaiset-tieteen-akateemikot/akateemikko-teuvo-kohonen/

Datan ja tekstien louhinta Edellä kuvatulla tavalla mitä tahansa suuria data- tai tekstiaineistoja voidaan tutkia (Honkela & Klami, 2008)

Suomen tieteen kartta Akatemian aineistosta Bio- ja ympäristötieteet Kone auttaa käymään Luonnon-jopa ja läpi tuhansia, insinööritieteet miljoonia dokumentteja Tieteellisiä tekstejä Terveystieteet ei lueta ainoastaan ihmisvoimin yksi kerrallaan Kulttuuri- ja yhteiskuntatieteet (Honkela & Klami, 2008) Kemia

Tilastollisesti etsittyjä assosiaatioita sanoille 1) onnellisuus ja 2) lätäkkö mielenrauha lammikko tyytyväisyys lampi onnellisuuden oja elämänilo läntti yksilöllisyys kuoppa rakkaus kolo välittäminen hiekka onni allas hyvinvointi pläntti positiivisuus läikkä Kiitokset: Turku BioNLP group, Filip Ginter ja Citizen Mindscapes -projekti (Helsinki, Turku) http://bionlp-www.utu.fi/wv_demo/ http://blogs.helsinki.fi/citizenmindscapes/

Uusi askel: Humanistinen meta-analyysi Timo Honkela Studia Generalia -esitelmä Helsingin yliopistossa 20.10.2016 https://www.helsinki.fi/fi/unitube/video/35ea5bc3-6d7a-4e86-88fc-26b851d975ec

Taustaa: tulkinnan yksilöllisyyden mallintaminen (GICA-menetelmä) GICA-menetelmät (Grounded Intersubjective Concept Analysis) (Honkela ym. 2012) mahdollistaa mallit, joissa kunkin sanan merkitystä tarkastellaan yksilöllisesti Esimerkkinä USAn presidenttien puheet (State of the Union Address) ja sanan HEALTH merkityksen analyysi kontekstitietoa tilastollisesti analysoide

Sanan health analyysi

Humanistinen meta-analyysi (Honkela 2016) Analyysi olettaen sanojen jaettu merkitys Aineisto sanoineen Analyysi hyödyntäen merkityksien vaihtelumallia Honkelan ehdotus Merkityksien analyysi rikkaissa konteksteissa Aineisto sanoineen

Humanistinen meta-analyysi (Honkela 2016) Sanoja Analyysiei voi ottaa olettaenperusdataksi analyysin sanojen olettaen, että sana tarkoittaa jaettu täsmälleen samaa, kun merkitys puhuja/ kirjoittaja on eri ja eri kontekstissa Honkelan ehdotus Aineisto Sanan merkitys on sanoineen tilastollinen, subjektiivinen ja kontekstiriippuva ilmiö Analyysi hyödyntäen merkityksien vaihtelumallia Merkityksien analyysi rikkaissa konteksteissa Aineisto sanoineen

Humanistinen meta-analyysi (Honkela 2016)... AUTENTTINEN... HAUVA KATTI KISSA KOIRA REILU... TEHOKAS... DATA (1) RIKAS MERKITYSMALLI DATA (2) SISÄLTÖANALYYSI (HUMANISTINEN META-ANALYYSI)

Yhteisen ymmärryksen uusia mahdollisuuksia Tieteen uudet keinot tilanteisiin ja kysymyksiin, joita koskien yhtä oikeaa tulkintaa ei ole eikä voi olla. Humanistinen meta-analyysi ja vastaavat keinot voivat auttaa meitä tuomaan yhteen ymmärrystä, jota ihmiset ovat keränneet eri kielellisissä, sosiaalisissa, kulttuurissa ja historiallisissa konteksteissa Merkitysneuvotteluiden osittaiseen automatisointi

Tekoäly ja intuitio (alitajuinen päättely)

Koneen intuitio? Koneelle voidaan syöttää keinotekoista kokemusta, joka ei ole valmiiksi kielellisessä tai luokitellussa muodossa Näin ollen koneen voidaan ajatella saavuttavan keinotekoista intuitiota Jonkin johtopäätöksen taustalla vaikkapa keinotekoinen neuroverkko voi punnita tuhansia tekijöitä; päättely on näin hienovaraisempaa kuin vaikkapa looginen päättely, joka on itse asiassa varsin pinnallista

Nobelisti harhapolulla? (kun puhutaan ihmisen intuitiosta) Daniel Kahnemann on tullut tunnetuksi ajattelutyyppien jaottelijana ja pyrkinyt osoittamaan, että ihmisen intuitio toimii huonosti rationaaliseen ajatteluun verrattuna Vahvoja vasta-argumentteja on esittänyt esimerkiksi Gerg Gigerenzer Laajoja empiirisia tutkimuksia on Ap Dijksterhuis (asiaan perehtyminen + alitajuinen päättely tuottaa parhaan tuloksen) Tekoälyn kehitys on vakuutta epäsuora todiste siitä, että neuroverkkotyyppinen päättely tuottaa parempia tuloksia kuin sääntöpohjainen päättely

Koneen intuitio Koneelle voidaan syöttää keinotekoista kokemusta, joka ei ole valmiiksi kielellisessä tai luokitellussa muodossa Näin ollen koneen voidaan ajatella saavuttavan keinotekoista intuitiota Jonkin johtopäätöksen taustalla vaikkapa voi punnita tuhansia tekijöitä; päättely on näin hienovaraisempaa kuin vaikkapa looginen päättely, joka on itse asiassa varsin pinnallista Rasmus, Valpola, keinotekoinen Honkala. Berglund, Raikoneuroverkko http://arxiv.org/pdf/1507.02672v1.pdf https://en.wikipedia.org/wiki/biological_neural_network

Tekoäly ja kuvat, luovuus ja tunteet

Kuvia katselevat ja tuottavat koneet Myös kuvallinen data voi olla koneoppimismenetelmien kohteena PICSOM: Laaksonen, Koskela, Oja (1999...) Kaupalliset sovellukset tunnistavat esimerkiksi ihmisiä kuvista http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.117.6021&rep=rep1&type=pdf

Luovat koneet Toivonen, Toivanen, Kantosalo, Xiao, Kantosalo, Valitutti, Gross et al. https://www.cs.helsinki.fi/en/story/82156/brain-poetry http://deepdreamgenerator.com

Tunteita analysoivat ja simuloivat koneet Koneita voidaan tiedon ja järjen sisältöjen lisäksi yhä lisääntyvässä määrin käyttää myös tunteiden analysointiin Nykyään on suosittua tehdä ns. sentimenttianalyysia esimerkiksi asiakaspalautteen selvittämiseen: mistä tuotteista tai palveluista asiakkaat ovat olleet tyytyväisiä, vihaisia, tms? Tunteiden maailmaa voi mallintaa ilmiöiden taustojen, dynamiikan ja keskinäisten tekijöiden näkökulmasta

Uhista ja mahdollisuuksista

Tulevaisuuden työ Olemme murrosvaiheessa, jossa kaikille työtä haluaville ei löydykään töitä, vaikka tosissaan haluaisi ja etsisi Monet perinteiset työt ovat korvautumassa koneellisilla Toisaalta tilanne mitä ilmeisimmin tulee uusia töitä, mutta niiden edellyttämä koulutus ja kokemus voi vaatia vuosia

Automatisoituminen: Yhteiskuntapoliittinen johtopäätös koskien Suomen nykytilannetta Monien tehtävien automatisoituminen tarkoittaa niiden tehostumista Vanhanaikaiset keinot kilpailukyvyn hankkimiseksi palkkakustannuksia alentamalla ei välttämättä riitä Olennaista on pärjätä automatisoimiskilpailussa ja järjestää yhteiskunnallisesti asiat niin, että tehostumisen tuottamat hyödyt jakautuvat järkevästi; jos keskiluokka köyhtyy olennaisesti, olemme vaikeuksissa; työpäivien pidentäminen ei ole viisas tie vaan älykäs laiskuus : koneet töihin

Talousjärjestelmän muutospaineet Taloudellisen hyödyn tuottamisen dynamiikka on jo muuttunut tähän mennessä niin, että omistaminen on keskittynyt entisestään Raha tulee rahan luokse pätee algoritmien maailmassa niin, että taloudellista menestystä syntyy ikään kuin itsestään sopivia algoritmeja soveltamalla ja hyödyntämällä pankkialan keskitettyä luonnetta Ei voida puhua siitä, että pärjääminen olisi erityisesti älykkyyden tai ahkeruuden seurausta

Talous: uhka versus mahdollisuus Uhkaskenaario: Taloudellinen keskittyminen voimistuu entisestää; syrjäytyminen, epätasa-arvo ja suoranainen köyhyys lisääntyvät; tyytymättömyys purkautuu väkivaltaisena toimintana, johon vastataan yhteiskunnallisella laillistetulla aggressiolla jopa robotisoituja poliiseja ja sotilaita hyödyntäen Mahdollisuusskenaario: Uusia menetelmiä ja välineitä varten kehitetään niiden käyttöön sopiva lainsäädäntö, joka perustuu todennäköisesti nykyistä hajautetummalle päätöksenteolle; tekoäly- ja koneoppimismenetelmiä käytetään normijärjestelmien optimointiin perusjärjestelmän optimoinnin lisäksi

Lääketiede ja hyvinvointi Lääketieteessä suuret tietoaineistot ja koneoppimismenetelmät mahdollistavat aiempaa tarkemmat ja nopeammat diagnoosit ja koneen antamat yksilölliset hoitosuositukset Elintapojen ja hoitojen vaikutuksia voidaan tutkia aiempaa tarkemmin ottaen huomioon jopa tuhansia tekijöitä Elintapojen vaikutusten selvittäminen ja niiden suhde geeniperimään voi parhaimmillaan estää joitakin sairauksia puhkeamasta

Terveys: uhka versus mahdollisuus Uhkaskenaario: Terveyttä koskevaa tietoa kerätään kattavasti niin, että tietoa käytetään ihmisiä vastaan esimerkiksi vakuutuksia myönnettäessä tai työpaikoilla päätöksiä tehtäessä Mahdollisuusskenaario: Terveystilannetta ja elintapoja koskevaa tietoa kerätään ja levitetään nykyistä paljon tehokkaammin; sairauksien tutkiminen ja hoito edistyy voimakkaasti; terveystietoja hyödynnetään ihmisiä tukien kaikissa elämäntilanteissa ja sairauksien kuuluminen elämään ymmärretään yhteiskunnassa laajasti, mikä estää syrjäytymistä

Tunteet: uhka versus mahdollisuus Uhkaskenaario: Yritykset ja hallitukset käyttävät tarkentuvaa ymmärrystä ja uusia välineitä kansalaisten manipulointiin ja valvontaan Mahdollisuusskenaario: Ihmiset saavat uusia välineitä ollakseen entistä onnellisempia ja selvitäkseen vaikeistakin tilanteista, kun heillä on henkilökohtainen psykologinen assistentti; tilanneadekvaatit emotionaaset reaktiot lisääntyvät suhteessa epäadekvaatteihin, mikä edistää myös yhteiskunnallista harmoniaa

Kiitos! http://375humanistia.helsinki.fi/humanistit/timo-honkela http://www.slideshare.net/timohonkela https://www.youtube.com/watch?v=uxwkgpmmzdk