Digabi II ajankohtaiskatsaus sähköisiin kokeisiin ja arviointeihin Koneoppiminen oppimisen ja opettamisen tukena digitalisoituvassa maailmassa Helsingin yliopisto Nykykielten laitos Timo Honkela Digitaalisten aineistojen tutkimuksen professori Kansalliskirjasto Digitointi- ja konservointikeskus 5.6.2014
Tieto- ja viestintätekniikan vaikutus Tietokoneet ja -verkot vaikuttavat ihmisten elämässä ja yhteiskunnassa monilla eri tavoilla Tämä kehitys ei ole loppumaisillaan vaan ehkä jopa kiihtymässä Muutokseen liittyy sekä uhkia että mahdollisuuksia
Tieto- ja viestintätekniikan vaikutus Tässä yhteydessä keskeinen muistettava asia on se, että tietotekniikan kehitys vaikuttaa siihen, mikä on tulevaisuuden työelämän kannalta tärkeää tietoa ja osaamista Monet ammatit ovat häviämässä ja uusia syntyy Koneet tekevät puolestamme yhä laajenevan joukon asioita; parhaimmillaan tämä voisi tarkoittaa, että elämämme on entistä auvoisampaa
Tieto- ja viestintätekniikan vaikutus Ihmisen (yksilönä ja yhteisönä) ja tietotekniikan kehitys on koevolutiivisessa suhteessa: yhden muutos vaikuttaa toiseen Erilaisten taitojen suhteellinen merkitys muuttuu (käsin kirjoittaminen, muistaminen, laskeminen, jne.); muutokset näkyvät jopa aivokuvantamisessa Hyvä uutinen: sirpaletiedon merkitys vähenee; tarvitaan kokonaisvaltaista ymmärrystä
Haasteita auvoisen tulevaisuuden saavuttamisessa Kuinka välttää varallisuuden ylenmääräinen keskittyminen? Kuinka ylläpitää nuorten toiveikkuutta tulevaisuuden suhteen, jos tuntuu siltä, että pärjäämiseksi vaadittava osaaminen on yhä haastavampaa ja kilpailu lisääntyvässä määrin globaalia? Kuinka pitää huolta siitä, että relevantti osaaminen on mahdollisimman laajasti saatavilla? Kuinka jatkuvasti uusintaa opetusta ilman liian suurta määrää harmaita hiuksia
Mittaaminen ihmisen pelkistämisenä? 16 muuttujaa
Jännitteitä Yleispätevyys versus kontekstuaalisuus Kansainvälinen ja kansallinen vertailtavuus versus paikallisuus ja yksilöllisyys Mitattavien asioiden suhde motivaatioon ja luontaisen lahjakkuuden osa-alueisiin Yhteisen pohjan luominen versus tarve erikoistua ja olla kilpailukykyinen omalla alueellaan Mitattavien asioiden pieni määrä versus todellisuuden valtava moninaisuus ja jatkuva muutos Kilpailu versus yhteistyö
Tieto- ja viestintätekniikan kehitys Nykytilanne tietotekniikassa lienee vasta alkusoittoa sille, mitä tulevaisuudessa tapahtuu Yksi tärkeä muutosvoima on se, että jatkossa koneet eivät vain kerta toisensa jälkeen tee sitä, mitä ne on ohjelmoitu tekemään Koneoppimisen tutkimus alkaa tuottaa tuloksia
Digital humanities Humanististen tieteiden tutkimusta tietokoneiden avulla Digitaaliset aineistot Laskennalliset mallit Teesi: Tärkeimmät avoimet kysymykset maailmassamme liittyvät ihmistieteiden alueelle
Kansalaiset Museot Taiteilijat Arkistot Kirjastot Opettajat Tutkijat Toimittajat Informaatikot Päätöksentekijät DIGITAALISET AINEISTOT Yliopistot Yhdistykset Media Yritykset Kunnat Valtio
Tekstien louhinta Tilastollisen koneoppimisen keinoin kone voidaan laittaa lukemaan suuria tekstimääriä ja selvittämään asioita, joita yksittäinen ihminen ei voisi koskaan tehdä. Kone voi käydä läpi miljoonia tai tarvittaessa jopa miljardeja tekstejä. Tässä on kyse paljon muustakin kuin vain perinteisestä tiedonhausta, koska tavoitteena ei ole löytää yksittäisiä dokumentteja tai tiedonsirpaleita vaan muodostaa ymmärrystä suurista kokonaisuuksista.
Alustava OPS-kartta
Kokeilu: OPS ja osajoukko HY:n oppiaineista
Esimerkkejä aiemmasta tutkimuksesta Honkela & Vepsäläinen (1991): Kokoilmaisujen tulkinta Honkela (1993): Tulkinnan subjektiivisuuden ja kontekstuaalisuuden mallintaminen Honkela, Pulkki & Kohonen (1995): Grimmin satujen analyysi; sanakategorioiden kehkeytyminen Honkela, Kaski, Kohonen, Lagus (1996): Dokumenttikartat Legrady & Honkela (1999-2002): Joukkoistettu kartta taidemuseoissa Honkela, Hyvärinen & Väyrynen (2003-): Sanapiirrekehkeytys Pyysiäinen, Lindeman & Honkela (2003): Uskonnollisten väittämien tulkinnan analyysi
Esimerkkejä aiemmasta tutkimuksesta Honkela, Nordfors & Tuuli (2004): Osaamisen mallintaminen O. Kohonen, Katajamäki & Honkela (2004): Shakespearen sonettien analyysi Lindh-Knuutila, Honkela & Lagus (2006): Merkitysneuvotteluiden mallintaminen Rusanen, Lappi, Honkela & Nederström (2008): Filosofisten väittämien tulkinnan analyysi Ellis, Creutz, Honkela & Kurimo (2008): Puheesta puheeseen konekäännös Janasik, Honkela & Bruun (2009): Tekstinlouhinta laadullisen tutkimuksen apuna organisaatiotutkimuksessa
Esimerkkejä aiemmasta tutkimuksesta Van Heeswijk, Miche, Lindh-Knuutila, Hilbers, Honkela, Oja & Lendasse (2009): Aikasarja-analyysi Hakkarainen, Engeström, Paavola, Pohjola & Honkela (2009): Tietämyskäytännöt Paju, Malmi & Honkela (2011): Historiaa koskevien haastatteluiden sisältö- ja verkostoanalyysi Zhang, Augilius, Honkela, Laaksonen, Gamber & Alene (2011): Abstraktin taiteen tuottamien tunnereaktioiden ja kuvasisältöjen vertailu Honkela, Izzatdust & Lagus (2012): Vertaistukea edistävä tekstinlouhinta Mehmood & Honkela (2012): Ympäristökokouksen puheiden analyysi Lagus, Vatanen, Kettunen, Heikkilä, Heikkilä, Pantzar & Honkela (2012): Hyvinvointipolkujen etsiminen data-aineistoista
Digitaalisen humanismin lupaus Uusien lähestymistapojen avulla voidaan saada ymmärrystä suurista kokonaisuuksista ja asioiden välisistä hienovaraisistakin suhteista Ei olla kaukana siitä, että tietokone voi toimia ihmisten apuna sivistyksen edistämisessä On syntymässä liittoutuma humanististen ja sosiaalitieteiden sekä tietojenkäsittelytieteiden välillä monimutkaisten inhimillisten ja yhteiskunnallisesti keskeisten ilmiöiden ymmärtämiseksi.
Kieli, kielen oppiminen ja kielen rooli inhimillisen toiminnan keskeisenä välineenä
Merkityksen tilannekohtaisuus Contextuality of meaning red wine red skin red shirt Gärdenfors: Conceptual Spaces Hardin: Color for Philosophers
Merkityksen tilannekohtaisuus Contextuality of meaning? Shall I compare thee? to a summer's day?
Tieteenalat järjestettynä hakemusten englanninkielisten osuuksien suhteellisen määrän mukaan(*) Matematiikka 95.3 Farmasia 94.1 Kemia 93.7 Fysiikka 93.4 Biokemia, molekyylibiologia, mikrobiologia, perinnöllisyystiede ja biotekniikka 93.4 (*) Suomen Akatemialle osoitettujen hakemusten korpuksessa Solu- ja kehitysbiologia, fysiologia ja ekofysiologia 93.4 Tietojenkäsittelytieteet 93.0 Sähkötekniikka ja elektroniikka 92.8 Ympäristötekniikka 92.7 Geotieteet 92.1 Ekologia, evoluutiotutkimus ja systematiikka 92.1 Kone- ja valmistustekniikka 91.9 Metsätieteet 91.4 Avaruustieteet ja tähtitiede 91.0 Prosessi- ja materiaalitekniikka 90.8 Tilastotiede 90.7 Timo Honkela, Koneoppimin Muu ympäristön ja luonnonvarojen tutkimus 90.1
Eläinlääketiede 88.5 Kansanterveystiede 88.1 Kielitieteet 87.6 Filosofia 87.3 Liiketaloustiede, talousmaantiede ja tuotantotalous 87.2 Hammaslääketiede 86.7 Kansantaloustiede 86.3 Rakennus- ja yhdyskuntatekniikka 85.9 Maatalous- ja elintarviketieteet 85.4 Ympäristöpolitiikka, -talous ja -oikeus 85.3 Maantiede 84.8 Arkkitehtuuri ja teollinen muotoilu 83.7 Viestintä- ja informaatiotieteet 83.1 Kasvatustiede 82.6 Valtio-oppi ja hallintotiede 82.2 Taiteiden tutkimus 81.6 Sosiaalitieteet 80.4 Kulttuurien tutkimus 79.3 Historia ja arkeologia 78.1 Teologia 77.0 Oikeustiede 70.8
Einsiedeln Abbey is a Benedictine monastery in the town of Einsiedeln in the Canton of Schwyz, Switzerland. The abbey is dedicated to Our Lady of the Hermits, the title being derived from the circumstances of its foundation, for the first inhabitant of the region was Saint Meinrad, a hermit. It is a territorial abbey and, therefore, not part of a diocese, subject to a bishop. It has been a major resting point on the Way of St. James for centuries. (Wikipedia)
Eri näkökulmat
Sanat heijastelevat todellisuutta, eivät ole sen jäännöksetön jäljennös
Merkitykset ovat yksilöllisiä Hyvä Good Reilu Fair Hyödyllinen Useful Tieteellinen Scientific Demokraattinen Democratic Kestävä Sustainable jne. etc.
Kielen yksilötason oppimisen ja yhteisötason muuttumisen kehityskulut ovat sekä konvergentteja että divergenttejä
Menetelmällinen moninaisuus Tilastotiede Todennäköisyyslaskenta Informaatioteoria Simulointi Matriisilaskenta Tensorialgebra Hahmontunnistus Koneoppiminen Dynaamisten järjestelmien teoria jne. Kielen, sen tulkintaan ja oppimiseen liittyvien ilmiöiden monimutkaisuuden ja hienovaraisuuden takia tarvitaan monipuolinen menetelmäjoukko
Kaksi esimerkkiä Puheentunnistus, puhujantunnistus, kuvaanalyysi, videoanalyysi Merkitysten yksilöllisen tulkinnan mittaaminen (GICA-menetelmä, Grounded Intersubjective Concept Analysis)
Kiitän Jorma Laaksosta ja Mikko Kurimoa tutkimusryhmineen mahdollisuudesta esittää seuraava esimerkki automaattisen sisällönkuvailun nykytilasta users.ics.aalto.fi/jorma/ scholar.google.com/citations?user=suhzeyiaaaaj&hl=en users.ics.aalto.fi/mikkok/ elec.aalto.fi/en/about/careers/professors/mikko_kurimo/
Videokuva-analyysi Puhujantunnistus Puheentunnistus (puheesta tekstiksi)
Videokuva-analyysi Puhujantunnistus Tekstintunnistus (OCR) Puheentunnistus (puheesta tekstiksi)
Sanan 'terveys' (health) analyysi
Kulttuuri Culture Vaaliminen Preservation Ymmärtäminen Understanding Yhteiskunta Society Oppiminen Learning Päätöksenteko Decision making Tiede Science Infrastruktuurit Infrastructures Moninäkökulmaisuus Multiple perspectives
Kulttuuri Culture Vaaliminen Preservation Ymmärtäminen Understanding Yhteiskunta Society Oppiminen Learning Päätöksenteko Decision making Tiede Science VAPAUTUMINEN MÄÄRÄMUOTOISUUDEN TAAKASTA Infrastruktuurit Infrastructures Moninäkökulmaisuus Multiple perspectives
Alkäämme unohtako ihmistä järjestelmien keskellä
Kiitos! Tack! Thank you! Merci! Obrigado! Gracias! Danke schön! 有 り 難 う 謝 謝 Σας ευχαριστούμε!