Kynä ja kone keskustakampuksella. Kaikki siitä puhuvat, mutta mitä se on: digitaalisuus? Kynä ja kone: Menetelmät ja analyysit.

Samankaltaiset tiedostot
Tulevaisuuden tutkimuksen seura Studia Generalia -esitelmä. Tekoälyn ja koneoppimisen uhat ja mahdollisuudet. Timo Honkela.

Studia Generalia: MIKÄ BIG DATA? Kylmä data kohtaa inhimillisen tulkinnan: koneoppiminen ihmistieteiden työkaluna. Timo Honkela

Edistyksen päivät, Helsinki. Voiko tutkija muuttaa maailmaa? Humanistista meta-analyysiä merkitysneuvottelevien koneiden avulla.

Kielellisten merkitysten tilastollinen ja psykologinen luonne: Kognitiivisia ja filosofisia näkökulmia. Timo Honkela.

JUHTA ja VAHTI juhlatilaisuus, Tietojärjestelmien tulevaisuudesta tekoälyn kehityksen näkökulmasta. Timo Honkela.

TIETOINEN HAVAINTO, TIETOINEN HAVAINNOINTI JA TULKINTA SEKÄ HAVAINNOLLISTAMINEN

E. Oja ja H. Mannila Datasta Tietoon: Luku 2

HAVAINTO LÄhde: Vilkka 2006, Tutki ja havainnoi. Helsinki: Tammi.

Luku 2. Datasta tietoon: mitä dataa? mitä tietoa?

Paneelin 20 näkökulma. Sami Pihlström Tutkijakollegium & teologinen tdk, Helsingin yliopisto sami.pihlstrom@helsinki.fi

Tarvitseeko informaatioteknologia matematiikkaa?

Sisällönanalyysi. Sisältö

Tilaisuus alkaa klo 9 ( ). #digibarometri Wi-Fi: FinlandiaHall

Johdatus rakenteisiin dokumentteihin

Laadullinen tutkimus. KTT Riku Oksman

YLEISESITTELY: MITÄ ON AVOIN TIEDE? Ilkka Niiniluoto Helsingin yliopisto OKM:n seminaari

Itseorganisoituvat hermoverkot: Viitekehys mielen ja kielen, aivokuoren ja käsitteiden tarkasteluun

Tiedonlouhinta rakenteisista dokumenteista (seminaarityö)

Tilastotiede ottaa aivoon

Useiden top-viittausindeksien tarkastelu tieteenalaryhmittäin Suomessa ja valituissa verrokkimaissa

MIKÄ ON HAVAINTO? TIEDON SUBJEKTIIVINEN LÄHTÖKOHTA

KIRJALLISUUTTA 1. Tieteen etiikka KIRJALLISUUTTA 3 KIRJALLISUUTTA 2 KIRJALLISUUTTA 4 KIRJALLISUUTTA 5

Robotit kuntien päätöksenteon tukena

Teoreettisen viitekehyksen rakentaminen

Jälkidigitaalinen tiede tieteellisen tiedon saatavuuden muutos

Rekisterit tutkimusaineistona: tieteenfilosofis-metodologiset lähtökohdat

Tiedekuntajako. Ehdotus

Analytiikan teknologiset trendit ja uudet mahdollisuudet HR:lle. Heikki Penttinen, OlapCon Oy

TIEDE KUULUU KAIKILLE. Helsingin yliopisto Pirjo Hiidenmaa

Tilastotiede ottaa aivoon

TIETEEN TILA Tohtoreiden sijoittuminen työelämässä: toimialoittainen tarkastelu

Tekoäly tänään , Vadim Kulikov (Helsingin Yliopisto)

Kieli merkitys ja logiikka. 2: Helpot ja monimutkaiset. Luento 2. Monimutkaiset ongelmat. Monimutkaiset ongelmat

Tieteen tila katsauksen tohtoreiden sijoittumista koskevien tarkastelujen tieteenalaryhmittelyt

PSY181 Psykologisen tutkimuksen perusteet, kirjallinen harjoitustyö ja kirjatentti

Toiminnan filosofia ja lääketiede. Suomen lääketieteen filosofian seura

HAVAINTO, TIEDONINTRESSI, PÄÄTTELY, HAVAINNOLLISTAMINEN JA DIALOGINEN KIRJOITTAMINEN MIKÄ ON HAVAINTO?

Joustavuus ja eettisyys: Opiskelija osaa tehdä päätöksiä ja toimia itsenäisesti terveystieteiden eettisten perusteiden mukaisesti

Malleja ja menetelmiä geometriseen tietokonenäköön

Tekoäly tukiäly. Eija Kalliala, Marjatta Ikkala

Hakijoista ensikertalaisia yht. yht.

Yhteentoimivuusalusta: Miten saadaan ihmiset ja koneet ymmärtämään toisiaan paremmin?

Kieli-, käännös- ja kirjallisuustieteiden yksikkö

Matematiikan olemus Juha Oikkonen

Tieteenfilosofia 3/4. Heikki J. Koskinen, FT, Dos. Helsingin yliopisto / Suomen Akatemia

Julkaisukohtainen kirjoittajien lukumäärä tieteellisissä julkaisuissa: kansainvälinen kehitys ja tieteenaloittaiset erot OKM-julkaisuaineistossa

Tähtitieteen käytännön menetelmiä Kevät 2009

Paavo Kyyrönen & Janne Raassina

Hyväksyttyjä. Aloituspaikat. Hyväksytyt. kaikista hakijoista ,0 % ,0 % ,0 % ,0 % ,7 % 130,7/180

Tekoäly ja tietoturva Professori, laitosjohtaja Sasu Tarkoma Tietojenkäsittelytieteen laitos Helsingin yliopisto

Jarmo Saarti Kirjastojuridiikan ajankohtaispäivä Kirjastot ja datamining, tutkijan ja kirjaston näkökulmat

AVOIN DATA AVAIN UUTEEN Seminaarin avaus Kansleri Ilkka Niiniluoto Helsingin yliopisto

Digitaalisten aineistojen tutkimus: Inhimillistä sivistystä ja yhteisymmärrystä puolustamassa. Timo Honkela

Yleistä lukion ainevalinnoista

Hyväksyttyjä. Aloituspaikat. Hyväksytyt. kaikista hakijoista ,0 % ,0 % ,0 % ,0 % ,3 % 40/70 62,6/100

Kuvailun verkostoituminen - kuvailufilosofiaa ja visioita

Avoimen väylä, terveystieteiden kandidaattiohjelma, terveystieteiden kandidaatti (3 v): Jyväskylän yliopisto, Liikuntatieteellinen tiedekunta 7

KONEOPPIMISEN HYÖDYNTÄMINEN: AUTOMAATTINEN TIKETTIEN KÄSITTELY. Esa Sairanen

Tietokoneohjelmien käyttö laadullisen aineiston analyysin apuna

TIETEEN TILA Tohtoreiden sijoittuminen työelämässä: tieteenalaluokitukset

Altmetriikka teoriaa ja käytäntöä

Tietoarkisto palveluksessanne. Avoin tutkimusdata ja aineistonhallinta ihmistieteissä Hannele Keckman-Koivuniemi

Monilukutaito. Marja Tuomi

Tieteenaloittaiset tilastot: Luonnontieteet

Tilastot: Kaikki tieteenalat yhteensä ja t&k-toiminta päätieteenaloittain

Tieteenaloittaiset tilastot: Yhteiskuntatieteet

Hyväksyttyjä. Paikan vastaanottaneet. Aloituspaikat. kaikista hakijoista ,0 % ,7 % ,0 % ,0 %

Jyväskylän yliopisto Opiskelijarekisterit , Tapani Harden, Mirja Tervo

Lukion ainevalinnat ja opiskelijarekrytointi, erinomaisten arvosanojen (L ja E) määrä aineyhdistelmissä

AVOIN DIGITAALINEN KULTTUURIPE RINTÖ JA OPISKELIJAT (5OP, HELSINGIN YLIOPISTO) MAIJA PAAVOLAINEN HELSINGIN YLIOPISTON KIRJASTO

NÄYTÖN ARVIOINTI: SYSTEMAATTINEN KIRJALLISUUSKATSAUS JA META-ANALYYSI. EHL Starck Susanna & EHL Palo Katri Vaasan kaupunki 22.9.

Matemaatikot ja tilastotieteilijät

Tieteenaloittaiset tilastot: Tekniikka

Tekoäly lääkärin päätöksenteon tukena. Arho Virkki, DI, FT Lääketieteellisen matematiikan dosentti, TY Auria tietopalvelun johtaja, TYKS

MTTTS2 Pro gradu -tutkielma ja seminaari. Kevät 2014, 40op Jaakko Peltonen

Mitä on sisällönkuvailu

4. Lausekielinen ohjelmointi 4.1

Puheenkäsittelyn menetelmät

Kvalitatiivisen aineiston analyysi

Kielellisen datan käsittely ja analyysi tutkimuksessa

Onko tietoallas osa ongelmaa vai osa ratkaisua? Tiedontuotannonkerrosarkkitehtuuri TOIVO-ohjelman avausseminaari Tiedä ensin, johda sitten 27.2.

Bibliometriikka Suomessa 1970-luvulta 2010-luvulle. Maria Forsman VTT Bibliometriikka- seminaari OKM, SYN, HULib, CSC

DAISY. Esteetöntä julkaisua

Automaattinen semanttinen annotointi

Tekoäly ja sen soveltaminen yrityksissä. Mika Rantonen

Ohjausryhmän kokous 4/2008

Liite opintojohtosääntöön (päivitetty vastaamaan voimassa olevaa lainsäädäntöä ja yliopiston hallituksen päätöksiä)

Tee-se-itse -tekoäly

Mitä on laadullinen tutkimus? Pertti Alasuutari Tampereen yliopisto

Kandiaikataulu ja -ohjeita

Informaatioverkostot, tietojenkäsittelytiede ja tietojärjestelmätiede.

Digitalisaation edellytykset sosiaalityössä

AJATTELE ITSE. Hanna Vilkka

LAADULLISESTA SISÄLLÖNANALYYSISTÄ

KDK: Finna ja pitkäaikaissäilytys

Yhteistyöaineiden edustajan puheenvuoro

Tekstinlouhinnan mahdollisuudet Digin historiallisessa sanomalehtiaineistossa. Kimmo Kettunen Dimiko (Digra-projekti)

Tiedon louhinnan teoria (ja käytäntö) OUGF kevätseminaari 2004 Hannu Toivonen

Googlen palvelut synkronoinnin apuna. Kampin palvelukeskus Jukka Hanhinen, Urho Karjalainen, Rene Tigerstedt, Pirjo Salo

Lukuohje. Oulun yliopisto

Transkriptio:

Kynä ja kone keskustakampuksella Kaikki siitä puhuvat, mutta mitä se on: digitaalisuus? Kynä ja kone: Menetelmät ja analyysit Timo Honkela timo.honkela@helsinki.fi 15.9.2016 Järjestäjät Pirjo Hiidenmaa Timo Honkela Maija Paavolainen

Valtavat ohjelmistomassat nyky-yhteiskunnan peruspilareina Ohjelmarivejä: - Unix 1.0 ~ 10.000 - Windows 3.1 ~ 2.000.000 - Firefox ~ 10.000.000 Suomalaislähtöisiä: - MySQL ~ 13.000.000 - Linux 3.1 ~ 15.000.000 http://www.informationisbeautiful.net/visualizations/million-lines-of-code/ - Facebook ~ 60.000.000 - Googlen palvelut ~ 2.000.000.000

http://375humanistia.helsinki.fi/humanistit Humanististen tieteenalojen ja tutkimusaiheiden moninaisuus ja tärkeys Andrew Chesterman Pirjo Hiidenmaa Ilkka Niiniluoto Terttu Nevalainen Käännöstiede Tiedeviestintä Filosofia Historiallinen sosiolingvistiikka Pirjo Kolbe Jaakko Hintikka Anna Mauranen Euroopan historia Tietoteoria Englanti lingua francana René Gothoni Uskontotiede

Humanistiset tieteet: valtavat aineistot Kirjat, artikkelit ja muut raportit Tutkimusaineistot

Humanistiset tieteet: valtavat aineistot Kirjat, Yksinäistä työtä, Tutkimusartikkelit erillisiä aineistoja ja muut aineistot ja tuloksia!? raportit

Tietoteknisiä muutostekijöitä Laskentakapasiteetti kasvaa Muistitila kasvaa Koneoppimisen ja hahmontunnistuksen lisääntyvä käyttö Uusia menetelmiä kehitetään, vanhoja löydetään uudelleen Saatavilla olevien aineistojen määrä ja koko kasvavat ( Big Data, Open Data, Open Linked Data )

Miksi laskenta- ja muistikapasiteetilla on merkitystä? Voidaan tarkastella digitaalisessa muodossa olevan puheen, musiikin tai kuva- ja videomateriaalinen laatua, jos käytettävissä on niukasti tai runsaasti tietokoneen muistia Edes tekstiaineistojen analyysi ei ollut aikoinaan kunnolla mahdollista kapasiteettirajoitusten takia. Niinpä monia hyviä analyysimenetelmiä on voitu keksiä jo vuosikymmeniäkin sitten ja nykyään niitä keksitään uudelleen

Kapasiteetin merkitystä Esimerkiksi digitaalinen kuva tai musiikkikappale voidaan esittää mielekkäästi vasta, kun kapasiteettia on riittävästi Kognitiivisten tulkintaprosessien simulointi vaatii vielä paljon enemmän resursseja

Tieteenfilosofisia näkökulmia Deduktiivinen, abduktiivinen ja induktiivinen päättely Teoria- versus aiheistolähtöisyys Rakennetaan teoria tai esitysmuoto sisäisen näkemyksen varassa Rakennetaan teoria tai esitysmuoto teorialähtöisesti mutta varmistaen sen toimivuus aineistoilla Rakennetaan teoria tai esitysmuoto aineistolähtöisesti esimerkiksi koneoppimista hyödyntäen

Tilastotiede von oben ja von unten Tilastotiedettä voidaan käyttää menetelmänä hypoteesien statuksen selvittämiseksi Tilastotiedettä ja todennäköisyyslaskentaa voidaan hyödyntää myös automaattiseen teorianmuodostukseen eli siihen, että tilastollisen koneoppimisen avulla muodostetaan tieteellisiä malleja

(Honkela & Klami, 2008) Suomen tieteen analyysi von unten : Suomen Akatemian aineiston louhinta Kohonen: Self-Organizing Map -neuroverkkoalgoritmi & Paukkeri et al.: Likey / datapohjainen termien valinta aineistosta

Suomen tieteen analyysi von unten : Suomen Akatemian aineiston louhinta Bio- ja ympäristötieteet Kone auttaa käymään Luonnon-jopa ja läpi tuhansia, insinööritieteet miljoonia dokumentteja Tieteellisiä tekstejä Terveystieteet ei lueta ainoastaan ihmisvoimin yksi kerrallaan Kulttuuri- ja yhteiskuntatieteet (Honkela & Klami, 2008) Kemia

Sanojen suhteet paljastuvat niiden käytöstä Kun käytettävissä on suuria tekstiaineistoja, mielivaltaisen kielen sanojen välisiä suhteita voidaan selvittää tilastollisesti Perusidea on se, että kahta sanaa käytetään tyypillisesti samaan tapaan (samanlaisessa lauseyhteydessä), jos niiden merkitykset ja/tai kieliopillinen rooli on samankaltainen

Tekoäly ja koneoppiminen kirjastossa Automaattinen asiasanoitus Dokumenttien automaattinen luokittelu Kunkin dokumentin sijoittaminen yhteen tai usempaan luokkaan; ehkä erilaisilla jäsenyysasteilla WEBSOM: Honkela, Kaski, Dokumenttien ryhmittely luokittelun sijaan tai lisäksi Virtuaalinen kirjasto Kohonen, Lagus (1996...)

AINEISTOT ANALYYSITAPOJA - Numeerinen data - Tekstikokoelma - Vahvasti hahmoluonteinen (ääni, puhe, kuva, jne.) - Sekamuodot - Teorian testaaminen - Teorian tai representaation kehkeyttäminen datan pohjalta - Sekamuodot

Digitaaliset ihmistieteet tieteen kartalla Ihmistieteiteiden ja yhteiskuntatieteiden ydinkysymyksiä ei voi lähestyä yksioikoisesti luonnontieteiden ihanteiden varassa ja niiden menetelmillä; siihen ne ovat liian yksinkertaisia ja yksinkertaistavia Tietokoneavusteisuus antaa kuitenkin mahdollisuuden rakentaa uusia siltoja ja uudenlaista meta-analyysia Suuria humanistisia aineistoja voidaan analysoida olettamatta, että niiden pohjalla olevat tulkinnat ovat luonnontieteellisen yksinkertaisia vaan pohjautuvat rikkaaseen ja monimutkaiseen sosiokulttuuriseen ja yksilöpsykologiseen puitteeseen

Koneen lisääntyvä intuitio?! Honkela (2000) Koneelle voidaan syöttää keinotekoista kokemusta, joka ei ole valmiiksi kielellisessä tai luokitellussa muodossa Näin ollen koneen voidaan ajatella saavuttavan keinotekoista intuitiota Jonkin johtopäätöksen taustalla vaikkapa voi punnita tuhansia tekijöitä; päättely on näin hienovaraisempaa kuin vaikkapa looginen päättely, joka on itse asiassa varsin pinnallista Esim. Rasmus, Valpola, keinotekoinen Honkala. Berglund, Raikoneuroverkko http://arxiv.org/pdf/1507.02672v1.pdf https://en.wikipedia.org/wiki/biological_neural_network

(Kieli)aineistojen analyysin erityiskysymyksiä Tekstiaineistojen teorialähtöinen koodaus Metadatan käyttö ilmiöiden tutkimuksessa Ko(n)tekstidatan hyödyntäminen analyysissa (esim. topiikkimallit) Yhteiskunnallinen analyysi Tunteet ja kieli Kieli ja kuvallinen informaatio Kulttuurikonteksti, tulkinnan yksilöllisyyys

Kuvia katselevat ja tuottavat koneet Myös kuvallinen data voi olla koneoppimismenetelmien kohteena PICSOM: Laaksonen, Koskela, Oja (1999...) Kaupalliset sovellukset tunnistavat esimerkiksi ihmisiä kuvista http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.117.6021&rep=rep1&type=pdf

Kuvia katselevat ja tuottavat koneet Myös kuvallinen data voi olla koneoppimismenetelmien kohteena PICSOM: Laaksonen, Koskela, Oja (1999...) Kaupalliset sovellukset tunnistavat esimerkiksi ihmisiä kuvista Kuva- ja videoanalyysin huippuasiantuntija Jorma Laaksonen tulee keskustelemaan kanssamme noin klo 15. http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.117.6021&rep=rep1&type=pdf

Humanististen tieteiden meta-analyysi Analyysi olettaen sanojen jaettu merkitys Aineisto sanoineen Analyysi hyödyntäen merkityksien vaihtelumallia Honkelan ehdotus Merkityksien analyysi rikkaisssa konteksteissa Aineisto sanoineen

Kiitos! http://375humanistia.helsinki.fi/humanistit/timo-honkela http://www.slideshare.net/timohonkela https://www.youtube.com/watch?v=uxwkgpmmzdk