Digitaalisten aineistojen tutkimus: Inhimillistä sivistystä ja yhteisymmärrystä puolustamassa Timo Honkela Helsingin yliopisto Nykykielten laitos 10.4.2014 Mikkelin maakunta arkiston 80 vuotisjuhla Kansalliskirjasto Digitointi- ja konservointikeskus
Digitaalinen humanismi Цифровой гуманизм Humanististen tieteiden tutkimusta tietokoneiden avulla Digitaaliset aineistot Laskennalliset mallit Teesit: Venäläisten vieraiden avuksi keskeisiä fraaseja on käännetty Googlen käännöstyökalulla Paperia osataan jo valmistaa ja kuuhun osataan lentää Tärkeimmät ratkaisemattomat kysymykset maailmassamme liittyvät humanististen ja sosiaalitieteiden alueelle Переводы на русский язык были сделаны с Google Translate
цифровой вычислительный Digitaalinen Laskennallinen Sisältöjen tallentaminen ja siirtäminen Sisältöjen muokkaaminen ja tulkinta Humanismi гуманитарные науки
Sivistyksestä Suomalaisen yhteiskunnan yksi vahvuus on se, että korkean koulutus- ja sivistystason ansiosta kansalaiset pystyvät laajasti osallistumaan yhteisten asioiden hoitoon. Sivistystä ei ole se, että on jonkin tietyn alan asiantuntija tuntee juuri tietyn osuuden yhteisestä kulttuuriperinteestä. Sivistykseen kuuluu pikemminkin se, että ihminen pystyy arvioimaan eri suunnilta saamiaan tiedon sirpaleita ja hahmottamaan niistä muodostuvia kokonaisuuksia.
Sivistyksestä Sivistyksen syntymistä ja kehittymistä edistää huolellisesti rakennettu koululaitos, joka pitää huolta tietotason ja lukeneisuuden perusteista. Pelkkä ulkoa oppiminen tai kirjaviisaus ei sellaisenaan riitä sivistyksen kasvattamiseen. Kyse on myös asenteista, motivaatiosta, toisten ihmisen kokemuksen ja näkökulmien kunnioittamisesta, nöyryydestä, ilosta ja halusta oppia ja ymmärtää lisää maailmasta ja sen monimutkaisista ilmiöistä. Sivistykseen kuuluu kunnioitus erilaisia ilmiötä kohtaan ja valmius haastaa omat ja toisten käsitykset kunniottavalla tavalla.
Yleissivistyksen moninaisuudesta Sivistyneisyyteen voi kuulua kiinnostuneisuus koskien antiikin kreikkalaisten runoutta, maailman-historian kehityskulkuja, talouden taustalla vaikuttavia mekanismeja tai kuuluisien säveltäjien parhaita saavutuksia. Inhimillinen kulttuuri on elävä ilmiö, johon kuuluvat nykymaailmassa myös elokuvat, popmusiikki, tietokonepelit ja urheilu. Esimerkiksi yksi maailmanhistorian nerokkaimmaksi luonnehdituista säveltäjistä, Dmitri Shostakovitsh kävi säännöllisesti katsomassa jalkapallo-otteluita. Mikä tahansa tarpeeksi monimutkainen ilmiö muuttuu osaksi inhimillistä kulttuuria.
Muistiorganisaatioiden rooleista Millä tavalla sivistys liittyy muistiorganisaatioihin ja varsinkaan niiden aineistojen digitalisoitumiseen, jota moni ehkä pitää varsin vähäpätöisenäkin teknologisena muunnosoperaationa? Ensinnäkin kirjastot ja arkistot ovat yhteiskunnassa keskeisiä toimijoita ylläpitämässä yhteistä kokemusperintöä ja säilyttämässä kulttuuriperintöä. Kirjastot ovat keskeinen toimija, kun ajatellaan sitä välillisen kokemuksen ja tiedon monipuolisuutta, jota lapset ja nuoret saavat koulujen opintoohjelmien ulkopuolelta.
Muistiorganisaatioiden rooleista Kirjastojen ja arkistojen aarteet ovat monien alojen tutkijoille keskeinen tietolähde, joiden kautta heille avautuu mahdollisuus rakentaa tarkentuvaa kuvaa siitä, miten nykyhetki ja tuleva ovat rakentuneet.
Digitaalisuudesta Digitalisoituminen on osin uhka mutta myös mahdollisuus. Hakukoneet ja sähköisessä muodossa olevat tieteelliset artikkelit ja aineistot ovat saaneet aikaan sen, että monilla aloilla tutkijat viettävät paljon aiempaa vähemmän aikaa kirjastoissa ja arkistoissa. Virtualisoituminen on kuitenkin vain osa kehittymässä olevasta kokonaisuudesta. Siitä, että aineistot ovat digitaalisessa muodossa, seuraa nimittäin aivan uudenlaisia mahdollisuuksia.
Tekstien louhinta Tilastollisen koneoppimisen keinoin kone voidaan laittaa lukemaan suuria tekstimääriä ja selvittämään asioita, joita yksittäinen ihminen ei voisi koskaan tehdä. Kone voi käydä läpi miljoonia tai tarvittaessa jopa miljardeja tekstejä. Tässä on kyse paljon muustakin kuin vain perinteisestä tiedonhausta, koska tavoitteena ei ole löytää yksittäisiä dokumentteja tai tiedonsirpaleita vaan muodostaa ymmärrystä suurista kokonaisuuksista.
Leksikaalisen semantiikan tilastollinen mallintaminen Статистическое моделирование лексической семантики Sanat, fraasit, tulkinnat tms. Yksilöt Kontekstiedon tilastollinen analyysi: * Latent Semantic Analysis * Word Category Maps * Word ICA Kontekstit * Latent Dirichlet Allocation
Sanakartta Карта слов (Honkela, Pulkki, Kohonen 1995)
Suomen tieteen kartta карта науки в Финляндии Medicine Biosciences Physics and engineering Culture and society Tuotettu automaattisesti ilman ihmisluokitteluita Suomen Akatemialle osoitetuista 3324 hakemuksesta käyttäen tilastollista termi-irrotusta ja itseorganisoivaa karttaa. Tilastollinen termi-irrotus: ks. Paukkeri et al. 2008 Honkela & Klami 2007 Chemistry
GICA: Grounded Intersubjective Concept Analysis - Tulkinnan yksilöllisyyden mallintaminen Моделирование субъективность семантики Sanat, fraasit, tulkinnat tms. Kontekstit Yksilöt
Kuvat, sanat ja tunteet Анализируя Эмоциональные семантика абстрактного искусства Analyzing Emotional Semantics of Abstract Art Using Low-Level Image Features. He Zhang, Eimontas Augilius, Timo Honkela, Jorma Laaksonen, Hannes Gamper and Henok Alene, Proceedings of IDA 2011.
Liikeverbit ja ihmisen todellinen liike Глаголы движения и реального человеческого движения (Förger & Honkela 2013)
Digitaalisen humanismin lupaus Uusien lähestymistapojen avulla voidaan saada ymmärrystä suurista kokonaisuuksista ja asioiden välisistä hienovaraisistakin suhteista Ei olla kaukana siitä, että tietokone voi toimia ihmisten apuna sivistyksen edistämisessä On syntymässä liittoutuma humanististen ja sosiaalitieteiden sekä tietojenkäsittelytieteiden välillä monimutkaisten inhimillisten ja yhteiskunnallisesti keskeisten ilmiöiden ymmärtämiseksi ja inhimillisen viisauden vahvistamiseksi.
Yhteisymmärryksen rakentaminen Keskeinen osa viisauden vahvistamista on ihmisten keskinäisen ymmärryksen edistäminen. Perinteisesti monet tietojärjestelmät ja jopa kirjastojen luokittelujärjestelmät ovat perustuneet yhteen valittuun tapaan hahmottaa maailma. Erilaisia perusteltuja käsityksiä ja käsitejärjestelmiä on kuitenkin valtava määrä ja niiden välisessä sovittelussa tietokoneilla tulee olemaan tulevaisuudessa keskeinen rooli. Tämän ihmisten välistä kunnioittavaa ja rauhanomaista rinnakkainoloa korostavan kehityksen polulla digitalisoituminen on yksi varhainen askel.
Nelli Honkela
Kiitoksia tarkkaavaisuudestanne! Спасибо за внимание!