Taksonomiasta folksonomiaan Metatiedon merkitys tiedon haussa

Taksonomiasta folksonomiaan Metatiedon merkitys tiedon haussa Jari Kaponen

What is Watson? http://www.youtube.com/watch?v=fc3irywr4c8 IBM and the Jeopardy Challenge2.mp4

http://www-05.ibm.com/innovation/fi/ideasfromibm/library/watson/

Tammikuussa 1511

Jeopardy HÄN TODISTI KUINKA MAAPALLO ON TAIVAANKAIKKEUDEN KESKIPISTE

Kuka on Ptolemaios?

Oli kuitenkin joitain viiteitä siitä, että maapallokeskeinen ajattelu ei ollut oikeassa

Kunnes tuli Nicolaus Copernicus

Oliko maapallokeskeisyys harhaoppi?

Ehkäpä ongelma oli vain näkökulmassa

Miten tämä liittyy päivän puheenaiheeseen?

Uudet välineet ja kokemus ovat tarjonneet erilaisen näkökulman maapallokeskeisyyteen

Tarkastellaanpa sisällönhallintaa historiallisesta näkökulmastamme dokumenteista katsottuna

Olemme kehittäneet kirjastoista oman tieteenalansa

Jeopardy HÄN KEHITTI MAAILMAN SUOSITUIMMAN JA YHÄ KÄYTÖSSÄ OLEVAN KIRJOJEN LUOKITUSJÄRJESTELMÄN

Jeopardy Kuka on Melvil Dewey?

Jeopardy PERUSTUEN DEWEYN DESIMAALISEEN JÄRJESTLEMÄÄN 700-SARJAN KIRJAT KÄSITTELEVÄT TÄTÄ AIHETTA 734

Jeopardy Mikä on taide? 700 Arts 730 Plastic Arts, Sculpture 734 Sculpture from ca. 500 to 1399 734

Löydätkö etsimäsi aineiston luokitusjärjestelmän perusteella?

Miksi työssä on niin vaikea löytää etsimäänsä?

Jeopardy TÄMÄ HENKILÖ TUOTTI PAINOA SISÄLLÖN HALLINNAN HAASTEILLE

Jeopardy Kuka on Gutenberg?

Painokoneen voima

Nyt kaikilla on painokone

Saavutamme enemmän tietoa kuin haluamme

Tiedon dokumenttikeskeinen malli on särkynyt

Dokumenttikeskeisyys on meillä DNA:ssa

Mutta emme voi vain jäädä vaistojen ohjaamana väistelemään dokumenttikeskeisyyden tuottamia tulva-aaltoja

Löydän etsimäni, mutta minkä valitsen?

Minkä näistä valitsen? Mikkä perusteella valitsen?

Kenen tekemä, missä roolissa?

Mitä siitä ovat muut sanoneet? Kuinka ovat merkinneet, miten ovat käyttäneet

Jonkun on jo tarvinnut pyöriä tämän asian ympärillä

Uudet työvälineet antavat erilaisen näkökulman

Mietipä ihmiskeskeistä mallia

Samalla voit ratkaista monta muuta liiketoiminnan ongelmaa

Otetaanpa esimerkki: Vaivaton yhden kentän haku, vaikea valinta. Minkä näistä valitsen?

Demo...

Helppo yhden kentän haku toimi. Löysi varmasti ja paljon, ja johti valintatilanteeseen. Ihmiskeskeisessä mallissa se ei ollutkaan niin vaikea. Valinnassa auttaa, kun sosiaalinen metatieto kertoo: - kenen tekemä - kuka sitä käyttää tai jakaa edelleen ja kenelle - mitä siitä ovat muut sanoneet - mitä tunnisteita siitä on käytetty

Ajattelit ehkä etsiä dokumenttia, mutta saatoitkin löytää henkilön taikka yhteisön. Usein se on vielä arvokkaampaa, sillä se johtaa tietoon tietysti myös dokumenttien muodossa. [Mitä merkitsee, jos etsit jotakin oudossa paikassa, ja kohtaa tutun ihmisen?] Reitti jatkuu henkilöstä sisältöön......ja sisällöstä henkilöön ja...

Reitti merkitykselliseen tietoon kulkee useimmiten ihmisen kautta missä asia, siinä nimi, missä nimi, siinä yhteys

Sosiaalisuus ei noudata hierarkiaa. Siksi paras kartta yhteyksistä tietoon syntyy soliaalisen analytiikan keinoin. Heikko Senior Vice President Riitta Anne Explorations Drilling Production Williams Susanna Rami Kaisa G& G Petrophysical Production Reservoir Andreas Pekka Timo O Brien Katri Susanna Jaska Jukka Rane Arska Cohen Matti Pena Liisa Kelly Jörgen Andrews Mårten Miller Mark Stefan Anne Ville Lars Hussain Pena Taylor Hussain Pekka Kelly Ramirez Bell Sten Sosiaalisen verkoston analyysi

Kirjanmerkit luovat siltoja yli siilorajojen. Metatiedon ei tarvitse perustua pelkästään dokumentteihin eikä yleensäkään yksittäisen järjestelmän sisältöön. Kirjanmerkeillä sitä voidaan liittää minne tahansa. Sosiaaliset kirjanmerkit perustuvat inhimilliseen älykkyyteen kontekstista. Sisältömme ovat jumissa tässä työtilassa, tällä levyalueella, tässä kirjastossa... Hei siellä! Tarvitsemme tietojanne.

Ihmiset tekevät hakujen jälkeistä analysointia jatkuvasti. Kirjanmerkeillä he jakavat tuloksensa helpottamaan seuraavia hakuja. Omia ja muiden tekemiä. Sisältömme ovat jumissa tässä työtilassa, tässä kirjastossa, tässä... Hei siellä! Tarvitsemme tietojanne.

Sosiaalisen metatiedon menestyksen tekijä: EnterpriseTagging Service Metatietojen on toimittava yli siilorajojen: Sisällönhallinnassa sen pitäisi olla itsestään selvää (vaan ei aina ole), mutta myös sosiaalisten avainsanoen on muodostettava yhksi yhtenäinen pilvi, olivatpa ne liitetty henkilöön, kirjanmerkkiin, wikisivuun, bogiin, minne tahansa; vaikkapa dokumenttiin missä tahansa yhteisössä. Testaapa oma työtilatuotteesi: Mikä erottaa se sisällönhallintajärjestlemästä? Kokeile miten dokumentti siirretään kansiosta toiseen, ja mitä silloin tapahtuu tunnisteille ja kommenteille? Vain alustatason yhtenäinen palvelu voi mahdollistaa sisällön todellisen hallinnan, järkevän hakemisen ja esimerkiksi sosiaalisen analytiikan.

Siis. Mitäpä jos dokumentti ei olekaan tietämyksen keskipiste?

Entäpä ihmiset? Eivätkö juuri ihmiset eri rooleissaan olekin tiedon alkulähde?

Osa 2: Menetetty tieto

Menetetty tieto Kun ihmisiä jättää tehtävänsä, heidän mukanaan lähtee paljon tietoa..., joka aluksi jää heidän viesteihinsä, tiedostoihinsa, levyasemiin, työtiloihin, jne. Ihmiskeskeinen lähestymistapa ja siitä lähtevät tietotekniset palveut vievät kaiken sisällön entistä paemmin käyttäjien ulottuville. Monissa asioissa mm. oikeudellisen tarkkailtavuuden vuoksi ja yleensäkin aktiivisen vaiheen jälkeen on tunnistettava, mikä sisältö on säilytettävä organisoidusti ja pitkäaikaisesti. Silloin ei riitä, että tieto ainoastaan löytyy. Katsotaanpa vielä ratkaisu siihenkin...

Luokittelemattoman sisällön määrä kasvaa joka tapauksessa

Luokittelematonta sisältöä

Sisltö voidaan (yrittää) varustaa metetiedolla tallenusvaiheessa ja tallennusta voidaan automatisoida (tai pakottaa tiedon tuottajat ja käsittelijät tekemään sitä)

Siitä huolimatta luokittelu ei useinkaan ole laadukasta ei palvele hakuja eikä varsinkaan hallintaa

Luokittelemattoman sisällön määrä on taipuvainen kasvamaan siinä tahdissa kuin uusia sisältöläheitä tai sisältötyyppejä ilmaantuu

Erityinen haaste ovat hajadokumentit, perinteisesti sähköposti ja verkkolevyt. Siirtyminen verkkolevyistä työtiloihin on yhä vain kasvattanut hallintaa kaipaavan sisällön määrää.

IBM Classification Module luokittelee tiedot automaattisesti

Lähtökohtana on luonnollisen kielen lingvistinen käsittely ja semanttinen analyysi, mikä tekee ison eron pelkkään sääntöpohjaisen käsittelyyn.

Luokittelun pohjaksi luodaan perus-taksonomia, jota koneellinen luokittelu edelleen kehittää. Se erottelee myös sisällön, jota ei tulekaan luokitella.

Luokittelu tuottaa statistiikkaa automatiikan onnistumisesta, ja luokittelua voidaan hienosäätää.

Koneellinen luokittelu löytää sijainnin ja metetiedot osalle sisällöstä. Loput luokitellaan luokittelemattomaksi

Luokittelematta jätetystä sisällöstä syntyy ehdotus taksonomian kehittämiseksi.

Taksonomian kehittämisessä ihminen osallistuu työhön, mutta työn tarve vähenee nopasti, samalla kuin automaattinen luokittelu kasvaa (50->100%)

Saavutettu tarkkuus tietosisältöjen luokittelussa antaa paljon hyötyjä: Alentaa riskejä Parantaa tuottavuutta Nopeuttaa tulksiin pääsyä

Saavutettu tarkkuus tietosisältöjen luokittelussa antaa paljon hyötyjä: Alentaa riskejä Parantaa tuottavuutta Nopeuttaa tulksiin pääsyä Parantaa muutosvalmiutta

Yhteenveto Metatiedon merkitys Hakujen kannalta: tarkennettuja hakuja ja arvottamista Sosiaalinen metatieto on tässä tarkoituksessa erityisen arvokasta. Hallinnan kannalta: sarjoittaminen ja poistaminen Tässä auttaa erityisesti automaattinen luokittelu ja siihen kytketty sisällönhallinnan kokonaisjärjestelmä

1) Vaihda näkökulma dokumenteista ihmisiin. Saat aktiivisessa vaiheessa olevan tiedon ihmisten ulottuville.

2) Käsittele tulviva tieto koneellisesti takaisin kontekstiin ja oikeasti sisällönhallinnan piiriin

Pidetään yhteyttä Jari Kaponen IBM Social Business Specialist jari.kaponen@fi.ibm.com http://www.ibm.com/profiles

Keskustelua

Legal Disclaimer IBM Corporation 2011. All Rights Reserved. The information contained in this publication is provided for informational purposes only. While efforts were made to verify the completeness and accuracy of the information contained in this publication, it is provided AS IS without warranty of any kind, express or implied. In addition, this information is based on IBM s current product plans and strategy, which are subject to change by IBM without notice. IBM shall not be responsible for any damages arising out of the use of, or otherwise related to, this publication or any other materials. Nothing contained in this publication is intended to, nor shall have the effect of, creating any warranties or representations from IBM or its suppliers or licensors, or altering the terms and conditions of the applicable license agreement governing the use of IBM software. References in this presentation to IBM products, programs, or services do not imply that they will be available in all countries in which IBM operates. Product release dates and/or capabilities referenced in this presentation may change at any time at IBM s sole discretion based on market opportunities or other factors, and are not intended to be a commitment to future product or feature availability in any way. Nothing contained in these materials is intended to, nor shall have the effect of, stating or implying that any activities undertaken by you will result in any specific sales, revenue growth or other results. IBM, the IBM logo, Lotus, Lotus Notes, Notes, Domino, Quickr, Sametime, WebSphere, UC2, PartnerWorld and Lotusphere are trademarks of International Business Machines Corporation in the United States, other countries, or both. Unyte is a trademark of WebDialogs, Inc., in the United States, other countries, or both. All references to Renovations refer to a fictitious company and are used for illustration purposes only. 71