Taksonomiasta folksonomiaan Metatiedon merkitys tiedon haussa Jari Kaponen
What is Watson? http://www.youtube.com/watch?v=fc3irywr4c8 IBM and the Jeopardy Challenge2.mp4
http://www-05.ibm.com/innovation/fi/ideasfromibm/library/watson/
Tammikuussa 1511
Jeopardy HÄN TODISTI KUINKA MAAPALLO ON TAIVAANKAIKKEUDEN KESKIPISTE
Kuka on Ptolemaios?
Oli kuitenkin joitain viiteitä siitä, että maapallokeskeinen ajattelu ei ollut oikeassa
Kunnes tuli Nicolaus Copernicus
Oliko maapallokeskeisyys harhaoppi?
Ehkäpä ongelma oli vain näkökulmassa
Miten tämä liittyy päivän puheenaiheeseen?
Uudet välineet ja kokemus ovat tarjonneet erilaisen näkökulman maapallokeskeisyyteen
Tarkastellaanpa sisällönhallintaa historiallisesta näkökulmastamme dokumenteista katsottuna
Olemme kehittäneet kirjastoista oman tieteenalansa
Jeopardy HÄN KEHITTI MAAILMAN SUOSITUIMMAN JA YHÄ KÄYTÖSSÄ OLEVAN KIRJOJEN LUOKITUSJÄRJESTELMÄN
Jeopardy Kuka on Melvil Dewey?
Jeopardy PERUSTUEN DEWEYN DESIMAALISEEN JÄRJESTLEMÄÄN 700-SARJAN KIRJAT KÄSITTELEVÄT TÄTÄ AIHETTA 734
Jeopardy Mikä on taide? 700 Arts 730 Plastic Arts, Sculpture 734 Sculpture from ca. 500 to 1399 734
Löydätkö etsimäsi aineiston luokitusjärjestelmän perusteella?
Miksi työssä on niin vaikea löytää etsimäänsä?
Jeopardy TÄMÄ HENKILÖ TUOTTI PAINOA SISÄLLÖN HALLINNAN HAASTEILLE
Jeopardy Kuka on Gutenberg?
Painokoneen voima
Nyt kaikilla on painokone
Saavutamme enemmän tietoa kuin haluamme
Tiedon dokumenttikeskeinen malli on särkynyt
Dokumenttikeskeisyys on meillä DNA:ssa
Mutta emme voi vain jäädä vaistojen ohjaamana väistelemään dokumenttikeskeisyyden tuottamia tulva-aaltoja
Löydän etsimäni, mutta minkä valitsen?
Minkä näistä valitsen? Mikkä perusteella valitsen?
Kenen tekemä, missä roolissa?
Mitä siitä ovat muut sanoneet? Kuinka ovat merkinneet, miten ovat käyttäneet
Jonkun on jo tarvinnut pyöriä tämän asian ympärillä
Uudet työvälineet antavat erilaisen näkökulman
Mietipä ihmiskeskeistä mallia
Samalla voit ratkaista monta muuta liiketoiminnan ongelmaa
Otetaanpa esimerkki: Vaivaton yhden kentän haku, vaikea valinta. Minkä näistä valitsen?
Demo...
Helppo yhden kentän haku toimi. Löysi varmasti ja paljon, ja johti valintatilanteeseen. Ihmiskeskeisessä mallissa se ei ollutkaan niin vaikea. Valinnassa auttaa, kun sosiaalinen metatieto kertoo: - kenen tekemä - kuka sitä käyttää tai jakaa edelleen ja kenelle - mitä siitä ovat muut sanoneet - mitä tunnisteita siitä on käytetty
Ajattelit ehkä etsiä dokumenttia, mutta saatoitkin löytää henkilön taikka yhteisön. Usein se on vielä arvokkaampaa, sillä se johtaa tietoon tietysti myös dokumenttien muodossa. [Mitä merkitsee, jos etsit jotakin oudossa paikassa, ja kohtaa tutun ihmisen?] Reitti jatkuu henkilöstä sisältöön......ja sisällöstä henkilöön ja...
Reitti merkitykselliseen tietoon kulkee useimmiten ihmisen kautta missä asia, siinä nimi, missä nimi, siinä yhteys
Sosiaalisuus ei noudata hierarkiaa. Siksi paras kartta yhteyksistä tietoon syntyy soliaalisen analytiikan keinoin. Heikko Senior Vice President Riitta Anne Explorations Drilling Production Williams Susanna Rami Kaisa G& G Petrophysical Production Reservoir Andreas Pekka Timo O Brien Katri Susanna Jaska Jukka Rane Arska Cohen Matti Pena Liisa Kelly Jörgen Andrews Mårten Miller Mark Stefan Anne Ville Lars Hussain Pena Taylor Hussain Pekka Kelly Ramirez Bell Sten Sosiaalisen verkoston analyysi
Kirjanmerkit luovat siltoja yli siilorajojen. Metatiedon ei tarvitse perustua pelkästään dokumentteihin eikä yleensäkään yksittäisen järjestelmän sisältöön. Kirjanmerkeillä sitä voidaan liittää minne tahansa. Sosiaaliset kirjanmerkit perustuvat inhimilliseen älykkyyteen kontekstista. Sisältömme ovat jumissa tässä työtilassa, tällä levyalueella, tässä kirjastossa... Hei siellä! Tarvitsemme tietojanne.
Ihmiset tekevät hakujen jälkeistä analysointia jatkuvasti. Kirjanmerkeillä he jakavat tuloksensa helpottamaan seuraavia hakuja. Omia ja muiden tekemiä. Sisältömme ovat jumissa tässä työtilassa, tässä kirjastossa, tässä... Hei siellä! Tarvitsemme tietojanne.
Sosiaalisen metatiedon menestyksen tekijä: EnterpriseTagging Service Metatietojen on toimittava yli siilorajojen: Sisällönhallinnassa sen pitäisi olla itsestään selvää (vaan ei aina ole), mutta myös sosiaalisten avainsanoen on muodostettava yhksi yhtenäinen pilvi, olivatpa ne liitetty henkilöön, kirjanmerkkiin, wikisivuun, bogiin, minne tahansa; vaikkapa dokumenttiin missä tahansa yhteisössä. Testaapa oma työtilatuotteesi: Mikä erottaa se sisällönhallintajärjestlemästä? Kokeile miten dokumentti siirretään kansiosta toiseen, ja mitä silloin tapahtuu tunnisteille ja kommenteille? Vain alustatason yhtenäinen palvelu voi mahdollistaa sisällön todellisen hallinnan, järkevän hakemisen ja esimerkiksi sosiaalisen analytiikan.
Siis. Mitäpä jos dokumentti ei olekaan tietämyksen keskipiste?
Entäpä ihmiset? Eivätkö juuri ihmiset eri rooleissaan olekin tiedon alkulähde?
Osa 2: Menetetty tieto
Menetetty tieto Kun ihmisiä jättää tehtävänsä, heidän mukanaan lähtee paljon tietoa..., joka aluksi jää heidän viesteihinsä, tiedostoihinsa, levyasemiin, työtiloihin, jne. Ihmiskeskeinen lähestymistapa ja siitä lähtevät tietotekniset palveut vievät kaiken sisällön entistä paemmin käyttäjien ulottuville. Monissa asioissa mm. oikeudellisen tarkkailtavuuden vuoksi ja yleensäkin aktiivisen vaiheen jälkeen on tunnistettava, mikä sisältö on säilytettävä organisoidusti ja pitkäaikaisesti. Silloin ei riitä, että tieto ainoastaan löytyy. Katsotaanpa vielä ratkaisu siihenkin...
Luokittelemattoman sisällön määrä kasvaa joka tapauksessa
Luokittelematonta sisältöä
Sisltö voidaan (yrittää) varustaa metetiedolla tallenusvaiheessa ja tallennusta voidaan automatisoida (tai pakottaa tiedon tuottajat ja käsittelijät tekemään sitä)
Siitä huolimatta luokittelu ei useinkaan ole laadukasta ei palvele hakuja eikä varsinkaan hallintaa
Luokittelemattoman sisällön määrä on taipuvainen kasvamaan siinä tahdissa kuin uusia sisältöläheitä tai sisältötyyppejä ilmaantuu
Erityinen haaste ovat hajadokumentit, perinteisesti sähköposti ja verkkolevyt. Siirtyminen verkkolevyistä työtiloihin on yhä vain kasvattanut hallintaa kaipaavan sisällön määrää.
IBM Classification Module luokittelee tiedot automaattisesti
Lähtökohtana on luonnollisen kielen lingvistinen käsittely ja semanttinen analyysi, mikä tekee ison eron pelkkään sääntöpohjaisen käsittelyyn.
Luokittelun pohjaksi luodaan perus-taksonomia, jota koneellinen luokittelu edelleen kehittää. Se erottelee myös sisällön, jota ei tulekaan luokitella.
Luokittelu tuottaa statistiikkaa automatiikan onnistumisesta, ja luokittelua voidaan hienosäätää.
Koneellinen luokittelu löytää sijainnin ja metetiedot osalle sisällöstä. Loput luokitellaan luokittelemattomaksi
Luokittelematta jätetystä sisällöstä syntyy ehdotus taksonomian kehittämiseksi.
Taksonomian kehittämisessä ihminen osallistuu työhön, mutta työn tarve vähenee nopasti, samalla kuin automaattinen luokittelu kasvaa (50->100%)
Saavutettu tarkkuus tietosisältöjen luokittelussa antaa paljon hyötyjä: Alentaa riskejä Parantaa tuottavuutta Nopeuttaa tulksiin pääsyä
Saavutettu tarkkuus tietosisältöjen luokittelussa antaa paljon hyötyjä: Alentaa riskejä Parantaa tuottavuutta Nopeuttaa tulksiin pääsyä Parantaa muutosvalmiutta
Yhteenveto Metatiedon merkitys Hakujen kannalta: tarkennettuja hakuja ja arvottamista Sosiaalinen metatieto on tässä tarkoituksessa erityisen arvokasta. Hallinnan kannalta: sarjoittaminen ja poistaminen Tässä auttaa erityisesti automaattinen luokittelu ja siihen kytketty sisällönhallinnan kokonaisjärjestelmä
1) Vaihda näkökulma dokumenteista ihmisiin. Saat aktiivisessa vaiheessa olevan tiedon ihmisten ulottuville.
2) Käsittele tulviva tieto koneellisesti takaisin kontekstiin ja oikeasti sisällönhallinnan piiriin
Pidetään yhteyttä Jari Kaponen IBM Social Business Specialist jari.kaponen@fi.ibm.com http://www.ibm.com/profiles
Keskustelua
Legal Disclaimer IBM Corporation 2011. All Rights Reserved. The information contained in this publication is provided for informational purposes only. While efforts were made to verify the completeness and accuracy of the information contained in this publication, it is provided AS IS without warranty of any kind, express or implied. In addition, this information is based on IBM s current product plans and strategy, which are subject to change by IBM without notice. IBM shall not be responsible for any damages arising out of the use of, or otherwise related to, this publication or any other materials. Nothing contained in this publication is intended to, nor shall have the effect of, creating any warranties or representations from IBM or its suppliers or licensors, or altering the terms and conditions of the applicable license agreement governing the use of IBM software. References in this presentation to IBM products, programs, or services do not imply that they will be available in all countries in which IBM operates. Product release dates and/or capabilities referenced in this presentation may change at any time at IBM s sole discretion based on market opportunities or other factors, and are not intended to be a commitment to future product or feature availability in any way. Nothing contained in these materials is intended to, nor shall have the effect of, stating or implying that any activities undertaken by you will result in any specific sales, revenue growth or other results. IBM, the IBM logo, Lotus, Lotus Notes, Notes, Domino, Quickr, Sametime, WebSphere, UC2, PartnerWorld and Lotusphere are trademarks of International Business Machines Corporation in the United States, other countries, or both. Unyte is a trademark of WebDialogs, Inc., in the United States, other countries, or both. All references to Renovations refer to a fictitious company and are used for illustration purposes only. 71