EUROVOC. -tesaurus. Nide 1 Muunnosten aakkosellinen esittely. A osa. Versio 4.1



Samankaltaiset tiedostot
-tesaurus. Nide 2. Aihekohtainen esittely. Versio 4.2 / suomen kieli. Euroopan unionin virallisen lehden taulukkojen liite

EUROOPAN PARLAMENTTI

Euroopan alueiden komitea (AK): Paikallis- ja aluehallintoa edustava neuvoa-antava elin Euroopan unionissa

Sisäasiainministeriö E-KIRJELMÄ SM

EUROOPAN PARLAMENTTI

Uudet EU-asetukset. EUR-Lexin tarkennetun haun käyttöohje

Kevät Mitä vaikutusmahdollisuuksia Suomella on Euroopan unionin päätöksentekojärjestelmässä?

Altistumisskenaarion laatimista koskeva ohje

KOMISSION DELEGOITU ASETUS (EU) N:o /, annettu ,

Eräät maat julkaisevat korttinsa eri kieliversioina, josta johtuen mallikortteja on useita.

Ehdotus neuvoston päätökseksi alueiden komitean kokoonpanon vahvistamisesta

Opintovierailut. Euroopan unionin. poikittaisohjelma. opintovierailut koulutuksen asiantuntijoille

EUROOPAN UNIONI. Sitovaa tariffitietoa (STT) koskeva hakemus. Yleistä tietoa. Lukekaa huolellisesti seuraavat tiedot ennen STT-hakemuksen täyttämistä.

EUROOPAN YHTEISÖJEN KOMISSIO. Ehdotus: NEUVOSTON ASETUS

Lähentyminen Yhteisestä käytännöstä usein kysytyt kysymykset Lähentymisohjelma 3. Erottamiskyky:

Ehdotus NEUVOSTON PÄÄTÖS

Sisällönkuvailun tulevaisuus: YSA vai YSO?

Euroopan unionin neuvosto Bryssel, 26. kesäkuuta 2015 (OR. en)

Euroopan unionin neuvosto Bryssel, 18. toukokuuta 2017 (OR. en) Jeppe TRANHOLM-MIKKELSEN, Euroopan unionin neuvoston pääsihteeri

Pysyvien edustajien komitea / Neuvosto Perussopimusten tarkistaminen Euroopan parlamentin kokoonpanoa koskevat siirtymätoimenpiteet

EUROOPPA-NEUVOSTO Bryssel, 31. toukokuuta 2013 (OR. en)

OIKAISUKIRJELMÄ LISÄTALOUSARVIOESITYKSEEN NRO 6/2014 YLEINEN TULOTAULUKKO

Tilastonäkymä: Yksityinen eurooppayhtiö

Euroopan parlamentin kokoonpano vuoden 2014 vaalien jälkeen

Ehdotus NEUVOSTON PÄÄTÖS

Euroopan unionin neuvosto Bryssel, 9. maaliskuuta 2016 (OR. en) Jeppe TRANHOLM-MIKKELSEN, Euroopan unionin neuvoston pääsihteeri

KOMISSION DELEGOITU ASETUS (EU) N:o /, annettu ,

L 172 virallinen lehti

13060/17 ADD 1 1 DPG

Yrittämisen edellytykset Suomessa. Varatoimitusjohtaja Antti Neimala Sähköurakoitsijapäivät , Hyvinkää

Komissio toimitti 13. toukokuuta 2015 eurooppalaisen ohjausjakson puitteissa neuvostolle

SÄÄDÖSKOKOELMAN SOPIMUSSARJA Julkaistu Helsingissä 5 päivänä joulukuuta 2011

99 der Beilagen XXIII. GP - Staatsvertrag - 06 Finnischer Vertragstext (Normativer Teil) 1 von 8

Bryssel COM(2016) 85 final ANNEX 4 LIITE. asiakirjaan

Eurooppalainen ohjausjakso: yhdennetyt maakohtaiset suositukset Hyväksyminen ja toimittaminen Eurooppa-neuvostolle

TARKISTUKSET FI Moninaisuudessaan yhtenäinen FI. Euroopan parlamentti 2016/0231(COD)

LIITE. Euroopan parlamentin vaaleja koskevien komission suositusten täytäntöönpanoon liittyvät jäsenvaltioiden vastaukset.

Ehdotus NEUVOSTON ASETUS

ESITYSLISTAEHDOTUS PYSYVIEN EDUSTAJIEN KOMITEA (Coreper II) Europa-rakennus, Bryssel 3. ja 4. heinäkuuta 2019 (klo 10.00, klo 9.

Energiaa ja ilmastostrategiaa

L 90/106 Euroopan unionin virallinen lehti

EUROOPAN UNIONIN NEUVOSTO. Bryssel, 15. heinäkuuta 2011 (18.07) (OR. en) 12987/11 TRANS 216 SAATE

Kääntäminen komissiossa: mikä on tilanne kaksi vuotta laajentumisen jälkeen?

KOMISSION TIEDONANTO NEUVOSTOLLE

EUROOPAN PARLAMENTTI

15410/17 VVP/sh DGC 1A. Euroopan unionin neuvosto. Bryssel, 14. toukokuuta 2018 (OR. en) 15410/17. Toimielinten välinen asia: 2017/0319 (NLE)

Miten lisää kilpailukykyä? Partneripäivät Leena Mörttinen

Kannattavuuskirjanpito mahdollisuutena siipikarjatiloille

LEHDISTÖ EUROOPAN UNIONIN NEUVOSTO C/06/ /06 (Presse 323) (OR. en) LEHDISTÖTIEDOTE

KOMISSION KERTOMUS EUROOPAN PARLAMENTILLE JA NEUVOSTOLLE

EUROOPAN KOMISSIO VIESTINNÄN PÄÄOSASTO EU-TALLEKIRJASTO LIITE III KUMPPANUUSSOPIMUKSEEN LIITTYVÄT OHJEET

RUOAN HINTA JA INFLAATIO. Ilkka Lehtinen

Julkinen kuuleminen TV UHF taajuuksien käytöstä tulevaisuudessa: Lamyn raportti

MTT- Rehuntuotantoseminaari Nitek Nivala Eero Isomaa,MTK Johtokunta

EUROOPAN PARLAMENTTI

EU:n liikenneturvallisuusohjelma tuottaa hyviä tuloksia tavoite ihmishengen säästämisestä Euroopan teillä voidaan saavuttaa vuonna 2010

Medical Subject Headings

Ehdotus NEUVOSTON PÄÄTÖS. alueiden komitean kokoonpanon vahvistamisesta

LIITE. asiakirjaan. Ehdotus neuvoston päätökseksi

Suomen maksut EU:n budjettiin vuonna 2012

RATKI 1.0 Käyttäjän ohje

KOMISSION TIEDONANTO

KOMISSION KERTOMUS EUROOPAN PARLAMENTILLE JA NEUVOSTOLLE

EUROOPAN KOMISSIO. Bryssel SEC(2011) 1507 lopullinen. Luonnos

10329/17 JG/cc 1 DRI

European Survey on Language Competences (ESLC) EU:n komission tutkimus vieraiden kielten osaamisesta EU-maissa

Euroopan unionin neuvosto Bryssel, 3. maaliskuuta 2017 (OR. en)

LEHDISTÖ LEHDISTÖTIEDOTE. Yleiset asiat ja ulkosuhteet EUROOPAN UNIONIN NEUVOSTO /09 (Presse 361) (OR. en) Neuvoston ylimääräinen istunto

Euroopan unionin virallinen lehti L 189/19

Ehdotus NEUVOSTON PÄÄTÖS. talous- ja sosiaalikomitean kokoonpanon vahvistamisesta

EUROOPAN UNIONIN NEUVOSTO. Bryssel, 19. syyskuuta 2011 (21.09) (OR. en) 14391/11 ENV 685 SAATE

Asko Ikävalko, k TP02S-D. Ohjelmointi (C-kieli) Projektityö. Työn valvoja: Olli Hämäläinen

Valtuuskunnille toimitetaan oheisena asiakirja COM(2017) 403 final LIITE 1.

LEHDISTÖTIEDOTE Kesäkuu 2018 EU:n 13 keskeistä elinkeinoalaa menettävät vuosittain 60 miljardia euroa väärennösten vuoksi.

***I MIETINTÖLUONNOS

EU-rikollisia koskevien tietojen laadun parantaminen

Talous tutuksi - Tampere Seppo Honkapohja Johtokunnan jäsen / Suomen Pankki

EUROOPAN UNIONI EUROOPAN PARLAMENTTI FIN 299 INST 145 AG 37 INF 134 CODEC 952

ANNEX LIITE. asiakirjaan KOMISSION KERTOMUS EUROOPAN PARLAMENTILLE JA NEUVOSTOLLE

EUROOPAN YHTEISÖJEN KOMISSIO KOMISSION TIEDONANTO EUROOPAN PARLAMENTILLE, NEUVOSTOLLE JA EUROOPAN KESKUSPANKILLE

Kansainvälisen tilausliikenteen matkustajat 2018

APULAISOPETTAJAHARJOITTELU

TIEDONHAKU INTERNETISTÄ

BELGIAN KUNINGASKUNTA, BULGARIAN TASAVALTA, TŠEKIN TASAVALTA, TANSKAN KUNINGASKUNTA, SAKSAN LIITTOTASAVALTA, VIRON TASAVALTA, IRLANTI,

Muuntamislomaketta koskevia huomautuksia

C Virkamiestuomioistuimen oikeudenkäyntitilastot

Euroopan unionin neuvosto Bryssel, 9. maaliskuuta 2016 (OR. en)

KOMISSION TIEDONANTO NEUVOSTOLLE. Euroopan kehitysrahastoa koskevat rahoitustiedot

NEUVOTTELUT BULGARIAN JA ROMANIAN LIITTYMISESTÄ EUROOPAN UNIONIIN

12398/17 HG/isk DGD 1. Euroopan unionin neuvosto. Bryssel, 24. lokakuuta 2017 (OR. en) 12398/17. Toimielinten välinen asia: 2017/0173 (NLE)

A8-0321/78

Euroopan unionin neuvosto Bryssel, 28. huhtikuuta 2016 (OR. en)

Euroopan unionin historia, perustamissopimukset ja poliittinen muoto

Euroopan unionin neuvosto Bryssel, 28. lokakuuta 2014 (OR. en) Euroopan komission pääsihteerin puolesta Jordi AYET PUIGARNAU, johtaja

Ohje: Miten haen artikkeleita KH Net verkkopalvelusta

KÄYTTÖOHJE. Servia. S solutions

Töihin Eurooppaan EURES

LIITE. asiakirjaan. ehdotus neuvoston päätökseksi

Ehdotus EUROOPAN PARLAMENTIN JA NEUVOSTON ASETUS

LIITE. asiakirjaan. Ehdotus neuvoston päätökseksi

Transkriptio:

EUROVOC -tesaurus Nide 1 Muunnosten aakkosellinen esittely A osa Versio 4.1

Internet: http://europa.eu.int/celex/eurovoc Luettelointitiedot julkaisun lopussa. Luxemburg: Euroopan yhteisöjen virallisten julkaisujen toimisto, 2005 ISBN 92-78-40242-7 Euroopan yhteisöt, 2005 Tekstin jäljentäminen on sallittua, kunhan lähde mainitaan. Printed in Luxembourg PAINETTU KLOORIVALKAISEMATTOMALLE PAPERILLE

JOHDANTO Eurovoc-tesauruksen tarkoitus Euroopan unionin toiminnasta syntyvä asiakirjamassa laajenee vuosittain useilla tuhansilla, ellei jopa kymmenillä tuhansilla teksteillä. Jatkuvasti kasvavan tietotulvan hallitsemiseksi unionin toimielinten asiakirjapalvelut yrittivät etsiä käyttöönsä sopivaa indeksointijärjestelmää. Erityisen kipeästi sitä tarvitsivat Euroopan yhteisöjen virallisten julkaisujen toimisto, joka laatii toimielinten säädösluettelon ja Euroopan unionin virallisen lehden kuukausihakemiston, sekä Euroopan parlamentti, jossa sitä tarvittiin asiakirjahallintoa ja kirjastoa varten. Käytettävissä olleet apuvälineet tutkittuaan julkaisutoimisto ja Euroopan parlamentti päättivät perustaa monikielisen asiasanaluettelon eli tesauruksen, joka kattaisi kaikki Euroopan yhteisöjen toimialat. Näin syntyi Eurovoc. Asiasanojen valinta ja tesauruksen rakenteen suunnittelu aloitettiin vuonna 1982 työryhmässä, joka koostui Euroopan parlamentin, Euroopan yhteisöjen komission ja julkaisutoimiston informaatikoista ja kirjastonhoitajista. Urakkaan saatiin apua komission silloisesta tieto- ja innovaatiomarkkinoiden pääosastosta, jonka politiikkaan kuuluu tukea monikielisten tesaurusten kehittelyä. Eurovoc-tesauruksen ensimmäinen versio julkaistiin seitsemällä kielellä vuonna 1984. Eurovocia on sittemmin pitänyt mukauttaa Euroopan unionin kehitykseen ja tapahtuneisiin geopoliittisiin ja kielellisiin muutoksiin. Tavanomaisten päivitysten lisäksi Eurovocille on tehty useita kieliasun tarkistuksia, ja siihen on lisätty uusia kieliä: yhdeksän kieltä vuonna 1987 ja 11 kieltä vuonna 2000. Viimeisin mittava uudistus tuotti version 4, joka julkaistiin marraskuussa 2002. Uuden version työstäminen alkoi virallisesti 12. lokakuuta 1999, kun julkaisutoimiston johtokunta neljän käyttövuoden jälkeen päätti aloittaa Eurovoc-tesauruksen perusteellisen tarkistuksen. Vastuu hankkeesta uskottiin kahdelle toimielinten väliselle komitealle: ohjauskomitealle ja ylläpitokomitealle. Kumpikin koostui hankkeeseen osallistuneiden toimielinten eli Euroopan parlamentin, Euroopan unionin neuvoston, Euroopan komission, tilintarkastustuomioistuimen ja Euroopan yhteisöjen tuomioistuimen edustajista. Eurovoc on aidon yhteistyön tulos, sillä sen teossa ovat olleet mukana paitsi EU:n toimielimet myös kansalliset parlamentit, joista on tullut yhä aktiivisempia Eurovocin ylläpidon kehittäjiä. Versiota 4 varten eri maiden parlamenteilta (Espanja, Venäjä, Belgia, Portugali, Tšekki, Puola ja Romania), Euroopan parlamentilta ja julkaisutoimistolta saatiin kaikkiaan 2 500 muutosehdotusta. Kunkin kieliversion tarkistamisesta vastasi komission kääntäjistä ja terminologeista koostuva työryhmä. Eurovoc on osaltaan helpottanut merkittävästi unionin laajentumisprosessia, sillä sitä on käytetty EU-lainsäädännön ja muiden siihen liittyvien tekstien (muun muassa oikeuskäytäntö) indeksoinnissa. Indeksoinnin ansiosta asiakirjojen haku yhteisön säännöstöstä on verrattoman helppoa, ja terminologian standardoinnilla on vältetty monia EU:n säädösten valmisteluun ja kääntämiseen liittyviä ongelmia. Tätä johdantoa kirjoitettaessa unioni on aivan toukokuussa 2004 koittavan laajentumisen kynnyksellä. Silloin Eurovocin nykyisten 11 kielen joukkoon liitetään yhdeksän uutta virallista kieltä. Uusia työkaluja Eurovoc-tesauruksen hallintaan ja levittämiseen Käyttäjät pääsivät ensimmäisen kerran Eurovocin Internet-sivustolle (http://europa.eu.int/celex/eurovoc) 22. joulukuuta 2000. Uuden sivuston avaaminen toi Eurovocille huomattavasti lisää käyttäjiä. Sivuston kautta termien haku tesauruksesta käy vaivattomasti, ja sen rakenne on hyvin lähellä paperiversiota. Aihekohtaisen ja aakkosellisen hakutoiminnon (termihaun) lisäksi sivusto tarjoaa muitakin toimintoja, joita ovat mikrotesauruksiin kuuluvien termien selailu, asiasanojen käännökset tai asiasanan koko semanttinen kenttä, asiasanojen monikielinen luettelo sekä mahdollisuus tesauruksen lataamiseen pdf-muodossa. Internet-sivuston avaamisen yhteydessä ylläpitokomitean jäsenet saivat uuden työkalun, jolla he pääsevät käyttämään Eurovocin ylläpitojärjestelmää www-teknologiaa hyväksi käyttäen. Tällä pelkästään Eurovocin ylläpitojärjestelmän tarpeisiin suunnitellulla työkalulla voidaan hallita kaikentyyppisiä muutoksia, esittää muutosehdotuksia, näyttää ja vastaanottaa ehdotuksia muilta käyttäjiltä sekä äänestää niistä. Ylläpitojärjestelmää käyttävät nykyisin ylläpitokomitean jäsenet ja kansalliset parlamentit, jotka voivat lähettää muutosehdotuksia, sekä terminologit ja kääntäjät, joiden tehtävänä on päivittää eri kieliversioita. Käyttäjätiedotus Euroopan parlamentti järjestää säännöllisesti Eurovoc-tesaurusta käsitteleviä konferensseja. 3

Ne tarjoavat käyttäjille tilaisuuden jakaa kokemuksia, vaihtaa näkemyksiä sekä esitellä Eurovocin ylläpidon kehitystä ja näkymiä. Euroopan parlamentaarinen tutkimus- ja dokumentointikeskus (ECPRD) on Euroopan neuvoston jäsenmaiden parlamenteissa toimivien asiakirjapalvelujen välinen yhteistyöelin. Yksi sen tavoitteista on helpottaa tietojenvaihtoa jäsenvaltioiden parlamenttien välillä. Tämä monikielinen yhteistyöverkosto oli toinen Eurovocin käytön kehittämistä edistänyt tekijä. Eurovocin kehittelyyn panostetaan myös EU:n omissa toimielimissä ja virastoissa: niiden kirjastot perustivat hiljattain uuden yhteistyöryhmittymän nimeltä Eurolib. Sen kautta voidaan vaihtaa säännöllisesti kokemuksia EU:n toimielimissä sekä laajentaa yhteistyötä asiakirjojen luetteloinnin ja analysoinnin aloilla. Eurovocin viimeisin versio ja tulevaisuudennäkymät Seuraavassa esitellään tesauruksen versio 4.1. Eurovocia kehitetään käyttäjien aloitteesta, ja tämäkin uusi versio on suunniteltu pääasiassa kansallisten parlamenttien ehdotusten pohjalta. Ne ovat tällä tavoin ilmaisseet halukkuutensa osallistua Eurovocin kehittämiseen. Tesaurukset ovat elävää ainesta, joka muovautuu asiakirjarekisterien ja tietokantojen indeksoijien ja käyttäjien tarpeiden mukaan. Tämä pitää erityisen hyvin paikkansa Eurovocin kohdalla, jota varten on laadittava käännöksiä Euroopan unionin toiminnassa jatkuvasti kehittyville käsitteille. Eurovocin ohjauskomitea ja ylläpitokomitea ottavat mielellään vastaan käyttäjiltä tulevat ehdotukset tesauruksen kehittämiseksi ja sen laadun parantamiseksi. Dick TOORNSTRA Eurovocin ohjauskomitean puheenjohtaja Parlamentin dokumentaatio-osaston johtaja Euroopan parlamentti DToornstra@europarl.eu.int 4

ESITTELY JA KÄYTTÖOPAS Sisällys 1. Esittely 7 1.1 Tarkoitus 7 1.1.1 Tesauruksen tarkoitus 7 1.1.2 Eurovoc-tesauruksen tavoitteet 7 1.1.3 Edut ja rajoitukset 7 1.2 Katetut aihealueet 8 1.3 Historiikki eri versiot 8 1.3.1 Eurovocin synty 8 1.3.2 Versio 2 8 1.3.3 Versio 3 9 1.3.4 Versio 3.1 9 1.3.5 Versio 4 10 1.3.6 Versio 4.1 10 1.4 Pääasialliset käyttötarkoitukset 10 1.5 Kieliversiot 10 1.6 Standardit 10 1.7 Rakenne 11 1.7.1 Aihealueet ja mikrotesaurus 11 1.7.2 Semanttiset suhteet 11 1.7.2.1 Selitykset 11 1.7.2.2 Suhde mikrotesaurukseen 11 1.7.2.3 Ekvivalenssisuhde 11 1.7.2.4 Hierarkkinen suhde 12 1.7.2.5 Assosiaatiosuhde 12 1.8 Sisällön määrä 13 1.9 Paperiversiot 14 1.9.1 Muunnosten aakkosellinen esittely 14 1.9.2 Aihekohtainen esittely 15 1.10 Sähköiset tiedostot 16 2. Hallinta ja ylläpito 16 3. Käyttöohjeita 17 3.1 Asiakirjojen indeksointi 17 3.2 Hakukysymysten muotoilu 19 Aihealueet ja mikrotesaurukset 21 Liite: Ylläpitolomake 5

1. Esittely 1.1 Tarkoitus 1.1.1 Tesauruksen tarkoitus Tesaurus on jäsennelty hakusanaluettelo, jonka tarkoitus on esittää yksiselitteisellä tavalla asiakirjatietokannan sisältämien asiakirjojen ja järjestelmässä tehtyjen hakujen käsitteellinen sisältö. Asiakirjojen laatijoiden ja asiakirjoja hakevien käyttäjien kielenkäyttö on usein monimerkityksistä. Yhdestä käsitteestä saatetaan käyttää useaa synonyymiä (esimerkiksi maatalouteen liittyvä teollisuus, maatalouden jalostusteollisuus, maataloustuotteita elintarvikkeiksi valmistava teollisuus). Jos tämä käsite olisi ilmaistu asiakirjojen indeksoinnissa vain yhdellä tavalla, se ei löytyisi haussa, jos hakukysymyksessä käytettäisiin jotain synonyymiä. Yksi tesauruksen tarkoituksista onkin välttää synonyymien käytöstä aiheutuvat ongelmat: yksi synonyymeistä valitaan melko sattumanvaraisesti asiasanaksi (descriptor); muut saman käsitteen synonyymit luokitellaan ohjaustermeiksi (nondescriptor). Vain asiasanoja voidaan käyttää käsitesisällön esittämiseen asiakirjojen indeksoinnissa ja hauissa; tesaurukseen kuuluvat ohjaustermit puolestaan ohjaavat käyttäjiä käyttämään oikeita asiasanoja. Kun vielä sisällöltään identtisten mutta eri kielellä ilmaistujen käsitteiden välille luodaan yhteys, käyttäjä voi tehdä monikielisessä tesauruksessa hakuja omalla kielellään ja löytää asiakirjoja indeksointikielestä riippumatta. Yhdellä termillä voi olla useita merkityksiä (esimerkiksi paino voi tarkoittaa painavuutta, esinettä ja kirjapainoa). Jos haussa käytetään tällaista homonyymiä, kaikilla tuloksena löydetyillä asiakirjoilla ei välttämättä ole mitään tekemistä haun aiheen kanssa. Yksi tesauruksen tarkoituksista on välttää homonyymien käytöstä aiheutuvat ongelmat: kukin asiasana sijoitetaan sellaiseen kontekstiin, jossa sen merkitys on yksiselitteinen. Tesauruksessa on siten: asiasanoja eli ilmaisuja, jotka ilmaisevat yksimerkityksisellä tavalla tesauruksen kattaman aihealueen käsitteitä (esimerkiksi lain täytäntöönpano ) ohjaustermejä eli ilmaisuja, jotka tavallisessa kielenkäytössä ilmaisevat: saman käsitteen (esimerkiksi lain toimeenpano ) vastaavan käsitteen (esimerkiksi lain pätevyys ) erityiskäsitteen, jolle annetaan ohjaustermin asema, koska sen käyttö on vähäistä (esimerkiksi banaani, trooppinen hedelmä ). semanttisia eli merkitykseen liittyviä suhteita asiasanojen ja ohjaustermien välillä ja toisaalta asiasanojen välillä. 1.1.2 Eurovoc-tesauruksen tavoitteet Eurovoc on monikielinen tesaurus, joka suunniteltiin alun perin Euroopan unionin toimielinten tuottaman aineiston käsittelyyn. Monialaisesta Eurovocista on sittemmin tullut riittävän laaja, jotta siihen on voitu sisällyttää EU-aiheiden lisäksi myös kansallisia aiheita, joiden painopisteenä on parlamentaarinen toiminta. Se on siis osoittautunut käyttökelpoiseksi myös muualla kuin Euroopan unionin toimielimissä. Erityisen kiinnostuneita siitä ovat olleet eri jäsenvaltioiden parlamentit. Tesauruksen tavoitteena on tarjota tiedonjakeluyksiköille johdonmukainen indeksointiväline, jolla voidaan hallita tehokkaasti asiakirjojen ja julkaisujen kasvavaa massaa ja auttaa käyttäjiä tekemään mahdollisimman tuloksekkaita asiakirjahakuja. 1.1.3 Edut ja rajoitukset Edut Asiakirjojen tallennukseen ja hakuun käytettäviin asiasanaluetteloihin valittu terminologia on standardoitua, joten asiakirjojen haku tietokannasta on erittäin tehokasta. Tesaurus on monikielinen, joten asiakirjojen indeksointi voi tapahtua laatijan kielellä ja haku käyttäjän kielellä. Eurovocia käyttävien asiakirjapalveluiden välille voidaan perustaa yhteistyöverkostoja, jolloin vältetään päällekkäisyydet. Rajoitukset Eurovoc on suunniteltu Euroopan unionin toimintaan liittyvien yleisten asiakirjajärjestelmien tarpeisiin; se ei sovellu erikoisalojen aineiston käsittelyyn. Vaikka Eurovocissa on pyritty huomioimaan myös Euroopan unionin toimielinten ulkopuolisten käyttäjien tarpeet, sitä ei pystytä riittävän tarkasti mukauttamaan erilaisiin kansallisiin oloihin. 7

1.2 Katetut aihealueet Eurovoc-tesaurus kattaa kaikki EU:n toimielinten toiminnan kannalta kiinnostavat aihealueet: politiikka kansainväliset suhteet Euroopan yhteisöt oikeus talouselämä kauppa finanssiasiat yhteiskunnalliset kysymykset koulutus ja viestintä tiede yritystoiminta ja kilpailu työllisyys ja työ liikenne ympäristö maatalous, metsätalous ja kalastus maatalouselintarvikkeet tuotanto, teknologia ja tutkimus energia teollisuus maantiede kansainväliset järjestöt. Jotkin aihealueet ovat muita kehittyneempiä, koska ne liittyvät Euroopan unionin toiminnan kannalta keskeisiin aloihin. Niinpä Eurovoc sisältää esimerkiksi Euroopan unionin kaikkien jäsenvaltioiden alueiden nimet, mutta ei kolmansien maiden alueita. On myös syytä korostaa yhtä tesaurusten yleistä ja erityisesti Eurovocin ominaisuutta: asiasanojen ryhmittely aihealueisiin ei ole täysin järjestelmällistä. Tietyt asiasanat voivat nimittäin viitata kahteen tai useampaan aihealueeseen. Tesaurusten hallinnan helpottamiseksi ja niiden koon rajoittamiseksi on yleisesti hyväksytty, että polyhierarkiaa, ts. jokaisen asiasanan järjestelmällistä sisällyttämistä kaikkiin niiden mahdollisiin aihealueisiin, on rajoitettava. Asiasanat, jotka voivat viitata useisiin aihealueisiin, yhdistetään yleensä vain käyttäjien kannalta luonnollisempaan aihealueeseen. Niinpä eri Euroopan unionin politiikat, jotka voisivat hyvin kuulua aihealueeseen Euroopan yhteisöt, onkin yhdistetty niihin suoraan liittyviin aihealueisiin: esim. asiasana yhteinen maatalouspolitiikka on luokiteltu aihealueeseen maatalous, metsätalous ja kalastus ja asiasana yhteisön tutkimuspolitiikka aihealueeseen tuotanto, teknologia ja tutkimus. Tämä ei ole mikään este indeksoijalle ja käyttäjälle, jotka yleensä yhdistelevät toisiinsa eri aihealueiden asiasanoja (esim. aihealueeseen Euroopan yhteisöt kuuluva asiasana yhteisön rahoitus voidaan yhdistää aihealueeseen liikenne kuuluvaan asiasanaan maantieverkko ). Aihealueilla maantiede ja kansainväliset järjestöt on kuitenkin tietty polyhierarkia sallittu. Esim. Nigeria on sekä Länsi-Afrikan maa, AKT-maa että OPECmaa: se esiintyy tesauruksessa kolmessa eri yhteydessä, Länsi-Afrikan maiden, AKT-maiden ja OPEC-maiden joukossa. 1.3 Historiikki eri versiot 1.3.1 Eurovocin synty Vuonna 1982 sen jälkeen, kun oli laadittu vertaileva tutkimus Euroopan komission ja Euroopan parlamentin asiakirjoissa käytetyistä kielistä, päätettiin perustaa kansainväliset standardit täyttävä monikielinen asiasanaluettelo, joka kattaisi EU:n toimielinten toiminnan kannalta kiinnostavat aihealueet. Työ perustui seuraaviin lähteisiin: Euroopan parlamentin valmistelema ensimmäinen yksikielinen asiasanaluettelo, joka tukeutui muun muassa OECD:n makrotesauruksen sisältöön, komission keskuskirjaston ECLAS-tesauruksen ensimmäinen versio vuodelta 1978 sekä taulukko asiasanojen esiintymistiheydestä. Eurovocissa on vielä nykyäänkin vaikutteita ECLASista (esim. scope notes eli selitykset, joissa annetaan asiasanan määritelmä tai käyttötapa), luettelo SCAD:n (Service Central Automatisé de Documentation) ehdottamista asiasanoista, komission EC-01-tietokannan asiakirjojen luokitteluun käytetty vapaiden hakusanojen luettelo ja taulukko niiden esiintymistiheydestä, julkaisutoimiston virallisen lehden kuukausihakemistojen laatimisessa käyttämä vapaiden hakusanojen luettelo. Euroopan parlamentissa ja julkaisutoimistossa toteutetun kokeilujakson jälkeen vuonna 1984 julkaistiin Eurovoc-tesauruksen versio 1, jossa oli kaksi osaa: aakkosellinen luettelo ja aihekohtainen luettelo. Se ilmestyi seitsemällä kielellä: englanniksi, italiaksi, hollanniksi, kreikaksi, ranskaksi, saksaksi ja tanskaksi. Luettelo otettiin heti käyttöön Euroopan parlamentissa ja julkaisutoimistossa. 1.3.2 Versio 2 Tesauruksen versio 2 julkaistiin vuonna 1987 sen jälkeen, kun ensimmäistä versiota oli uudistettu perusteellisesti Euroopan parlamentissa ja julkaisutoimistossa siihen asti hankitun indeksointikokemuksen pohjalta. 8

Seitsemän alkuperäisen kielen joukkoon lisättiin espanja ja portugali; kahta alkuperäistä luettelomuotoa (aakkosellista ja aihekohtaista luetteloa) laajennettiin vuonna 1987 monikielisellä luettelolla, vuonna 1989 muunnosten aakkosellisella esittelyllä ja vuonna 1990 termikaavioilla. Eurovocin versio 2 alkoi herättää kiinnostusta myös Euroopan unionin toimielinten ulkopuolella: kansallisissa parlamenteissa ja hallinnoissa, aluehallinnoissa ja joskus jopa yksityisellä sektorilla. Siksi Euroopan parlamentti ja julkaisutoimisto tesauruksen omistajat ja ylläpitäjät päättivät vuonna 1989 järjestää ensimmäisen Eurovocin käyttäjille suunnatun seminaarin. Se antoi osviittaa Eurovocin hallintaa ja ylläpitoa koskeville päätöksille. Yksi näistä päätöksistä koski sellaisen ylläpitorakenteen käyttöönottoa, jossa voitaisiin huomioida käyttäjien ehdotukset, tulivat ne sitten itse unionin toimielimiltä tai ulkopuolisilta tahoilta. Version 2 päivitys julkaistiin vuonna 1990 erillisenä vihkosena. 1.3.3 Versio 3 Eurovocin versio 3 ilmestyi vuonna 1995. Kielivastineiden sopivuudesta oli alkanut tulla palautetta, ja ennen pitkää ylläpitäjät havaitsivat, että ranskankielinen versio oli käytetyin jopa muunkielisten käyttäjien piirissä. Tämä sai ylläpitoyksikön pyytämään kieliversioiden perusteellista tarkistamista. Tehtävä uskottiin Euroopan komission kääntäjistä ja terminologeista koostuneelle monikieliselle työryhmälle, joka vastasi myös uusien asiasanojen vastineiden laadinnasta. Edellisen viisiosaisena ilmestyneen version sijaan versio 3 julkaistiin kolmessa osassa kullakin virallisella kielellä. Entisen muunnosluettelon käyttöä rajoittivat asiasanojen esiintyminen irrallaan semanttisesta yhteydestään sekä asiasanaviittausten puuttuminen ohjaustermeiltä; muunnosluetteloa voitiin käyttää enää aakkosellisen luettelon lisänä, sillä se olisi moninkertaistanut hakusanojen määrän. Käyttäjien toivomuksesta luettelot päätettiin yhdistää uudeksi muunnosten aakkoselliseksi esittelyksi. Lisäksi vaikeudet version 2 termikaavioiden toteutuksessa viivästyttivät niiden julkaisemista ainakin kahdella vuodella, minkä jälkeen kiinnostus niihin lopahti. Alun perin tarkoituksena oli lisätä asiasanojen aihekohtaiseen esittelyyn graafiset esitykset asiasanojen assosiaatiosuhteista, mutta lopputulos oli erittäin vaikealukuinen. Uudessa aihekohtaisessa esittelyssä jäsentely perustui assosiaatiosuhteisiin. Niillä korvattiin entiset termikaaviot, joista käyttäjille tehdyn kyselyn jälkeen päätettiin luopua kokonaan. Edelliseen versioon lisättiin 566 asiasanaa ja 26 asiasanaa poistettiin. Poistoja tehtiin vain, jos termeissä esiintyi kaksiselitteisyyttä tai päällekkäisyyttä. Tässä vaiheessa Eurovoc otettiin käyttöön julkaisutoimistossa, jonka päätehtävänä on virallisen lehden säädösluetteloiden ja kuukausihakemistojen laatiminen. 1.3.4 Versio 3.1 Julkaisutoimiston johtokunta päätti lokakuussa 1999 aloittaa Eurovoc-tesauruksen uuden version työstämisen. Vastuu hankkeesta uskottiin kahdelle toimielinten väliselle komitealle: ohjauskomitealle ja ylläpitokomitealle. Kumpikin koostui hankkeeseen osallistuneiden toimielinten eli Euroopan parlamentin, Euroopan unionin neuvoston, Euroopan komission, Euroopan tilintarkastustuomioistuimen ja Euroopan yhteisöjen tuomioistuimen edustajista. Eurovoc-hankkeen päälinjoista vastaa ohjauskomitea. Se määrittää tavoitteet ja painopisteet, vahvistaa yleisen aikataulun, päättää resurssien käytöstä ja laatii alustavan talousarvion. Se myös hyväksyy virallisesti jokaisen uuden version. Komitea kokoontuu kahdesti vuodessa Euroopan parlamentin johdolla, ja kokousten teknisistä järjestelyistä vastaavat julkaisutoimisto ja komitean sihteeristö. Ylläpitokomitea muodostuu toimielinten pysyvistä edustajista (pääasiassa erikoistuneista informaatikoista), ja se on yksi järjestelmän keskeisistä toimijoista. Se vastaa Eurovocin päivittämistä koskevien ehdotusten käsittelystä. Komitea kokoontuu kahdesti vuodessa, ja sen kokousten teknisistä järjestelyistä ja töiden koordinoinnista vastaa julkaisutoimisto. Komitean ytimen muodostaa pysyvä ylläpitoyksikkö, jonka toimintaa organisoi julkaisutoimisto. Versio 3.1 laadittiin vastaukseksi kaikkein välttämättömimpiin ja kiireellisimpiin indeksointitarpeisiin. Se oli ensimmäinen vaihe version 4 kehittelyssä. Termipäivitysten (muun muassa 142 uuden asiasanan) lisäksi versiota 3.1 täydennettiin kahdella uudella kielellä: suomella ja ruotsilla. 22. joulukuuta 2000 Europa-palvelimelle avattiin kaksi uutta Internet-sivustoa: yleisölle tarkoitettu Eurovocin versio 3.1 http:// europa.eu.int/celex/eurovoc, ylläpitojärjestelmä, joka mahdollisti tesauruksen automaattisen ja jaetun hallinnoinnin (pääsy rajoitettu). 9

1.3.5 Versio 4 Eurovocin versio 4 julkaistiin Internetissä 26. marraskuuta 2002. Tesaurusta oli tarkistettu perusteellisesti. Ortografisia korjauksia oli tehty pääasiassa englannin, saksan ja hollannin versioihin. Käyttäjien toivomuksesta yleinen rakenne oli säilytetty ennallaan. Versioon 3.1 oli lisätty 364 uutta asiasanaa, ja 9 asiasanaa oli poistettu. Internet-sivustolla on helmikuusta 2003 lähtien tarjottu mahdollisuus Eurovocin kopiointiin pdf-muodossa aloittain tai aakkosellisesti esitettynä. Kuukautta myöhemmin sivustolle lisättiin vielä monikielinen asiasanaluettelo, joka korvaa entisen monikielisen esittelyn. 1.3.6 Versio 4.1 Eurovocin versio 4.1 julkaistiin Internetissä 13. helmikuuta 2004. Uusi versio perustuu pääasiassa kansallisten parlamenttien ehdotuksiin. Eurovoc sisältää nyt kaikkiaan 6 501 asiasanaa: versioon 4 lisättiin 63 asiasanaa ja yksi asiasana poistettiin. Eurovoc-sivustolla on tietoja eroista version 4 ja version 4.1 välillä. 1.4 Pääasialliset käyttötarkoitukset Eurovoc-tesaurusta käytetään nykyisin dokumentaatiotyössä lähinnä seuraavissa elimissä: julkaisutoimisto käyttää tesaurusta virallisessa lehdessä julkaistavien tekstien sekä muiden asiakirjojen ja julkaisujen indeksoinnissa. Eurovocia käytetään oikeudellisten asiakirjojen hakuun Celex-tietokannasta, ja se otetaan käyttöön julkaisujen luokittelussa EU-Bookshopissa, joka on määrä avata vuoden 2004 jälkipuoliskolla (url: http:// bookshop.eu.int), Euroopan parlamentaarinen tutkimus- ja dokumentointikeskus (ECPRD) käyttää Eurovocia parlamentaaristen tutkimusten indeksoinnissa (Studiestietokanta), Euroopan parlamentin kirjasto käyttää tesaurusta asiakirjarekisterinsä ja arkistonsa indeksoinnissa, useat Euroopan unionin toimielinten ja virastojen kirjastot käyttävät Eurovocia asiakirjarekisteriensä indeksoinnissa, alueellisella ja kansallisella tasolla Eurovocin käyttäjiin lukeutuvat useiden Euroopan maiden parlamentit ja hallinnot. 1.5 Kieliversiot Versiosta 3.1 lähtien Eurovoc on julkaistu Euroopan unionin 11 virallisella kielellä, jotka ovat: englanti espanja hollanti italia kreikka portugali ranska ruotsi saksa suomi tanska. Kaikilla kielillä on sama asema: yhden kielen kullakin asiasanalla on oltava vastaava asiasana kaikilla muilla kielillä. Erikielisten ohjaustermien välillä vastaavuutta ei kuitenkaan ole: kunkin kielen sanaston laajuus vaihtelee eri aihealueilla. Eurovoc-tesaurusta valmistellaan nyt Euroopan unionin laajentumiseen 1. toukokuuta 2004. Tätä varten siitä laaditaan yhdeksän uutta kieliversiota: latvia, liettua, malta, puola, slovakki, sloveeni, tšekki, unkari ja viro. 1.6 Standardit Eurovoc-tesauruksen teossa on noudatettu seuraavia Kansainvälisen standardointijärjestön standardeja: ISO 2788-1986: Guidelines for the establishment and development of monolingual thesauri. ISO 5964-1985: Guidelines for the establishment and development of multilingual thesauri. Asiasanat ja ohjaustermit ovat kaikissa kieliversioissa yleensä yksikössä; monikkoa käytetään, jos sana ei yleensä esiinny yksikössä. Lyhenteiden käyttöä on vältetty mahdollisimman pitkälle ymmärtämisen ja tesauruksen käytön helpottamiseksi. Kansainvälisten järjestöjen hakusanoina on kuitenkin käytetty lyhenteitä, jotta hakukenttään ei tarvitsisi kirjoittaa koko järjestön nimeä, joka on usein hyvin pitkä. Koko nimi tulee näkyviin asiasanan ohjausterminä tai selityksenä. Termien aakkosellinen luokitus on järjestetty seuraavasti: kirjain- ja numeromerkkejä edeltää välilyönti ja yhdysviiva, heittomerkkiä ja pilkkua ei huomioida. 10

1.7 Rakenne 1.7.1 Aihealueet ja mikrotesaurus Eurovoc-tesaurus on yleisellä tasolla järjestetty seuraavan kaksitasoisen hierarkian mukaisesti: aihealueet, jotka on yksilöity kaksinumeroisella luvulla ja nimellä, esim. 10 EUROOPAN YHTEISÖT mikrotesaurukset, jotka on yksilöity nelinumeroisella luvulla kaksi ensimmäistä numeroa kuvaavat mikrotesauruksen aihealuetta ja nimellä, esim. 1011 YHTEISÖN OIKEUS Aihealueiden ja mikrotesaurusten numerointi on sama kaikissa kieliversioissa. 1.7.2 Semanttiset suhteet Eurovoc-tesaurus on asiasanojen ja ohjaustermien tasolla järjestetty semanttisten suhteiden mukaisesti: selitys suhde mikrotesaurukseen ekvivalenssisuhde hierarkkinen suhde assosiaatiosuhde. 1.7.2.1 Selitykset Joihinkin asiasanoihin liittyy selitys, jonka tunnus on (scope note). Se voi olla: määritelmä, jos se yksilöi asiasanan merkityksen; Esimerkki: osuusviljely : Sopimus, jolla maanomistaja vuokraa maansa viljelytuotoksen osaa vastaan. soveltamisohje, jos se yksilöi asiasanojen käyttötavat asiakirjojen indeksoinnissa ja hauissa. Esimerkki: vähittäishinta : Käytetään erotuksena tukkuhinnasta. Muuten käytetään kuluttajahintaa. 1.7.2.2 Suhde mikrotesaurukseen Jokaiseen asiasanaan on määritelty sen suhde siihen mikrotesaurukseen, johon se kuuluu (tunnuksella MT, Microthesaurus). Esimerkki yhteen mikrotesaurukseen kuuluvasta asiasanasta: kansalaisuus MT 1231 kansainvälinen oikeus Esimerkki useaan mikrotesaurukseen kuuluvasta asiasanasta: Panama MT 7216 Amerikka MT 7231 talousmaantiede MT 7236 poliittinen maantiede 1.7.2.3 Ekvivalenssisuhde Asiasanojen ja ohjaustermien välinen ekvivalenssisuhde on merkitty seuraavin tunnuksin: (used for) asiasanan ja sen edustamien ohjaustermien välillä. Esimerkki: teknologiakylä tiedepuisto teknologiakeskus teknopoli USE (employed) ohjaustermin ja sen edustamien asiasanojen välillä. Esimerkki: tiedepuisto USE teknologiakylä (6806) Ekvivalenssisuhde auttaa indeksoijaa ja käyttäjää valitsemaan oikean asiasanan silloin, kun tämän valitsema hakutermi ei ole varsinainen asiasana. Edellä oleva esimerkki osoittaa, että teknologiakylä (mikrotesaurus 6806) on oikea asiasana ilmaisemaan käsitteitä tiedepuisto, teknologiakeskus ja teknopoli. Ekvivalenssisuhde kattaa käytännössä useantyyppisiä suhteita: aito synonymia eli identtinen merkitys Esimerkki: Kansainvälinen energiajärjestö USE IEA (7621) kvasisynonymia eli läheinen merkitys Esimerkki: karjan teurastus USE eläinten teurastus (6036) antonymia eli vastakohta Esimerkki: teknologinen riippuvuus USE teknologinen omavaraisuus (0806) 11

hyponymia, kun asiasana kattaa yhden tai useita erityiskäsitteitä, joille annetaan ohjaustermien asema, koska niiden käyttö on vähäistä. Esimerkki: omena USE siemenhedelmät (6006) 1.7.2.4 Hierarkkinen suhde Hierarkkinen suhde on merkitty seuraavin tunnuksin: BT (broader term = laajempi termi), spesifisen ja geneerisen asiasanan välillä. Tunnukseen liittyvä numero ilmaisee hierarkkisten tasojen määrän spesifisen ja geneerisen asiasanan välillä. Esimerkki: standardi standardointi BT2 tekniset määräykset Huomautuksia: 1) Asiasanat, joilla ei ole laajempia termejä, ovat ylimmän tason asiasanoja (top term). 2) Tietyt aihealueiden 72 MAANTIEDE ja 76 KAN- SAINVÄLISET JÄRJESTÖT asiasanat ovat polyhierarkkisia eli niillä on useita ylimmän tason geneerisiä termejä. NT (narrower term = suppeampi termi), sijoittuu geneerisen ja spesifisen asiasanan välille. Tunnukseen liittyvä numero ilmaisee hierarkkisten tasojen määrän geneerisen ja spesifisen asiasanan välillä. Esimerkki: standardointi standardien yhdenmukaistaminen hyväksyntä NT2 yhteisön varmentaminen CE-vaatimustenmukaisuusmerkintä standardi NT2 tuotantostandardi NT2 laatustandardi NT2 turvallisuusstandardi NT2 tekninen standardi kansainvälinen standardi NT2 eurooppalainen standardi Kun käyttäjä tekee asiakirjatietokannassa haun tietyllä asiasanalla (esim. standardi ), hän voi hierarkkisen suhteen avulla laajentaa hakua muilla aiheeseen liittyvien asiakirjojen indeksoinnissa käytetyillä asiasanoilla (esim. standardointi tai tekninen standardi ). Hierarkkista suhdetta käytetään myös täsmentämään asiasanan merkitystä; esim. asiasanan lehdistö sisältöä tarkentaa sen luokittelu asiasanan joukkotiedotusväline alakäsitteeksi. Hierarkkisia suhteita on kahdentyyppisiä: osa-kokonaisuussuhde Esimerkki: Kolumbia Etelä-Amerikka ryhmittelysuhde tai laji-/luokkasuhde. Esimerkki: kollektivismi talousjärjestelmä 1.7.2.5 Assosiaatiosuhde Kahden toisiinsa liittyvän asiasanan välinen assosiaatiosuhde on merkitty tunnuksella (related term = rinnakkaistermi). Esimerkki: standardointi teollinen yhteistyö tekninen este merkinnät vastavuoroisen tunnustamisen periaate Assosiaatiosuhde kertoo, että indeksoijan tai käyttäjän valitseman asiasanan (esim. standardointi ) lisäksi on olemassa muita yhtä käypiä asiasanoja (esim. teollinen yhteistyö tai tekninen este ) tai tietyissä tapauksissa jopa sitä sopivampia asiasanoja (esim. talousarvion laatiminen yhteisön talousarvion laatiminen ). Assosiaatiosuhde kattaa useantyyppisiä suhteita: kausaalinen Esimerkki: tullieste tullitariffi instrumentaalinen Esimerkki: maatilan nykyaikaistaminen korkotuki hierarkkinen (erityisesti tapauksissa, joissa ei kohdassa 1.2 kuvatuista syistä voi esiintyä polyhierarkiaa tai joissa puuttuvat hierarkkiset suhteet on käytön helpottamiseksi korvattu assosiaatiosuhteilla), Esimerkki: maatalousmarkkinat MT 5606 maatalouspolitiikka maatalouspolitiikka markkinat 12

(asiasana markkinat löytyy mikrotesauruksesta 2006 kauppapolitiikka ) yhteisyyteen perustuva, Esimerkki: matalapalkka alhainen tulotaso ajan tai paikan seuraavuuteen perustuva, Esimerkki: invention brevet osallisuuteen perustuva, Esimerkki: naudanliha nautakarja ominaisuuteen perustuva, Esimerkki: pakolaishallitus legitimiteetti toiminnan, prosessin tai alan kohteeseen perustuva, Esimerkki: melu melunvaimennus sijaintiin perustuva, Esimerkki: laskentatoimi edunvalvontayhtiö samankaltaisuuteen perustuva (jos kaksi kvasisynonyymia on määritelty asiasanoiksi), Esimerkki: puolueen rahoitus vaalirahoitus vastakohtaisuuteen perustuva Esimerkki: sensuuri tiedonvälityksen vapaus Assosiaatiosuhteella on muitakin tärkeitä ominaisuuksia: se on symmetrinen, Esimerkki: luottotakuu maksukyky maksukyky luottotakuu saman ylimmän tason termin (top term) alakäsitteiden välillä ei voi olla assosiaatiosuhdetta, Esimerkki: Mikrotesaurukseen 2826 sosiaalinen elämä sisältyvät asiasanat pelaaminen ja urheilu, jotka kumpikin ovat ylimmän tason termin vapaa-aika alakäsitteitä. Näiden kahden asiasanan välillä ei siis voi olla assosiaatiosuhdetta. 1.8 Sisällön määrä Kaikkiin Eurovoc-tesauruksen kieliversioihin sisältyy: 21 aihealuetta, 127 mikrotesaurusta, 6 501 asiasanaa (joista 512 ylimmän tason termiä, top terms), 6 510 hierarkkista suhdetta (eli 6 510 BT-termiä ja 6 510 NT-termiä), 3 542 assosiaatiosuhdetta. Kaikkien kieliversioiden aihealueet, mikrotesaurukset, asiasanat, hierarkkiset suhteet ja assosiaatiosuhteet vastaavat tarkasti toisiaan. Jokaisessa kieliversiossa voi sitä vastoin olla vaihteleva määrä ohjaustermejä ja selityksiä: Lukumäärä Kieliversiot Selitykset Ohjaustermit Englanti 738 6 592 Espanja 870 7 534 Hollanti 828 6 702 Italia 730 9 257 Kreikka 803 6 714 Portugali 740 6 143 Ranska 819 6 469 Ruotsi 796 6 353 Saksa 707 8 131 Suomi 837 5 333 Tanska 805 6 349 13

1.9 Paperiversiot Eurovoc-tesauruksessa on kaikissa kieliversioissa kaksi osaa: Osa 1: Muunnosten aakkosellinen esittely Osa 2: Aihekohtainen esittely. Huom. Monikielistä esittelyä ei ole enää saatavilla paperiversiona. Eurovoc-sivustolla on maaliskuusta 2002 lähtien ollut käytössä asiasanojen monikielinen luettelo. Luettelossa esitetään asiasanat (mutta ei ohjaustermejä) käyttäjän valitsemilla kielillä (2 4 kieltä). Käyttäjä valitsee kielen, jonka mukaan asiasanojen luettelo aakkostetaan. Haetun kielen asiasanat on lihavoitu. Muiden kielten vastaavat asiasanat on esitetty viereisissä sarakkeissa samalla rivillä ja normaalilla kirjasintyypillä. Internet-sivustolta on myös mahdollista ladata kaikki kieliversiot sisältävä Excel-tiedosto. 1.9.1 Muunnosten aakkosellinen esittely Muunnosten aakkosellinen esittely jakautuu kahteen osaan: osa A sisältää alkukirjaimilla A I alkavat termit ja osa B alkukirjaimilla J Z alkavat termit. Joka sivulla on kolme saraketta, joissa on neljäntyyppisiä muunnoksia: asiasanoja, jotka on aakkostettu ensimmäisen sanansa mukaan, asiasanoja, jotka on aakkostettu jonkin muun merkitsevän sanan mukaan, ohjaustermejä, jotka on aakkostettu ensimmäisen sanansa mukaan, ohjaustermejä, jotka on aakkostettu jonkin muun merkitsevän sanan mukaan. Kaikki termit ovat asiasanojen ja ohjaustermien ensimmäisen sanan ja muiden merkitsevien sanojen mukaisessa aakkosjärjestyksessä. Asiasanat, jotka on aakkostettu ensimmäisen sanansa mukaan: varsinainen asiasana lihavoituna, selitys, jota edeltää tunnus (scope note), mikäli asiasanaan liittyy sen merkitystä tai käyttötapaa täsmentävä teksti, kursivoituna sen mikrotesauruksen numero ja nimi, johon asiasana kuuluu, ja edellä on tunnus MT (Microtesaurus), ensimmäiseen sanaan liittyvät ohjaustermit, joita edeltää tunnus (used for); ohjaustermit esitetään aakkosjärjestyksessä, ensimmäisen sanan geneerinen asiasana, jota edeltää tunnus BT (broader term) ja luku, joka ilmaisee hierarkkisten tasojen määrän ensimmäisen sanan ja geneerisen asiasanan välillä; geneeriset asiasanat on luokiteltu seuraavasti: ensin hierarkkisten tasojen mukaan nousevassa järjestyksessä ja sisennettyinä kullakin hierarkkisella tasolla toisesta tasosta lukien, sen jälkeen aakkosjärjestyksessä kunkin hierarkkisen tason sisällä, ensimmäiseen sanaan liittyvä spesifinen asiasana, jota edeltää tunnus NT (narrower term) ja luku, joka ilmaisee hierarkkisten tasojen määrän ensimmäisen sanan ja spesifisen asiasanan välillä; spesifiset asiasanat on luokiteltu seuraavasti: ensin hierarkkisten tasojen mukaan laskevassa järjestyksessä ja sisennettyinä kullakin hierarkkisella tasolla toisesta tasosta lukien, sen jälkeen aakkosjärjestyksessä kunkin hierarkkisen tason sisällä, ensimmäisen sanan rinnakkaistermit, joiden tunnus on (related term); rinnakkaistermit on esitetty aakkosjärjestyksessä. Esimerkki: alkuperätuote Tietyssä maassa tuotettu tuote; kun tuotteen valmistukseen osallistuu useampia maita, tuote on sen maan alkuperätuote, jossa sitä on viimeiseksi jalostettu MT 2021 kansainvälinen kauppa tavaroiden alkuperä tuotteen alkuperä alkuperäsääntö GATT BT2 kansainvälinen kauppa alkuperätodistus perushyödykesopimus vapaa liike kolmas maa tullietuuskohtelu tuontirajoitus yleinen tullietuus Asiasanat, jotka on aakkostettu jonkin muun merkitsevän sanan mukaan: lihavoituina asiasanan merkitsevä sana ja mikäli se ei ole asiasanan viimeinen sana sanat, jotka 14

seuraavat merkitsevää sanaa asiasanan ollessa täydellisessä muodossaan, ja sen jälkeen pilkku, pilkun jälkeen samalla rivillä lihavoituina (tarvittaessa seuraavalle riville jatkuen) ne asiasanan sanat, jotka edeltävät merkitsevää sanaa asiasanan ollessa täydellisessä muodossaan, ja sen jälkeen aaltoviiva ja lopuksi alaviiva, samalla rivillä suluissa ja lihavoituna sen mikrotesauruksen numero, johon asiasana kuuluu. Esimerkki (kaksi merkitsevää sanaa): tuote, alkuperä~_ (2021) Esimerkki (kolme merkitsevää sanaa): välineet, joukkoviestintä~_ (3226) viestintävälineet, joukko~_ (3226) Kuten edellinen esimerkki osoittaa, asiasana täydellisessä muodossaan siis sellaisena, kuin se on ensimmäisen sanansa mukaan aakkostettuna saadaan lukemalla sanat ensin pilkun oikealta ja sitten sen vasemmalta puolelta. Kokonaisen asiasanan alta löytyvät kaikki sen semanttiset suhteet. Ohjaustermit, jotka on aakkostettu ensimmäisen sanan mukaan: ohjaustermi tavallisella kirjasintyypillä esitettynä, seuraavalla rivillä lihavoituina vastaava asiasana, jota edeltää tunnus USE, sekä suluissa sen mikrotesauruksen numero, johon asiasana kuuluu. Esimerkki: Maatalouskoneosuuskunta USE viljelijöiden keskinäinen apu (5616) alkuperäsääntö USE alkuperätuote (2021) Ohjaustermit, jotka on aakkostettu jonkin muun merkitsevän sanan mukaan: normaalilla kirjasintyypillä esitettyinä ohjaustermin merkitsevä sana ja mikäli se ei ole ohjaustermin viimeinen sana sanat, jotka seuraavat merkitsevää sanaa ohjaustermin ollessa täydellisessä muodossaan, ja sen jälkeen pilkku, pilkun jälkeen samalla rivillä (jatkuen tarvittaessa seuraavalle riville) normaalilla kirjasintyypillä esitettyinä ne ohjaustermin sanat, jotka edeltävät merkitsevää sanaa ohjaustermin ollessa täydellisessä muodossaan, ja sen jälkeen aaltoviiva ja lopuksi alaviiva, seuraavalla rivillä tunnus USE sekä vastaava asiasana täydellisessä muodossaan ja lihavoituna, ja sen jälkeen suluissa sen mikrotesauruksen numero, johon asiasana kuuluu. Esimerkki (kaksi merkitsevää sanaa): sääntö, alkuperä~_ USE alkuperätuote (2021) Esimerkki (kolme merkitsevää sanaa): koneosuuskunta, maatalous~_ USE viljelijöiden keskinäinen apu (5616) osuuskunta, maatalouskone~_ USE viljelijöiden keskinäinen apu (5616) 1.9.2 Aihekohtainen esittely Aihekohtainen esittely voi olla yhden tai useamman sivun pituinen mikrotesauruksen mukaan; kullakin sivulla on ensimmäisellä rivillä otsikko, joka muodostuu mikrotesauruksen numerosta, mikrotesauruksen nimestä. Otsikon jälkeen on nuoli oikealle, jos mikrotesaurus jatkuu seuraavalle sivulle, ja nuoli vasemmalle, jos kyseessä ei ole mikrotesauruksen ensimmäinen sivu. Esimerkki: 0421 parlamentti => (mikrotesauruksen ensimmäinen sivu) <= 0421 parlamentti (mikrotesauruksen toinen sivu) Mikrotesaurukset on numeroitu, ja ne siis jaksottuvat samalla tavoin tesauruksen jokaisessa kieliversiossa. Sen jälkeen sivulla esitetään kahdessa sarakkeessa: hierarkian ylimmän tason asiasanat (siis ne, joilla ei ole geneeristä termiä) lihavoituina ja aakkostettuina, jokaisen ylimmän tason asiasanan alla lihavoituna ja hierarkian mukaan laskevassa järjestyksessä spesifiset asiasanat, joita edeltää tunnus NT (narrower term) ja luku, joka ilmaisee hierarkkisten tasojen määrän ylimmän tason asiasanan ja spesifisen asiasanan välillä; spesifiset asiasanat on luokiteltu seuraavasti: ensin hierarkkisten tasojen mukaan nousevassa järjestyksessä, sen jälkeen aakkosjärjestyksessä kunkin hierarkkisen tason sisällä. 15

Asiasanat on esitetty hierarkian mukaan laskevassa järjestyksessä ja edeltävän hierarkkisen tason asiasanaan nähden sisennettyinä. Jokaisen hierarkkiseen ketjuun kuuluvan asiasanan alla on esitetty normaalilla kirjasintyylillä sen rinnakkaistermit, joita edeltää tunnus. Kunkin rinnakkaistermin perään on merkitty suluissa sen mikrotesauruksen numero, johon termi kuuluu, elleivät termit ole samasta mikrotesauruksesta. 1.10 Sähköiset tiedostot Eurovoc-tesaurus on saatavilla sähköisessä muodossa xml-tiedostoina. Tiedostoja varten on hankittava käyttölupa. Tiedostoja voidaan käyttää joko sellaisinaan tai laajemman kokoonpanon osaksi liitettyinä, tai niistä voidaan kehitellä sivu- tai lisäarvotuotteita. Käytännössä lupaehdot vaihtelevat ilmaisesta maksulliseen. Lupa on maksullinen, jos tiedostoja aiotaan käyttää kaupallisiin tarkoituksiin. Saatavilla on kolmentyyppisiä käyttölupia: ilmainen tai maksullinen käyttölupa, jolla tesauruksen saa puhtaasti henkilökohtaiseen käyttöön (ilmainen), ilmaiseen levitykseen esim. korkeakouluissa ja hallintoelimissä (ilmainen) tai kaupalliseen levitykseen (maksullinen), ilmainen käyttölupa, joka oikeuttaa käyttäjän kielellisiin muutoksiin, mutta velvoittaa tämän luovuttamaan uuden kieliversion ilmaiseksi julkaisutoimistolle, jolla on oikeus mukauttaa sitä ja sisällyttää sen tiedot Eurovociin, ilmainen käyttölupa (ei myönnetä kaupallisiin tarkoituksiin), joka oikeuttaa tesauruksen muuntamisen tai täydentämisen varsinkin alueellisiin tarpeisiin tai erikoissanastoksi, mutta velvoittaa käyttäjän ilmoittamaan täydennysten ja tesauruksen väliset erot ja toimittamaan täydennykset ilmaiseksi julkaisutoimistolle, jolla on oikeus sisällyttää ne tesaurukseen. Sähköisiä tiedostoja voi tilata kirjallisesti seuraavasta osoitteesta: Office for Official Publications of the European Communities Author Service Copyright 2, rue Mercier L-2985 Luxemburg Sähköposti: opoce-info-copyright@cec.eu.int Eurovoc-tiedostoihin liittyviä teknisiä tietoja voi pyytää kirjallisesti seuraavasta osoitteesta: Office for Official Publications of the European Communities Official Journal Eurovoc Unit 2, rue Mercier L-2985 Luxemburg Sähköposti: opoce-eurovoc@cec.eu.int 2. Hallinta ja ylläpito Kaikkien tesaurusten tapaan Eurovocia on jatkuvasti mukautettava Euroopan yhteisön toimielinten toimialojen kehittyessä ja kielenkäytön muuttuessa. Eurovocin erityispiirteenä on sen tekijöiden halu ja kyky vastata tasapuolisesti ja puolueettomasti kaikkien käyttäjien ilmaisemiin tarpeisiin Euroopan unionin toimielinten kaikilla toimialoilla. Siksi Eurovocin ylläpito perustuu niin sisäisiin kuin ulkoisiinkin tarpeisiin: kaikki käyttäjät voivat tehdä ehdotuksia Eurovocin muuttamiseksi ja kehittämiseksi. Ylläpito on järjestetty seuraavasti: Euroopan parlamentin työyksikkö tutkii kansallisten parlamenttien laatimat ehdotukset ja lähettää niiden joukosta valitsemansa hyödylliset ehdotukset sekä omat ehdotuksensa julkaisutoimiston ylläpitoyksikköön. Julkaisutoimiston ylläpitoyksikkö kerää ja tarkastaa kaikkien käyttäjien ehdotukset ja laatii lisäksi omia ehdotuksia. Se koordinoi ylläpitokomitean työskentelyä ja vastaa teknisistä muutoksista sekä käännösten seurannasta. Euroopan unionin toimielinten edustajista koostuva ylläpitokomitea äänestää ehdotuksista ja päättää lopullisesti tesaurukseen tehtävistä muutoksista. Ohjauskomitea valvoo hanketta ja hyväksyy virallisesti tesauruksen jokaisen uuden version sen jälkeen, kun se on valmis. Käyttäjät voivat ehdottaa asiasanan, ohjaustermin tai semanttisen suhteen lisäämistä, poistamista tai muuttamista täyttämällä Eurovocin Ylläpitolomakkeen, jonka malli on liitteenä. Lomakkeen voi myös ladata Eurovoc-sivustolla Internetissä. Käyttäjille ja muille asiasta kiinnostuneille tiedotetaan Eurovociin liittyvistä asioista Euroopan parlamentin julkaisemalla uutiskirjeellä (Eurovoc Newsletter), joka on saatavilla Eurovocin Internet-sivustolla. Ohjauskomitea päätti syyskuussa 2002, että Eurovocia aletaan päivittää entistä useammin. Periaatteessa päivityksiä tehdään kerran tai kahdesti vuodessa. 16

3. Käyttöohjeita 3.1 Asiakirjojen indeksointi Indeksointi eli asiasanoitus on menetelmä, jossa ensin määritetään asiakirjan sisältöä parhaiten kuvaavat käsitteet ja sen jälkeen valitaan tesauruksesta niitä vastaavat asiasanat. Tavoitteena on, että hakukone löytää asiakirjatietokantaan tallennetuista tunnistetiedoista ne asiasanat, jotka vastaavat hakijan muotoilemaa hakukysymystä. Haku ei onnistu, elleivät hakusanat ole samassa muodossa kuin tesauruksen asiasanat. Käytännössä indeksointi tapahtuu seuraavasti: tutustutaan nopeasti indeksoitavan asiakirjan sisältöön valitaan asiakirjan indeksointiin sopivat käsitteet seuraavien periaatteiden mukaisesti: valikoivuus: on valittava vain sellaisia käsitteitä, jotka sisältävät hakijalle oleellista tietoa, tyhjentävyys: kaikki tekstissä esiintyvät hyödylliset käsitteet on otettava mukaan kuvaukseen, olivatpa ne eksplisiittisiä tai implisiittisiä, valitaan tesauruksesta kyseisiä käsitteitä parhaiten kuvaavat asiasanat: jos asiakirja on vieraskielinen, käsitteet on ensin käännettävä indeksoijan käyttämän tesauruksen kielelle, sen jälkeen on etsittävä muunnosten aakkosellisen esittelyn avulla sanat, jotka parhaiten vastaavat asiakirjassa esiintyvien käsitteiden sisältöä. Tässä on kolme vaihtoehtoa: käsitteen merkityssisältö vastaa asiasanaa: tämä asiasana valitaan indeksointiin (esim. koulutuspolitiikka ), käsitteen merkityssisältö vastaa jotakin ohjaustermiä: ohjaustermi osoittaa oikean asiasanan, joka valitaan indeksointiin (esim. ohjaustermi koulutusavustus ohjaa käyttämään asiasanaa opintotuki ), jos tesauruksesta ei löydy käsitettä vastaavaa asiasanaa, voidaan valita jokin seuraavista toimintatavoista: haetaan muunnosten aakkosellisesta esittelystä jokainen käsitteen sisältämä sana erikseen ja etsitään sen kohdalta sopiva asiasana (esim. käsitettä budjettitoimivalta ei ole tesauruksessa; oikea asiasana budjettivalta löytyy selaamalla muunnosten aakkosellista esittelyä sanan budjetti kohdalta) tai ohjaustermi, joka osoittaa oikean asiasanan, otetaan jokin toinen tästä käsitteestä tavallisessa kielenkäytössä esiintyvä ilmaisu ja katsotaan, vastaako se jotakin muunnosten aakkosellisessa esittelyssä olevista sanoista (esim. sanaa häväistys ei ole tesauruksessa, mutta se on ajatuksellisesti lähellä termiä kunnianloukkaus, joka on Eurovocin asiasana), määritellään, mihin pääluokkiin (mikrotesauruksiin) haettu käsite kuuluu, ja etsitään aihekohtaisesta esittelystä sitä lähinnä olevat asiasanat (esim. ekologista seurausta ei ole tesauruksessa, mutta se kuuluu aihepiiriltään selvästi mikrotesaurukseen 5206 ympäristöpolitiikka ; sieltä löytyy asiasana ympäristövaikutus, joka soveltuu indeksointiin), yhdistetään kaksi tai useampia muunnosten aakkosellisessa esittelyssä esiintyviä asiasanoja ja muodostetaan niistä kiertoilmaus käsitteelle (esim. Washingtonin yleissopimus ei sisälly tesaurukseen, mutta siihen voidaan viitata asiasanoilla kansainvälinen yleissopimus, eläinkunta ja kasvikunta ). Käsitettä merkitsevän asiasanan tai ohjaustermin sisältö riippuu asiakirjasta valittujen käsitteiden asiayhteydestä. Se on usein syytä tarkistaa, jotta asiasanaa käytettäisiin todellisessa eikä kirjaimellisessa merkityksessään. Esim. ranskankielinen käsite gel des terres voi merkitä joko maan jättämistä viljelemättä, jolloin asiasanaksi on valittava kesannointi (tesauruksessa merkitys on täsmennetty selityksellä), tai hallaa (sääilmiötä), jolloin asiasanoiksi on valittava huono sää (asiasana, johon ohjaustermi halla johtaa) ja esimerkiksi maatalousmaa. Käsitteiden kuvaamiseen tesauruksen asiasanoilla liittyy kaksi muutakin sääntöä: vertikaalinen spesifisyys: käsitteen ja sitä kuvaavan asiasanan tulisi olla yhtä spesifisiä, ja ellei tällaista asiasanaa löydy, tesauruksesta on valittava käsitteen tasoa välittömästi edeltävän tason asiasana, Esimerkkejä: Maakuntia tarkasteleva asiakirja on indeksoitava asiasanalla maakunta, ei geneerisellä asiasanalla alueelliset ja paikalliset viranomaiset. Sen sijaan jos asiakirja käsittelee käsitettä anestesialääketiede, joka ei esiinny Eurovocissa, se on 17

indeksoitava geneerisellä käsitteellä lääketiede, joka on tesauruksen asiasana. Asiakirja, jossa tarkastellaan erikseen kunkin Benelux-maan tilannetta, on indeksoitava asiasanoilla Belgia, Luxemburg ja Alankomaat, ei asiasanalla Benelux-maat. horisontaalinen spesifisyys: kahdesta tai useammasta sanasta muodostuva käsite on ilmaistava yhdistelmäksi kootulla asiasanalla, mikäli tesauruksesta sellainen löytyy, ei yhdistämällä yksittäisiä asiasanoja. Esimerkki: Unionin tutkimuspolitiikkaa käsittelevä asiakirja on indeksoitava asiasanalla yhteisön tutkimuspolitiikka, ei asiasanoilla yhteisön politiikka ja tutkimus. Valikoivuuden, tyhjentävyyden ja spesifisyyden periaatteiden oikea käyttö on ratkaisevan tärkeää asiakirjojen tunnistetietojen tallennus- ja hakujärjestelmän laadun kannalta. Indeksoinnin valikoivuus: ei riipu tesauruksen laadusta, riippuu kussakin asiakirjajärjestelmässä noudatetusta indeksointipolitiikasta ja varsinkin indeksoinnin tarkkuudesta, riippuu siitä, miten hyvin indeksoinnista vastaava informaatikko tuntee asiakirjajärjestelmän käyttäjät ja näiden tarpeet. Tyhjentävyyttä säätelevät: tesauruksen monipuolisuus: indeksointiin ei luonnollisestikaan voida kelpuuttaa muita kuin dokumentointikielessä esiintyviä käsitteitä, indeksointipolitiikka, joka määrää indeksoinnin tarkkuuden, informaatikon menettelytavat ja huolellisuus. Indeksoinnin tyhjentävyys vaikuttaa hakutulokseen seuraavasti: parantaa saantia eli sitä, miten suuri osa kaikista tietokantaan sisältyvistä käyttökelpoisista asiakirjoista löytyy haussa, heikentää hakutuloksen tarkkuutta eli sitä, miten suuri osa hakutuloksen dokumenteista oli käyttökelpoisia. Jos epäolennaisimmatkin asiakirjoissa esiintyvät käsitteet indeksoitaisiin, järjestelmän mahdollisuus löytää kaikki tai lähes kaikki hakukysymykseen täsmäävät asiakirjat kasvaisi, mutta samalla hakutulokseen sisältyisi suuri määrä tarpeettomia asiakirjoja. Saannin ja tarkkuuden käsitteiden selventämiseksi voitaisiin vaikkapa olettaa, että tietty asiakirjakokoelma sisältää asiakirjat A, B, C, D, E ja F. Hakutulokseksi saadaan asiakirjat A, C, D ja E. Niiden tarkastelussa havaitaan, että vain asiakirjat C ja E ovat käyttökelpoisia eli vastaavat hakukysymystä. Kun tutkitaan tarkemmin itse kokoelmaa, havaitaan, ettei asiakirjaa F löytynyt haussa, vaikka se on käyttökelpoinen. Saanti määritetään jakamalla luku 2 (asiakirjat C ja E) luvulla 3 (asiakirjat C, E ja F), jolloin tulokseksi saadaan 0,67: haussa löytyi 67 prosenttia käyttökelpoisista asiakirjoista. Hakutuloksen tarkkuus määritetään jakamalla luku 2 (samat asiakirjat C ja E) luvulla 4 (asiakirjat A, C, D ja E), jolloin tulokseksi saadaan 0,5: 50 prosenttia hakutuloksen asiakirjoista on käyttökelpoisia. Asiasanoituksen spesifisyys riippuu myös seuraavista tekijöistä: tesauruksesta, joka voi sisältää huomattavan määrän erittäin spesifisiä asiasanoja, indeksointipolitiikasta, informaatikoista. Päinvastoin kuin tyhjentävyys, asiasanoituksen spesifisyys: vähentää saantia mutta parantaa tarkkuutta. Jos asiakirjat indeksoidaan asiasanoilla, jotka ovat yhtä spesifisiä kuin niitä vastaavat käsitteet (esim. kansallinen parlamentti ), ja jos hakukysymyksessä käytetään samoja asiasanoja, hakukone ei löydä geneerisen tason asiasanoilla (esim. asiasanalla parlamentti ) indeksoituja asiakirjoja, joista osa voi sisältää oleellista tietoa. Tämän puutteen korvaa kuitenkin se, että hakutulokseen sisältyy vain pieni määrä käyttökelvottomia asiakirjoja. On kuitenkin huomattava, että geneerisellä tasolla indeksoidut asiakirjat löytyvät nimenomaan näillä geneerisillä asiasanoilla. Toisin päin haku ei valitettavasti onnistu: jos indeksointi ei ole riittävän spesifistä, saanti kasvaa mutta tarkkuus heikkenee. Tästä syystä asiakirjojen sisällönkuvauksessa on tärkeää pyrkiä spesifisyyteen. Esim. jos kokoelmassa noudatetaan järjestelmällisesti geneeristä indeksointia (eli liitetään jokaiseen 18

asiasanaan järjestelmällisesti sen geneerinen asiasana), eteen voi tulla esim. seuraava tilanne: asiakirjat, joissa käsitellään yleisesti kaikkia Euroopan unionin maita syventymättä jokaiseen tai joihinkin niistä erikseen, indeksoidaan asiasanalla EU-maat : asiakirjat, joissa tarkastellaan erikseen Belgiaa, indeksoidaan asiasanoilla Belgia ja EU-maat, asiakirjat, joissa tarkastellaan erikseen Italiaa, indeksoidaan asiasanoilla Italia ja EU-maat, kaikki edellä mainitut kolme asiakirjatyyppiä löytyvät yleisellä hakukysymyksellä EU-maat, vaikka todellisuudessa vain ensimmäinen niistä on käyttökelpoinen. Tietyissä asiakirjajärjestelmissä mahdollisimman spesifinen sisällönkuvaus auttaa löytämään joko spesifisiä asiakirjoja (edellisessä esimerkissä Belgiaa tai Italiaa koskevat asiakirjat) tai sekä spesifisiä tai geneerisiä asiakirjoja käyttäjän valinnan mukaan, kun hakuun sisältyvät automaattisesti tesauruksen hierarkkiset suhteet (edellisessä esimerkissä sekä Belgiaa ja Italiaa että kaikkia Euroopan unionin maita koskevat); käyttäjillä ei olisi tätä valinnanvapautta, jos asiakirjat indeksoitaisiin sekä spesifisillä että geneerisillä asiasanoilla, kuten geneerisessä indeksoinnissa. Eurovocista otettujen asiasanojen rinnalla sisällönkuvauksessa voisi olla hyödyllistä käyttää vapaita hakusanoja sellaisille asiakirjoissa esiintyville käsitteille, joita Eurovocissa ei ole: tätä varten olisi laadittava virallinen luettelo sellaisista vapaista asiasanoista, joita voisi tarvittaessa yhdistää Eurovocin asiasanoihin hierarkkisten suhteiden ja assosiaatiosuhteiden avulla. Mikäli jokin vapaista asiasanoista olisi syytä sisällyttää Eurovociin, asiasanaa käyttänyt asiakirjapalvelu voisi ilmoittaa sen ylläpitolomakkeella Eurovocin ylläpitoyksikölle. Olisikin yleisesti kiinnostavaa harkita kaksitasoista indeksointia, jossa jaoteltaisiin: ensisijaiset asiasanat kenttään ensisijaiset asiasanat, toissijaiset asiasanat kenttään toissijaiset asiasanat. Ensimmäiseen kenttään tallennettaisiin ne asiasanat, jotka edustavat asiakirjan pääaiheeseen liittyviä käsitteitä. Toiseen kenttään tallennettaisiin asiasanat, jotka edustavat käsitteitä, joista asiakirjassa on hyödyllistä tietoa, vaikka ne eivät varsinaisesti liitykään pääaiheeseen. Tämä ei tietenkään tarkoita, että Eurovoc-tesaurus jaettaisiin kahteen asiasanaluokkaan (ensisijaiset ja toissijaiset asiasanat), vaan sama asiasana voi asiakirjasta riippuen olla joko ensisijaisessa tai toissijaisessa asemassa. Tämä menetelmä auttaisi tarkentamaan hakukysymystä seuraavasti: jos käyttäjä haluaa löytää pienen määrän mahdollisimman käyttökelpoisia asiakirjoja, haussa käytetään vain ensisijaisia asiasanoja, jos käyttäjä haluaa erittäin laajan hakutuloksen, haku tehdään sekä ensisijaisilla että toissijaisilla asiasanoilla. Tällä menetelmällä voitaisiin myös rajoittaa EUVL:n aakkosellisen kuukausihakemiston pituutta ottamalla siihen vain ensisijaisia asiasanoja. 3.2 Hakukysymysten muotoilu Hakukysymyksen muotoilu tapahtuu symmetrisesti asiakirjan indeksoinnin kanssa: indeksointia varten asiakirjasta on etsitty käsitteet, jotka kuvaavat parhaiten sen sisältöä ja joilla voidaan ilmaista käyttäjiä kiinnostavia tietoja; sen jälkeen on valittu tesauruksesta näitä käsitteitä vastaavat asiasanat. Hakukysymystä varten on valittava käsitteet, joita haettavissa asiakirjoissa voi esiintyä, muunnettava ne asiasanoiksi ja haettava asiakirjatietokannasta näillä asiasanoilla indeksoidut asiakirjat. Hakukysymyksen muotoilu aloitetaan määrittämällä mahdollisimman tarkasti ja yksiselitteisesti käyttäjän tarvitsemat tiedot ja ilmaisemalla ne arkikielen käsitteillä; sitten käyttäjä valikoi käsitteet, joista hakulause muodostetaan. Sen jälkeen samat käsitteet on ilmaistava tesauruksen asiasanoilla. Tässä on kolme vaihtoehtoa: kun hakukysymys on tarkka ja sen sisältämät käsitteet löytyvät tesauruksesta, käyttäjän kannattaa käyttää muunnosten aakkosellista esittelyä, josta löytyvät: hakukysymyksen käsitteitä vastaavat asiasanat tai ohjaustermit (ja niiden kautta oikeat asiasanat), hierarkkisten suhteiden ja assosiaatiosuhteiden avulla saatavat asiasanat, jotka voivat auttaa täsmentämään kysymystä, kun hakukysymys on tarkka, mutta kaikkia sen sisältämiä käsitteitä ei löydy tesauruksesta eikä liioin muunnosten aakkosellisesta esittelystä, käyttäjän kannattaa valita aihekohtaisesta esittelystä kysymyksensä aihealueita parhaiten vastaavat mikrotesaurukset ja etsiä niistä hakukysymyksensä käsitteitä lähinnä olevat asiasanat; 19

kun hakukysymys ei ole tarkka (mikä on hyvin tavallista), käyttäjän kannattaa käyttää tesauruksen alakohtaista esittelyä ja valita sieltä ne mikrotesaurukset, jotka parhaiten vastaavat hakukysymyksen aihealueita; mikrotesauruksissa esitetään kokoelma kyseisiin aihealueisiin liittyviä asiasanoja, joista käyttäjä voi valita sopivimmat. Jotkut loppukäyttäjät tekevät mieluiten itse asiakirjahakuja omalta päätteeltään, johon on asennettu tarvittava tietokanta. Jotkut taas turvautuvat informaatikkoon, jolle he tekevät hakupyyntöjä: tässä tapauksessa käyttäjän on voitava olla suoraan yhteydessä informaatikkoon, ja hänen on kuvattava tälle mahdollisimman tarkasti, minkäluonteista tietoa hän tarvitsee. Vain siten hakupyyntö on tuloksekas. 20