OA-AJ-07-003-FI-S Eurovoc-tesaurus Nide 2 Aihekohtainen esittely -tesaurus Nide 2 Aihekohtainen esittely Hinta Luxemburgissa (ei sis. alv:a): EUR 50 FI Versio 4.2 / suomen kieli Euroopan unionin virallisen lehden taulukkojen liite
Mistä EU:n julkaisuja saa? Julkaisutoimiston tuottamia myytäviä julkaisuja on saatavilla EU Bookshopissa osoitteessa http://bookshop.europa.eu/, jonka kautta voi jättää tilauksen valittuun myyntipisteeseen. Luettelo maailmanlaajuisen myyntiverkostomme jäsenistä on saatavilla faksitse numerosta (352) 29 29-42758.
EUROVOC -tesaurus Nide 2 Aihekohtainen esittely Versio 4.2
Europe Direct -palvelu auttaa sinua löytämään vastaukset EU:hun liittyviin kysymyksiisi Yhteinen maksuton palvelunumero (*): 00 800 6 7 8 9 10 11 (*) Jotkin matkapuhelinoperaattorit eivät salli pääsyä 00 800 -alkuisiin numeroihin, tai niistä voidaan laskuttaa. Internet:http://eurovoc.europa.eu/ Suuri määrä muuta tietoa Euroopan unionista on käytettävissä Internetissä Europa-palvelimen kautta (http://europa.eu). Luettelointitiedot ovat teoksen lopussa. Luxemburg: Euroopan yhteisöjen virallisten julkaisujen toimisto, 2008 ISBN 978-92-78-40398-0 ISSN 1725-4353 Euroopan yhteisöt, 2008 Tekstin jäljentäminen on sallittua, kunhan lähde mainitaan. Printed in Luxembourg PAINETTU KLOORIVALKAISEMATTOMALLE PAPERILLE
JOHDANTO Eurovoc-tesauruksen tarkoitus Euroopan unionin toiminnasta syntyvä asiakirjamassa laajenee vuosittain useilla tuhansilla ellei jopa kymmenillä tuhansilla teksteillä. Jatkuvasti kasvavan tietotulvan hallitsemiseksi unionin toimielinten asiakirjapalvelut ovat 1980-luvun alusta alkaen etsineet sopivaa indeksointijärjestelmää. Erityisen kipeästi sitä ovat tarvinneet Euroopan yhteisöjen virallisten julkaisujen toimisto, joka laatii toimielinten julkaisujen luettelon ja Euroopan unionin virallisen lehden kuukausihakemiston, sekä Euroopan parlamentti asiakirjahallintoaan ja kirjastoaan varten. Käytettävissä olleet apuvälineet tutkittuaan julkaisutoimisto ja Euroopan parlamentti päättivät laatia monikielisen asiasanaluettelon eli tesauruksen, joka kattaisi kaikki Euroopan unionin toimialat. Näin syntyi Eurovoc. Asiasanojen valinta ja tesauruksen rakenteen suunnittelu aloitettiin työryhmässä, joka koostui Euroopan parlamentin, Euroopan yhteisöjen komission ja julkaisutoimiston informaatikoista ja kirjastonhoitajista. Urakkaan saatiin apua komission silloiselta tieto- ja innovaatiomarkkinoiden pääosastolta, jonka työtä nykyisin jatkaa tietoyhteiskunnan ja viestinten pääosasto. Sen politiikkaan kuuluu tukea monikielisten tesaurusten kehittelyä. Eurovoc-tesauruksen ensimmäinen versio julkaistiin seitsemällä kielellä vuonna 1984. Eurovocia on sittemmin pitänyt mukauttaa Euroopan unionin kehitykseen ja tapahtuneisiin geopoliittisiin ja kielellisiin muutoksiin. Yksittäisten päivitysten lisäksi Eurovocille on tehty kuusi perusteellista ajantasaistusta ja useita kieliasun tarkistuksia, ja siihen on sisällytetty unionin uudet kielet: vuonna 1987 kieliä oli yhdeksän, vuonna 2000 yksitoista ja vuonna 2006 yhdeksäntoista. yhteisön säännöstöstä, ja terminologian standardoinnilla on vältetty monia EU:n säädösten valmisteluun ja kääntämiseen liittyviä ongelmia, erityisesti kun liittymässä oleva maa käsittelee johdettua oikeutta unionin laajentumisen yhteydessä. Uusia työkaluja Eurovoc-tesauruksen hallinnointiin ja levittämiseen Käyttäjät pääsivät ensimmäisen kerran Eurovocin Internet-sivustolle joulukuussa 2000. Mahdollisuus päästä Eurovociin Internetin kautta on lisännyt huomattavasti käyttäjien määrää. Sivuston kautta termien haku tesauruksesta käy vaivattomasti, ja sen rakenne on lähellä paperiversiota. Aiheenmukaisen ja aakkosellisen hakutoiminnon (termihaun) lisäksi sivusto tarjoaa muitakin toimintoja. Näitä ovat mikrotesaurukseen kuuluvien termien haku, asiasanojen ja niiden semanttisen ympäristön käännökset, asiasanojen monikielinen luettelo sekä mahdollisuus tesauruksen lataamiseen pdf-muodossa. Samalla on kehitetty Web-teknologiaan perustuva Eurovoc-tesauruksen ylläpitojärjestelmä yksinomaan Eurovocin hallinnoinnin tarpeisiin. Tässä käyttöoikeudeltaan rajoitetussa järjestelmässä voidaan toteuttaa kaikentyyppisiä muutoksia, tehdä ehdotuksia, visuaalistaa uusia käsitteitä ja käsitellä käyttäjien esityksiä kaikilla kielillä. Kyseistä sähköistä ylläpitojärjestelmää käyttävät nykyisin ylläpitokomitean jäsenet ja kansalliset parlamentit, jotka voivat lähettää muutosehdotuksia, sekä terminologit ja kääntäjät, joiden tehtävänä on käsitteiden sisällyttäminen eri kieliversioihin. Vastuu hankkeesta on uskottu kahdelle toimielinten väliselle komitealle: ohjauskomitealle ja ylläpitokomitealle. Komiteat koostuvat hankkeeseen osallistuvien toimielinten edustajista. Toimielimet ovat Euroopan parlamentti, Euroopan unionin neuvosto, Euroopan komissio, Euroopan yhteisöjen tuomioistuin ja Euroopan tilintarkastustuomioistuin. Eurovoc on aidon yhteistyön tulos, sillä sen teossa ovat olleet mukana paitsi EU:n toimielimet myös kansalliset parlamentit, joista on tullut yhä aktiivisempia Eurovocin kehittäjiä. Valtaosa tesauruksen kehittämisehdotuksista tulee jäsenmaiden parlamenteilta, Euroopan parlamentilta ja julkaisutoimistolta. Eurovoc on osaltaan helpottanut merkittävästi unionin lainsäädännön ja siihen liittyvien oikeudellisten asiakirjojen (lainsäädäntöehdotusten ja muiden päätösasiakirjojen) indeksointia. Eurovoc helpottaa asiakirjojen hakua
Käyttäjätiedotus Euroopan parlamentti järjestää säännöllisesti Eurovoctesaurusta käsitteleviä konferensseja. Ne tarjoavat jäsenvaltioiden parlamenttien jäsenille tilaisuuden jakaa kokemuksia, vaihtaa näkemyksiä sekä esitellä Eurovoc-tesauruksen kehitysnäkymiä. Euroopan parlamentaarinen tutkimus- ja dokumentointikeskus (ECPRD) on Euroopan neuvoston jäsenmaiden parlamenteissa toimivien asiakirjapalvelujen välinen yhteistyöelin. Yksi sen tavoitteista on helpottaa tiedonvaihtoa jäsenvaltioiden parlamenttien välillä. Tämä monikielinen yhteistyöverkosto on ollut toinen Eurovocin käytön kehittämistä edistänyt tekijä. Eurovocin kehittelyyn panostetaan myös EU:n omissa toimielimissä ja virastoissa. Niiden kirjastot perustivat hiljattain uuden yhteistyöryhmittymän nimeltä Eurolib. Näin voidaan vaihtaa säännöllisesti kokemuksia EU:n toimielimissä sekä laajentaa yhteistyötä asiakirjojen luetteloinnissa ja analysoinnissa. Eurovocin viimeisin versio ja tulevaisuudennäkymät Ohjauskomitea esittelee nyt Eurovoc-tesauruksen version 4.2. Tämä uusin versio on ollut käytettävissä verkossa heinäkuusta 2005, ja se sisältää Espanjan, Tšekin, Puolan ja Ruotsin parlamenttien ehdottamat uudet asiasanat sekä laajentuneen Euroopan unionin maantieteelliset ja alueelliset käsitteet. Se sisältää 6 645 asiasanaa, joista 155 on uusia. Eurovoc on nyt käytettävissä unionin 21 virallisella kielellä) ja kroatiaksi. Eurovoc-tesauruksen kehittämiseen osallistuvat aktiivisesti kaikki käyttäjät, jäsenvaltioiden parlamentit, unionin toimielimet ja muut Eurovocin käyttöluvan haltijat. Eurovocin menestys perustuu kahteen tekijään: monikielisyyteen ja yleiseen kattavuuteen. Eurovocin käyttölupien määrä kasvoi 43 prosenttia vuonna 2005 (25 käyttölupaa vuonna 2004, vuonna 2005 jo 44). Tesaurukset ovat elävää ainesta, joka muovautuu unionin toiminnan, tiedon indeksoijien sekä asiakirjarekisterien ja tietokantojen ylläpitäjien ja käyttäjien tarpeiden mukaan. Tämä pätee erityisen hyvin Eurovociin, jonka on tarjottava käännöksiä jatkuvasti kehittyville Euroopan unioniin liittyville käsitteille tiukasti dokumentointistandardeja noudattaen. Eurovocin ohjauskomitea ja ylläpitokomitea ottavat mielellään vastaan käyttäjiltä tulevia ehdotuksia tesauruksen kehittämiseksi ja sen laadun parantamiseksi. Dick Toornstra Eurovocin ohjauskomitean puheenjohtaja Parlamentin dokumentaatio-osaston johtaja Euroopan parlamentti DToornstra@europarl.europa.eu 4
ESITTELY JA KÄYTTÖOPAS Sisällys 1 Esittely............................................................................................. 6 1.1 Tavoitteet........................................................................................ 6 1.1.1 Tesaurusten tavoitteet........................................................................ 6 1.1.2 Eurovoc-tesauruksen tavoitteet................................................................ 6 1.1.3 Edut ja rajoitukset........................................................................... 6 1.2 Katetut aihealueet................................................................................. 6 1.3 Historiikki eri versiot............................................................................ 7 1.3.1 Eurovocin synty............................................................................. 7 1.3.2 Versio 2.................................................................................... 7 1.3.3 Versio 3.................................................................................... 7 1.3.4 Versio 3.1.................................................................................. 7 1.3.5 Versio 4.................................................................................... 8 1.3.6 Versio 4.1.................................................................................. 8 1.3.7 Versio 4.2.................................................................................. 8 1.4 Pääasialliset käyttötarkoitukset...................................................................... 8 1.5 Kieliversiot....................................................................................... 8 1.6 Sovelletut standardit............................................................................... 9 1.7 Asiasanaluettelon tarkistukset...................................................................... 9 1.8 Rakenne......................................................................................... 9 1.8.1 Aihealueet ja mikrotesaurus.................................................................. 9 1.8.2 Semanttiset suhteet.......................................................................... 9 1.8.2.1 Suhde mikrotesaurukseen............................................................. 9 1.8.2.2 Ekvivalenssisuhde.................................................................. 10 1.8.2.3 Hierarkkinen suhde................................................................. 10 1.8.2.4 Assosiaatiosuhde................................................................... 11 1.9 Sisällön määrä................................................................................... 12 1.10 Paperiversiot.................................................................................... 12 1.10.1 Muunnosten aakkosellinen luettelo.......................................................... 12 1.10.2 Aiheenmukainen luettelo................................................................... 14 1.10.2.1 Mikrotesaurusten aiheenmukainen luettelo........................................... 14 1.10.2.2 Aihealueen terminologia........................................................... 14 1.11 Elektroniset tiedostot............................................................................. 14 2 Hallinnointi ja ylläpito..........................................................................16 3 käyttöohjeita.....................................................................................16 3.1 Asiakirjojen indeksointi.......................................................................... 16 3.1.1 Käsitteiden valinta.......................................................................... 16 3.1.2 Käsitteiden kääntäminen.................................................................... 16 3.2 Asiakirjajärjestelmän tehokkuus................................................................... 17 Aihealueet ja mikrotesaurukset.....................................................................19 Liite: Ylläpitolomakkeet 5
1 ESITTELY 1.1 Tavoitteet 1.1.1 Tesaurusten tavoitteet Tesaurus on jäsennelty hakusanaluettelo, jonka tarkoitus on esittää yksiselitteisellä tavalla asiakirjatietokannan sisältämien asiakirjojen ja järjestelmässä tehtyjen hakujen käsitteellinen sisältö. Tavallisella kielellä sanottuna yhdestä käsitteestä saatetaan käyttää useita toisiaan vastaavia ilmauksia. Tesauruksen avulla tarkistetaan sanasto ja varmistetaan, että jokaista käsitettä edustaa jokin suositeltava termi tai asiasana. Asiasanan merkitys täsmentyy tesauruksen sisältämien termien välisten suhteiden avulla. Synonyymejä tai termivastineita, joita sanotaan ohjaustermeiksi, ei milloinkaan esitetä indeksointitermeinä, vaan niiden tehtävä on ohjata käyttäjä asianmukaiseen asiasanaan. 1.1.2 Eurovoc-tesauruksen tavoitteet Eurovoc on monikielinen tesaurus, joka laadittiin alun perin erityisesti Euroopan unionin toimielinten tuottaman aineiston käsittelyyn. Eurovocista tuli riittävän laaja-alainen, jotta siihen voidaan sisällyttää EU-aiheiden lisäksi myös kansallisia aiheita, joiden painopisteenä on parlamentaarinen toiminta. Eurovoc on jatkuvasti tarkistettava asiasanaluettelo, joka on osoittautunut käyttökelpoiseksi muuallakin kuin Euroopan unionin toimielimissä, erityisesti jäsenvaltioiden parlamenteissa. Tesauruksen tavoitteena on tarjota tiedonhallinta- ja jakeluyksiköille yhtenäinen indeksointiväline, jolla voidaan käsitellä tehokkaasti asiakirjarekistereitä ja auttaa käyttäjiä löytämään haluamansa asiakirjat tarkistettujen hakusanojen avulla. 1.1.3 Edut ja rajoitukset a) Edut Teusauruksen käytöstä on seuraavia etuja: Asiakirjojen indeksointiin käytettävien asiasanaluettelojen terminologia on standardoitua, mikä lisää asiakirjojen haun tarkkuutta; Monikielisyys: eri kielillä ilmaistujen identtisten käsitteiden välisten vastaavuuksien vahvistaminen mahdollistaa asiakirjojen indeksoinnin informaatikon kielellä ja haun käyttäjän kielellä; Eurovoc-tesaurusta käyttävät asiakirjapalvelut voivat vaihtaa tunnistetietoja. b) Rajoitukset Eurovocilla on kuitenkin rajoituksensa: Eurovoc on suunniteltu Euroopan unionin toimintaan liittyvien yleisten asiakirjajärjestelmien tarpeisiin. Se ei sovellu erityisalojen asiakirjojen indeksointiin tai hakuun; Eurovocia ei pystytä riittävän tarkasti mukauttamaan erilaisiin kansallisiin oloihin. Eurovocissa on kuitenkin pyritty huomioimaan myös Euroopan unionin toimielinten ulkopuolisten käyttäjien tarpeet. 1.2 Katetut aihealueet Eurovoc-tesaurus kattaa kaikki EU:n toimielinten aihealueet: politiikka kansainväliset suhteet Euroopan yhteisöt oikeus talouselämä kauppa finanssiasiat yhteiskunnalliset kysymykset koulutus ja viestintä tiede yritystoiminta ja kilpailu työllisyys ja työ liikenne ympäristö maatalous, metsätalous ja kalastus maatalouselintarvikkeet tuotanto, teknologia ja tutkimus energia teollisuus maantiede kansainväliset järjestöt. Eräitä aihealueita on kehitetty muita pitemmälle, sillä ne ovat keskeisiä Euroopan unionin toiminnalle. Niinpä Eurovoc sisältää esimerkiksi Euroopan unionin kaikkien jäsenvaltioiden alueiden nimet, mutta ei kolmansien maiden alueita. Asiasanojen ryhmittely aihealueisiin on tietyssä määrin mielivaltaista. Yksi Eurovocin ominaisuuksista on monihierarkian rajoittaminen. Asiasanat, jotka voivat viitata useisiin aihealueisiin, yhdistetään yleensä vain käyttäjien kannalta luonnollisimpaan aihealueeseen tesauruksen hallinnoinnin helpottamiseksi ja koon rajoittamiseksi. 6
1.3 Historiikki eri versiot 1.3.1 Eurovocin synty Vuonna 1982, sen jälkeen kun oli laadittu vertaileva tutkimus toimielinten asiakirjoissa sisäisesti käytetyistä indeksointikielistä, Euroopan parlamentti ja komissio päättivät perustaa kansainväliset standardit täyttävän monikielisen asiasanaluettelon, joka kattaisi EU:n toimielinten toiminnan kannalta kiinnostavat aihealueet. Työ perustui seuraaviin lähteisiin: Euroopan parlamentin erityisesti OECD:n makrotesauruksen sisällön pohjalta valmistelema ensimmäinen yksikielinen tesaurus-hanke; komission keskuskirjaston Eclas-tesauruksen ensimmäinen versio vuodelta 1978 sekä taulukko asiasanojen esiintymistiheydestä; Eurovoc ja Eclas ovat nykyisinkin läheisesti toisiinsa liittyviä välineitä erityisesti ehdotettujen asiasanojen valinnassa; SCAD-palvelun (Service Central Automatisé de Documentation) ehdottamat asiasanat; komission EC-01-tietokannan asiakirjojen luokitteluun käytetyt vapaat hakusanat ja niiden esiintymistiheys; julkaisutoimiston virallisen lehden kuukausihakemistojen laatimisessa käytetyt vapaat hakusanat. Euroopan parlamentissa ja julkaisutoimistossa toteutetun kokeilujakson jälkeen vuonna 1984 julkaistiin Eurovoc-tesauruksen versio 1 seitsemällä kielellä (englanniksi, hollanniksi, italiaksi, kreikaksi, ranskaksi, saksaksi ja tanskaksi) ja kahtena osana: aakkosellinen luettelo ja aiheenmukainen luettelo. Tesaurus otettiin heti käyttöön Euroopan parlamentissa ja julkaisutoimistossa. 1.3.2 Versio 2 Tesauruksen versio 2 julkaistiin vuonna 1987, kun ensimmäistä versiota oli uudistettu perusteellisesti Euroopan parlamentissa ja julkaisutoimistossa siihen asti hankitun indeksointikokemuksen pohjalta. Kaksi uutta kieliversiota (espanja ja portugali) lisättiin alkuperäiseen seitsemän kielen valikoimaan. Kahta alkuperäistä luettelomuotoa (aakkosellista ja aiheenmukaista luetteloa) laajennettiin vuonna 1987 monikielisellä luettelolla, vuonna 1989 muunnosten aakkosellisella luettelolla ja vuonna 1990 termikaavioilla. Eurovocin versio 2 herätti kasvavaa kiinnostusta myös Euroopan unionin toimielinten ulkopuolella jäsenvaltioiden parlamenteissa, valtion- ja aluehallinnossa ja jopa yksityisellä sektorilla. Euroopan parlamentti ja julkaisutoimisto tesauruksen omistaja ja sen ylläpitäjä päättivät vuonna 1989 järjestää ensimmäisen Eurovocin käyttäjille suunnatun seminaarin. Seminaari antoi osviittaa Eurovocin hallinnointia ja ylläpitoa koskeville päätöksille. Yksi päätöksistä koski sellaisen ylläpitorakenteen käyttöönottoa, jossa voitaisiin huomioida käyttäjien ehdotukset, tulivat ne sitten unionin toimielimiltä tai ulkopuolisilta tahoilta. Version 2 päivitys julkaistiin vuonna 1990 erillisenä vihkosena. 1.3.3 Versio 3 Eurovocin versio 3 ilmestyi vuonna 1995. Euroopan komission kääntäjistä ja terminologeista koostuva monikielinen työryhmä tarkisti perusteellisesti Eurovocin eri kieliversiot eräiden kielivastineiden oikeellisuudesta käyttäjiltä saadun palautteen johdosta. Versio 3 julkaistiin kolmena osana kullakin virallisella kielellä; edellinen versio oli ollut viisiosainen. Kun käyttäjiä oli kuultu, tesauruksen aakkosellinen ja muunnosluettelo päätettiin yhdistää. Uudessa aakkosellisessa näytössä asiasanat esitetään semanttisessa yhteydessään ohjaustermeihin kohdistuvin viittauksin. Uusi temaattinen näyttö sisältää termikaavioissa esitetyt assosiaatiosuhteet. Termikaavioiden julkaisemisesta luovuttiin version 2 laatimisessa kohdattujen vaikeuksien vuoksi ja siksi että käyttäjien kiinnostus tällaiseen esitystapaan on vähäistä. Edelliseen versioon lisättiin 566 asiasanaa ja 26 asiasanaa poistettiin. Tästä versiosta alkaen Eurovocia on käytetty julkaisutoimiston asiakirjatietokantojen indeksointiin virallisen lehden luetteloiden ja kuukausihakemistojen laatimisessa. 1.3.4 Versio 3.1 Julkaisutoimiston johtokunta päätti lokakuussa 1999 antaa vastuun Eurovoc-tesauruksen uuden version työstämisestä kahdelle uudelle toimielinten väliselle komitealle ohjauskomitealle ja ylläpitokomitealle. Komiteat koostuvat hankkeeseen osallistuvien toimielinten edustajista. Toimielimet ovat Euroopan parlamentti, Euroopan unionin neuvosto, Euroopan komissio, Euroopan yhteisöjen tuomioistuin ja Euroopan tilintarkastustuomioistuin. Ohjauskomitea vastaa Eurovoc-hankkeen päälinjoista. Se määrittää tavoitteet ja painopisteet, vahvistaa yleisen aikataulun, päättää resurssien käytöstä ja laatii alustavan talousarvion. Se myös hyväksyy virallisesti jokaisen uuden version. Komitea kokoontuu kahdesti vuodessa Euroopan parlamentin johdolla. Julkaisutoimisto huolehtii kokousten teknisistä järjestelyistä ja komitean sihteeristöstä. Ylläpitokomitea muodostuu toimielinten pysyvistä edustajista (pääasiassa erikoistuneista informaatikoista), ja se on yksi järjestelmän keskeisistä toimijoista. Se vastaa Eurovocin päivittämistä koskevien ehdotusten käsittelystä. Komitea kokoontuu kahdesti vuodessa. Julkaisu- 7
toimisto huolehtii kokousten teknisistä järjestelyistä ja työskentelyn koordinoinnista. Se hallinnoi myös pysyvän ylläpitoyksikön toimintaa. Versio 3.1 laadittiin vastaukseksi kiireellisimpiin indeksointitarpeisiin. Termipäivitysten ja 142 uuden asiasanan lisäksi kyseistä versiota on täydennetty kahdella uudella kielellä, suomella ja ruotsilla. Europa-palvelimeen avattiin 22. joulukuuta 2000 kaksi uutta Internet-sivustoa: yleisölle tarkoitettu Eurovocin versio 3.1 (http://eurovoc.europa.eu/) ylläpitokomitean jäsenille erityisjärjestelmä, joka mahdollistaa tesauruksen automaattisen ja jaetun hallinnoinnin. 1.3.5 Versio 4 Eurovocin versio 4 julkaistiin Internetissä 26. marraskuuta 2002. Tesaurusta oli tarkistettu perusteellisesti. Oikeinkirjoitussääntöjen kehityttyä saksan-, englannin- ja hollanninkielisiä versioita oli korjattu. Käyttäjien toivomuksesta yleinen rakenne oli säilytetty ennallaan. Versioon 3.1 oli lisätty 364 uutta asiasanaa ja 9 asiasanaa oli poistettu. Helmikuusta 2003 alkaen Internet-sivustolta on ollut mahdollista ladata Eurovocin aiheenmukaisia ja aakkosellisia luetteloita pdf-muodossa sekä selata monikielistä luetteloa. Tämä luettelo korvaa entisen painetun monikielisen asiasanaluettelon. 1.3.6 Versio 4.1 Eurovocin versio 4.1 julkaistiin Internetissä 13. helmikuuta 2004. Eurovoc sisälsi nyt kaikkiaan 6 501 asiasanaa: 63 asiasanaa oli lisätty ja yksi asiasana poistettu. Eurovoc-sivustolle tuli luettelo uuden version ja välittömästi edellisen version välisistä eroista. 1.3.7 versio 4.2 Eurovocin versio 4.2 julkaistiin Internet-sivustolla 15. heinäkuuta 2005. Se sisältää Espanjan, Tšekin, Puolan ja Ruotsin parlamenttien ehdottamat asiasanat sekä laajentuneen Euroopan maantieteelliset ja alueelliset käsitteet. Se sisältää 6 645 asiasanaa, joista 155 on uusia. Eurovoc on nyt käytettävissä unionin 21 virallisella kielellä ja kroatiaksi. 1.4 Pääasialliset käyttötarkoitukset Eurovoc-tesaurusta käytetään EU:n dokumentaatiotyössä lähinnä seuraavasti: lainsäädännöllisten asiakirjojen indeksointiin ja hakuun EUR-Lexissä (http://eur-lex.europa.eu/) Euroopan unionin oikeus ulottuvillasi sivuilla; EU-Bookshopissa (http://bookshop.europa.eu/) laadittavan EU:n kaikkien julkaisujen sähköisen luettelon tarpeisiin; Euroopan parlamentaarisessa tutkimus- ja dokumentointikeskuksessa (ECPRD) parlamentaaristen tutkimusten indeksointiin (Studies-tietokanta); Euroopan parlamentin kirjastossa asiakirjarekisterin ja arkiston indeksointiin; useissa Euroopan unionin toimielinten ja elinten kirjastoissa asiakirjarekisterien indeksointiin; useiden Euroopan maiden parlamenteissa kansallisella ja aluetasolla; yksityisten käyttöluvan haltijoiden tarpeisiin (yliopistot, tutkimuskeskukset, yritykset, opiskelijat jne.). 1.5 Kieliversiot Versiosta 4.2 lähtien Eurovoc-tesaurusta on julkaistu Euroopan unionin 21 virallisella kielellä, jotka ovat bulgaria espanja tšekki tanska saksa viro kreikka englanti ranska italia latvia liettua unkari hollanti puola portugali romania slovakki sloveeni suomi ruotsi. Eurovoc on jo käytettävissä kroatiaksi. Internet-sivustolla tesaurus on nykyisin käytettävissä 22 kielellä. Kaikilla kieliversioilla on sama asema: jokaisen kielen kullakin asiasanalla on oltava kielellinen vastine kaikilla muilla kielillä. Ohjaustermeillä sen sijaan ei välttämättä ole vastinetta eri kielissä. Kullakin kielellä on oma rikkautensa sekä semanttiset ja kulttuuriset erityispiirteensä, eikä jollain kielellä esitetty käsite aina esiinny vastaavalla tavalla muissa kielissä. 8
1.6 Sovelletut standardit Eurovoc-tesauruksen teossa on noudatettu seuraavia Kansainvälisen standardointijärjestön standardeja: ISO 2788-1986: Guidelines for the establishment and development of monolingual thesauri; ISO 5964-1985: Guidelines for the establishment and development of multilingual thesauri. Asiasanat ja ohjaustermit ovat kaikissa kieliversioissa yleensä yksikössä; monikkoa käytetään, jos sana ei tavallisesti esiinny yksikössä. Lyhenteiden käyttöä on vältetty mahdollisimman pitkälle ymmärtämisen ja tesauruksen käytön helpottamiseksi. Vain kansainvälisten järjestöjen hakusanoina on käytetty laajalti tunnettuja lyhenteitä. Lyhennetyn ja lyhentämättömän hakusanan välillä on viittaus. Termien aakkosellista luokitusta ei ole järjestetty yhdenmukaisesti kaikissa kieliversioissa. Eurovoc-tesauruksen hallinnoinnissa ei vielä ole otettu käyttöön mitään luokitusstandardia. 1.7 Asiasanaluettelon tarkistukset Tesauruksen tehtävänä on poistaa monimerkityksisyydet ja varmistaa, että kukin asiasana sijoitetaan sellaiseen kontekstiin, jossa sen merkitys on yksiselitteinen. Kullakin asiasanalla on vain yksi merkitys sillä aihealueella, jolle se kuuluu. Tesaurukset muodostuvat indeksoinnissa käytettävistä asiasanoista tai suositeltavista termeistä, jotka ilmaisevat yksimerkityksisellä tavalla tesauruksen kattaman aihealueen käsitteet (esimerkiksi lain täytäntöönpano ) ohjaustermeistä tai ei-preferenssitermeistä; synonyymejä tai ohjaustermejä ei milloinkaan esitetä indeksointitermeinä; niitä käytetään tesauruksen selailun apuvälineinä, ja ne ohjaavat käyttäjän asianmukaiseen asiasanaan jollain selitteellä (USE, UF) Esimerkkejä: lainsäädännön täytäntöönpano UF lain pätevyys lain pätevyys USE lainsäädännön täytäntöönpano semanttisista eli termien merkitykseen liittyvistä suhteista asiasanojen ja ohjaustermien välillä ja toisaalta asiasanojen kesken. Jos merkitys ei ole kyllin eksplisiittinen, sanaan voidaan liittää tunnuksella SN (scope note) varustettu selitys, jolla täsmennetään sanan merkitys tai käyttötapa. Esimerkki: määritelmä, jos se yksilöi asiasanan merkityksen: osuusviljely SN: Sopimus, jolla maanomistaja vuokraa maansa viljelytuotoksen osaa vastaan soveltamisohje, jos se yksilöi asiasanan käyttötavat vähittäishinta SN: Käytetään erotuksena tukkuhinnasta. Muuten käytetään kuluttajahintaa. Jos asiasanoina tai ohjaustermeinä käytetään homografeja termejä, joilla on yksi kirjoitusasu mutta useita merkityksiä, niiden merkitys täsmennetään sulkeissa esitetyllä luonnehdinnalla. 1.8 Rakenne 1.8.1 Aihealueet ja mikrotesaurus Eurovoc-tesaurus on järjestetty yleisellä tasolla seuraavan kaksitasoisen hierarkian mukaisesti: aihealueet, jotka on yksilöity kaksinumeroisella luvulla ja nimellä Esimerkki: 10 EUROOPAN YHTEISÖT mikrotesaurukset, jotka on yksilöity nelinumeroisella luvulla kaksi ensimmäistä numeroa kuvaavat mikrotesauruksen aihealuetta ja nimellä Esimerkki: 1011 yhteisön oikeus Aihealueiden ja mikrotesaurusten numerointi on sama kaikissa kieliversioissa. 1.8.2 Semanttiset suhteet Eurovoc-tesaurus on asiasanojen ja ohjaustermien tasolla järjestetty semanttisten suhteiden mukaisesti: suhde mikrotesaurukseen (MT) ekvivalenssisuhde (UF, USE) hierarkkinen suhde (BT, NT) assosiaatiosuhde (RT). 1.8.2.1 Suhde mikrotesaurukseen Jokaiseen asiasanaan on määritelty sen suhde niihin mikrotesauruksiin, joihin se kuuluu (tunnuksella MT, mikrotesaurus). Esimerkki yhteen mikrotesaurukseen kuuluvasta asiasanasta: kansalaisuus MT 1231 kansainvälinen oikeus 9
1.8.2.2 Ekvivalenssisuhde Asiasanojen ja ohjaustermien välinen ekvivalenssisuhde on merkitty seuraavin tunnuksin: UF (used for) ohjaustermin edellä Esimerkki: esittävät taiteet UF baletti UF konsertti UF ooppera UF sirkus UF tanssiesitys UF teatteri USE (employed) asiasanan edellä. Esimerkki: Konsertti USE esittävät taiteet (2831) Jos samasta käsitteestä esiintyy useita termejä, ekvalenssisuhteella täsmennetään, mitä termiä indeksoinnissa on käytettävä. Edellä olevassa esimerkissä termi esittävät taiteet (joka kuuluu mikrotesaurukseen 2831 kulttuuri ja uskonto ) on asiasana, jota on käytettävä sellaisten käsitteiden indeksoinnissa kuin baletti, konsertti, ooppera, sirkus, tanssiesitys ja teatteri. Asiasanojen ja ohjaustermien välistä vastavuoroisuutta sovelletaan Eurovocissa synonyymeihin; Esimerkki: IEA (OECD) USE Kansainvälinen energiajärjestö (7621) kvasisynonyymeihin eli termeihin, joita pidetään erilaisina tavanomaisessa käytössä mutta joihin suhtaudutaan synonyymeinä indeksoinnin tarpeita varten Esimerkki: karjan teurastus USE eläinten teurastus (6036) teknologinen riippuvuus USE teknologinen omavaraisuus (0806) Jos kyseessä on tesauruksen aihealueisiin nähden marginaalinen termi, käytetään laajempaan termiin viittaamisen tekniikkaa. Luokan nimeä ja sen jäsenten nimeä käsitellään ekvivalentteina. Luokan ylimmän tason termi katsotaan tällöin asiasanaksi. Esimerkki: kvitteni omena päärynä siemenhedelmät viikuna USE siemenellinen hedelmä (6006) 1.8.2.3 Hierarkkinen suhde Suhde perustuu asiasanojen välisiin hierarkkisiin ylä- ja alatasoihin. Ylätason termi muodostaa luokan, alatason termit sen sijaan edustavat kyseisen luokan tekijöitä tai osia. Luokka esitetään symbolein: BT (broader term eli laajempi termi) alatason ja ylimmän tason asiasanan välissä. Tunnukseen liittyvä numero ilmaisee alatason asiasanan ja ylimmän tason asiasanojen välisten hierarkkisten tasojen määrän. Esimerkki: standardi BT1 standardointi BT2 tekniset määräykset Asiasanat, joilla ei ole laajempia termejä, ovat ylimmän tason asiasanoja (top terms). NT (narrower term eli suppeampi termi) sijoittuu ylimmän tason ja alatason asiasanan välille. Tunnukseen liittyvä numero ilmaisee ylimmän tason asiasanan ja alatason asiasanojen välisten hierarkkisten tasojen määrän. Esimerkki: standardointi NT1 CE-vaatimustenmukaisuusmerkintä NT1 hyväksyntä NT2 yhteisön varmentaminen NT1 kansainvälinen standardi NT2 eurooppalainen standardi NT1 standardi NT2 laatustandardi NT2 tekninen standardi NT2 tuotantostandardi NT2 turvallisuusstandardi NT1 standardien yhdenmukaistaminen Hierarkkinen suhde auttaa asiakirjajärjestelmän käyttäjää löytämään haluamansa spesifisyystason hierarkiassa navigoimalla. Käyttäjä voi laajentaa tai täsmentää kysymystään valitsemalla asiasanan, jolla on laajempi merkitys (esimerkiksi standardointi tai tekniset määräykset ) tai täsmällisempi merkitys ( tuotantostandardi, laatustandardi, turvallisuusstandardi tai tekninen standardi ). Hierarkkinen suhde täsmentää asiasanan merkityksen asiayhteydessään. Esimerkiksi asiasanan lehdistö merkityksen määrittää sen luokittelu asiasanan joukkotiedotusväline alakäsitteeksi. Esimerkki: lehdistö BT1 joukkoviestintävälineet BT2 viestintävälineet Eurovocissa hierarkkinen suhde muodostuu loogisten tilanteiden pohjalta. 10
a. Geneerinen suhde Geneerinen suhde määrittää luokan (ylätason termin, laajemman termin tai ylimmän tason termin) ja sen tekijöiden (alatason termien tai suppeampien termien) välisen yhteyden. Esimerkki: suojelualue NT kansallispuisto NT luonnonsuojelualue b. Partitiivinen suhde Partitiivinen suhde koskee suppeaa joukkoa tilanteita, joissa osan nimeen sisältyy kokonaisuuden nimi asiayhteydestä riippumatta. Kokonaisuuden nimi edustaa ylätason termiä ja osan nimi alatason termiä tai termejä. Eurovocissa partitiivista suhdetta sovelletaan lähinnä seuraaviin termiluokkiin: Maantieteelliset paikannimet Esimerkki: valtameri NT Atlantin valtameri NT Eteläinen jäämeri NT Intian valtameri NT Pohjoinen jäämeri NT Tyyni valtameri Tieteen ja tiedon alat Esimerkki: kemia NT analyyttinen kemia NT biokemia NT sähkökemia NT valokemia Hierarkkiset yhteiskuntarakenteet Esimerkki: parlamentin puhemiehistö NT kvestori NT parlamentin puhemies NT parlamentin varapuhemies c. Monihierarkkinen suhde Eräät asiasanat voivat kuulua loogisesti yhtaikaa useisiin aihealueisiin. Yksi Eurovocin ominaispiirteistä on monihierarkian rajoittaminen. Asiasanat, jotka voivat viitata useisiin aihealueisiin, yhdistetään yleensä vain käyttäjien kannalta loogisimpaan aihealueeseen. Aihealueilla 72 MAANTIEDE ja 76 KANSAINVÄLI- SET JÄRJESTÖT sallitaan kuitenkin tietty monihierarkia. Kyseisiin kahteen aihealueeseen kuuluvat asiasanat voivat olla alatason termeinä useille laajemmille termeille. Esimerkiksi Nigeria kuuluu samanaikaisesti asiasanaluokkiin Länsi-Afrikka, AKT-maat, OPEC-maat ja CEAO-maat. Niinpä Euroopan unionin eri politiikat, jotka voisivat loogisesti kuulua aihealueeseen Euroopan yhteisöt, onkin yhdistetty niihin suoraan liittyviin aihealueisiin. Esimerkiksi asiasana yhteinen maatalouspolitiikka on luokiteltu aihealueeseen 56 maatalous, metsätalous ja kalastus ja asiasana yhteisön tutkimuspolitiikka aihealueeseen 64 tuotanto, teknologia ja tutkimus. Esimerkki useaan mikrotesaurukseen kuuluvasta asiasanasta: Panama MT 7216 Amerikka MT 7231 talousmaantiede MT 7236 poliittinen maantiede 1.8.2.4 Assosiaatiosuhde Assosiaatiosuhde on sellaisten kahden asiasanan välinen suhde, jotka eivät kuulu samaan hierarkkiseen rakenteeseen, vaikka ne ovat semanttisesti tai asiayhteydeltään läheisiä. Kyseisten kahden asiasanan välisen suhteen on oltava eksplisiittinen, sillä se ilmoittaa indeksoijalle merkitykseltään viereisten tai läheisten, indeksoinnissa tai tutkimuksessa käyttökelpoisten asiasanojen käyttötavan. Toisiinsa liittyvien asiasanojen välinen assosiaatiosuhde on merkitty kyseisten sanojen väliin sijoitetulla vastavuoroisuustunnuksella RT (related term eli rinnakkaistermi). Esimerkki: standardointi RT merkinnät RT tekninen este RT teollinen yhteistyö RT vastavuoroisen tunnustamisen periaate Assosiaatiosuhde toimii vastavuoroisesti kahden asiasanan välillä. Esimerkkejä: luottotakuu RT maksukyky maksukyky RT luottotakuu Assosiaatiosuhdetta ei ole sellaisten asiasanojen välillä, joilla on sama ylimmän tason termi. Esimerkkejä: Assosiaatiosuhdetta ei ole asiasanojen pelaaminen ja urheilu välillä, sillä ne ovat alatason termejä samalle ylimmän tason termille vapaa-aika (mikrotesaurus 2826 sosiaalinen elämä ). 11
1.9 Sisällön määrä Kaikkiin Eurovoc-tesauruksen kieliversioihin sisältyy 21 aihealuetta 127 mikrotesaurusta 6 645 asiasanaa (joista 519 ylimmän tason termiä) 6 669 vastavuoroista hierarkkista suhdetta 3 636 vastavuoroista assosiaatiosuhdetta. Kaikkien kieliversioiden aihealueet, mikrotesaurukset, asiasanat, hierarkkiset suhteet ja assosiaatiosuhteet vastaavat tarkasti toisiaan. Jokaisessa kieliversiossa voi sitä vastoin olla vaihteleva määrä ohjaustermejä ja selityksiä: Kieliversiot Selitykset Lukumäärä Ohjaustermit bulgaria 0 10 espanja 891 7 756 tšekki 834 13 139 tanska 827 6 602 saksa 728 8 295 viro 819 6 131 kreikka 825 6 866 englanti 759 6 769 ranska 840 6 691 italia 754 9 453 liettua 855 6 648 latvia 680 6 009 unkari 889 8 618 hollanti 849 6 828 puola 17 172 portugali 761 6 308 romania 0 951 sloveeni 27 150 slovakki 737 5 500 suomi 859 5 445 ruotsi 818 6 491 1.10 Paperiversiot Eurovoc-tesauruksen kaikki kieliversiot ovat kaksiosaisia: Osa 1: muunnosten aakkosellinen luettelo Osa 2: aiheenmukainen luettelo. Monikielinen näyttö on maaliskuusta 2002 alkaen ollut käytössä ainoastaan Eurovocin Internet-sivustolla. Monikielisessä näytössä esitetään asiasanat ja niiden kielelliset vastineet valituissa kielissä. Samalla kertaa voidaan valita enintään neljä kieltä. Kohdekielen asiasanat on aakkostettu ja lihavoitu. Muiden kielten vastaavat asiasanat on esitetty viereisissä sarakkeissa samalla rivillä ja normaalilla kirjasintyypillä. Intenet-sivustolta on myös mahdollista ladata Excelmuotoinen luettelo kaikkien kieliversioiden asiasanavastineista. 1.10.1 Muunnosten aakkosellinen luettelo Muunnosten aakkosellinen luettelo jakautuu kahteen osaan: Osa A sisältää alkukirjaimilla A I alkavat termit. Osa B sisältää alkukirjaimilla J Ö alkavat termit. Muunnosten aakkosellisessa luettelossa on joka sivulla kolme saraketta ja niissä viidentyyppisiä hakusanoja ensimmäisen sanan ja muiden merkitsevien sanojen mukaisessa aakkosjärjestyksessä. Ensimmäisen merkitsevän sanan mukaan aakkostetut asiasanat varsinainen asiasana lihavoituna; tunnuksella SN (scope note) merkitty selitys, jolla täsmennetään asiasanan merkitys tai käyttötapa; kursivoituna niiden mikrotesaurusten numero ja nimi, joihin asiasana kuuluu, ja edellä tunnus MT (mikrotesaurus); aakkosjärjestyksessä asiasanaan liittyvät ohjaustermit, joita edeltää tunnus UF (used for); haettavaan asiasanaan liittyvät laajemmat termit, joita edeltää tunnus BT (broader term) ja luku, joka ilmaisee hierarkkisten tasojen määrän haettavan asiasanan ja seuraavaksi ylemmän tason asiasanan välillä. Laajemmat termit on luokiteltu seuraavasti: hierarkkisten tasojen mukaan nousevassa järjestyksessä ja kullakin hierarkkisesti ylenevällä tasolla toisesta tasosta lukien oikealle sisennettyinä; sen jälkeen kullakin hierarkkisella tasolla aakkosjärjestyksessä. haettavaan asiasanaan liittyvät suppeammat termit, joita edeltää tunnus NT (narrower term) ja luku, joka ilmaisee hierarkkisten tasojen määrän haettavan asiasanan ja alemman tason asiasanan välillä. Alatason asiasanat on luokiteltu seuraavasti: ensin hierarkkisten tasojen mukaan laskevassa järjestyksessä ja kullakin hierarkkisesti alemmalla tasolla toisesta tasosta lukien oikealle sisennettyinä; sen jälkeen kullakin hierarkkisella tasolla aakkosjärjestyksessä. 12
aakkosjärjestyksessä asiasanan rinnakkaistermit, joita edeltää tunnus RT (related term). Esimerkki: alkuperätuote SN Tietyssä maassa tuotettu tuote; kun tuotteen valmistukseen osallistuu useampia maita, tuote on sen maan alkuperätuote, jossa sitä on viimeiseksi jalostettu. MT 2021 kansainvälinen kauppa UF alkuperäsääntö UF tavaroiden alkuperä UF tuotteen alkuperä BT1 GATT BT2 kansainvälinen kauppa NT1 alkuperätodistus RT kolmas maa RT perushyödykesopimus RT tuontirajoitus RT tullietuuskohtelu RT vapaa liike RT yleinen tullietuus Jonkin toisen merkitsevän sanan mukaan aakkostetut asiasanat Jos asiasana on sanaliitto, asiasanan jokaista merkitsevää sanaa varten luodaan muunnettu tai käänteinen hakusana, joka on muu kuin ensimmäinen merkitsevä sana. Asiasanan muunnettu hakusana muodostuu seuraavista tekijöistä: lihavoituina asiasanan merkitsevä termi, joka on muu kuin asiasanan ensimmäinen merkitsevä sana, sen perässä asiasanan jatko, jos hakutermi ei ole itse asiasanan viimeinen termi, sitten pilkku ja ensimmäinen merkitsevä termi, sitten vaakasuora viiva ja sulkeissa asiasanan aihealueen numero. Esimerkkejä: Kaksi merkitsevää termiä: vapaus, akateeminen (1236) Enemmän kuin kaksi merkitsevää termiä: pätevyyden tunnustaminen, ammatillisen (4406) tunnustaminen, ammatillisen pätevyyden (4406) Ensimmäisen merkitsevän sanan mukaan aakkostetut ohjaustermit ohjaustermi tavallisella kirjasintyypillä seuraavalla rivillä lihavoituna itse asiasana tai indeksointitermi, jota edeltää tunnus USE, sekä sulkeissa sen mikrotesauruksen numero, johon asiasana kuuluu. Esimerkkejä: kodin turvallisuus USE kotitapaturma (2826) tuotteen alkuperä USE alkuperätuote (2021) Jonkin toisen merkitsevän sanan mukaan aakkostetut ohjaustermit Jos ohjaustermi on sanaliitto, termin jokaista merkitsevää sanaa varten luodaan muunnettu tai käänteinen hakusana, joka on muu kuin ensimmäinen merkitsevä sana. Ohjaustermin muunnettu hakusana muodostuu seuraavista tekijöistä: tavallisella kirjasintyypillä ohjaustermin merkitsevä termi, joka on muu kuin ohjaustermin ensimmäinen merkitsevä sana, sen perässä asiasanan jatko, jos hakutermi ei ole itse asiasanan viimeinen termi, sitten pilkku ja ensimmäinen merkitsevä termi, sitten vaakasuora viiva seuraavalla rivillä lihavoituna itse asiasana tai indeksointitermi, jota edeltää tunnus USE, sitten sulkeissa sen mikrotesauruksen numero, johon asiasana kuuluu. Esimerkkejä: Kaksi merkitsevää termiä: koulutus, työvoiman USE USE ammatillinen koulutus (4406) Enemmän kuin kaksi merkitsevää termiä: suhteet, aviopuolisoiden varallisuusoikeudelliset USE avioliitto-oikeus (2806) varallisuusoikeudelliset suhteet, aviopuolisoiden USE avioliitto-oikeus (2806) Jonkin toisen merkitsevän sanan mukaan aakkostetut yhdyssanat, asiasanat tai ohjaustermit Eräät yhdyssanat (asiasanat tai ohjaustermit) voidaan jakaa erillisiksi merkitseviksi tekijöiksi. Tällöin jokaista asiasanan tai ohjaustermin muodostavaa merkitsevää leksikaalista yksikköä varten luodaan hakusana seuraavasti: tavallisella kirjasintyypillä ilmaistuina hakusana jonkin asiasanaan tai ohjaustermiin kuuluvan merkitsevän termin perusteella, sitten asiasanan tai ohjaustermin jatko, jos hakutermi ei ole itse asiasanan tai ohjaustermin viimeinen termi, sitten pilkku ja asiasanan tai ohjaustermin alku, sitten aaltoviiva ja vaakasuora viiva; seuraavalla rivillä lihavoituna itse asiasana, jota edeltää tunnus USE, sekä sulkeissa sen mikrotesauruksen numero, johon asiasana kuuluu. Esimerkki: dollarikanta, kulta~ USE kultavaluuttakanta (2406) 13
1.10.2 Aiheenmukainen luettelo Aiheenmukainen eli järjestelmällinen luettelo on esitetty aihealueittain ja järjestetty mikrotesaurukseksi. Kukin aihealue on jaettu kahteen osaan: aihealueen mikrotesaurusten aiheenmukainen luettelo ja aihealueen terminologia. 1.10.2.1 Mikrotesaurusten aiheenmukainen luettelo Jokaiselle sivulle merkitään otsikoksi mikrotesauruksen numero ja nimi. Otsikkoa seuraa oikealle osoittava nuoli, jos mikrotesauruksen luettelo jatkuu seuraavalle sivulle; otsikkoa edeltää vasemmalle osoittava nuoli, jos kyseessä on luettelon jatko. Esimerkki: 0421 parlamentti 0421 parlamentti Aiheenmukainen luettelo on luokitettu mikrotesaurusten numerojärjestyksessä, ja se on identtinen kaikissa kieliversioissa. Jokainen sivu on jaettu kahteen sarakkeeseen ja sisältää: lihavoituina aakkostetut ylemmän tason asiasanat, joilla ei ole laajempaa termiä (ylimmän tason asiasanat); jokaisen ylimmän tason asiasanan alla lihavoituina suppeammat termit, joita edeltää tunnus NT (narrower term) ja sen perässä luku, joka ilmaisee hierarkkisten tasojen määrän ylimmän tason asiasanan ja alatason asiasanan välillä; alatason asiasanat on luokitettu hierarkkisten tasojen nousevassa järjestyksessä ja kullakin hierarkkisella tasolla aakkosjärjestyksessä. Jokainen aleneva hierarkkinen taso on esitetty edeltävään hierarkkiseen tasoon nähden oikealle sisennettynä. Hierarkkiseen ketjuun kuuluvan asiasanan yhteydessä voidaan esittää normaalilla kirjasintyypillä sen rinnakkaistermit, joita edeltää tunnus RT. Kunkin rinnakkaistermin perään on merkitty sulkeissa sen mikrotesauruksen numero, johon termi kuuluu, elleivät termit ole samasta mikrotesauruksesta. Sivun alaosassa on oikealle osoittava nuoli, jos toisen sarakkeen hierarkkinen luettelo jatkuu seuraavalle sivulle. 1.10.2.2 Aihealueen terminologia Kunkin aihealueen asiasanat ja ohjaustermit on aakkostettu terminologian mukaan. Aihealueen terminologia osoitetaan otsikolla, johon sisältyy ilmaus Aihealueen terminologia:. Sitä seuraavat suuraakkosin aihealueen numero ja nimi. Terminologia on järjestetty kahteen sarakkeeseen kahdentyyppisten aakkostettujen hakusanojen mukaan. Ensimmäisen sanansa mukaan aakkostetut asiasanat lihavoituina asiasana ja sen perässä sulkeissa sen mikrotesauruksen numero, johon asiasana kuuluu. Esimerkki: rikoslaki (1206) Ensimmäisen sanansa mukaan aakkostetut ohjaustermit itse ohjaustermi tavallisella kirjasintyypillä; seuraavalla rivillä lihavoituna vastaava asiasana, jota edeltää tunnus USE, sekä sulkeissa sen mikrotesauruksen numero, johon asiasana kuuluu. Esimerkki: vangitsemisedellytykset USE vankeinhoitolaitos (1216) 1.11 Elektroniset tiedostot Eurovoc-tesaurus on saatavilla sähköisessä muodossa xml-tiedostoina edellyttäen, että julkaisutoimistolta on hankittu käyttölupa. Kyse voi olla tesauruksen käytöstä sellaisenaan, Eurovocin sisällyttämisestä johonkin sovellukseen tai sen käyttämisestä sivu- tai lisäarvotuotteiden kehittelyyn. Käyttölupa on maksuton paitsi jos tiedostoja aiotaan käyttää kaupalliseen sovellukseen tai levitykseen. Eri käyttöluvat kattavat seuraavat käyttötavat: käyttö puhtaasti henkilökohtaisiin tarpeisiin tai ilmaiseen levitykseen (yliopistot ja hallinto); tesauruksen lingvistiset sovellukset; käyttöluvan haltija sitoutuu vastavuoroisesti toimittamaan uuden kieliversion korvauksetta julkaisutoimistolle, jolla on oikeus mukauttaa sitä ja sisällyttää sen tiedot Eurovociin; tesauruksen muuntaminen tai täydentäminen alueellisia tarpeita varten tai erikoissanastoksi; käyttöluvan haltijan on vastavuoroisesti ilmoitettava esiintyvät eroavuudet ja toimitettava muunnettu tai täydennetty versio korvauksetta julkaisutoimistolle, jolla on oikeus sisällyttää se Eurovociin. Sähköisiä tiedostoja voi tilata kirjallisesti seuraavasta Eurovocin tekijöiden osoitteesta: Office for Official Publications of the European Communities Author Service Copyright 2, rue Mercier L-2985 Luxembourg Sähköposti: copyright-info@publications.europa.eu 14
Tiedostoja koskevia teknisiä tietoja voi pyytää kirjallisesti seuraavasta Eurovocin ylläpitoyksikön osoitteesta: Office for Official Publications of the European Communities Eurovoc maintenance team 2, rue Mercier L-2985 Luxembourg Sähköposti: eurovoc@publications.europa.eu 15
2 HALLINNOINTI JA YLLÄPITO Eurovoc-tesaurusta mukautetaan jatkuvasti Euroopan yhteisön toimielinten toimialojen ja yhteisön kielijärjestelmän kehittyessä. Eurovocin erityispiirteenä on sen tekijöiden halu ja kyky vastata tasapuolisesti ja puolueettomasti kaikkien käyttäjien ilmaisemiin tarpeisiin Euroopan unionin toimielinten kaikilla toimialoilla. Tesauruksen hallinnointia ja ylläpitoa varten on perustettu seuraava ylläpitojärjestelmä: Euroopan parlamentin työyksikkö tutkii ja arvioi kansallisten parlamenttien laatimat ehdotukset ja toimittaa ne omien ehdotustensa kanssa julkaisutoimiston ylläpitoyksikköön. Julkaisutoimiston ylläpitoyksikkö kerää ja tarkastaa kaikkien käyttäjien ehdotukset. Se koordinoi ylläpitokomitean työskentelyä ja vastaa tietoteknisistä ja teknisistä muutoksista sekä käännösten seurannasta. Euroopan unionin toimielinten edustajista koostuva ylläpitokomitea äänestää ehdotuksista ja päättää tesaurukseen tehtävistä muutoksista. Ohjauskomitea valvoo hanketta ja hyväksyy virallisesti tesauruksen jokaisen uuden version. Kaikki käyttäjät voivat lähettää ehdotuksia Eurovocin muuttamiseksi ja kehittämiseksi tähän julkaisuun liitetyllä ylläpitolomakkeella tai Eurovocin Internet-sivuston kautta. 3 KÄYTTÖOHJEITA 3.1 Asiakirjojen indeksointi Indeksointi eli asiasanoitus on menetelmä, jossa määritetään asiakirjan tai asiakirjahaun sisältöä parhaiten kuvaavat käsitteet ja valitaan tesauruksesta niitä vastaavat asiasanat. Indeksoinnin tarkoituksena on löytää asiakirjojen sisällön ja järjestelmässä tehtyjen hakujen yhtymäkohdat. Haun tehokkuus asiakirjajärjestelmässä ja kyky toimittaa käyttökelpoiset asiakirjat riippuu indeksoinnin laadusta. 3.1.1 Käsitteiden valinta Älyllisellä analyysillä määritellään asiakirjassa tai järjestelmälle asetetussa kysymyksessä esiintyvät käsitteet. Indeksoinnin on oltava selektiivinen (selektiivisyysperuste) Kaikkia asiakirjan analyysissä tunnistettuja käsitteitä ei välttämättä tarvitse käyttää indeksoinnissa. On valittava ne käsitteet, joista asiakirja antaa käyttäjälle merkitsevää tietoa. Indeksoinnin selektiivisyys on tesauruksen laadusta riippumaton tekijä. Se riippuu kussakin asiakirjajärjestelmässä noudatetusta indeksointipolitiikasta ja asiakirjan asiasanojen keskimäärästä (indeksoinnin tarkkuus). Indeksoinnin on oltava tyhjentävä (tyhjentävyysperuste) On otettava mukaan kaikki käsitteet, joiden osalta asiakirja on käyttökelpoinen. Tyhjentävyys on yhtä kuin asiakirjan indeksoinnin yksityiskohtaisuus. Se riippuu tesaurukselta vaadittavista ominaisuuksista ja tesauruksen esikoordinoinnin tasosta (yhdyssanatermit), indeksoinnin yksityiskohtaisuuden määrittävästä indeksointipolitiikasta ja indeksoinnin tarkkuudesta. Asiakirjan käyttökelpoisuusaste vaihtelee käsitteiden tärkeyden mukaan. Käsitteet voidaan painottaa kaksitasoisesti niiden tärkeyden mukaan: Ensisijaiset asiasanat ilmentävät käsitteitä, joiden osalta asiakirja on käyttökelpoinen kaikissa tapauksissa ja kaikissa hauissa. Toissijaiset asiasanat ilmentävät käsitteitä, joiden osalta asiakirjasta voi olla käyttäjälle hyötyä tiedonhaussa. 3.1.2 Käsitteiden kääntäminen Käsite käännetään indeksoijan työkielelle. Indeksoija etsii valittuja käsitteitä vastaavat hakusanat Eurovoctesauruksen muunnetusta aakkosellisesta luettelosta. 16
Vaihtoehtoja on kolme: a) Käsite vastaa asiasanaa (esimerkiksi koulutuspolitiikka ). b) Käsite vastaa ohjaustermiä: ohjaustermi viittaa tällöin käytettävään asiasanaan. Esimerkki: koulutusavustus USE opintotuki (3216) c) Jos käsitettä vastaavaa hakusanaa ei ole, tesaurus auttaa muuntamaan käsitteen asiasanaksi seuraavasti: Haetaan muunnosten aakkosellisesta luettelosta jokainen käsitteen sisältämä sana erikseen. Esimerkiksi budjettitoimivalta ei ole tesauruksen asiasana. Aakkosellisesta hakemistosta termin budjetti- kohdalta valitaan asiasana budjettivalta. Käsite muotoillaan uudestaan tavallisen kielenkäytön mukaiseksi ja tarkistetaan, onko Eurovocin muunnetussa aakkosellisessa luettelossa vastaavaa hakusanaa. Esimerkiksi käsitettä häväistys ei ole tesauruksessa, mutta sitä edustaa asiasana, kunnianloukkaus. Tunnistetaan aihe tai aiheet tai luokat, joihin haettu käsite kuuluu, ja tutkitaan aiheenmukainen luettelo mikrotesauruksittain. Esimerkiksi käsitettä ympäristöseuraus ei ole tesauruksessa, mutta se kuuluu ympäristöalaan. Mikrotesaurukseen 5206 ympäristöpolitiikka sisältyy asiasana ympäristövaikutus. Ilmaistaan käsite kahden tai useamman asiasanan yhdistelmällä. Esimerkiksi Washingtonin sopimusta ei ole tesauruksessa, mutta sitä voivat edustaa asiasanat kansainvälinen yleissopimus, eläinkunta ja kasvikunta. Asiasanan ympäristö täsmentää sen merkityksen. On suositeltavaa, että indeksoija tutkii järjestelmällisesti jokaisen asiasanan semanttisen ja asiaympäristön. Käsitettä edustamaan valitun asiasanan on oltava mahdollisimman spesifinen tai lähellä edustettavaa käsitettä spesifisyyssääntöjen edellyttämällä tavalla. Vertikaalinen spesifisyys: käsitteen ja sitä kuvaavan asiasanan on oltava yhtä spesifisiä, ja ellei tällaista asiasanaa löydy, tesauruksesta on valittava käsitteen tasoa välittömästi ylemmän tason asiasana. Esimerkkejä: Maakuntia käsittelevä asiakirja on indeksoitava asiasanalla maakunta, ei ylätason asiasanalla. alueelliset ja paikalliset viranomaiset. Jos asiakirja käsittelee anestesialääkärin ammattia, joka ei esiinny Eurovocissa, se on indeksoitava ylätason asiasanalla lääkäri. Asiakirja, jossa käsitellään erikseen kunkin Beneluxmaan tilannetta, on indeksoitava asiasanoilla Belgia, Luxemburg ja Alankomaat, ei asiasanalla Benelux-maat. Horisontaalinen spesifisyys: kahdesta tai useammasta sanasta muodostuva käsite on ilmaistava esikoordinoidulla tai yhdistelmäasiasanalla, mikäli tesauruksesta sellainen löytyy, ei yhdistämällä yksittäisiä asiasanoja. Asiasanan esikoordinoinnin aste lisää sen spesifisyyttä. Esimerkki: Unionin tutkimuspolitiikkaa käsittelevä asiakirja on indeksoitava asiasanalla yhteisön tutkimuspolitiikka, ei asiasanoilla yhteisön politiikka tai tutkimus. Asiasanoituksen spesifisyys riippuu myös seuraavista tekijöistä: tesauruksesta, joka voi sisältää huomattavan määrän alatason asiasanoja; indeksointipolitiikasta; indeksoijien asiantuntemuksesta kyseisellä aihealueella. 3.2 Asiakirjajärjestelmän tehokkuus Asiakirjajärjestelmän tehokkuus riippuu sen kyvystä toimittaa haun tuloksena yksi tai useampi käyttökelpoinen asiakirja. Tehokkuus mitataan saannin ja tarkkuuden asteena: Saannilla mitataan järjestelmän kykyä löytää kaikki käyttökelpoiset asiakirjat. Saantiaste on järjestelmän löytämien käyttökelpoisten asiakirjojen määrän suhde asiakirjajärjestelmän sisältämien käyttökelpoisten asiakirjojen määrään. Jos järjestelmä ei löydä kaikkia käyttökelpoisia asiakirjoja, siinä on tietokato eli hiljaisuus ; Tarkkuudella mitataan järjestelmän kykyä löytää pelkästään käyttökelpoiset asiakirjat tai antaa oikeat vastaukset. Tarkkuusaste on löydettyjen käyttökelpoisten asiakirjojen lukumäärän suhde kaikkien löydettyjen asiakirjojen määrään. Jos järjestelmä löytää muita kuin käyttökelpoisia asiakirjoja, siinä on melua. Tyhjentävyyden ja spesifisyyden käsitteet liittyvät läheisesti toisiinsa: Tyhjentävyys lisää saantia mutta vähentää tarkkuutta. Löydettyjen asiakirjojen määrä on toisin sanoen suurempi, mutta ne ovat vähemmän käyttökelpoisia; Spesifisyys lisää tarkkuutta mutta vähentää saantia. Löydetyt asiakirjat ovat toisin sanoen käyttökelpoisempia, mutta niiden lukumäärä on pienempi. 17
Saantiasteen parantamiseksi voidaan käyttää kaikenkattavaa eli geneeristä indeksointia (toisin sanoen esittää automaattisesti asiasanat, jotka kuuluvat samoihin hierarkkisiin ketjuihin kuin indeksoijan esittämät asiasanat). Toimenpide voidaan suorittaa seuraamalla hierarkkista ketjua ylöspäin asiakirjojen saapuessa tietokantaan tai alaspäin tietoa tietokannasta haettaessa. Nouseva geneerinen indeksointi: esimerkiksi asiasanalla oppisopimuskoulutus suoritettu haku antaa tulokseksi kaikki asiakirjat, jotka on indeksoitu oppisopimuskoulutukseen ja ammatillinen koulutus, joka on ylätason termi. Laskeva geneerinen indeksointi: esimerkiksi asiasanalla irtisanominen suoritettu haku antaa tulokseksi kaikki asiakirjat, jotka on indeksoitu irtisanomiseen, eroraha ja laiton irtisanominen. Jos Eurovoc-tesauruksesta puuttuu jotain käsitteitä, vapaista asiasanoista on syytä laatia ehdotus viralliseksi luetteloksi. Tällaisia asiasanoja voidaan ehdottaa Eurovocin ylläpitoyksikölle tähän julkaisuun liitetyllä ylläpitolomakkeella tai Internet-sivuston kautta. 18