Tiedonhakumenetelmät Tiedonhakumenetelmät, Helsingin yliopisto, tktk, k2014. H.Laine 1. Tiedonhaku Boolen haku Indeksit. Tiedonhaku?
|
|
- Petteri Aarno Keskinen
- 7 vuotta sitten
- Katselukertoja:
Transkriptio
1 Tiedonhaku? Tiedonhakumenetelmät Tiedonhaku Boolen haku Indeksit Tiedonhaku (information retrieval, IR) Tietotarpeen tyydyttävän pääasiallisesti jäsentämättömän (tyypillisesti tekstimuotoisen) materiaalin hakemista laajasta (yleensä tietokoneille tallennetusta) aineistosta. Esimerkkejä Webbihaut Sähköpostihaut Omat aineistot työasemalla Ohjeistot, käsikirjat Kirjastot Arkistot Lait ja säädökset, 1 2 Tiedonhaku? Tiedonhaku Tietotarve Dokumentit Aineisto Kysely Osumatesti Kuvailut Kyselyn tarkennus Hakutulos Tietotarpeet (information needs): Tietoa aiheesta, tietty dokumentti, jokin fakta, Dokumentit rakenteeltaan Rakenteisia, puolirakenteisia, vapaamuotoisia Hakutavat Kyselyt, selaus, suodatus, hierarkkinen haku, Käyttäjät Hakuammattilaiset,, jokamies Rajautuneisuus Henkilökohtaiset tiedot, yrityksen tiedot, aihepiirikohtaiset tiedot, yleinen webbihaku 3 4 Hakumallit Hakumallit: Boolen haku Haun perusmalli: dokumentti sisältää termin (sanan) Esim: Hae dokumentit, joissa esiintyy sana Caesar Grep ratkaisuna: haetaan säännöllisen lausekkeen avulla Esim: grep -slw Caesar aineisto/* Toimii hyvin, jos aineisto on kohtuullisen pieni Ehdon monimutkaistuminen tekee hakukyselyn hankalaksi Aineiston koon kasvu tekee hausta hitaan Dokumentit nähdään sanojen joukkona Kyselyt esitetään termeistä muodostuvana Boolen lausekkeena Operaattorit AND, OR ja NOT Kukin termi ilmaisee totuusarvon tilanteelle sana sisältyy dokumenttiin Tarkastellaan Shakespearen näytelmiä, Kysely Caesar AND Brutus AND NOT Calpurnia hakee dokumentteja, joihin sisältyvät sanat Caesar ja Brutus mutta ei sana Calpurnia grep:n kaltainen lineaarinen läpikäynti hankaloituu (kuinka NOT?) Lineaarisen läpikäynnin tilalle indeksit Dokumentti joko sisältää termin tai sitten ei 5 6 H.Laine 1
2 Boolen haku Esiintymämatriisi Esiintymämatriisi: missä dokumentissa termi esiintyy Antony and Cleopatra Julius Caesar The Tempest Hamlet Othello Macbeth Antony Brutus Caesar Calpurnia Cleopatra mercy worser jos näytelmä sisältää termin, muuten 0 Voidaan ajatella, että jokaiseen termiin liittyy bittivektori, joka kuvaa termin esiintymistä Caesar: Brutus: NOT Calpurnia: AND: Tarvitaan lisäksi järjestetty lista dokumenteista, jotta voidaan selvittää, mikä dokumentti vastaa bittipositiota: Tulos: Anthony and Cleopatra, Hamlet 7 8 Käsitteitä Haun tehokkuus Aineisto (collection /corpus) Kiinteä joukko dokumentteja Ennakoimattomat tietotarpeet (ad hoc retrieval) Haetaan dokumentit, jotka ovat relevanttejasuhteessa käyttäjän satunnaiseen tietotarpeeseen ja auttavat käyttäjää suoriutumaan tehtävästään Dokumentti on relevantti, jos se käyttäjän mielestä sisältää arvokasta asiaa suhteessa tietotarpeeseen. Tietotarvetta ei useinkaan pysty ilmaisemaan määrittelemällä täsmällisesti mitä sanoja dokumentin tulee sisältää Tiedonhaun tehoa (effectiveness) voidaan arvioida kahdella tunnusluvulla: Tarkuudella (precision): Kuinka suuri osa saaduista tuloksista on relevantteja Saannilla (recall): Kuinka suuren osan aineiston relevanteista dokumenteista vastaus kattaa Tarkkuus ja saanti Tarkkuus ja kattavuus häly osumat tavoittamattomat Pieni tarkkuus => enemmän työtä relevanttien löytämiseksi aineisto Pieni kattavuus => pieni tiedon määrä suhteessa saatavissa olevaan epärelevantit tarkkuus= osumat /(osumat+häly) relevantit saanti= osumat/(osumat+tavoittamattomat) hakutulos H.Laine 2
3 Isot aineistot Käänteisindeksi (inverted index) Toimiiko esiintymämatriisi? Esimerkki: 1 miljoona dokumenttia, dokumentti noin 1000 sanaa (2-3 sivua), sana noin 6 tavua noin 6GB aineisto erillistä termiä Esiintymämatriisi 0.5M*1M bittiä =62.5GB (ISO) 1-bittejä kuitenkin enintään 1000M; 1/500 = 0.2% hyvin harva matriisi Parempi indeksi: kirjataan vain 1-bittien positiot Jokaiseen termiin liittyen laaditaan järjestetty lista niiden dokumenttien tunnuksista, joissa termi esiintyy Oletetaan, että dokumentin tunnus on järjestysnumero Brutus Caesar Calpurnia esiintymä(tieto) 13 Sanasto (dictionary) Esiintymät (postings) 14 Käänteisindeksi (inverted index) Käänteisindeksin tekeminen Termien esiintymälistat ovat kovin erikokoisia, joten tarvitaan vaihtuvapituisia listoja Levyllä yhtenäinen peräkkäisten esiintymien sekvenssi on kätevin rakenne Keskusmuistissa voi käyttää linkitettyjä listoja tai vaihtuvapituisia taulukoita (muokkaustarve vaikuttaa) dokumentit Saneistaminen (tokenization) yhtenäistäminen Lingisticpreprocessing Indeksin teko Index writing Friends, Romans, countrymen. Friends Romans Countrymen friend roman countryman friend 2 4 roman countryman Esiprosessointi Saneistaminen ja esiprosessointi Saneistaminen (tokenization) Pilkotaan lähtötieto saneiksi (token) [sanamuodon esiintymä] Miten käsitellään erilaiset erottimet ja muut erikoismerkit? Normalisointi (normalization) Yhtenäistetään esitystapa (esim U.S.A. => USA) Typistäminen, stemmaus (stemming) Karsitaan esimerkiksi taivutusmuodoista johtuvia päätteitä tai sanan johdannaisia, jäljelle jää vain runko Hukkasanojen käsittely (stop words) Voidaan poistaa hakua edistämättöminä Esim. engl. a, the, to, in, if,.. Muodostetaan (termi, dokumenttitunnus) -pareja I did enact Julius Caesar I was killed i the Capitol; Brutus killed me. Dokumentti 1 So let it be with Caesar. The noble Brutus hath told you Caesar was ambitious Dokumentti H.Laine 3
4 Sane, esiintymä -parien järjestäminen Koonti Järjestetään parit ensisijaisesti termin toissijaisesti dokumenttitunnuksen mukaisesti Saman dokumentin saneista kootaan termitieto, johon liitetään järjestetty esiintymälista dokumenttitunnuksista Termiin liitetään esiintymien lukumäärä Indeksien pystytys ja käyttö Indeksit kyselynkäsittelyssä Entä, jos aineisto on suuri? Miten indeksoidaan suuri aineisto? Miten isoksi indeksit muodostuvat? Voiko indeksejä tiivistää? Miten indeksejä hyödynnetään parhaan tuloksen saavuttamiseksi? Tarkastellaan kyselyä: Brutus AND Calpurnia Hae termin Brutus esiintymälista Hae termin Calpurnia esiintymälista Hae listoista yhteiset tunnukset (listojen leikkaus) lomittamalla ne Brutus Calpurnia Listojen leikkaus Lomitusjärjestys Suoritettavissa lineaarisessa ajassa suhteessa listojen pituuteen O(n+m) Listojen pitää olla järjestettyjä Edullisin lomitusjärjestys? Tarkastellaan n:n AND yhdistetyn termin kyselyä Esim: Brutus AND Caesar AND Calpurnia Haetaan kuhunkin termiin liittyvät esiintymälistat ja lomitetaan ne. Edullisinta on aloittaa lyhimmistä listoista => välitulos enintään lyhimmän listan pituinen => listan pituus saadaan selville termiin liittyvästä esiintymälaskurista H.Laine 4
5 Lomitusjärjestys Boolen kyselyt Yleisemmin kyselyn (termi1 OR termi2) AND (termi3 OR termi4) AND Lomitusjärjestys voidaan määrätä seuraavasti: Haetaan kaikkien termien esiintymäfrekvenssit Arvioidaan OR-yhdistettyjen listojen kooksi yhdistettävien listojen kokojen summa (konservatiivinen arvio) Käsitellään OR-ryhmät arvioidun koon mukaisesti pienimmästä suurimpaan Välitulosten kirjoitus voidaan usein välttää pitämällä leikkaustulos muistissa ja yhdistämällä seuraavan termin lista välitulokseen Kyselyt ovat täsmällisiä Vastaus on täsmällinen suhteessa kyselyyn, mutta onko se hyvä suhteessa todelliseen tietotarpeeseen AND yhdistelmillä hyvä tarkkuus mutta pieni saanti OR yhdistelmillä hyvä saanti mutta huono tarkkuus H.Laine 5
Tiedonhakumenetelmät Tiedonhakumenetelmät Helsingin yliopisto / TKTL. H.Laine 1. Rankkaukseen perustuva tiedonhaku.
Boolen haut Tiedonhakumenetelmät Rankkaukseen perustuva tiedonhaku Boolen haussa dokumentti joko täyttää hakuehdon tai ei täytä hakuehtoa Hakuehdon täyttäviä vastauksia voi olla runsaasti (tuhansia - miljoonia)
LisätiedotTiedonhakumenetelmät Tiedonhakumenetelmät Helsingin yliopisto, tktl, k2014. H.Laine 1
Kyselyn käsittely Tiedonhakumenetelmät Ranking mitan laskenta Vektorimalli ja muut kyselytyypit Hakujärjestelmä 1 2 Kosinimitan laskennassa käytetään dokumenttien painon normalisointiin dokumentin Euclidista
LisätiedotOhjelmoinnin peruskurssi Y1
Ohjelmoinnin peruskurssi Y1 CSE-A1111 30.9.2015 CSE-A1111 Ohjelmoinnin peruskurssi Y1 30.9.2015 1 / 27 Mahdollisuus antaa luentopalautetta Goblinissa vasemmassa reunassa olevassa valikossa on valinta Luentopalaute.
LisätiedotAlgoritmit 2. Luento 7 Ti Timo Männikkö
Algoritmit 2 Luento 7 Ti 4.4.2017 Timo Männikkö Luento 7 Joukot Joukko-operaatioita Joukkojen esitystapoja Alkiovieraat osajoukot Toteutus puurakenteena Algoritmit 2 Kevät 2017 Luento 7 Ti 4.4.2017 2/26
LisätiedotOhjelmoinnin perusteet Y Python
Ohjelmoinnin perusteet Y Python T-106.1208 11.2.2009 T-106.1208 Ohjelmoinnin perusteet Y 11.2.2009 1 / 33 Kertausta: listat Tyhjä uusi lista luodaan kirjoittamalla esimerkiksi lampotilat = [] (jolloin
LisätiedotOvid Medline käyttöohjeita (10/2010)
Ovid Medline käyttöohjeita (10/2010) Sisältö 1. Pikahaku - Basic Search:... - 1-2. Tarkennettu haku asiasanoilla - Advanced Ovid Search... - 1-3. Tulosjoukkojen yhdistely... - 5-4. Vapaasanahaku yksittäisellä
LisätiedotTKHJ:ssä on yleensä komento create index, jolla taululle voidaan luoda hakemisto
Indeksin luonti ja hävitys TKHJ:ssä on yleensä komento create index, jolla taululle voidaan luoda hakemisto Komentoa ei ole standardoitu ja niinpä sen muoto vaihtelee järjestelmäkohtaisesti Indeksi voidaan
Lisätiedot1. Johdanto. Näkökulma dokumentti kohteena on yksinkertaistettu: - www-sivu tai -sivujoukko - monimutkainen tiedontarve
Tiedonhakumenetelmät, k.01 1 Luku 1. Johdanto 1. Johdanto IR (Information Retrieval; Information Storage and Retrieval) Tiedonhaku = prosessit, jotka liittyvät tiedon esittämiseen organisointiin tallentamiseen
LisätiedotVinkkejä musiikin tiedonhakuun OUTI-verkkokirjastossa
Vinkkejä musiikin tiedonhakuun OUTI-verkkokirjastossa Katja Pietilä / Musiikkiosasto 23.9.2017 Sisältö Verkkokirjaston aloitussivu Tarkan haun aloitussivu Hakutuloksen lukeminen Kokonaisten julkaisujen
LisätiedotAlgoritmit 2. Luento 3 Ti Timo Männikkö
Algoritmit 2 Luento 3 Ti 20.3.2018 Timo Männikkö Luento 3 Järjestäminen eli lajittelu Kekorakenne Kekolajittelu Hajautus Yhteentörmäysten käsittely Ketjutus Algoritmit 2 Kevät 2018 Luento 3 Ti 20.3.2018
LisätiedotLumme-verkkokirjaston tiedonhaun opas Pieksämäen kaupunginkirjasto
Lumme-verkkokirjaston tiedonhaun opas Pieksämäen kaupunginkirjasto Tervetuloa Lumme-kirjastojen verkkokirjastoon! Ilman kirjautumista voit selata aineistotietokantaa tarkistaa onko teos hyllyssä vai lainassa
LisätiedotOhjelmoinnin perusteet Y Python
Ohjelmoinnin perusteet Y Python T-106.1208 10.2.2010 T-106.1208 Ohjelmoinnin perusteet Y 10.2.2010 1 / 43 Kertausta: listat Tyhjä uusi lista luodaan kirjoittamalla esimerkiksi lampotilat = [] (jolloin
LisätiedotKuva 7.2 vastaustaulu harjoitukseen 7.2
Harjoitus 7. Lataa tiedosto http://users.metropolia.fi/~pasitr/opas/ran13b/data/ran13b.zip levylle Z: ja pura se. Kun olet tehnyt kaikki seuraavat 17 tehtävää palauta Tuubiin harjoituksen 7 vastauksena
LisätiedotAlgoritmit 1. Luento 11 Ti Timo Männikkö
Algoritmit 1 Luento 11 Ti 14.2.2017 Timo Männikkö Luento 11 Algoritminen ongelmanratkaisu Osittaminen Lomituslajittelu Lomituslajittelun vaativuus Rekursioyhtälöt Pikalajittelu Algoritmit 1 Kevät 2017
LisätiedotINTERNET KYSELYN TOTEUTUS
INTERNET KYSELYN TOTEUTUS 1. Tutkimuksen suunnittelu ja lomakkeen teko Kysymysten määrää ei ole rajoitettu. Kysymykset voivat olla luokiteltuja tai avovastauksisia. Luokitelluissa kysymyksissä voidaan
LisätiedotOhjelmoinnin perusteet Y Python
Ohjelmoinnin perusteet Y Python T-106.1208 25.2.2009 T-106.1208 Ohjelmoinnin perusteet Y 25.2.2009 1 / 34 Syötteessä useita lukuja samalla rivillä Seuraavassa esimerkissä käyttäjä antaa useita lukuja samalla
LisätiedotOhjelmoinnin perusteet Y Python
Ohjelmoinnin perusteet Y Python T-106.1208 9.2.2011 T-106.1208 Ohjelmoinnin perusteet Y 9.2.2011 1 / 46 Kännykkäpalautetteen antajia kaivataan edelleen! Ilmoittaudu mukaan lähettämällä ilmainen tekstiviesti
LisätiedotAlgoritmit 2. Luento 3 Ti Timo Männikkö
Algoritmit 2 Luento 3 Ti 21.3.2017 Timo Männikkö Luento 3 Järjestäminen eli lajittelu Kekorakenne Kekolajittelu Hajautus Yhteentörmäysten käsittely Ketjutus Algoritmit 2 Kevät 2017 Luento 3 Ti 21.3.2017
LisätiedotTiedonhaku korkeakouluopinnoissa
Kun Google ei riitä Tiedonhaku korkeakouluopinnoissa Googlesta tiedon ja julkaisujen saatavuus parantunut hyvä paikantamaan jo tiedettyä lähdettä tulosten relevanssilajittelu tiedon laatu ja taso vaihtelevat
LisätiedotTIEDONHAKU INTERNETISTÄ
TIEDONHAKU INTERNETISTÄ Internetistä löytyy hyvin paljon tietoa. Tietoa ei ole mitenkään järjestetty, joten tiedonhaku voi olla hankalaa. Tieto myös muuttuu jatkuvasti. Tänään tehty tiedonhaku ei anna
LisätiedotAlgoritmit 1. Luento 9 Ti Timo Männikkö
Algoritmit 1 Luento 9 Ti 7.2.2017 Timo Männikkö Luento 9 Graafit ja verkot Kaaritaulukko, bittimatriisi, pituusmatriisi Verkon lyhimmät polut Floydin menetelmä Lähtevien ja tulevien kaarien listat Forward
LisätiedotAlgoritmit 1. Luento 8 Ke Timo Männikkö
Algoritmit 1 Luento 8 Ke 1.2.2017 Timo Männikkö Luento 8 Järjestetty binääripuu Solmujen läpikäynti Binääripuun korkeus Binääripuun tasapainottaminen Graafit ja verkot Verkon lyhimmät polut Fordin ja Fulkersonin
LisätiedotAlgoritmit 1. Luento 1 Ti Timo Männikkö
Algoritmit 1 Luento 1 Ti 10.1.2017 Timo Männikkö Luento 1 Algoritmi Algoritmin toteutus Ongelman ratkaiseminen Algoritmin tehokkuus Algoritmin suoritusaika Algoritmin analysointi Algoritmit 1 Kevät 2017
Lisätiedotoheishakemistoja voi tiedostoon liittyä useita eri perustein muodostettuja
Tietokantojen hakemistorakenteet Hakemistorakenteiden (indeksien) tarkoituksena on nopeuttaa tietojen hakua tietokannasta. Hakemisto voi olla ylimääräinen oheishakemisto (secondary index), esimerkiksi
LisätiedotTietokanta löytyy kirjaston sähköisistä aineistoista ja NELLI-portaalin kautta.
CINAHL (OVID) hoitotieteen ja hoitotyön kansainvälinen viitetietokanta Cinahl sisältää hoitotyön ja sen lähialojen, esimerkiksi terveydenhuollon hallinnon ja koulutuksen aineistoviitteitä. Joidenkin lehtien
LisätiedotHajautusrakenteet. R&G Chapter Tietokannan hallinta, kevät 2006, Jan 1
Hajautusrakenteet R&G Chapter 11 16.02.06 Tietokannan hallinta, kevät 2006, Jan 1 Hajautukseen perustuvat tiedostorakenteet Hajautukseen perustuvissa tiedostorakenteissa on tavoitteena yksittäisen tietueen
LisätiedotAlgoritmit 2. Luento 4 To Timo Männikkö
Algoritmit 2 Luento 4 To 21.3.2019 Timo Männikkö Luento 4 Hajautus Yhteentörmäysten käsittely Avoin osoitteenmuodostus Hajautusfunktiot Puurakenteet Solmujen läpikäynti Algoritmit 2 Kevät 2019 Luento 4
LisätiedotWeb of ScienceTM Core Collection (1987-present)
Tampereen yliopiston kirjasto 2014 Web of ScienceTM Core Collection (1987-present) Science Citation Index Expanded (1987-present): Monitieteinen tietokanta, joka sisältää 8,500 tieteellistä lehteä luonnontieteiden,
LisätiedotCINAHL(EBSCO) käyttöohjeita (10/2010)
CINAHL(EBSCO) käyttöohjeita (10/2010) Sisältö 1. Katkaisumerkki, sanojen yhdistely, fraasihaku... - 1-2. Advanced Search haku vapailla hakusanoilla... - 1-3. Haku asiasanoilla (CINAHL Headings)... - 2-4.
LisätiedotHajautusrakenteet. Hajautukseen perustuvat tiedostorakenteet. Hajautukseen perustuvat tiedostorakenteet. Hajautukseen perustuvat tiedostorakenteet
Hajautusrakenteet R&G Chapter Hajautukseen perustuvissa tiedostorakenteissa on tavoitteena yksittäisen tietueen nopea haku. Tähän pyritään siten, että tietueen sijoituspaikan eli solun (cell, bucket) osoite
Lisätiedot2. Haet työntekijöiden tiedot etunimen mukaan nousevasti järjestettyinä. (ORDER BY) SELECT * FROM employees ORDER BY firstname ASC;
Tällä viikolla Kotitehtävien läpikäynti SQL-harjoituksia, osa 1 Jatketaan Pelifirman tietovaraston suunnittelua: tietotyyppien kertaus, taulun luonti ER-kaavioon, taulun luonti kaavion avulla tietokantaan,
LisätiedotCantorin joukon suoristuvuus tasossa
Cantorin joukon suoristuvuus tasossa LuK-tutkielma Miika Savolainen 2380207 Matemaattisten tieteiden laitos Oulun yliopisto Syksy 2016 Sisältö Johdanto 2 1 Cantorin joukon esittely 2 2 Suoristuvuus ja
LisätiedotTaulukot. Jukka Harju, Jukka Juslin 2006 1
Taulukot Jukka Harju, Jukka Juslin 2006 1 Taulukot Taulukot ovat olioita, jotka auttavat organisoimaan suuria määriä tietoa. Käsittelylistalla on: Taulukon tekeminen ja käyttö Rajojen tarkastus ja kapasiteetti
LisätiedotOhjelmoinnin perusteet Y Python
Ohjelmoinnin perusteet Y Python T-106.1208 9.2.2009 T-106.1208 Ohjelmoinnin perusteet Y 9.2.2009 1 / 35 Listat Esimerkki: halutaan kirjoittaa ohjelma, joka lukee käyttäjältä 30 lämpötilaa. Kun lämpötilat
LisätiedotDatatähti 2019 alku. task type time limit memory limit. A Kolikot standard 1.00 s 512 MB. B Leimasin standard 1.00 s 512 MB
Datatähti 2019 alku task type time limit memory limit A Kolikot standard 1.00 s 512 MB B Leimasin standard 1.00 s 512 MB C Taulukko standard 1.00 s 512 MB D Ruudukko standard 1.00 s 512 MB E Sanalista
LisätiedotKäsiteanalyysi prosessina ja tarveanalyysi
Informaatioteknologian instituutti IIO30100 Tietokantojen suunnittelu Käsiteanalyysi prosessina ja tarveanalyysi kirjan Hovi, Huotari, Lahdenmäki: Tietokantojen suunnittelu & indeksointi, Docendo (2003,
LisätiedotKÄSITEANALYYSI PROSESSINA JA TARVEANALYYSI
TIETOJEN MALLINNUS KÄSITEANALYYSI PROSESSINA JA TARVEANALYYSI HOVI, HUOTARI, LAHDENMÄKI: TIETOKANTOJEN SUUNNITTELU & INDEKSOINTI DOCENDO (2003, 2005) LUKU 3 S. 68 73 JA LUKU 4 (S. 79 84) JOUNI HUOTARI
LisätiedotEtsi aineistoa, uusi lainoja, tee varauksia. http://juolukka.linneanet.fi Onnistuneita hetkiä Juolukan parissa!
Lapin korkeakoulukirjasto Kirjasto- ja tietopalvelut Juolukka pikaopas Etsi aineistoa, uusi lainoja, tee varauksia. http://juolukka.linneanet.fi Onnistuneita hetkiä Juolukan parissa! TIEDONHAKU Jos etsit
LisätiedotCIRI Ontologiaperustainen tiedonhakuliittymä
CIRI Ontologiaperustainen tiedonhakuliittymä Eija Airio, Kalervo Järvelin, Sari Suomela, Pirkko Saatsi ja Jaana Kekäläinen Tampereen yliopisto Informaatiotutkimuksen laitos Ontologian kolmitasomalli kehitetty
LisätiedotAlgoritmit 1. Luento 4 Ke Timo Männikkö
Algoritmit 1 Luento 4 Ke 18.1.2017 Timo Männikkö Luento 4 Tietorakenteet Pino Pinon toteutus Jono Jonon toteutus Lista Listaoperaatiot Algoritmit 1 Kevät 2017 Luento 4 Ke 18.1.2017 2/29 Pino Pino, stack,
LisätiedotAlgoritmit 1. Luento 2 Ke Timo Männikkö
Algoritmit 1 Luento 2 Ke 11.1.2017 Timo Männikkö Luento 2 Algoritmin esitys Algoritmien analysointi Suoritusaika Asymptoottinen kertaluokka Peruskertaluokkia NP-täydelliset ongelmat Algoritmit 1 Kevät
LisätiedotLuento 2: Tiedostot ja tiedon varastointi
HELIA 1 (19) Luento 2: Tiedostot ja tiedon varastointi Muistit... 2 Päämuisti (Primary storage)... 2 Apumuisti (Secondary storage)... 2 Tiedon tallennuksen yksiköitä... 3 Looginen taso... 3 Fyysinen taso...
LisätiedotOhjelmoinnin perusteet Y Python
Ohjelmoinnin perusteet Y Python T-106.1208 17.2.2010 T-106.1208 Ohjelmoinnin perusteet Y 17.2.2010 1 / 41 Sanakirja Monissa sovelluksissa on tallennettava rakenteeseen avain arvo-pareja. Myöhemmin rakenteesta
LisätiedotOhjelmoinnin peruskurssi Y1
Ohjelmoinnin peruskurssi Y1 CSE-A1111 28.9.2015 CSE-A1111 Ohjelmoinnin peruskurssi Y1 28.9.2015 1 / 16 Mahdollisuus antaa luentopalautetta Goblinissa vasemmassa reunassa olevassa valikossa on valinta Luentopalaute.
LisätiedotPIKAOHJE Web of Science tietokantojen käyttöön
PIKAOHJE Web of Science tietokantojen käyttöön SCIENCE CITATION INDEX Monitieteinen tietokanta, joka sisältää biologian, lääketieteen ja psykiatrian alalta n. 7100 lehteä SOCIAL SCIENCES CITATION INDEX
LisätiedotFinna ja ontologiat tms.
Finna ja ontologiat tms. Erkki Tolonen 3.9.2014 Finna.fi - taustaa FINNA on osa Kansallinen digitaalinen kirjasto hanketta, sen asiakasliittymä, joka on toteutettu avoimen lähdekoodin ohjelmistojen päälle.
LisätiedotAlgoritmit 2. Luento 4 Ke Timo Männikkö
Algoritmit 2 Luento 4 Ke 22.3.2017 Timo Männikkö Luento 4 Hajautus Yhteentörmäysten käsittely Avoin osoitteenmuodostus Hajautusfunktiot Puurakenteet Solmujen läpikäynti Algoritmit 2 Kevät 2017 Luento 4
LisätiedotOhjelmoinnin perusteet Y Python
Ohjelmoinnin perusteet Y Python T-106.1208 7.2.2011 T-106.1208 Ohjelmoinnin perusteet Y 7.2.2011 1 / 39 Kännykkäpalautetteen antajia kaivataan edelleen! Ilmoittaudu mukaan lähettämällä ilmainen tekstiviesti
LisätiedotMetropolia ammattikorkeakoulu TU00BS : ICT-teknologiaosaaminen Tuntitehtävät 7 Pasi Ranne
Suorita osoitteen http://users.metropolia.fi/~pasitr/2015-2016/tu00bs69-3001/tt/07/all.sql SQL-skripti phpmyadmin-ohjelmalla (https://users.metropolia.fi/phpmyadmin/). Tuloksena syntyy videotietokanta
LisätiedotLukkarikone Pikaohjeet v. 1.0
Lukkarikone Pikaohjeet v. 1.0 Huom! Lukkarikone toimii oikein vain jos koulutusohjelmasi ylläpitää lukujärjestystietoja Metropolian tilanvarausjärjestelmässä (tvj.metropolia.fi). Käyttöperiaate Lukkarikone
LisätiedotOhjelmoinnin perusteet Y Python
Ohjelmoinnin perusteet Y Python T-106.1208 16.2.2010 T-106.1208 Ohjelmoinnin perusteet Y 16.2.2010 1 / 41 Kännykkäpalautetteen antajia kaivataan edelleen! Ilmoittaudu mukaan lähettämällä ilmainen tekstiviesti
LisätiedotTieto- ja tallennusrakenteet
Tieto- ja tallennusrakenteet Sisältö Tyyppi, abstrakti tietotyyppi, abstraktin tietotyypin toteutus Tallennusrakenteet Taulukko Linkitetty rakenne Abstraktit tietotyypit Lista (Puu) (Viimeisellä viikolla)
LisätiedotAlgoritmit 1. Luento 5 Ti Timo Männikkö
Algoritmit 1 Luento 5 Ti 24.1.2017 Timo Männikkö Luento 5 Järjestetty lista Järjestetyn listan operaatiot Listan toteutus taulukolla Binäärihaku Binäärihaun vaativuus Algoritmit 1 Kevät 2017 Luento 5 Ti
LisätiedotEtsintä verkosta (Searching from the Web) T Datasta tietoon Heikki Mannila, Jouni Seppänen
Etsintä verkosta (Searching from the Web) T-61.2010 Datasta tietoon Heikki Mannila, Jouni Seppänen 12.12.2007 Webin lyhyt historia http://info.cern.ch/proposal.html http://browser.arachne.cz/screen/
Lisätiedot8 KANNAT JA ORTOGONAALISUUS. 8.1 Lineaarinen riippumattomuus. Vaasan yliopiston julkaisuja 151
Vaasan yliopiston julkaisuja 151 8 KANNAT JA ORTOGONAALISUUS KantaOrthogon Sec:LinIndep 8.1 Lineaarinen riippumattomuus Lineaarinen riippumattomuus on oikeastaan jo määritelty, mutta kirjoitamme määritelmät
LisätiedotTIETOKANTOJEN PERUSTEET MARKKU SUNI
TIETOKANTOJEN PERUSTEET MARKKU SUNI OSIO 01 Peruskäsitteitä Kurssin tavoite: antaa osallistujille valmiudet ymmärtää tietokantojen periaatteet ymmärtää tietokantojen suunnittelunäkökohtia osallistua tietokantojen
LisätiedotHelsingin yliopisto/tktl Kyselykielet, s 2006 Optimointi Harri Laine 1. Kyselyn optimointi. Kyselyn optimointi
Miksi optimoidaan Relaatiotietokannan kyselyt esitetään käytännössä SQLkielellä. Kieli määrittää halutun tuloksen, ei sitä miten tulos muodostetaan (deklaratiivinen kyselykieli) Tietokannan käsittelyoperaatiot
LisätiedotSELECT-lauseen perusmuoto
SQL: Tiedonhaku SELECT-lauseen perusmuoto SELECT FROM WHERE ; määrittää ne sarakkeet, joiden halutaan näkyvän kyselyn vastauksessa sisältää
LisätiedotPubMed lääketieteellinen kokoteksti- ja viitetietokanta
PubMed lääketieteellinen kokoteksti- ja viitetietokanta Linkki: http://www.ncbi.nlm.nih.gov/entrez PubMed-tietokanta on internetissä vapaasti käytettävissä. Tietokanta sisältää yli 16 miljoonaa viitettä
LisätiedotITKP102 Ohjelmointi 1 (6 op)
ITKP102 Ohjelmointi 1 (6 op) Tentaattori: Antti-Jussi Lakanen 7. huhtikuuta 2017 Vastaa kaikkiin tehtäviin. Tee jokainen tehtävä erilliselle konseptiarkille. Kirjoittamasi luokat, funktiot ja aliohjelmat
Lisätiedot815338A Ohjelmointikielten periaatteet Harjoitus 6 Vastaukset
815338A Ohjelmointikielten periaatteet 2015-2016. Harjoitus 6 Vastaukset Harjoituksen aiheena on funktionaalinen ohjelmointi Scheme- ja Haskell-kielillä. Voit suorittaa ohjelmat osoitteessa https://ideone.com/
LisätiedotTietokanta (database)
Tietokanta Tietokanta (database) jotakin käyttötarkoitusta varten laadittu kokoelma toisiinsa liittyviä säilytettäviä tietoja 1 Tiedosto Ohjelmointikielissä apumuistiin tallennettuja tietoja käsitellään
LisätiedotHankintaesityksen tekeminen EBSCOhost Collection Managerissa
Hankintaesityksen tekeminen EBSCOhost Collection Managerissa Päivitetty 7.4.2016 Kaarina Meriläinen EBSCOn e-kirjanhankintaohjelmassa (ECM) on yliopiston henkilökunnan jäsenten mahdollista tehdä hankintaesityksiä,
LisätiedotDatatähti 2019 loppu
Datatähti 2019 loppu task type time limit memory limit A Summa standard 1.00 s 512 MB B Bittijono standard 1.00 s 512 MB C Auringonlasku standard 1.00 s 512 MB D Binääripuu standard 1.00 s 512 MB E Funktio
LisätiedotAlgoritmit 1. Luento 3 Ti Timo Männikkö
Algoritmit 1 Luento 3 Ti 17.1.2017 Timo Männikkö Luento 3 Algoritmin analysointi Rekursio Lomituslajittelu Aikavaativuus Tietorakenteet Pino Algoritmit 1 Kevät 2017 Luento 3 Ti 17.1.2017 2/27 Algoritmien
LisätiedotJukka Larja, Kim Nylund. 15. maaliskuuta 2005
Hirviön käyttöohje Jukka Larja, Kim Nylund 15. maaliskuuta 2005 1 Sisältö 1 Johdanto 3 1.1 Käsitteet...................................... 3 1.1.1 Muistiinpanot................................ 3 1.1.2
LisätiedotEsimerkkejä vaativuusluokista
Esimerkkejä vaativuusluokista Seuraaville kalvoille on poimittu joitain esimerkkejä havainnollistamaan algoritmien aikavaativuusluokkia. Esimerkit on valittu melko mielivaltaisesti laitoksella tehtävään
LisätiedotKysy kirjastonhoitajalta. Linkkikirjasto. Tiedonhaun portti. Frank-monihaku. kirjastot.fi>
Kysy kirjastonhoitajalta Linkkikirjasto Tiedonhaun portti Frank-monihaku kirjastot.fi> : Tiedonhaku-kanava Kaikki hakupalvelut ja hakutavat { www.kirjastot.fi/tiedonhaku Tiedonhaku-kanava kokoaa yhteen
LisätiedotMääritelmä Olkoon T i L (V i, W i ), 1 i m. Yksikäsitteisen lineaarikuvauksen h L (V 1 V 2 V m, W 1 W 2 W m )
Määritelmä 519 Olkoon T i L V i, W i, 1 i m Yksikäsitteisen lineaarikuvauksen h L V 1 V 2 V m, W 1 W 2 W m h v 1 v 2 v m T 1 v 1 T 2 v 2 T m v m 514 sanotaan olevan kuvausten T 1,, T m indusoima ja sitä
LisätiedotKääreluokat (oppikirjan luku 9.4) (Wrapper-classes)
Kääreluokat (oppikirjan luku 9.4) (Wrapper-classes) Kääreluokista Javan alkeistietotyypit ja vastaavat kääreluokat Autoboxing Integer-luokka Double-luokka Kääreluokista Alkeistietotyyppiset muuttujat (esimerkiksi
LisätiedotOhjelmoinnin peruskurssien laaja oppimäärä
Ohjelmoinnin peruskurssien laaja oppimäärä Keskeneräinen luento 3: Listat (mm. SICP 22.2.3) Riku Saikkonen 31. 10. 2011 Sisältö 1 Linkitetyt listat 2 Linkitetyt listat (SICP 2.1.1, 2.2.1) funktionaalinen
LisätiedotTiedonhakumenetelmät 8.4.2014. Tiedonhakumenetelmät Helsingin yliopisto/ TKTL, k 2014. H.Laine 1. Webbihaut Hakukone. Webbihaku. Hakukoneiden käyttö
Webbihaku Hakurobotti (crawler) Indeksoija Tiedonhakumenetelmät Indeksit Mainosindeksit Webbihaut Hakukone Hae 1 2 Webbihaku Hakukoneiden käyttö Perinteisessä tiedonhaussa haetaan dokumentteja tietotarpeen
LisätiedotOhjelmoinnin perusteet Y Python
Ohjelmoinnin perusteet Y Python T-106.1208 1.4.2009 T-106.1208 Ohjelmoinnin perusteet Y 1.4.2009 1 / 56 Tentti Ensimmäinen tenttimahdollisuus on pe 8.5. klo 13:00 17:00 päärakennuksessa. Tämän jälkeen
LisätiedotSeuraavassa taulukossa on annettu mittojen määritelmät ja sijoitettu luvut. = 40% = 67% 6 = 0.06% = 99.92% 6+2 = 0.
T-6.28 Luonnollisen kielen tilastollinen käsittely Vastaukset, ti 7.2.200, 8:30-0:00 Tiedon haku, Versio.0. Muutetaan tehtävässä annettu taulukko sellaiseen muotoon, joka paremmin sopii ensimmäisten mittojen
Lisätiedot1. (a) Seuraava algoritmi tutkii, onko jokin luku taulukossa monta kertaa:
Tietorakenteet, laskuharjoitus 10, ratkaisuja 1. (a) Seuraava algoritmi tutkii, onko jokin luku taulukossa monta kertaa: SamaLuku(T ) 2 for i = 1 to T.length 1 3 if T [i] == T [i + 1] 4 return True 5 return
LisätiedotTerveysportti: Lääkärin tietokannat WWW-muodossa
Terveysportti: Lääkärin tietokannat WWW-muodossa www.terveysportti.fi Ohjelmaan kirjoittaudutaan valitsemalla aloitusikkunasta oma sairaanhoitopiiri, jolloin ohjelman käynnistyttyä pääsee kätevästi lukemaan
LisätiedotSisällys. 3. Muuttujat ja operaatiot. Muuttujat ja operaatiot. Muuttujat. Operaatiot. Imperatiivinen laskenta. Muuttujat. Esimerkkejä: Operaattorit.
3. Muuttujat ja operaatiot Sisällys Imperatiivinen laskenta. Muuttujat. Nimi ja arvo. Muuttujan nimeäminen. Muuttujan tyyppi.. Operandit. Arvon sijoitus muuttujaan. Aritmeettiset operaattorit. Arvojen
Lisätiedot3. Muuttujat ja operaatiot 3.1
3. Muuttujat ja operaatiot 3.1 Sisällys Imperatiivinen laskenta. Muuttujat. Nimi ja arvo. Muuttujan nimeäminen. Muuttujan tyyppi. Operaattorit. Operandit. Arvon sijoitus muuttujaan. Aritmeettiset operaattorit.
LisätiedotMonihaku ja sähköiset aineistot tutuksi. Jyväskylän kaupunginkirjaston tiedonhaun koulutus
Monihaku ja sähköiset aineistot tutuksi Jyväskylän kaupunginkirjaston tiedonhaun koulutus Miksi monihaku? Sähköistä aineistoa valtavat määrät Laadukasta ja ei-niin-laadukasta Ilmaista ja maksullista Monihakuun
LisätiedotYKSA(2) (https://yksa.mikkeliamk.fi) Käyttäjän ohje
YKSA(2) (https://yksa.mikkeliamk.fi) Käyttäjän ohje KÄSITTEET JA LYHENTEET Palveluntarjoaja YKSA AMS Mikkelin Ammattikorkeakoulu Arkistonpalvelun työnimi Arkistonmuodostussuunnitelma. Suunnitelma siitä
LisätiedotYleistä. Nyt käsitellään vain taulukko (array), joka on saman tyyppisten muuttujien eli alkioiden (element) kokoelma.
2. Taulukot 2.1 Sisältö Yleistä. Esittely ja luominen. Alkioiden käsittely. Kaksiulotteinen taulukko. Taulukko operaation parametrina. Taulukko ja HelloWorld-ohjelma. Taulukko paluuarvona. 2.2 Yleistä
LisätiedotT Syksy 2004 Logiikka tietotekniikassa: perusteet Laskuharjoitus 7 (opetusmoniste, kappaleet )
T-79144 Syksy 2004 Logiikka tietotekniikassa: perusteet Laskuharjoitus 7 (opetusmoniste, kappaleet 11-22) 26 29102004 1 Ilmaise seuraavat lauseet predikaattilogiikalla: a) Jokin porteista on viallinen
LisätiedotTiedonhaku ja varaaminen
Tiedonhaku ja varaaminen Kyytin verkkokirjasto kyyti.finna.fi 20.11.2018 Tiedonhaku Kirjoita hakukenttään teoksen nimi, tekijä, aihe tai muita asiaan liittyviä hakusanoja. Tarvittaessa katkaise hakusana
LisätiedotVerkkokirjaston hakuohjeet
1 Verkkokirjaston hakuohjeet Pikahaku Hakulaatikon löydät kaikkien sivujen yläosasta. Voit valita kohdistuuko haku kirjaston aineistotietokantaan, verkkokirjastosivustoon vai avainsanoihin. Voit hakea
Lisätiedot811120P Diskreetit rakenteet
811120P Diskreetit rakenteet 2016-2017 2. Lukujen esittäminen ja aritmetiikka 2.1 Kantajärjestelmät ja lukujen esittäminen Käytettävät lukujoukot: Luonnolliset luvut IN = {0,1,2,3,... } Positiiviset kokonaisluvut
LisätiedotJohdatus verkkoteoriaan 4. luento
Johdatus verkkoteoriaan 4. luento 28.11.17 Viikolla 46 läpikäydyt käsitteet Viikolla 47 läpikäydyt käsitteet Verkko eli graafi, tasoverkko, solmut, välit, alueet, suunnatut verkot, isomorfiset verkot,
LisätiedotREKISTERÖINTIKATSASTUKSEN ALOITTAMINEN, RAJOITUSTIEDOT, KATSASTUKSEN PÄÄTTÄMINEN JA JATKAMINEN
REKISTERÖINTIKATSASTUKSEN ALOITTAMINEN, RAJOITUSTIEDOT, KATSASTUKSEN PÄÄTTÄMINEN JA JATKAMINEN REKISTERÖINTIKATSASTUKSEN ALOITTAMINEN... 2 KATSASTUKSEN PÄÄVALIKKO... 2 AJONEUVON HAKU (REKISTERÖINTIKATSASTUS)...
LisätiedotHohde Consulting 2004
Luento 5: XQuery AS-0.110 XML-kuvauskielten perusteet Janne Kalliola XQuery XQuery uudet funktiot sekvenssit muuttujat Iterointi järjestys suodatus järjestäminen Ehtorakenteet Muita toimintoja www.hohde.com
LisätiedotKirjastoverkkopäivät 2017 Erkki Tolonen
Kirjastoverkkopäivät 2017 Erkki Tolonen 25.10. Photograph: Eeva Rista 1974, Helsinki City Museum, https://finna.fi/record/hkm.hkms000005:km0000lqgq Melinda kuvailuun Finna asiakkaille Tiedonhakija / asiakas
LisätiedotTietorakenteet ja algoritmit - syksy 2015 1
Tietorakenteet ja algoritmit - syksy 2015 1 Tietorakenteet ja algoritmit - syksy 2015 2 Tietorakenteet ja algoritmit Johdanto Ari Korhonen Tietorakenteet ja algoritmit - syksy 2015 1. JOHDANTO 1.1 Määritelmiä
LisätiedotSisällysluettelo 1 Johdanto Root, koko Opalan pääkäyttäjä
OPALA Käyttöohje Sisällysluettelo 1 Johdanto 4 2 Root, koko Opalan pääkäyttäjä...5 2.1 Sisäänkirjautuminen.5 2.2 Käyttäjätunnukset 6 2.2.1 Pääkäyttäjätunnukset.6 2.2.1.1 Luo. 7 2.2.1.2 Muokka/poista 8
LisätiedotTiedonhaku. Esim. kymenlaakso muutosjohtami* Laila Hirvisaari Tuntematon sotilas Ruksi tyhjentää hakukentän.
Tiedonhaku Kirjoita hakukenttään teoksen nimi, tekijä, aihe tai muita asiaan liittyviä hakusanoja. Tarvittaessa katkaise hakusana tähdellä *. Tällöin haku löytää kaikki niin alkavat sanat. Esim. hakusana
LisätiedotSuomi.fi-verkkopalvelu
Suomi.fi-verkkopalvelu Haun toiminta Suomi.fi-verkkopalvelussa Tuuli Krekelä, Suomi.fi-verkkotoimitus Janne Murtonen, Gofore 14.12.2018 Koulutus nauhoitetaan Agenda 1. Suomi.fi-haun periaatteet 2. Mikä
LisätiedotARTIKKELITIETOKANNAT JA OMANELLI PIRJO POHJOLAINEN
ARTIKKELITIETOKANNAT JA OMANELLI PIRJO POHJOLAINEN 1 Etäkäyttö Käyttöoikeudet ja -rajoitukset PSK ITU-T IEEE Tali Helsingin Sanomien tekstiarkisto TALENTUM Suomen laki INTERNET hakukoneet aihehakemistot
LisätiedotOhjelmoinnin peruskurssi Y1
Ohjelmoinnin peruskurssi Y1 CS-A1111 10.10.2018 CS-A1111 Ohjelmoinnin peruskurssi Y1 10.10.2018 1 / 20 Oppimistavoitteet: tämän luennon jälkeen Tiedät, miten ohjelman toimintaa voi tutkia ja ohjelmassa
Lisätiedot1 Aritmeettiset ja geometriset jonot
1 Aritmeettiset ja geometriset jonot Johdatus Johdatteleva esimerkki 1 Kasvutulille talletetaan vuoden jokaisen kuukauden alussa tammikuusta alkaen 100 euroa. Tilin nettokorkokanta on 6%. Korko lisätään
LisätiedotOhjelmoinnin perusteet Y Python
Ohjelmoinnin perusteet Y Python T-106.1208 15.2.2010 T-106.1208 Ohjelmoinnin perusteet Y 15.2.2010 1 / 46 Merkkijonot Merkkijonojen avulla ohjelmassa voi esittää tekstitietoa, esim. nimiä, osoitteita ja
Lisätiedot13. Loogiset operaatiot 13.1
13. Loogiset operaatiot 13.1 Sisällys Loogiset operaatiot AND, OR, XOR ja NOT. Operaatioiden ehdollisuus. Bittioperaatiot. Loogiset operaatiot ohjausrakenteissa. Loogiset operaatiot ja laskentajärjestys.
LisätiedotTietorakenteet ja algoritmit Johdanto Lauri Malmi / Ari Korhonen
Tietorakenteet ja algoritmit Johdanto Lauri Malmi / Ari 1 1. JOHDANTO 1.1 Määritelmiä 1.2 Tietorakenteen ja algoritmin valinta 1.3 Algoritmit ja tiedon määrä 1.4 Tietorakenteet ja toiminnot 1.5 Esimerkki:
LisätiedotPubMed-opas. kesäkuu 2012
PubMed-opas kesäkuu 2012 Tämän ohjeen päivittämisessä on osittain käytetty apuna Turun yliopiston kirjaston Tieteenalakirjasto Protoksen Lääketieteen kirjaston opasta, joka puolestaan pohjautuu osittain
Lisätiedot