1. Skannaus ja tekstintunnistus (OCR) verkkoskannerilta



Samankaltaiset tiedostot
SKANNAUSVINKKEJÄ. Skannausasetukset:

Sharpdesk -asiakirjanhallintaratkaisu

ALVin käyttöohjeet. 1. Tositteiden tallennus palveluun. 1.1 Kuvaus, rajaus ja tallennus puhelimella

M-Files 6.0:n uudet ominaisuudet ja parannukset

Itsepalvelukopiokone

ALVin käyttöohjeet. Kuvaus, rajaus ja tallennus puhelimella ALVin -mobiilisovelluksen avulla dokumentit kuvataan, rajataan ja tallennetaan palveluun.

ALVin käyttöohjeet. 1. Tositteiden tallennus palveluun. 1.1 Kuvaus, rajaus ja tallennus puhelimella

- Voit muodostaa PDF-dokumentin myöskin Office tuotteisiin asentuneen PDF-XChange pluginin kautta

Ohjekirja Kilipa Cup versio 1.0 Mäkihypyn ja yhdistetyn cup-pisteiden laskentaohjelma

M-Files 7.0:n uudet ominaisuudet ja parannukset

MultiSave - käyttö ja käyttöönotto

Pikaopas - Rahoitushakemus

Onko teillä vielä paperisia arkistoja?

5. Valitse Skannauslähde Skannaa-painike (etupaneeli) -ikkunasta Kuva tiedostoon.

Toimittajaportaalin pikaohje

RATKI 1.0 Käyttäjän ohje

Ohjeet asiakirjan lisäämiseen arkistoon

FOTONETTI BOOK CREATOR

Mobiilitulostus-/- skannausopas Brother iprint&scanille (Android )

Lue ohjeet huolellisesti ennen laitteen käyttöä.

Ostolasku: 100 % verkkolaskuja CloudScanratkaisun avulla.

HELIA 1 (11) Outi Virkki Tiedonhallinta

Basware Supplier Portal

Asiakirjojen ja valokuvien skannaaminen Canon Canoscan -skannerilla

Internet Explorer 7 & 8 pop-up asetukset

Toimittajaportaalin rekisteröityminen Toimittajaportaalin sisäänkirjautuminen Laskun luonti Liitteen lisääminen laskulle Asiakkaiden hallinta Uuden

Brother ScanViewerin opas ios- / OS X -järjestelmille

Fixcom Webmail ohje. Allekirjoitus. Voit lisätä yhden tai useamman allekirjoituksen.

Toimittajaportaalin pikaohje

Valintanauhan komennot Valintanauhan kussakin välilehdessä on ryhmiä ja kussakin ryhmässä on toisiinsa liittyviä komentoja.

Työpöytäskanneri asiakirjojen skannaukseen ADS

KÄYTTÖÖN. Koulukirjat tietokoneelle PIKAOHJEET PAPERPORT -OHJELMAN. Sisällysluettelo

JÄRJESTELMÄN TEKNINEN KÄYTTÖOHJE

YKSILÖLLISET bizhub- LAAJENNUSOSAT

Ohjeistus yhdistysten internetpäivittäjille

Pienet ja tehokkaat. kooltaan kompaktit asiakirjaskannerit. WIRELESS

SIMPLIFYSCAN. Viisas valinta älykkääseen skannaukseen

Käsikirjan paperiversiota ei enää ylläpidetä ohjeen päivämäärän jälkeen. Viimeisimmät versiot ohjeista löydät ohjelman Help-ruudulta.

MAANMITTAUSLAITOKSEN ILMAISTEN KARTTOJEN TULOSTAMINEN QUANTUM GIS -OHJELMALLA

Operatiiviset päivät Ohjeita luennoitsijoille AV-tekniikasta

Käyttäjän valikkokartta

Web Services -toiminnon käyttö skannaukseen verkossa (Windows Vista SP2 tai uudempi, Windows 7 ja Windows 8)

idvd 5 ELOKUVAKASVATUS SODANKYLÄSSÄ Vasantie Sodankylä +358 (0) tommi.nevala@sodankyla.fi

Pedanet oppilaan ohje Aleksanteri Kenan koulu Eija Arvola

POP-UP -IKKUNOIDEN SALLIMINEN

Selkosanakirja sdfghjklöäzxcvbnmqwertyuiopåasdfghjklöäzxcvbnmq. Tietokoneet. wertyuiopåasdfghjklöäzxcvbnmqwertyuiopåasdfghjk 1.4.

Ensimmäisen myyntiprojektin tarjouksen luonti

Tekstieditorin käyttö ja kuvien käsittely

Visma Nova. Visma Nova ASP käyttö ja ohjeet

YKSILÖLLISET bizhub LAAJENNUSOSAT

HAKUKONEMARKKINOINTI KOTISIVUJEN PÄIVITYSOHJE

STS Uuden Tapahtuma-dokumentin teko

Pikaopas. Microsoft Word 2013 näyttää erilaiselta aiempiin versioihin verrattuna, joten laadimme tämän oppaan avuksi uusien ominaisuuksien opetteluun.

ohjeita kirjautumiseen ja käyttöön

Digilehtiön Käyttövinkkejä

M-Files 8.0:n uudet ominaisuudet ja parannukset

Pelaajan tietojen lisääminen

AirPrint-opas DCP-J562DW MFC-J480DW MFC-J680DW MFC-J880DW

Suomen Lions-liitto ry

PRINTER DRIVER PÄÄKÄYTTÄJÄN OPAS

ASTERI KIRJANPITO KIELIVERSION OHJE

Tilastokeskuksen rajapintapalveluiden käyttöönotto ArcGISohjelmistossa

WCONDES OHJEET ITÄRASTEILLE (tehty Condes versiolle 8)

Muita kuvankäsittelyohjelmia on mm. Paint Shop Pro, Photoshop Elements, Microsoft Office Picture Manager

LASERJET PRO 500 COLOR MFP. Pikaopas M570

PlanMan Project projektihallintaohjelmisto koulutusohjeistus

Excel-taulukkoon X- ja Y-sarakkeisiin tallennettujen koordinaattien muuntaminen paikkatietokohteiksi

Murikan kurssimatkalaskun täyttöohje

Muuttujien määrittely

M-Filesin käyttöönotto

Toimeentulotuen sähköinen asiointi - Käyttöohje

Mobiilitulostus-/-skannausopas Brother iprint&scanille

Pikaopas. Ohjeiden etsiminen Hae ohjesisältöä napsauttamalla kysymysmerkkiä.

RINNAKKAISTALLENNUSOHJE

MICROSOFT PUBLISHER 2010

1 Visma Econet Pro Arkistointi

Piirustusten toimittaminen rakennusvalvontaan. Ohje rakennusvalvonnan asiakkaille

Sonera Viestintäpalvelu VIP VIP Laajennettu raportointi Ohje

Visma Fivaldi -käsikirja Tehtävienhallinta- ohje käyttäjälle

1. Kalenterin omistajan käyttöohje

Febdok 6.0, Uudet ominaisuudet OHJEISTUS

TUTA Q2 Tallentava valvontakamera Asennusohje

Sen jälkeen Microsoft Office ja sen alta löytyy ohjelmat. Ensin käynnistä-valikosta kaikki ohjelmat

PaikkaOpin kartta-alustan käyttöohje

Hybrid Cloud -ratkaisulla pilvipalvelun hyödyt nopeasti käyttöön, Case Haarla Oy:n M-Filesdokumenttienhallintajärjestelmän käyttöönotto

Backup Premium Pikakäyttöopas

Kennelliiton Omakoira-jäsenpalvelu Ohje Kennelpiireille, osoitelistat

Mobiilitulostus-/- skannausopas Brother iprint&scanille (ios)

Webforum. Version 17.3 uudet ominaisuudet. Päivitetty:

Manager. Doro Experience. ja Doro PhoneEasy 740. Suomi

PDF-tiedostojen optimointi hakukoneille

Kun olet valmis tekemään tilauksen, rekisteröidy sovellukseen seuraavasti:

Mobiilitulostus-/- skannausopas Brother iprint&scanille (Android )

Käyttäjän valikkokartta

1 YLEISTÄ 1. 2 KARTAT yleistä Avoimien aineistojen tiedostopalvelu 2 3 KARTAN TEKEMINEN JA SIIRTÄMINEN PUHELIMEEN 4

Aktivoi dokumentin rakenteen tarkistamiseksi piilomerkkien näyttäminen valitsemalla valintanauhasta Kappale-kohdasta painike Näytä kaikki.

Enigmail-opas. Asennus. Avainten hallinta. Avainparin luominen

Moodle 2.2 pikaohje. 1. Kirjautuminen ja omat kurssit (Työtilat) 1. Mene internet-selaimella osoitteeseen

Multimaker7 ohjelmalla tuotettujen ohjelmien julkaisusta

RATKI 1.0 Talousraportin käyttäjän ohje

Transkriptio:

M-Files OCR M-Files OCR:n avulla voidaan skannattavalle paperidokumentille tehdä tekstintunnistus skannerista riippumatta. Tällöin tekstiä sisältävät kuvat tunnistetaan varsinaisiksi tekstimerkeiksi, jonka jälkeen dokumentin tekstisisällön mukaan voidaan tehdä hakuja. M-Files OCR mahdollistaa myös "ID-pohjaisen skannauksen", jonka avulla voidaan tallentaa tietoja automaattisesti sekä automatisoida erilaisia tehtäviä. Tällöin esimerkiksi dokumentin nimi, laskun numero, asiakkaan nimi, laskun loppusumma tai vastaavat muut tiedot voidaan tallentaa suoraan skannausvaiheessa dokumentin metatiedoiksi. Automaattisesti tallennettavien tietojen avulla voidaan varmentaa tarvittavien tietojen tallennus ja oikeellisuus. Työnkulkuja ja muita toimintoja voidaan myös automatisoida näitä tietoja hyödyntämällä. M-Files OCR (Optical Character Recognition) tarjoaa tuen tekstintunnistukselle sekä metatietojen automaattiselle tallennukselle suoraan skannerilta (Zone OCR). Kun käytät M-Filesin tarjoamaa OCR-lisätuotetta, et tarvitse erillistä kolmannen osapuolen skannaus- ja OCR-ohjelmistoa. M-Files OCR hyödyntää I.R.I.S.:n tarjoamaa teknologiaa. M-Files OCR -moduuli on maksullinen lisäosa M-Filesiin, joka voidaan ottaa käyttöön lisenssikoodin avulla. M-Files OCR -moduulin käytön mahdollistava lisenssikoodi tulee vaihtaa vanhan lisenssikoodin tilalle. Tämän jälkeen OCR:ään liittyvät toiminnot ovat käytettävissä M- Files-palvelimen hallinnassa sekä M-Files-asiakasohjelmiston puolella. 1. Skannaus ja tekstintunnistus (OCR) verkkoskannerilta Käyttämällä yhteyksiä ulkoisiin lähteisiin voit merkittävästi nopeuttaa M-Filesin käyttöönottoa. Ulkoisia lähteitä käyttämällä voit tuoda myös skannattuja dokumentteja automaattisesti M-Filesiin. Tämä mahdollisuus on ollut mukana jo aiemmissa M-Files-versioissa, mutta M-Files 6.0 ja sitä uudemmat versiot tarjoavat lisäksi mahdollisuuden tekstintunnistukselle sekä OCR-arvolähteen määrittelylle (Zone OCR). Näiden toimintojen aktivointi vaatii M-Files OCR -moduulin. M-Files-palvelimen hallinnassa voit määritellä yhteydet ulkoisiin lähteisiin sekä näiden ominaisuudet.

Tekstintunnistus (muunna hakukelpoiseksi PDF:ksi) Mikäli haluat, että skannerilta tuotaville tiedostoille tehdään M-Filesissa automaattinen tekstintunnistus, aktivoi valinta Käytä OCR:ää, jotta skannatuille dokumenteille voidaan tehdä hakuja sisällön mukaan. Tällöin kuvatiedostomuodossa tuotava tiedosto muunnetaan hakukelpoiseksi PDF:ksi M-Filesin avulla. Tämä mahdollistaa sen, että skannattavan tiedoston sisällön mukaan voidaan tehdä hakuja. Muunnoksen jälkeen löydät esimerkiksi skannatun sopimusdokumentin käyttämällä hauissa sopimusosapuolten nimiä tai muuta sopimuksessa olevaa tekstiä. Hakukelpoiseksi PDF:ksi muuntaminen ei vaikuta siihen, miltä skannattu asiakirja näyttää sitä katseltaessa. Käyttäjät näkevät edelleen alkuperäisen skannatun kuvan. M-Files tallentaa automaattisen tekstintunnistuksen tulokset PDF-tiedostoon näkymättömänä tekstinä, jonka avulla tiedosto voidaan löytää hauilla. Mahdolliset epätarkkuudet tekstintunnistuksen tuloksissa eivät siis vaikuta mitenkään siihen, miltä näin käsitelty skannattu asiakirja näyttää, kun sitä katsellaan kuvaruudulla tai kun se tulostetaan. Seuraaville tiedostomuodoille voidaan tehdä tekstintunnistus: TIFF, JPEG, BMP, PNG ja GIF. Ohjeet tekstintunnistukselle Tekstintunnistus tunnistaa kaikkia länsimaisia kieliä sekä kyrillisiä merkistöjä, mutta käytettävien kielten valinta parantaa usein tunnistustulosten laatua. Esimerkiksi epäselvässä rajatapauksessa tunnistuksen tulos voidaan tällöin ratkaista kieleen liittyvän sanaston perusteella (esim. ä-kirjaimen tunnistus suomen kielessä). Toissijaisten kielten lista sisältää vain ne kielet, jotka on sallittu käytettäväksi valitsemasi ensisijaisen kielen kanssa. Aktivoi OCR käyttöön välilehdellä "Hakukelpoinen PDF". Myös M-Files-asiakasohjelmiston puolella voidaan tehdä tekstintunnistus. Mikäli tekstintunnista halutaan käyttää ainoastaan ulkoisia lähteitä yhteydessä, voidaan tämä rajaus tehdä rekisteriasetuksia muuttamalla. Rekisteriasetuksilla voidaan tehdä myös muita rajauksia. Lisätietoja rekisteriasetuksista saat teknisestä tuesta: tuki@m-files.fi.

Metatietojen automaattinen tallennus skannerilta (käytä OCR-arvolähdettä) Ulkoisesta lähteestä tuotaville tiedostoille voit määrittää automaattisesti lisättävän ominaisuuden, joka käyttää OCR-arvolähdettä. OCR-arvolähde on sivulle määriteltävä alue, josta tekstintunnistuksen avulla saadaan valitulle ominaisuudelle arvo. Tämä arvo tallennetaan automaattisesti ko. dokumentin metatietoihin. OCR-arvolähteen käyttö on mahdollista ainoastaan ulkoista lähdettä käyttämällä. OCRarvolähdettä ei voida määritellä M-Files-asiakasohjelmiston puolella. Lisää ensin uusi ominaisuus Metatiedot-välilehdellä. Määrittele sen jälkeen, että ominaisuus käyttää OCR-arvolähdettä (Zone OCR). Ohjeet tekstintunnistukselle Tekstintunnistus tunnistaa kaikkia länsimaisia kieliä sekä kyrillisiä merkistöjä, mutta käytettävien kielten valinta parantaa usein tunnistustulosten laatua. Esimerkiksi epäselvässä rajatapauksessa tunnistuksen tulos voidaan tällöin ratkaista kieleen liittyvän sanaston perusteella (esim. ä-kirjaimen tunnistus suomen kielessä). Toissijaisten kielten lista sisältää vain ne kielet, jotka on sallittu käytettäväksi valitsemasi ensisijaisen kielen kanssa. Määrittele OCR-arvolähteen alue Voit määrittää alueen, josta tunnistetaan tietyt merkit määrittelemäsi ominaisuuden arvoksi. Tämä arvo tallennetaan automaattisesti dokumentin metatietoihin. Merkit voivat olla mitä tahansa merkkejä: kirjaimia, numeroita tai välimerkkejä. Esimerkiksi paperilla näkyvä laskun numero voidaan lisätä Laskun numero -ominaisuuden arvoksi skannattavalle dokumentille. Tällä tavoin voidaan automatisoida esimerkiksi määrämuotoisten lomakkeiden skannaus ja tallennus M-Filesiin aina oikeilla metatiedoilla. Useimmissa tapauksissa skannaus kannattaa tehdä levyltä syöttönä ennemmin kuin arkinsyöttölaitteesta, jotta määritelty alue osuu oikeaan kohtaan paperia skannausvaiheessa. Joissakin tapauksissa tekstintunnistus ei kuitenkaan aina anna oikeaa tulosta: esimerkiksi fonttityypistä tai fontin koosta johtuen numero 1 voidaan tulkita l-kirjaimeksi. Mikäli halutaan varmistaa, että merkit lisätään oikein dokumentin metatietoihin, voidaan ominaisuuksien arvojen tarkistus tehdä tapahtumakäsittelijöiden ja VBScriptin avulla. Tällöin VBScriptin avulla voidaan tarkistaa esimerkiksi, että kaikki lisätyt merkit ovat numeroita. Lisätietoja tapahtumakäsittelijöista, VBScriptistä sekä M-Files APIsta saat teknisestä tuestamme (tuki@mfiles.com). Huom. OCR-arvolähdettä voidaan käyttää ilmankin, että OCR-välilehdellä on valittuna toiminto Käytä OCR:ää, jotta skannatuille dokumenteille voidaan tehdä hakuja sisällön mukaan.

Määrittele alue, josta tunnistetaan merkit määrittelemäsi ominaisuuden arvoksi. Alueen sijainti määrittelee kaksi alueen kulmaa (vasen-ylä ja oikea-ala) suhteessa koordinaatiston lähtöpisteeseen, joka on sivun vasemmassa yläkulmassa. Tässä esimerkissä arvot ovat: vasen 144 mm, ylä 59 mm, oikea 170 mm ja ala 68 mm.

2. Skannaus ja tekstintunnistus (OCR) paikalliselta skannerilta M-Filesiin voidaan lisätä skannattavia paperidokumentteja joko käyttämällä ulkoisia yhteyksiä (verkkoskannausta) tai paikallista skanneria. Skanneri-integraatio M-Files-asiakasohjelmiston puolella käyttää TWAIN-teknologiaa ja WIAteknologiaa. Skannaus voidaan tehdä skannereilla, joille on saatavilla joko TWAIN-ajuri tai WIA-ajuri Paikallista skannausta käytettäessä skannerin tulee olla kytkettynä suoraan siihen tietokoneeseen, jolla skannattavan tiedoston lisäys tehdään M-Filesiin. Skannaustoiminnot löydät Toiminnot- tai pikavalikosta (napsauttamalla hiiren oikealla). Skannaustoiminnot löydät M-Files-asiakasohjelmiston puolella Toiminnot- tai pikavalikosta. Lisää dokumentti skannerilta Voit lisätä uusia dokumentteja skannerilta. Tällöin M-Files luo uuden dokumentin skannattavasta tiedostosta. Lisää tiedosto skannerilta Mikäli haluat lisätä tiedostoja monitiedostoiseen dokumenttiin, valitse toiminto Lisää tiedosto skannerilta. Tällöin M-Files lisää monitiedostoiseen dokumenttiin uuden tiedoston skannatusta tiedostosta. Huom. monitiedostoisella dokumentilla on vain yhdet metatiedot, eli siihen kuuluvilla tiedostoilla ei ole erillisiä metatietoja. Korvaa skannerilta tulevalla tiedostolla Voit myös korvata yksittäisen tiedoston skannerilta tulevalla tiedostolla. Voit korvata yksitiedostoisessa tai monitiedostoisessa dokumentissa olevan tiedoston tällä toiminnolla. Skannauksen jälkeen M-Files kysyy, haluatko päättää skannaustyön vai lisätä sivuja tai toisen dokumentin.

Tekstintunnistus skannauksen jälkeen Mikäli käytössäsi on M-Files OCR -moduuli, M-Files ehdottaa skannauksen lopussa, että tiedosto muunnetaan hakukelpoiseksi PDF:ksi tekemällä sille tekstintunnistus. Tämä mahdollistaa sen, että skannattavan tiedoston sisällön mukaan voidaan tehdä hakuja. Voit valita tekstintunnistuksen tai ohittaa sen. Voit myös määrittää lisäasetuksia tekstintunnistukselle (ks. ohjeet tekstintunnistukselle luvusta 3). Huom. mikäli tekstintunnistus tehdään kuvatiedostolle, jota ei ole tallennettu ja palautettu M- Filesiin, tallennetaan tiedosto ainoastaan PDF-muodossa. Muussa tapauksessa alkuperäinen kuvatiedosto löytyy dokumentin versiohistoriasta. 3. Muunna hakukelpoiseksi PDF:ksi Mikäli käytössäsi on M-Files OCR -moduuli, voit muuntaa kuvatiedostomuodossa tallennetun tiedoston hakukelpoiseksi PDF:ksi. Tämä mahdollistaa sen, että skannattavan tiedoston sisällön mukaan voidaan tehdä hakuja. OCR-toiminnot löydät M-Files-asiakasohjelmiston puolella Toiminnot- tai pikavalikosta. Muunnoksen jälkeen löydät kyseisen PDF-muotoa olevan sopimusdokumentin esimerkiksi käyttämällä hauissa sopimusosapuolten nimiä tai muuta sopimuksessa olevaa tekstiä. Hakukelpoiseksi PDF:ksi muuntaminen ei vaikuta siihen, miltä skannattu asiakirja näyttää sitä katseltaessa. Käyttäjät näkevät edelleen alkuperäisen skannatun kuvan. M-Files tallentaa automaattisen tekstintunnistuksen tulokset PDF-tiedostoon näkymättömänä tekstinä, jonka avulla tiedosto voidaan löytää hauilla. Mahdolliset epätarkkuudet tekstintunnistuksen tuloksissa eivät siis vaikuta mitenkään siihen, miltä näin käsitelty skannattu asiakirja näyttää, kun sitä katsellaan kuvaruudulla tai kun se tulostetaan. Seuraaville tiedostomuodoille voidaan tehdä tekstintunnistus: TIFF, JPEG, BMP, PNG ja GIF. Mikäli tekstintunnistus tehdään kuvatiedostolle, jota ei ole tallennettu ja palautettu M-Filesiin, tallennetaan tiedosto ainoastaan PDF-muodossa. Muussa tapauksessa alkuperäinen kuvatiedosto löytyy dokumentin versiohistoriasta. Huomaa, että et voi tehdä tekstintunnista tiedostolle, joka on jo tallennettu PDF-muodossa M- Filesiin. Jos haluat muuntaa olemassa olevia PDF-tiedostoja hakukelpoiseen PDF-muotoon, ota yhteyttä konsultointiimme (support@m-files.com).

4. Ohita muunnos Mikäli käytössäsi on M-Files OCR -moduuli, M-Files ehdottaa tekstintunnistusta myös silloin, kun raahaat hiirellä kuvatiedostomuodossa olevan tiedoston M-Filesiin. Voit valita tekstintunnistuksen tai ohittaa muunnoksen. Mikäli ohitat muunnoksen, tiedosto tallennetaan alkuperäisessä kuvatiedostomuodossa M-Filesiin. Mikäli tekstintunnista halutaan käyttää ainoastaan ulkoisia lähteitä yhteydessä, voidaan tämä rajaus tehdä rekisteriasetuksia muuttamalla. Rekisteriasetuksilla voidaan tehdä myös muita rajauksia. Lisätietoja rekisteriasetuksista saat teknisestä tuesta: tuki@m-files.fi. M-Files OCR -moduuli on maksullinen lisäosa M-Filesiin, joka voidaan ottaa käyttöön lisenssikoodin avulla. M-Files OCR -moduulin käytön mahdollistava lisenssikoodi tulee vaihtaa vanhan lisenssikoodin tilalle. Tämän jälkeen OCR:ään liittyvät toiminnot ovat käytettävissä M- Files-palvelimen hallinnassa sekä M-Files-asiakasohjelmiston puolella. M-Files käyttää I.R.I.S.:n tarjoamaa OCR-moottoria. Ota yhteyttä omaan M-Files-myyjääsi tai myyntipalveluumme (myynti@m-files.fi)!