Virheraportoijien virhemäärien jakaumat virhetietokannassa

Samankaltaiset tiedostot
Virheraportoijien virhemäärien jakaumat virhetietokannassa

Epälineaarinen hinnoittelu: Diskreetin ja jatkuvan mallin vertailu

Tutkittua tietoa. Tutkittua tietoa 1

TARKASTUSMENETTELYT JA NIIDEN APUVÄLINETUKI

Asiakaspalautteen monikanavainen keräys ja analyysi (valmiin työn esittely)

TIE Ohjelmistojen testaus 2015 Harjoitustyö Vaiheet 1 ja 2. Antti Jääskeläinen Matti Vuori

Simulation and modeling for quality and reliability (valmiin työn esittely) Aleksi Seppänen

Kirjallisuuskatsaus sisäpistemenetelmiin ja niiden soveltamiseen eri optimointiluokille (valmiin työn esittely)

voidaan hylätä, pienempi vai suurempi kuin 1 %?

MS-A0502 Todennäköisyyslaskennan ja tilastotieteen peruskurssi

PRH:n seuranta listayhtiöiden tilintarkastuskertomuksista

Lajittelumenetelmät ilmakehän kaukokartoituksen laadun tarkkailussa (valmiin työn esittely)

KYMENLAAKSON AMMATTIKORKEAKOULU Tietotekniikan koulutusohjelma / Tietoverkkotekniikka. Joni Korjala APACHE WWW-PALVELIN Seminaarityö 2012

Optimization of Duties in Railway Traffic (valmiin työn esittely)

Käyttöohje. KotKot. Helsinki Ohjelmistotuotantoprojekti HELSINGIN YLIOPISTO Tietojenkäsittelytieteen laitos

Gaussiset prosessit derivaattahavainnoilla regressio-ongelmassa (valmiin työn esittely)

Vedonlyöntistrategioiden simulointi ja evaluointi

Trimmitysongelman LP-relaksaation ratkaiseminen sarakkeita generoivalla algoritmilla ja brute-force-menetelmällä

Avoimen lähdekoodin kehitysmallit

Tuulimittausraportti. Eagle tuulivoimtuulitutkimus Lammaskallio. Eagle tuulivoima Oy

Ohjelmistoprosessit ja ohjelmistojen laatu Kevät Ohjelmistoprosessit ja ohjelmistojen laatu. Projektinhallinnan laadunvarmistus

Optimaalisen tarkastusvälin määrittäminen suun terveydenhuollossa

Monte Carlo -menetelmä optioiden hinnoittelussa (valmiin työn esittely)

Convergence of messaging

Sähköisen liiketoiminnan tason mittaaminen pk-yrityksissä (aihe-esittely)

UCOT-Sovellusprojekti. Testausraportti

Ketteryys kokeilemalla. Leo Malila Kehittämispäällikkö, Kela

Lisäinformaation arvo monikriteerisessä projektiportfoliovalinnassa (valmiin työn esittely)

Osakkeiden tuottojakaumia koskevien markkinaja asiantuntijanäkemysten yhdistely copulafunktioilla

KEHITYSTOIVEIDEN JA VIRHEIDEN KIRJAUSOHJE INTERNETISTÄ

CT60A4150 OHJELMISTOTESTAUKSEN PERUSTEET. Jussi Kasurinen Kevät 2016

Johnson, A Theoretician's Guide to the Experimental Analysis of Algorithms.

Ohjelmistotuotteen hallinnasta

Avoimet ohjelmistot julkisessa hallinnossa. Oskari verkostopäivä Tommi Karttaavi

Provet Pet ohjelmisto ja tulostus PDF-tiedostoon.

NÄYTÖN JAKAMINEN SELAIMEN KAUTTA YHDISTÄVIEN OPPILAIDEN KANSSA

Cubature Integration Methods in Non-Linear Kalman Filtering and Smoothing (valmiin työn esittely)

Informaation leviäminen väkijoukossa matemaattinen mallinnus

Sovellettu todennäköisyyslaskenta B

Puhelintukiasema-antennin säteilykuvion mittaus multikopterilla (Valmiin työn esittely)

MTTTA1 Tilastomenetelmien perusteet 5 op Luento Kokonaisuudet johon opintojakso kuuluu

Diplomityöseminaari

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Linux rakenne. Linux-järjestelmä koostuu useasta erillisestä osasta. Eräs jaottelu: Ydin Komentotulkki X-ikkunointijärjestelmä Sovellusohjelmat

F10-Lavalaput Versio 1.1. F10-Lavalaput ohjelmiston käyttöohjeet. 1 Yleistä. 2 Ohjelmiston pikaohje. 3 Ohjelmiston laajempi ohje

Otto Kekäläinen Avoimien ovien päivä / Werkkoviestijät ry Helsinki

Tietoasiantuntijoiden osaamisen kehittyminen, kontekstina hanketoiminta ja moniammatillinen yhteistyö

TR Building Investment Research

Korrelaatiokerroin. Hanna Heikkinen. Matemaattisten tieteiden laitos. 23. toukokuuta 2012

Näistä standardoiduista arvoista laskettu keskiarvo on nolla ja varianssi 1, näin on standardoidulle muuttujalle aina.

Experiment on psychophysiological responses in an economic game (valmiin työn esittely) Juulia Happonen

805324A (805679S) Aikasarja-analyysi Harjoitus 4 (2016)

Julkishallinnon ICT-palveluiden kustannusseurannan kehittäminen

Televerkon verkkotietojärjestelm

Monitavoitteiseen optimointiin soveltuvan evoluutioalgoritmin tarkastelu

Käytin tehtävän tekemiseen Xubuntu käyttöjärjestelmää aikaisemmin tekemältäni LiveUSB-tikulta.

Uudelleenkäytön jako kahteen

NÄYTÖN JAKAMINEN OPPILAILLE, JOTKA MUODOSTAVAT YHTEYDEN SELAIMELLA TAI NETOP VISION STUDENT -SOVELLUKSELLA

CCLEANER LATAAMINEN JA ASENTAMINEN

Karhunmäen koulu (hdfq)

Heinävaaran koulu (vnnm)

Ulkoistustoimittajan valvontapalvelu. Ville Mannonen / DataCenter Finland

Tikon Web-sovellukset

Mat Operaatiotutkimuksen projektityöseminaari

Verkko-oppiminen: Teoriasta malleihin ja hyviin käytäntöihin. Marleena Ahonen. TieVie-koulutus Jyväskylän lähiseminaari

Tekstin rakenne ja epälineaarinen työskentely. Kandidaattiseminaarin kielikeskuksen osuus, tekstipaja 1

FoA5 Tilastollisen analyysin perusteet puheentutkimuksessa. Luentokuulustelujen esimerkkivastauksia. Pertti Palo. 30.

Sisällönkuvaukset Projektinhallinta 3 op. Sisältö. 2. Palvelinalustat 3 op

Sähkötekniikan tutkintoohjelma. DI-tutkinto ja uranäkymät

TUTKI OMAT TIETOTURVA-AUKKOSI. ENNEN KUIN JOKU MUU TEKEE SEN PUOLESTASI. F-Secure Radar Ville Korhonen

AVOIN KOODI YRITTÄJYYDEN LÄHTÖKOHTANA

Ohjelmistoarkkitehtuurit. Syksy 2010

Tik Tietojenkäsittelyopin ohjelmatyö Tietotekniikan osasto Teknillinen korkeakoulu. LiKe Liiketoiminnan kehityksen tukiprojekti

TUTKIMUSAINEISTON KVANTITATIIVINEN ANALYYSI LTKY012. Timo Törmäkangas

Järjestelmäarkkitehtuuri (TK081702) Järjestelmäarkkitehtuuri. Järjestelmäarkkitehtuuri

Kooste kotitehtävien vastauksista. Kotitehtävä 6 - Ylläpito- ja kehittämismalli

MTTTA1 Tilastomenetelmien perusteet 5 op Luento , osa 1. 1 Kokonaisuudet johon opintojakso kuuluu

Sovellettu todennäköisyyslaskenta B

Laiteriippumaton UI Ajaxilla ja Javalla

KEKKILÄ OY JA NURMIJÄRVEN KUNTA METSÄ-TUOMELAN YMPÄRISTÖPANEELI. Kekkilä Oy ja Nurmijärven kunta. Raportti

KOKOUSKUTSU TEKNILLINEN KORKEAKOULU Automaatio- ja systeemitekniikan osasto Osastoneuvoston kokous 1/2006

TIE Ohjelmistojen testaus 2015 Harjoitustyö Vaihe 3. Antti Jääskeläinen Matti Vuori

Avoimen tutkimuksen suunnittelu tietojärjestelmätieteen tutkijan näkökulmasta

Seurantajärjestelmä ja vuosiraportointi Poimintoja raportoijalle, TETS Saara Elväs

HYVÄKSYMISTESTAUS- RAPORTTI - HAKEUTUJAN PALVELUT JA TODENNETUN OSAAMISEN REKISTERI

How to Support Decision Analysis with Software Case Förbifart Stockholm

Demo 13. Aihe: Linux. Opettaja: Antti Ekonoja. Tekijä: Heini Puuska

Teoreettisen viitekehyksen rakentaminen

Polaarisatelliittidataan perustuva lumentunnistusalgoritmi (valmiin työn esittely)

Tapahtuipa Testaajalle...

Ohjelmistojen laadun parantaminen refaktoroinnilla Simo Mäkinen Tietojenkäsittelytieteen laitos Helsingin yliopisto

1 YLEISKUVAUS Verkkoturvapalvelu Verkkoturvapalvelun edut Palvelun perusominaisuudet... 2

Yhteistyöaineiden edustajan puheenvuoro

Web-palvelut ja niihin kohdistuneiden poikkeavuuksien tunnistamisen. Harri Mäkelä

Harjoitus 7: NCSS - Tilastollinen analyysi

Korvausvastuun ennustejakauma bootstrap-menetelmän avulla

Vankien poistumislupakäytännöt ja niiden yhteneväisyys

Jussi Sainio. Kandidaattiseminaari helmikuuta 2010

Ketterä ja asiakaslähtöinen palvelukehitys tietoliikenneteollisuudessa

Palvelukuvaus LOUNEA VERKKOTURVA PALVELUKUVAUS.

Transkriptio:

Virheraportoijien virhemäärien jakaumat virhetietokannassa (Valmiin työn esittely) 13.9.2010 Ohjaaja: TkT Mika Mäntylä Valvoja: prof. Harri Ehtamo

Yleistä ohjelmistoissa virheitä, jotka estävät ohjelmistojen halutunlaisen toiminnan tieto virheestä siirrettävä virheen löytäjältä ohjelmistokehittäjälle virhetietokanta virheraportoijien ja ohjelmistokehittäjien kommunikaatioväline

Osuus virheraportoijista Taustaa Mäntylä ym. (2010) tutkivat virheiden jakautumista virheraportoijien välille 14 % 12 % 10 % 8 % 6 % 4 % 2 % 0 % 0 10 20 30 40 50 60 70 80 Raportoitujen virheiden lukumäärä

Tavoitteet tavoitteena selvittää 1. Voidaanko virhejakaumien katsoa noudattavan Paretojakaumaa tai jotain muuta teoreettista jakaumaa? 2. Mistä raportointimäärien erot yksittäisten virheraportoijien välillä johtuvat? tavoitteita lähestyttiin kahden tutkimuskysymyksen avulla, joihin haettiin vastauksia tutkimalla empiiristä aineistoa ja olemassa olevaa kirjallisuutta

Tutkimuskysymykset Tutkimuskysymys 1: Noudattavatko virheraportoijien virhetietokantaan raportoimien virheiden jakaumat Paretojakaumaa tai jotain muuta tunnettua teoreettista jakaumaa tarkasteltavassa empiirisessä tutkimusaineistossa? muut tutkitut teoreettiset jakaumat: eksponenttijakauma, lognormaalijakauma, Poisson-jakauma, Weibull-jakauma, Yulen jakauma ja Pareto-eksponenttijakauma tutkittiin niin virhejakaumia kokonaisuudessaan kuin jakaumien pelkkiä häntiäkin

Tutkimuskysymykset Tutkimuskysymys 2: Mistä erot raportointimäärissä yksittäisten virheraportoijien välillä johtuvat? Osakysymys 1: Onko virheraportoijien raportoimien virheiden lukumäärillä ja korjausprosenteilla jonkinlaista yhteyttä tarkasteltavassa tutkimusaineistossa? Osakysymys 2: Keskittyvätkö runsaasti virheitä raportoivat virheraportoijat tyypillisesti raportoimaan virheitä erityisesti niistä komponenteista, joista ylipäätään on raportoitu eniten virheitä?

Aineisto dataa kolmen suomalaisen ohjelmistoyrityksen virhetietokannasta dataa kolmen avoimen lähdekoodin ohjelmiston virhetietokannasta Apachen HTTP-palvelin, Linux-käyttöjärjestelmä, Mozillan Firefox-Internet-selain Apache Linux Mozilla Yritys A Yritys B Yritys C Virheraportteja 2389 6713 13610 981 790 1368 Korjausprosentti 35% 61% 24% 84% 91% 67% Virheraportoijia 1763 3241 7435 69 39 45

Jakaumantutkimismenetelmä Clausetin ym. (2009) esittelemä menetelmä 1. sovitetaan empiiriseen jakaumaan Pareto-jakauma suurimman uskottavuuden menetelmällä 2. määritetään empiirisen jakauman ja sovitetun Paretojakauman yhteensopivuuden aste ja selvitetään, voidaanko empiirisen virhejakauman katsoa noudattavan Paretojakaumaa valitulla riskitasolla 3. tutkitaan, sopiiko jokin muista tarkasteltavista teoreettisista jakaumista empiiriseen jakaumaan Pareto-jakaumaa paremmin

Tulokset Pareto-jakauma hyvä malli erityisesti Apachen ja Linuxin kokonaisille virhejakaumille Apachen, Linuxin, Mozillan ja yrityksen B virhejakaumien hännille lognormaalijakauma myös hyvä malli yritysaineistoista hankalaa tehdä luotettavia johtopäätöksiä pienten raportoijamäärien vuoksi

Tulokset Virheraportoijien raportoimien virheiden lukumäärien ja korjausprosenttien korrelaatiot kussakin aineistossa Apache Linux Mozilla Yritys A Yritys B Yritys C Korrelaatio 0.07 0.02 0.18 0.02 0.20 0.07 p-arvo 0.00 0.29 0.00 0.89 0.22 0.65 virheraportoijien raportoimien virheiden ja korjausprosenttien välillä ei ainakaan mitään selkeää lineaarista tilastollista riippuvuutta, vaikkakin lievää positiivista korrelaatiota nähtävissä

Tulokset jonkin verran näyttöä siitä, että eniten virheitä raportoineet virheraportoijat keskittyneet niihin komponentteihin, joissa ylipäätään eniten virheitä Mozillalla eniten virheitä raportoinut prosentti virheraportoijista voimakkaasti keskittynyt siihen komponenttiin, josta ylipäätään raportoitu eniten virheitä Apachella samantyyppistä, joskaan ei yhtä voimakasta keskittymistä Linuxilla eniten virheitä raportoinut prosentti virheraportoijista keskittynyt muihin kuin niihin neljään komponenttiin, joista ylipäätään raportoitu eniten virheitä

Rajoitukset virhetietokannan datan luotettavuus osa ongelmista suoraan kehittäjille? raportoidaan toisten löytämiä virheitä? korjausprosentin merkitys roolin tai aseman vaikutus korjausprosenttiin? testausasetelman monimutkaisuus löytyykö virhe juuri testatusta komponentista?

Yhteenveto työssä saatiin näyttöä, että Pareto-jakauma melko hyvä malli erityisesti virhejakaumien häntien käyttäytymiselle raportoitujen virheiden lukumäärien ja korjausprosenttien välillä ei voimakasta yhteyttä runsaasti virheitä raportoivat virheraportoijat jonkin verran keskittyvät komponentteihin, joissa eniten virheitä

Lähteet Clauset, A., Shalizi, C. R. ja Newman M., E., J. 2009. Power-law Distributions in Empirical Data. SIAM Review. Vol. 51:4. S. 661 703. ISSN 0036-1445. Mäntylä M., Iivonen J., Itkonen J. Who Tested My Software an Industrial Case Study of Organization, Values, and Distribution of Testing. Tarkastuksessa, ESEM 2010.