Dynaaminen SLA-riski. Goodnet-projektin loppuseminaari pe Pirkko Kuusela, Ilkka Norros VTT

Samankaltaiset tiedostot
IP-verkon luotettavuuden mallintaminen ja strategiat luotettavuuden parantamiseksi

Luento 5 Riippuvuudet vikapuissa Esimerkkejä PSA:sta

Luotettavuuden mittaamisesta. Ilkka Norros ja Urho Pulkkinen

Luento 6 Yhteisvikojen analyysi PSA:n sovelluksia

Luento 5 Yhteisvikojen analyysi PSA:n sovelluksia

Esimerkki Metson ESD-ventiilidiagnostiikasta (osaiskutesti)

Kohdassa on käytetty eksponentiaalijakauman kertymäfunktiota (P(t > T τ ) = 1 P(t T τ ). λe λτ e λ(t τ) e 3λT dτ.

Luento 5 Riippuvuudet vikapuissa Esimerkkejä PSA:sta

The administrative process of a cluster. Santtu Rantanen Valvoja: Prof. Jorma Jormakka

Liittymän vikadiagnosointi

Ohjelmistojen virheistä

Luento 4 Vikapuuanalyysit

Vikasietoisuus ja luotettavuus

Yhteisviat ja intervallitodennäköisyydet vikapuuanalyysissä

PFD laskennan taustoja

Vikasietoisuus ja luotettavuus

BL20A0700 Sähköverkkotekniikan peruskurssi

Luento 4 Vikapuuanalyysit

Tervetuloa infotilaisuuteen vuoden 2017 eläkeuudistuksesta

Jännitestabiiliushäiriö Suomessa Liisa Haarla

Eläkeinfo. Varsinais-Suomen sairaanhoitopiiri Liisi Gråstén-Weckström

Uudistuvat eläkemuodot ja varhaiseläkemenoperusteinen maksu

Luotettavuuden kokonaiskuva. Ilkka Norros ja Urho Pulkkinen

Asiakkaat ilman sähköä, koko asiakasmäärä 17500

IPTV:n laadun ja luotettavuuden mittaamisesta. Jorma Kilpi

ERISTYSTASON VALVONTARELE MEV-7

LEAN-JOHTAMISEN KESKEISET PERIAATTEET

Liite 2: Verkot ja todennäköisyyslaskenta. Todennäköisyyslaskenta ja puudiagrammit

ERISTYSTASON VALVONTARELE MEV-7 (LC-7/6)

Agenda. Läpäisyvaatimukset Henkilökunta Luennot ja aikataulu Kurssimateriaali Harjoitustyöt Demoharjoitus Tentti ja arvostelu Muuta?

BL20A0500 Sähkönjakelutekniikka

ERISTYSTASON VALVONTARELE MEV-7 (LC-7 ja Kosketusnäyttö)

Sähköisen ylioppilaskirjoituksen katastrofiharjoitus

MAAJOUKKUE MIEHET DISTANCE

1 YLEISTÄ. Taitaja2002, Imatra Teollisuuselektroniikkatyö Protorakentelu 1.1 PROJEKTIN TARKOITUS

S Laskuharjoitus 2: Ratkaisuhahmotelmia

Luento 10 Riskitekijöiden priorisointi

Käyttö- ja asennusohje

Älykäs verkottuminen ja käyttäjänhallinta. Pekka Töytäri TeliaSonera Finland

Integrointialgoritmit molekyylidynamiikassa

S Sähkön jakelu ja markkinat S Electricity Distribution and Markets

Ydinvoimalaitoksen turvallisuustoimintojen varmistaminen vikautumisten varalta

Käytettävyysanalyysi

Simulation and modeling for quality and reliability (valmiin työn esittely) Aleksi Seppänen

Luento 5 Vikapuuanalyysit

Tietohallinto. Risto Laakkonen, Tuotantopäällikkö. Arki sujuu helpommin, kun apu löytyy läheltä.

Kaksintaistelun approksimatiivinen mallintaminen (valmiin työn esittely)

KOUVOLAN JA KOTKAN KAUPUNKIPYÖRÄ- KOKEILU

Pilvipalvelut kehityksen mahdollistajana - (valmistavan PK-yrityksen näkökulmaa)

Superintend VR-16 Vikavirtarele 5-johdinverkkoihin Lyhyt käyttöohje

Johdatus todennäköisyyslaskentaan Todennäköisyyslaskenta ja puudiagrammit. TKK (c) Ilkka Mellin (2005) 1

Siirtokapasiteetin määrittäminen

Kasvavaa kilpailukykyä. Tuottavuuspalvelut. Selvästi enemmän

EASY PILVEN Myynnin opas - Storage IT

1 db Compression point

Vanhankaupunginkosken ultraäänikuvaukset Simsonar Oy Pertti Paakkolanvaara

Todennäköisyyslaskenta ja puudiagrammit. Todennäköisyyslaskenta ja puudiagrammit. Todennäköisyyslaskenta ja puudiagrammit: Esitiedot

Yksityistielossien sopimusuudistuksen teknisen sisällön erittely / Mikko Jukakoski

Televerkon synkronointi

RIKASTA POHJOISTA 2017

KÄYTTÖOHJE PEL 1000 / PEL 1000-M

Eri tietolähteiden käyttö kunnossapidon tukena

Volvo Selekt on Volvo -liikkeiden standardi Volvo -vaihtoautoille.

jens 1 matti Etäisyydet 1: 1.1 2: 1.4 3: 1.8 4: 2.0 5: 3.0 6: 3.6 7: 4.0 zetor

IBM Iptorin pilven reunalla

Testauksen tuki nopealle tuotekehitykselle. Antti Jääskeläinen Matti Vuori

Sähkökatkot lyhyemmiksi simulointityökalun Pertti Raatikainen ja Seppo Horsmanheimo VTT

DEE Uusiutuvien energiamuotojen työkurssi. 5 op

Turvallisuus prosessien suunnittelussa ja käyttöönotossa

Ilmankäsittelykone Huoltokirja

5/11 6/11 Vaihe 1. 6/10 4/10 6/10 4/10 Vaihe 2. 5/11 6/11 4/11 7/11 6/11 5/11 5/11 6/11 Vaihe 3

ELEC-E8419 syksy 2016 Laskeminen tietokoneohjelmilla 1. Verkon tiedot on annettu erillisessä Excel-tiedostossa: nimeltä CASE_03-50-prosSC.

Innovaatiokilpailu Fingrid hakee uusia ideoita sähköverkon eristimien kunnonvalvontaan

Eläkeuudistus Tehy PPSHP ja Tehy OuKa. Päivi Lilleberg

Valvottu ilmoituksensiirto

Markkinatoimikunta. Pohjoismainen Inertia 2 projekti valmistunut, yhteenveto tuloksista

Tavallisen videomainoksen sijasta Ruudussa voidaan mainostauolla esittää dynaamisia spotteja.

Älykkään vesihuollon järjestelmät

IT-ERP Tietohallinnon toiminnanohjausratkaisuna. ja ITIL palveluiden kehittämisessä

Pohjoismaisen sähköjärjestelmän käyttövarmuus

SIMO, Siltojen monitorointi. Ilkka Hakola, VTT

Ilkka Mellin Todennäköisyyslaskenta Osa 1: Todennäköisyys ja sen laskusäännöt Verkot ja todennäköisyyslaskenta

Pakettivälitteisyyden vaikutukset matkapuhelinoperaattorin keskusverkon kustannusrakenteeseen

Käyttö- ja asennusohje

MIKA KOKKONEN Lääkintä ja sähkötekniikka

SMG-4500 Tuulivoima. Kuudennen luennon aihepiirit. Tuulivoimalan energiantuotanto-odotukset AIHEESEEN LIITTYVÄ TERMISTÖ (1/2)

Palomuurit. Palomuuri. Teoriaa. Pakettitason palomuuri. Sovellustason palomuuri

Käyttäjäkunnossapitokoulutus 2010 Outokumpu Tornio Works, Leikkauslinjat ja Kemi-Tornion AMK, Tekniikan yksikkö.

Geogebra -koulutus. Ohjelmistojen pedagoginen hyödyntäminen

MS-C1340 Lineaarialgebra ja differentiaaliyhtälöt

Luento 10 FinPSA-ohjelma

JYVÄSKYLÄN KAUPUNKI KAUPUNKIRAKENNEPALVELUT A.1 LAMPPUJEN YKSITTÄISVAIHTO (TYÖ JA MATERIAALI) ja A5 VA- LAISIMIEN PUHDISTAMINEN

Tietokoneverkon luomiseen ja hallintaan

Sisällysluettelo LIIKENNEVIRASTO VIKAILMOITUSOHJE 2 (5) Dnro 1181/1003/2012

PALOTURVALLISUUS MAANALAISISSA TILOISSA

KÄYTTÖOHJE PEL / PEL-M

METEORIEN HAVAINNOINTI III VISUAALIHAVAINNOT 3.1 YLEISTÄ

Tuulivoiman integraatio Suomen sähköjärjestelmään - kommenttipuheenvuoro

Osallistuminen YVA-menettelyssä koulutus palvelumuotoiluhankkeen tulosten pohjalta

Järjestelmän kriittisimmille toiminnallisuuksille (listattu alla), toteutetaan 1

Transkriptio:

Dynaaminen SLA-riski Goodnet-projektin loppuseminaari pe 19.10.2012 Pirkko Kuusela, Ilkka Norros VTT

2 Motivaatio Suunniteltu verkko: No-single-point-of-failure Arki: vähänkin isommassa verkossa on yleensä joku vika päällä (UNINETTin rungon 35 linkkiä, stabiili 2v, 10% ajasta vähintään yksi linkki alhaalla) SIIS: Verkkojen häiriösietoisuus vaihtelee eri verkon osissa, eri aikoina No-single-point-of-failure muuttuu single-point-of-failure tilanteeksi eri aikoina, eri kohdissa verkkoa. Missä ja milloin? Merkitys palveluille? Vaikutus riskeihin? Miten tämä otetaan mukaan verkon suunnitteluun ja operointiin? Verkonhallinnan arki: monia verkkoja, kiire, vian vaikutuksen havainnollistaminen, uusi näkökulma: jonkin komponentin toimimisen tärkeys, tulkitun tiedon tuottaminen

3 Sisältö Tavoite: Havainnollista reitittimien ja linkkien vikojen merkitys SLA-sopimusten kannalta tällä hetkellä operoitavassa verkossa (joka ei ole se suunnittelupöydällä ollut verkko ja/tai joillekin asiakkaille on päässyt kertymään palvelukatkoja) Askeleet: Verkon palvelukatkojen mallinnus (IPLU-II) Todennäköisyys rikkoa SLA kauden aikana, interval availability Approksimaatio, kun viat harvinaisia, SLA-kausi lyhyt Dynamiikka ajassa sekä vikojen suhteen Liityntäreitittimen SLA-riski perustapahtumien summana Verkon komponenttien toimimisen tai korjaamisen tärkeys SLA-riskien kannalta

4 Fiktiivinen esimerkki menetelmästä Funetin vanha topologia Palveluksi määritelty reitityssäännön mukainen yhteys ulkomaailmaan = Ficix & Nordunet Funet pieni, mutta riittävän iso havainnollistamaan menetelmää Funetin komponenttien luotettavuusmallit perustuvat osittain dataan, osittain heuristiikkaan ja asiantuntijoiden näkemyksiin TÄRKEÄÄ: Esimerkit EIVÄT kerro Funetin luotettavuudesta tai palvelusta, ne ovat fiktiivisiä ja valittu havainnollistamaan erilaisia asioita

5 Tausta: verkon palvelukatkojen mallinnus (IPLU-II) Lähtökohta minimikatkosjoukot Palvelulla (yhteys Ficix & Nordunet) ei yksittäisvikaa lasketaan kaikki 2 komponentin (reititin/linkki) yhteisviat, joista palvelukatko johonkin liityntäreittimeen (=vikojen tunnistaminen) Joka yhteisviasta kirjataan ne liityntäreittimet, joita palvelukatko koskee (=vian vaikutus) Uudelleenreititys ei korjaa näitä, vaan tarvitaan min yhden komponentin korjausoperaatio Yhteensä 112 yhteisvikaa Linkkien ja reitittimien on-off mallit (data, heuristiikka), vikojen kestossa suuri vaihtelu, riippumattomat viat Yhteisvian on off -mallintaminen On-off -malli palvelulle liityntäreitittimessä Kaikki analyyttistä, ei simulaatioita, nopeaa Katso P.Kuusela, I. Norros. On/Off Process Modeling of IP Network Failures.

6 Connection UP - (1) SLA-riski periodin aikana Interval Availability Finite time interval Connection DOWN -(0) Time Keskeinen suure Interval Availability, hankala laskea tarkasti Approksimaatio, kun komponenttien viat kohtalaisen harvinaisia Palvelukatkon aiheuttava tilanne on 2 komponentin yhteisvika Laske P(yhteisvika aiheuttaa SLA:n rikkoutumisen kauden aikana) Aikadynamiikka, todennäköisyys pienenee kauden loppua kohden Vika ja SLA dynamiikka: ehdollista laskenta havaittuun verkon tilaan: komponenttien tilat ja SLA tilanne tällä hetkellä

7 2 komponenttia rinnan. Palvelukatko jos kumpikin alhaalla. Tässä kuvassa vain toinen komponentti vikaantuu ja se korjataan ennen toisen vikaantumista, ei yhteisvikaa silti SLA-riski nousee ensimmäisen vian tullessa ja poistuu vian korjautuessa. Vialla minimikesto md, jonka vuoksi riski aluksi laskee (kun odotellaan ensimmäistä mahdollisuutta vian poistumiseen) ja lopulta alkaa taas nousta (todennäköisyys sille, että kyseessä on nk. pitkä vika kasvaa) Kun vika on korjattu palataan samalle laskevalle suoralle, jolta hypättiin pois vian alkaessa Jos vikoja ei olisi lainkaan, SLA-riski on ajan suhteen laskeva

8 2 komponenttia rinnan. SLA-riski kauden aikana kohoaa ensimmäisen katkon vuoksi ja räjähtää toisen katkon tullessa. Tästä tilanteesta seuraa SLA:han vaikuttava palvelukatko. Korjausten jälkeen kohonnut riskitaso, joka taas laskee (ellei SLAta jo rikottu) jos vikoja ei ole. Interval Availability approksimoidaan eri tavoilla 0, 1 ja 2 vian tilanteissa

9 Liityntäreitittimen dynaaminen SLA-riski yhteisvikojen johdosta

10 Verkon komponentin toiminnan/korjauksen tärkeys verkon SLA-riskien kannalta

11 DYNAAMINEN INPUT: 1)Komponenttien tilat ja tilan kestot 2) SLA-kertymä 3) Aika jäljellä Verkon dynaaminen SLA-riski MALLI 1) minimikatkosjoukot 2) komponenttien luotettavuus 3) SLA-riski periodin aikana Asiakas antaa: 1) topologia, reitityssääntö 2) verkon palvelu 3) vikadataa tai arvioita 4) SLA-rajat, kaudet DYNAAMINEN OUTPUT: 1)Riski rikkoa SLA kauden loppuun mennessä 2) Vikaantuneen komponentin korjaamisen SLA-tärkeys 3) Toimivan komponentin ehjänä pysymisen SLA-tärkeys

Esimerkki perustilanteesta, ei vikoja, ei kertyneitä katkoja, kausi alussa 12 Risk level Riski rikkoa SLA ennen kauden loppua Havainnollistetaan yhteisvioista johtuvaa riskiä, Liityntäreitittimen yksittäisvika helppo lisätä päälle SLA-kausi 28 vrk alkanut, ei kertyneitä katkoja, kaikissa liityntäreiteittimissä sama SLA-raja 6h kauden aikana. Kaikki komponentit toimivat Palvelu = yhteys ficix & nordunet Kaikissa reitittimissä sama luotettavuusmalli ja SLA, mutta eri riskit. Huom pohjoinen. Laskenta per liityntäreititin: kerätään yhteisviat, joista palvelukatko. Arvioidaan SLA-riskit dynaamisen inputin mukaan ja summataan Aikadynamiikka: jos vikoja ei tule, pallot vihertyvät kauden loppua kohden low

Esimerkki perustilanteesta, ei vikoja, ei kertyneitä katkoja, kausi alussa 13 Operational importance normal Repair importance Perustilannetta vastaava komponenttien tärkeys, kaikki komponentit toimivat SLA-kausi 28 vrk alkanut, ei kertyneitä katkoja, kaikissa liityntäreiteittimissä sama SLA-raja 6h kauden aikana. Palvelu = yhteys ficix & nordunet Kuva yhteisvikamielessä, miten vaikuttaa verkon kokonaisriskiin Jos komponentti toimii: laske miten tässä verkkotilanteessa koko verkon yhteisvikojen SLA-riskit (ed. kuva) muuttuvat, jos komponentti vikaantuisi juuri nyt toimimisen tärkeys Jos komponentti ei toimi: laske miten tässä verkkotilanteessa koko verkon yhteisvikojen SLA-riskit (ed. kuva) muuttuvat, jos komponentin vika loppuisi juuri nyt korjauksen tärkeys Joillakin ei vaikuta muihin -rooli ja lähtökohta 2 komponenttiviat

Aikadynamiikka vian keston suhteen (tut0 alhaalla, kesto vaikuttaa) 14 Risk level normal low Ei SLA kertymää, tut0 alhaalla Kesto vaikuttaa. Kohonnut riski, mutta ei katkoa. Palautuminen lähes alkutilaan korjauksen jälkeen Vika alkaa Operational importance normal Repair importance

Aikadynamiikka vian keston suhteen (tut0 alhaalla, kesto vaikuttaa) 15 Risk level normal low Ei SLA kertymää, tut0 alhaalla Kesto vaikuttaa. Kohonnut riski, mutta ei katkoa. Palautuminen lähes alkutilaan korjauksen jälkeen Vika kestänyt 400 sec Operational importance normal Repair importance

Aikadynamiikka vian keston suhteen (tut0 alhaalla, kesto vaikuttaa) 16 Kohonnut riski Risk level normal low Ei SLA kertymää, tut0 alhaalla Kesto vaikuttaa. Kohonnut riski, mutta ei katkoa. Palautuminen lähes alkutilaan korjauksen jälkeen Vika kestänyt 800 sec Operational importance normal Repair importance

Aikadynamiikka vian keston suhteen (tut0 alhaalla, kesto vaikuttaa) 17 Risk level normal low Ei SLA kertymää, tut0 alhaalla Kesto vaikuttaa. Kohonnut riski, mutta ei katkoa. Palautuminen lähes alkutilaan korjauksen jälkeen Uhka ohi, palautuminen Operational importance normal Repair importance

Esim B: ei SLA-kertymää, kausi alussa, (uku0,uku3) vika alkanut 18 Risk level normal low Operational importance normal Repair importance

Esim D: ei SLA-kertymää, kausi alussa, (uku0,oulu0) vika alkanut 19 Huomaa runkolinkin tärkeys. Risk level normal low Operational importance normal Repair importance

Esim E: joensuu3:ssa katkoja 90% SLA-rajasta, kautta jäljellä 23.10.2012 75%, 20 kaikki komponentit toimivat Huomaa linkien tärkeys tällä suunnalla. Yksittäisvikana Risk level normal low Operational importance normal Repair importance

Esim F: joensuu3:ssa katkoja 90% SLA-rajasta, kautta jäljellä 23.10.2012 75%, 21 (uku0, uku3) ollut vikatilassa 800 sec, vika jatkuu kohonnut riski Linkien tärkeys kasvaa tällä suunnalla. Yksittäisvikana Risk level normal low Operational importance normal Repair importance

Esim G: ei SLA-kertymää, kausi alussa, 23.10.2012 (uku0, uku3) vika alkanut, (abo0, abo3) ollut alhaalla 800 sec 22 kohonnut riski Tärkein linkki Tärkein korjaus Risk level normal low Operational importance normal Repair importance

23 Lopuksi Kiitos kuulijoille! Tahti oli tiukka... Jos kiinnostuit aihepiiristä, ota yhteyttä pirkko.kuusela@vtt.fi. Tulen mielelläni kertomaan lisää tästä ja muista tuloksista. Jatkoideoita: Menetelmien hyödyntäminen suunnittelussa ja verkon operoinnissa (hälytysten rikastaminen) Laajentaminen viiveisiin liittyviin riskeihin (viiverajan ylitys = off) SLA-riskin approksimaatio kun katko tiheästi toistuva (häiriötila, viiveen vaihtelu) Minimikatkosjoukkojen täysimittainen hyödyntäminen

24 VTT luo teknologiasta liiketoimintaa