Kriittisten ympäristöjen katastrofivalmius: VMware Site Recovery Manager ja EMC RecoverPoint Santeri Stolt Sr. Systems Engineer santtu@vmware.com Mika Ulmanen Sr. Account Manager Ulmanen_Mika@emc.com
Tiedon turvaaminen katastrofin varalta RPO = Paljonko dataa voidaan menettää Vk Pv Varmistus levylle Varmistus nauhalle Levy kloonit Paikallinen suoja Hr Levy snapshotit Min Sek Synkr. replikointi Asynkr. replikointi Maantieteellinen suoja RTO = Kuinka kauan palautuminen saa kestää Sek BANG Min Hr Pv Vk
Tiedon turvaaminen katastrofin varalta - CDP RPO = Paljonko dataa voidaan menettää Vk Pv Hr Min Sek BANG CDP Sek CDP = Continuous Data Protection eli Jatkuva Tiedon Suojaus RPO = 0 (paikallinen), RPO 0 < 1min (replikoitu) Suojaa myös loogiselta korruptiolta Min Hr Pv RTO = Kuinka kauan palautuminen saa kestää Vk
EMC:n johtavat replikointiteknologiat MirrorView Synchronous replication for flexible recovery-point and recovery-time objective requirements 1 2 4 3 Celerra Replicator IP replication with Quality of Service to optimize LAN/WAN bandwidth utilization FS/LUN LAN FS/LUN Snaps Snaps
HARDWARE SOFTWARE HARDWARE SOFTWARE EMC:n johtavat replikointiteknologiat SRDF Family The ultimate business continuity and disaster recovery solution for the broadest range of use cases RecoverPoint Host, array, fabric continuous data protection (CDP), continuous remote replication (CRR), concurrent local and remote (CLR) data protection; and compression Virtualization layer Intel architecture Windows Replica of Windows Linux Virtualization layer Intel architecture Production ESX Servers Replica of Linux Backup Server
EMC RecoverPoint Datan suojaus, replikointi, ja katastrofivalmius RecoverPoint Family Yksi tuote yhden tai monen konesalin skenaarioon Erittäin nopea palautuminen haluttuun ajanhetkeen Vähentää kaistantarvetta konesalien välillä Uniikki pakkausteknologia Vähentää kaistantarvetta jopa 50-90% CDP: paikallinen kopio CRR: suojaus etäpisteeseen CLR: paikallinen kopio ja etäsuojaus samanaikaisesti Dynaaminen vaihtelu sync/asyncreplikoinnin välillä Tukee yleisimpiä käyttöjärjestelmiä Host-, CLARiiON-, or fabric-pohjainen datan splittaus
CDP vs. Snapshotit RecoverPoint CDP CDP versus Traditional Array Snaps RecoverPoint CDP Multiple point-in-time images Snapshots Limited number of predefined point-in-time images Production Replica Journal Traditional Snaps Production Snapshot copy All writes captured continually Journal contains point-in-time images Significant bandwidth reduction for remote replication Specify different RPO/RTO and policies per application Consolidation saves storage space Snaps taken every few hours Number of snaps determined by user, disk space Limited bandwidth reduction when replicated RPO/RTO changes require scripting per application Storage requirements grow depending on the type of snap Original production data Delta snapshot
CDP - Jatkuvan suojauksen palautuspisteet Daily backup Snapshots Any point in time Significant point in time Daily recovery points from tape or disk More frequent disk-based recovery points All recovery points Database Pre-app checkpointpatch Post-app patch Database checkpoint Quarterly close Any userconfigurable event Significant points in time RecoverPoint Any point in time Snapshot Daily backup Yesterday 24 hours Midnight Now
Katastrofista toipuminen fyysisellä palvelininfralla Toipumisvalmiuden ylläpito on erittäin työlästä Identtinen rauta tuotanto- ja varapalvelimissa Päivitykset ja korjaukset asennettava molempiin ympäristöihin Automatisointi alkeellista (tai ei automatiikkaa) Virhealtista ja testaaminen vaikeaa Toipumisvaatimukset rankataan liiketoimintakriittisyyden perusteella Tier RPO RTO Hinta I Minuutteja Minuutteja II 24+ t 48+ t III 7+ pv 5+ pv
Virtualisoinnin hyödyt katastrofista toipumisessa Virtuaalikoneita on helppo siirtää Virtuaalinen rauta voidaan konfiguroida automaattisesti Testaus ja failover voidaan automatisoida (minimoi inhimillisen virheen mahdollisuuden) Varalla olevaa rautaa tarvitaan vähemmän Maksaa vähemmän, palvelutaso paranee Koko infra toipuu minuuteissa!!!
Site Recovery Manager katastrofivalmiusratkaisu Konesali 1 Konesali 2 Turvattu ympäristö Varaympäristö Varaympäristö Turvattu ympäristö VirtualCenter Site Recovery Manager Tukee kaksisuuntaista varautumista VirtualCenter Site Recovery Manager Run Test Datastore Groups Levyjärjestelmän replikointi FC, iscsi, NFS -Sync/Async EMC RecoverPoint Datastore Groups
Site 1 SRM ratkaisuarkkitehtuuri VC Server 1 Site 2 VC Server 2 VCMS 1 DB VCMS 2 DB SRM Server 1 SRM Server 2 SRM 1 DB Storage Replication Adapter Storage Replication Adapter SRM 2 DB Block Replication SW Array 1 Array 2 Block Replication SW * Note: Conceptual drawing only. Site Recovery Manager Server may run on another system than VCMS
VMFS 4 VMFS 3 VMFS 2 VMFS 1 SRM riippuvuudet LUN 1 Recovery Plan 1 (Whole Site) Datastore Group 1 LUN 2 Protection Group 1 Protection Groups: Protection Group 1 Protection Group 2 Protection Group 3 LUN 3 Datastore Group 2 LUN 4 LUN 5 Protection Group 2 Recovery Plan 2 (Subset) Protection Groups: Protection Group 1 Datastore Group 3 Protection Group 3 Protected Site Recovery Site
SRM integroituu suoraan vsphere 4.0 Clientiin
Toipumissuunnitelma on nyt sähköinen
Toipumissuunnitelman testaaminen Protected Site In-Sync Recovery Site Storage Array Replication Test Continue
Toipumissuunnitelman ajaminen Protected Site In-Sync Recovery Site Storage Array Replication Run SRM valmistelee levyt Sovitinkorttien uudelleenskannaus ESX-palvelimet näkevät levyt RW-oikeuksin
Auditoitavuus - Raportointi Toipumissuunnitelman ajaminen joko testi- tai failover-moodissa tallentuu aina raportiksi ja on siis helposti auditoitavissa
Failback Failback ilman Site Recovery Manageria Poista suojatut virtuaalikoneet vcenter Serverin inventaariosta Käynnistä replikointi DR-ympäristöstä tuotantokonesaliin Tuo virtuaalikoneet inventaarioon tuotantoympäristössä, uudelleenkäynnistä ja vaihda IP:t (manuaalisesti tai skriptattuna) Ei suunnitelmaa, testaaminen vaikeaa, ei auditoitavaa jälkeä Failback Site Recovery Managerilla SRM:ssä ei ole valmiiksi konfiguroitua failback toimintoa, vaan failback konfiguroidaan failoverin jälkeen Käynnistä replikointi DR-ympäristöstä tuotantokonesaliin Luo SRM:llä toipumissuunnitelma virtuaalikoneiden siirtämiseksi takaisin tuotantoympäristöön Dokumentoitu failback-suunnitelma, testausmahdollisuus ennen siirtoa, auditoitava jälki
Shared Recovery Site Site1 vcenter Site1 SRM-A Site1 SRM-B Site2 SRM-A Site2 vcenter Site3 SRM-B Site3 vcenter
Shared Recovery Site Etäpisteiden katastrofivalmius SRM Site A SRM Site B SRM Site C Tuotanto Site A vcenter Tuotanto Site B Jaettu DR Site Yksi vcenter Server ja SRM instanssi etäpisteissä Tuotanto Site C Yksi vcenter Server useampi SRM instanssi jaetussa DR-ympäristössä
Shared Recovery Site - DR Hosting-kumppanilta SRM Asiakas A SRM Asiakas B SRM Asiakas C Asiakas A Tuotanto vcenter Asiakas B Tuotanto Palveluntarjoajan DR Site Asiakas C Tuotanto Palveluntarjoajan DR-ympäristö suojaa useamman asiakkaan ympäristöjä Partitioitu ja suojattu asiakaskohtainen SRM instanssi jokaiselle asiakkaalle Yksi vcenter Server ja SRM instanssi tuotantoympäristöissä Yksi vcenter Server ja useampi SRMinstanssi jaetussa DR-ympäristössä
SRM:n ja RecoverPointin integraatio Production Disaster Recovery vcenter SRM SRA Protected Virtual Machines Automated VM failover SRM SRA vcenter Protected Virtual Machines VMware Infrastructure Servers Nondisruptive disaster recovery testing VMware Infrastructure Servers SAN RecoverPoint WAN RecoverPoint SAN LUN Production LUNs Heterogeneous storage Remote CRR Journal LUN Remote Replicas LUN
VMware virtuaalikoneiden monitorointi myös RP:lle RecoverPoint GUI näyttää kaikki virtuaalikoneet ja niiden RecoverPoint suojauksen tilan RecoverPoint voi valvoa molempien konesalien VMware-ympäristöjen suojaustilaa
Katastrofitilanteen työvaiheet VMware ESX 3. Sammuta virtuaalikone Pysäytä replikoitava image Valitse tuorein ajanhetki Salli R/W pääsy remote ESX-palvelimelle Skannaa uudet levyt Rekisteröi VM Käynnistä VM VMware ESX ESX Server SAN RecoverPoint WAN RecoverPoint ESX Server (disaster recovery) SAN 1. VM mapatty LUNeihin ja consistency groupeihin 2.Replikoidaan LUNit
Näe itse integroitu ratkaisu tositoiminnassa Klo 14.25 14.55 Proact Solution Center Demot trackilla Site Recovery Manager & EMC RecoverPoint
Kysymyksiä & vastauksia