Easyhost Easyhost Easyhost Easyhost Easyhost

[Studiu de caz] Migrarea infrastructurii. Nivel complexitate: AVANSAT

Migrarea de pe o infrastructură pe alta poate părea o procedură de rutină privită din afară. Lucrurile decurgând rapid de obicei, ai putea crede că totul în spate este automatizat complet. Ce se întâmplă însă când ai zeci de rack-uri de mutat, câteva granițe de traversat și estimări inițiale care anunță multe ore de downtime? Să luăm ca exemplu MIGRAREA INFRASTRUCTURII EASYHOST ÎNTR-UN DATACENTER NOU.

CONTEXT

Problema se anunța simplă la început. Easyhost își dorea consolidarea activității sale, migrând serviciile găzduite în două datacentere (Germania și UK) către unul singur din Regatul Unit. Motivația din spate a fost dorința de upgrade a infrastructurii actuale, pentru o îmbunătățire a performanței serviciilor, dincolo de potențialul lor actual.

Mai concret: 40+ de rack-uri și 8,000+ conturi de clienți trebuiau consolidate și mutate pe echipamente noi, minimizând downtime-ul serviciilor găzduite.

Noua locație aleasă pentru migrare, Easyhost Enterprise UK DC, fusese selectată datorită performanței infrastructurii: servere de ultimă generație HP-G9, toate cu storage SSD și uplink în internet de minim 10Gb pentru fiecare client. În plus, noul datacenter venea cu avantaje extra pe partea de securitate (monitorizarea locație cu camere HDTV de 1080p, 6 zone de securitate între rack-uri și perimetrul cădirii, intrare cu acces biometric) și de eficiență  operațională (datacenter ”verde”, cu consum de energie redus cu 20%).

Toate caracteristici care susțin o performanță mai bună, până chiar la de 3x mai bună ca cea din datacenterul anterior.

PROVOCĂRI

Spre deosebire însă de o migrare clasică, echipa tehnică Easyhost s-a lovit în acest caz de diferite provocări specifice anvergurii proiectului. Prima provocare a fost ridicată de infrastructura folosită până în prezent în cele două datacentere. Fiind vorba de echipament legacy, echipele tehnice au avut parte de puțină flexibilitate și de anumite limitări în tipul de proceduri alese.

În etapa de Discovery & Planning, echipe tehnice au fost provocate să gândească soluții inovative și abordări noi pentru a atinge obiectivele proiectului.

În etapa de Discovery & Planning, echipe tehnice au fost provocate să gândească soluții inovative și abordări noi pentru a atinge obiectivele proiectului.

Un al doilea hop a apărut din cauza distanțelor geografice între locațiile implicate în migrare. Operațiunile de acest tip sunt, ca regulă, programate noaptea, când traficul pe aplicația sau site-ul clientului este redus.  Când noaptea este însă diferit percepută de client (cu sediul și operațiunile în SUA, spre exemplu) și de către echipa tehnică (localizați în România și în UK), soluții trebuiau găsite pentru minimizarea impactului asupra funcționării serviciilor.

PROCES

Cea mai complexă migrare din istoria Easyhost s-a desfășurat pe parcursul a câtorva luni, începând cu finalul anului 2015. Echipa tehnică responsabilă pentru proiect a fost una multi-națională, incluzând specialiști Systems din România și din Marea Britanie.

Proiectul a demarat cu o cercetare asupra diferitelor metode de migrare potrivite acestui demers, soluții care să respecte parametrii proiectului și termenii contractuali agreați. Opțiunile inițiale anunțau un downtime mediu de 2-4 ore per serviciu, provocarea fiind de găsire a unei alternative de reducere a acestei durate. După o analiză extensivă și multe simulări, echipa noastră Systems L3 a dezvoltat  o variantă de reducere a downtime-ului sub 10 minute. Acest interval scurt de discontunitate reprezintă un record nemaiîntâlnit, chiar și în contextul echipei tehnice care mai făcuse deja 5 migrări majore care implicau mii de servere.

Solutions

Soluția tehnică gândită a dus la o reducere substanțială a perioadei de downtime, cu până la de 10 ori mai mic ca estimarea inițială.

A venit apoi rândul echipei Systems L2 care a realizat câteva migrări „pilot” pentru un număr select de clienți. Pe tot parcursul acestei etape, echipa de Account Managers a fost constant implicată, comunicând în timp real cu clienții și transmițându-le update-uri live din fiecare stadiu al proiectului.

Cea de-a treia etapă a fost în întregime în responsabilitatea echipei de implementare, care a avut ca rol virtualizarea anumitor servicii și migrarea diferitelor grupe de conturi. Etapă realizată în întregime remote de către specialiștii din București, care au orchestrat migrarea a mii de conturi găzduite la mii de kilometri distanță.

Ce a ieșit? Doar în prima fază a proiectului, 240 core-uri CPU, 1 TB RAM și 60+ TB spațiu pe disc au fost migrate cu succes, înregistrând un downtine record, de sub 10 min per serviciu, spre bucuria clienților migrați:

Bruce Craig, Head of IT operations for The Restaurant Group  – TRG este unul din cele mai mari hub-uri de restaurante din Marea Britanie, site-urile a peste 500 restaurante fiind sub gestiunea TRG

”We noticed that the migration lasted an incredibly low amount of time, we were prepared for a much higher downtime. Very well done!”

Din perspectiva clienților? O optimizarea a mediilor în care aplicațiile lor rulează. Sau extra-performanță la costul a câtorva minute de downtime. Din perspectiva Easyhost? Servicii optimizate și mult mai stabile, precum și o poveste de trecut în studiile despre migrările de succes.