Easyhost Easyhost Easyhost Easyhost Easyhost

Cum am trecut prin cel mai mare eveniment online din Romania – Black Friday

Black Friday - Hostway & eMAG

În primele 12 minute de la lansarea Black Friday, pe eMAG.ro erau deja 1000 comenzi pe minut si 135.000 vizitatori unici.  Cu alte cuvinte, în fiecare secundă, 200 de oameni noi intrau pe site și 17 comandau.

La ora 12, după mai puțin de 4 ore, Black Cat avusese deja mai mulți vizitatori decât au cele mai vizitate site-uri din România într-o săptămână. Cu alte cuvinte, pe oră, de 42 de ori mai mulți oameni au intrat pe eMAG.ro , decât pe orice alt site .ro, într-o zi normală.

În plus,  traficul de internet realizat de utilizatorii eMAG atingea 12 Gbps. Ca să vă faceți o idee despre ordinul de mărime – este echivalentul a 1.5 GB sau ca și cum în fiecare secundă s-ar fi scris 2 CD-uri doar cu imagini de pe eMAG.ro.

Incredibil, nu? Nouă așa ni se pare și suntem foarte bucuroși că am avut ocazia să susținem eMAG și Black Friday din prima linie. Este, fără îndoială cea mai mare provocare pe care a avut-o echipa noastră din România. În același timp, presupune un efort extraordinar.  Lucrăm alături de echipa tehnică eMAG la pregătirea evenimentului încă de la încheierea ediției din 2011. S-au luat în considerare și testat zeci de variante de infrastructură înainte să se aleagă cea finală. Iar odată ce decizia a fost luată, au urmat luni de zile de lucru intens: s-au instalat și configurat peste 100 de servere și o serie de soluții foarte avansate de balansare și accelerare.

Care a fost rezultatul? În anumite momente, extraordinar: am trecut cu bine peste peak-ul de trafic de dimineață. Dar au existat și probleme: un incident de downtime, de aproximativ 20 de minute.  Totul a pornit de la o componentă hardware care pur și simplu a cedat, într-unul din servere. Din păcate, serverul făcea parte dintr-un cluster foarte important și oprirea lui a generat disfuncționaliăți întregului site. Totuși, în mai puțin de 5 minute serverul a fost identificat, iar în alte 15 a fost înlocuit cu totul.

Suntem foarte conștienti că ideea de downtime sună rău oricum ar fi. Dar, când lucrezi cu 100 de servere pentru o singură aplicație și ai o problemă hardware, să identifici și  să  schimbi echipamentul cu totul în 20 de minute e, probabil, un record de viteză. Timpul standard de replacement hardware din SLA-ul nostru este cel mai bun din România (60 de minute) și totuși situația s-a rezolvat de 3 ori mai rapid. Nu încercăm să ne scuzăm prin asta. Zeci de oameni au muncit luni de zile ca acel downtime să nu existe. Dar e o explicație. Iar scuza reală urmează acum: ne pare sincer rău pentru întrerupere. Vom face tot ce putem ca la următorul Black Friday să se desfășoare fără nicio secundă de downtime. O să muncim și mai mult și mai bine și vom folosi tot ce am învățat.

Între timp, mulțumim echipei eMAG pentru suportul și înțelegerea lor. Sunt chiar niște oameni extraordinari și ne simțim foarte norocoși că avem ocazia să lucrăm împreună. Devenim mai buni datorită lor, în fiecare an.

Update – iată și reacția eMAG:

In ultimele saptamani echipele IT eMAG si Hostway au fost practic una si aceeasi. S-a lucrat cot la cot, s-au instalat peste 100 de servere si s-au facut teste de anduranta la cele mai imposibile ore de noapte. Ne-am simtit o echipa adevarata care a lucrat in primul rand pentru a-si testa limitele si a arata ca pot sustine impreuna cel mai mare eveniment online pe care l-a avut Romania. Multumim Hostway pentru suport, pentru atitudine si pentru ce am realizat impreuna.

Știți de ce o să dăm întotdeauna tot ce avem mai bun pentru eMAG? Pentru că merită!

4 Comments

Leave a Comment
  1. “Zeci de oameni au muncit luni de zile ca acel downtime să nu existe.” – FAIL.

    ei bine, poate intr-o zi o sa invatati si voi ca MTTR conteaza mult mai mult decit MTBF

Comments are closed.