Gondolatok egy szerencsétlen VMware hiba kapcsán

"A nép, az istenadta nép", amely éljenez Jézus Jeruzsálembe érkezésekor, hogy aztán pár nappal később Barabbást kiáltson – leszedi a keresztvizet haragjában a VMware-ről egy szoftverhiba miatt. Igaz, elég nagy a hiba: az ESX 3.5U1 és U2, valamint az ESXi is tévesen lejártnak érzékel egy licencet, ezért a leálló virtuális gépeket már nem hajlandó újraindítani, sőt, a Vmotion sem működik. Pukk. Pár ezer gazdagépen pár tízezer virtuális gép áll jelen pillanatban. Néhány gondolat kavarog bennem, megosztom őket.

  • A hiba nem volt látható, előrejelezhető a felhasználók számára. Még azok is, akik alapos tesztelésnek vetették alá az új verziót, simán "végeztek" a tesztekkel és áttértek a legfrissebb változatra.
  • A pechek pechje, hogy mindez a hónap második keddjén történik, ami köztudottan MS frissítési nap. Ilyenkor néhány tízmillió gép általában újraindul – már ha ellenőrizetlenül kerülnek fel a hotfixek. Voltam rendszergazda, nincsenek illúzióim.
  • Az ESXi is érintett a dologban, ergó a hiba magában a hypervisorban van. Hypervisorban licence ellenőrzés…
  • Az ESXi egy hónapok óta tervezetten ingyenes verzió. (Vagyis: már hónapokkal ezelőtt eldőlt, hogy ingyenes lesz.) Milyen fejlesztési módszertant követ a VMware, hogy ezt a tényt nem vezették át a kódon?
  • Ezek után mondja nekem valaki, hogy a hypervisor nem operációs rendszer?

A hiba nem is igazán ez a konkrét eset. Sokkal inkább az, hogy kiderült: a VMware erős nyomás alatt van, a szoftverfejlesztési folyamata hagy kívánnivalót maga után, és ezen két dolog együttállása előhozhat ilyen jelenségeket (A többes szám indokolt). Azért a sulykot nem szeretném elvetni, ezért mindenképpen megjegyzendő:

  • Az ESX 2001 óta van a piacon, és híresen stabil szoftver.
  • Nem a konkrét hiba kijavítása a legfontosabb, hanem az, hogyan módosítja a VMware a folyamatait, és azt azután miképp mutatja meg.
  • A hypervisor egy "ragadós" termék, tucatszámra kellene ilyen hibáknak megjelenniük ahhoz, hogy a felhasználók tényleg más terméken kezdjenek gondolkodni. Az új ügyfelek megszerzése, az persze más.
  • Semelyik gyártó nem védett ilyen jellegű katasztrófától, a folyamataik javításával legfeljebb a hibák előfordulási valószínűsége csökkenthető.

Nagyon érdekes egyébként, hogy a Vista RTM-ben lévő "Csökkentett funkcionalitás" módszer a Windows Server 2008 (vagyis a Vista SP1) megjelenésével eltűnt. Ott valami hasonlóról volt szó. Lejárt az újrakaktiválási idő? Csökkentett funkcionalitás. Node egy szerver esetén? Ezt nem vállalta a Microsoft – nagyon helyesen.

És még valami: most látszik igazán, hogy a hypervisorban lévő hibák súlyossága a processzorokban található hibák súlyosságához mérhető. Vagyis, bármennyire marketingszagúnak tűnik, van abban valami, amikor a Microsoft a mikrokernel hypervisor mellett érvelve megjegyzi: a kisebb kód és egyszerűbb felépítés a hibák valószínűségét is csökkenti. És mint tudjuk, az ESX monolitikus hypervisor.

2 Responses to Gondolatok egy szerencsétlen VMware hiba kapcsán

  1. Gábor says:

    Nem tudom, a VMware amugy mindig igy csinalja. VMware Server is tok
    free, es megis ker license code-t, nem lehet kikerulni. Nem meglepo az
    ESXi ilyten mukodese sem, mert altalaba ezek azonos kodbazissal jonnek,
    es tkp. a license egy ilyen no-expiration cucc, ami aztan eldonti, hogy
    ez amugy free. Fejlesztoi szempontbol azert kenyelmes ez, mert egyfelol
    nem kell kodolni, masfelol meg nem kell, hogy a ket programnak
    kulonbozo legyen a kodbazisa, hiszen akkor az ESXi-nek teljesen uj
    kodfat kellene nyitni, igy meg eleg #ifdef-ekkel koruldolgozni a nem
    kello resteket.A MS-nek meg alapvetoen konnyu dolga van az
    egesszel. A connectix cuccabol mindig is volt XY napos demo, ott tehat
    kodszinten megvolt a lehetoseg a licensz nelkuli hasznalathoz (Sem a
    GSX sem az ESX Server soha nem volt free kiprobalhato amennyire tudom).
    Igy tehat a MS-nek csak elo kellett hivni egy mar meglevo supportot,
    atdolgozni, hogy a 30 napos idokorlat eltunjon, es igy nagyjabol vege
    is. Ezekutan igazabol szerintem nincs osszehasonlitasi alap –
    fejlesztoi oldalon.

  2. Tamas says:

    Az MS hosszú történettel "büszkélkedhet" hogyan épített termékkulcsokat a termékeibe. Az alapvető felállás a következő volt: telepítéskor add meg, akkor használhatod. Ha nem tudod telepítéskor, akkor nem fog felmenni. Ha akárhogy is, de feltelepítetted, akkor már ment. A Vista volt az első, amely megfordította a történetet: ha lejárt az aktivációs idő, akkor jött a csökkentett üzemmód. Ezt én a kezdetektől őrületnek tartottam, de a Microsoftnak el kellett jutnia az SP1-ig (vagyis inkább a Windows Server 2008" telepítéséig), mire rájöttek, hogy ezzel nem lehet játszani. Márpedig a VMware ezzel játszott.
    De még egyszer: a konkrét hiba lényegtelen. A Microsoft éppúgy elkövethetett volna (vagy akár a jövőben is elkövethet bármikor) ilyet. A fontosabb a folyamatok átszervezése – hogy a hibák jövőbeli megjelenésének minimalizálására. A Microsoft tett ilyet a biztonság terén: Secure Development lifecycle. (Ezt nem a VMware-rel szemben mondom, hanem csak egy példa arra, hogy egy cégnek át kellett alakítania valami miatt a fejlesztési folyamatait.)

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

%d bloggers like this: