داستان پشتیبانی، باتری کارت Cache کارت Raid سرورهای HP

داستان پشتیبانی، باتری کارت Cache کارت Raid سرورهای HP


 

موضوع مربوط به حدود 3 سال پیش است. اتفاق نادری در سایت 4 کارفرمای پویش اتفاق افتاد که یا در حین کار و یا اینکه به واسطه خاموشی ناگهانی حجم قابل توجهی از اطلاعات کارفرمایان با مشکل مواجه شد.

اتفاقی نادر که اصولا بدون وجود هیچگونه اخطار در ظاهر سرور بروز کرد. مشاوره از فروشندگان سخت افزار راه به جایی نداشت.

تیم فنی پویش با تکیه بر توان فنی خود شروع به بررسی علت بروز مشکل کرد. بروز مشکل از دو بعد مورد بررسی قرار گرفت: 1- نرم افزاری، 2- سخت افزاری

برای بررسی سخت افزاری مستندات گوناگون HP مورد بررسی قرار گرفت و همچنین لاگ ILO سرورها بررسی شد. در لایه نرم افزاری، تعاملات با انجمنهای نرم افزهای هدف آغاز شد.

بعد از بررسیهای عمیق، علت بروز مشکل در باتری کارت Cache سرورهای HP تشخیص داده شد. تشخیصی که در ابتدا توسط فروشندگان سخت افزار رد شد، اما بعد از ارائه مستندات مستدل شرکت HP مورد قبول واقع شد.

داستان آن بود که عمر مفید باتری کارت Cache سرورهای HP سه سال هست و اصولا بعد از سه سال باید تعویض شوند. زمانی که باتری با مشکل مواجه میشود، در صورتیکه سرورها خاموش شود و یا ممکن است بدون خاموشی به علت ضعف زیاد باتری کارت Cache، اطلاعات موجود در Cache با مشکل مواجه میشود و از بین میرود.

میتوانید حدس بزنید که چه اتفاقی در صورت از بین رفتن اطلاعات Cache حادث میشود؟ حجم قابل توجهی از اطلاعات از بین میرود. و این اتفاقی بود که برای ما حادث شد.

عرصه پشتیبانی از زیرساخت کارفرمایان عرصه پرتلاطم و پر از وقایع تازه هست که شرکت پویش در برخورد با تک تک موارد ضمن کشف علت، از بروز مجدد آن جلوگیری کرده و همچنین به واسطه وجود سامانه های Backup مطمئن از ازبین رفتن اطلاعات جلوگیری میکند.

در تمامی مواردی که این اتفاق حادث شد، به علت وجود Backupهای مطمئن به هیچ وجه اطلاعات از بین نرفت و سرویس دهی کارفرمایان با قطعی مواجه نشد.

جلوگیری از این حادثه به دو شکل امکان پذیر است:

  1. به روزرسانی Firmware سرور
  2. تعویض باتری Cache بعد از 3 سال


هم اکنون سامانه PVM مجهز به ابزارهای مانیتورینگ سرورهای HP میباشد و همچنین در چک لیستهایی که برای کارفرمایان ارسال میگردد سلامتی این باتری همچون دیگر پارامترهای سخت افزاری مورد بررسی قرار میگیرد.

تمامی تلاش تیم فنی پویش، رفع دغدغه های زیرساختی با ارائه محصولی با کیفیت و علت یابی مباحث زیرساختی به صورت مستدل می‌باشد.