ASR در سرور hp

ASR در سرور hp



 

چکیده

قابلیت ASR در سرور های HP یکی از ابزارهای مفید جهت حل مشکل crash در سیستم عامل های مختلف میباشد . در این مستند سعی شده است تا در مورد ASR مطالبی بیان شود.

 

1 مقدمه

ASR قابلیتی است که به صورت دائم یک سیستم را از جنبه‌های مختلف مورد ارزیابی قرار می‌دهد تا در صورت بروز مشکل و خطا، جهت تشخیص و رفع آن به صورت خودکار اقدام نماید.این ویژگی توسط شرکت hp، در سرورهای تولید خود به کار گرفته شده است تا در صورت بروز مشکل در عمل‌کرد سخت‌افزار و سیستم عامل، سیستم را به یک وضعیت مناسب برگرداند.

 

2 معرفی ASR

تکنولوژی ASR یا Automatic System Recovery این امکان را به سیستم می دهد تا در صورت بروز مشکلات حاد در سیستم عامل نظیر (Blue Screen of death ، ABEND (abnormal end و یاKernel panic سیستم را restart نماید، عمل repair خودکار memory را انجام دهد و یا در صورت fail شدن یک process سیستم را recover کند. در هنگام load شدن سیستم عامل، درایور خاصی تحت عنوان System Management Driver یا همان Health Driver همراه با آن load می شود. هنگامی که سیستم عامل بدون مشکل در حال کار کردن است timer خاصی به نام ASR timer ، که زمان پیش فرض آن10 دقیقه است، به طور مداوم توسط این driverدر فاصله زمانی مشخصی restart می شود. در صورتی که سیستم عامل به درستی عمل نکند و یا به شکلی قفل نماید، این timer پس از اتمام دوره چک کردن، expire شده و سیستم restart می شود. همزمان با restart شدن سیستم یک پیغام log در قسمت login نرم افزار Insight Manager در ویندوز و همچنین در IML در لینوکس درج خواهد شد. به طور پیش‌فرض قابلیتASR در سرور های hp فعال است و می توان آنرا از طریق نرم افزار Insight Manager در ویندوز و یا(RBSU (ROM-Based Setup Utility در BIOS غیر فعال نمود و زمان پیش‌فرض مربوط به Timer را تغییر داد.

 

3 تنظیم ASR در منوی RBSU(Rom-Based Setup Utility)

تنظیم ASR علاوه بر نرم‌افزارInsight Manager از طریق BIOS سیستم نیز قابل انجام می باشد.برای این کار بایستی در زمان بوت شدن سرور از طریق کلید F9 وارد BIOS سرور شویم.تنظیمات ASR درگزینه Server Availability در منویRBSU در دسترس است.

تصویر 1: صفحه ابتدای لود شدن سرورهای hp

 

تصویر 2:منوی RBSU


تصویر 3: تنظیمات مربوط به ASR

 

Server Avalability شامل دو گزینه برای تنظیم ASR می باشد:

  1. ASR Status :جهت فعال و غیر فعال کردن ویژگیASR.

  2. ASR Timeout: تنظیم زمان تایمر ASR که به صورت پیش‌فرض 10 دقیقه می باشد.

زمانی که سیستم عامل در وضعیت مناسبی قرار داشته باشد،Health Driver به صورت پیوسته تایمر ASR را ریست می‌کند تا از صفر شدن تایمر جلوگیری کند. در صورتی که سیستم عامل نتواند جواب دهد و به دلایلی که بعداً ذکر می شود سیستم عامل قفل کرده باشد این تایمر بعد از گذشت زمان تعیین شده صفر شده و Health Driver فرض را بر قفل کردن سیستم عامل گرفته و سرور را reboot خواهد نمود.در اغلب مواردی که ASR عمل می کند یک Log به IML سیستم نیز ارسال می شود.

 

4 دلایل قفل شدن سیستم عامل

  1. خطای یکی از اجزای سخت افزاری سیستم

  2. نرم افزار سطح بالا یا Process ای که تمام منابعCPU سیستم را اشغال کرده و اجازه نمی‌دهد تا CPU به Health Driver تخصیص داده شود تا بتواند تایمر ASR را ریست نماید.

  3. نرم‌افزار یا Process ای که تمام منابع Swape,RAM سیستم را اشغال کرده واجازه تخصیص Memory به Health Driver را نمی دهد.

  4. خرابی یکی از اجرای سیستم عامل، مانند خرابی فایل سیستم یا درایور یکی از اجزا

و هر اتفاقی که باعث ایجاد وقفه در عمل‌کرد سیستم عامل شود.

 

5 عیب یابی جهت رفع و تشخیص نوع خطا

همان‌طور که در قسمت قبل هم توضیح داده شد ASR ممکن است به دلایل نرم افزاری و یا سخت افزاری اتفاق بیافتد.

مراحل عیب یابی جهت رفع و تشخیص نوع خطای اتفاق افتاده(سخت‌افزارنرم‌افزار).

به موارد زیردر مواقع اتفاق افتادن ASR توجه نماید:

  1. آیاASR بعد از اضافه کردن یک سخت‌افزار جدید اتفاق افتاده هست؟

  2. آیاASR بعد از نصب Patch جدید سیستم عامل،درایور یا Firmware جدید اتفاق افتاده است؟

  3. در صورت امکان سخت‌افزار جدید نصب شده،درایور جدید و یا Patch جدید سیستم عامل را حذف کنید.

  4. در صورت امکان iLO , Firmware , BIOS سرور را بروزرسانی نمایید.

  5. ( SPP (Support Pack for Proliant ) ,PSP (Proliant Support Pack را بسته به مدل سرور بروزرسانی نمایید.

  6. NVRAM سرور را از طریق BRSU (همان BIOS سرور) پاک نمایید.

عیب یابی و Log ها:

  1. اجرا کردن نرم‌افزار Insight Diagnostics از CD همراه سرور برای سرورهای G7 و پایین تر.

  2. در سرورهای G8 , G9 از iLO سرور استفاده نمایید یا Health System را از iLO فعال نمایید.

  3. IML ،Integrated Management Log را از طریق رابط کاربری iLO یا Insight Diagnostics چک نمایید.

  4. برای سرورهای ویندوزی می‌توان از نرم‌افزار HPS Report جهت گزارش گیری از تمام قسمت‌های سیستم استفاده نمود.

  5. برای سرورهای لینوکسی از ابزار Cfg2html برای گزارش گیری کامل استفاده می شود.