تغییر دیتاسنتر


در هفته گذشته بالاخره بعد از تحمل 2 سال سختی و مشکلات در دیتاسنتر م.ن سرور را منتقل کردیم. مشکلات دیتاسنترهای داخلی تمامی ندارد و این موضوع جدیدی نیست، حس رهایی که چند شب گذشته داشتم با هیچ چیز قابل مقایسه نیست. داستان از تـ شروع شد، در ابتدا به نظر همه چیز خوب بود تا اینکه بازدیدهای سایت ها بالا رفت و فاکتورهایی که چپ و راست برای پهنای باند صادر می شد.

در تـ اخر هر ماه فاکتوری به دست ما میرسید که مثلا این ماه مقداری از پهنای باند بیشتر استفاده کردید و مثلا فلان رقم را واریز کنید، تا اینجا عجیب نیست ولی وقتی گزارشی از مصرف وجود ندارد و شما نمی دانید مثلا چقدر می توانید مصرف کنید یا چقدر مصرف کردید و چقدر اضافه مصرف شده عجیب است، بیشتر مشکلات در تـ بر سر مصرف پهنای باند بودی که نه ما می دانستیم چقدر است و کی تمام شده است!

به هرحال تا زمانی که سایت ها گروگان بودند و با یک اشاره ممکن بود همه چیز خاموش شود چاره ای جز پرداخت هر مبلغی که می خواستند نبود، بالاخره بعد از 4 سال از تـ خارج شدیم و به م.ن رفتیم، جالب اینکه فاکتورهای پهنای باند همچنان می رسید، رقم آخرین فاکتور انقدر بالا بود که صدای ما در امد البته دیگر سایت ها آنجا نبودند که نگران قطعی باشیم و آنها که این موضوع را متوجه شدند که دیگر اهرم فشاری ندارد از در تهدید و شکایت وارد شدند در نهایت معلوم شد بدلیل مشکلات زیرساخت به کل شبکه نفوذ شده و پهنای باندی که مصرف میشده ربطی به ما نداشته، بماند که ما پرداخت کردیم. (تـ و م.ن به اختصار اورده شده)

در اوج فعالیت سایت ها وارد دیتاسنتر جدید شدیم، در اینجا قول دادند که محدودیتی برای پهنای باند وجود نداشته باشند و واقعا هم همینطور بود. همیشه باید انصاف را رعایت کرد و تمامی جوانب موضوع را گفت، به هرحال در ابتدا مشکل خاصی که امروز به خاطر داشته باشم وجود نداشت ولی کم کم قطعی های سرور زیاد شد، دائما ایمیل هایی برای Maintenance می گرفتم که مثلا از ساعت 12 نیمه شب تا 4 صبح شبکه اختلال دارد، طبق برنامه ریزی دیتاسنتر ما به کاربران اطلاع می دادیم که سایت ها قطع می شود و تیم فنی ما نیز پیگیر بود و مثلا در ساعت فوق هیچ خبر نبود، چند روز بعد ایمیل دوباره که در تاریخ قبلی امکان سرویس و نگهداری نبوده و مثلا امشب این کار انجام می شود. جوری دست و پای ما بسته می شد که مثلا به شما بگویند امشب عروسی است و شما 4 ساعت فرصت دارید مراسم را برپا کنید، لباس عروس بدوزید و کارت دعوت طراحی، چاپ و پخش کنید!

داستان جالب تر هم می شود منظور از اختلال در شبکه قطع کل سرور است، نه برای 4 ساعت، در یک مورد شخصا به یاد دارم که 3 شبانه روز کامل سرور خارج از دسترس بود، مشتریان ما فکر کردند ما پول سفارشات را گرفتیم و فرار کردیم. مشکل قطعی به این صورت حداقل 2 بار دیگر تکرار شد و سرور برای بیشتر از 24 از دسترس خارج شد، قطعی های موقت برای یکی دو ساعت که دیگر خوراک روزانه ما بود، انقدر پیام های عذرخواهی به کاربران و مشتریان فرستادیم که دیگر متن پیام ها تکراری شده بود، دیتاسنتر حتی برای یکبار نه تماسی، نه ایمیلی، نه پیامکی برای عذرخواهی یا جبران خسارت نفرستاد!

مشکلات ما با این دیتاسنتر به همین جا ختم نشد و دقیقا 3 ماه پیش ناگهان تمامی rule های فایروال قبل سرور حذف شد، سرور ما که دائما زیر Attack قرار داشت چندین بار هنگ کرد،  ما سریعا پیگیر موضوع از کار افتادن فایروال شدیم و جواب درستی نگرفتیم، به هرحال فایروال دوباره به حالت قبل برگشت ولی داستان دقیقا 2 هفته پیش تکرار شد، اگر بار اول اتفاقی بود و مثلا یکی از کارمندان دیتاسنتر rule ها را حذف کرده بود اینبار دیگر اتفاقی نبود و مطمئنا به صورت عمدی داشتن خرابکاری می کرد.

در نهایت تصمیم بر این شد که از آن دیتاسنتر خارج شویم. مشکلات فنی و حادثه در همه جای دنیا وجود دارد، اینکه چگونه با آن ها برخورد کنیم و از تکرار آن جلوگیری کنیم یا حتی خسارت وارده را جبران کنیم مهم است.

نظرات

برای ارسال نظر باید وارد حساب کاربری شوید. ورود یا ثبت نام
لینک کوتاه