КИПиА

Промышленная автоматизация

ИБП

Источники бесперебойного питания

Аварии в ЦОД и как их избежать – изучаем опыт UniSuper и Amazon

Чтобы минимизировать вероятность даунтайма, эксперты рекомендуют владельцам и операторам ЦОД перенимать успешный опыт коллег и учиться на чужих ошибках.

Пожар в дата-центре нарушил работоспособность сервисов австралийской компании UniSuper

Клиенты австралийской фонда пенсионного обеспечения UniSuper лишились возможности получить доступ к своим аккаунта в фирменном сервисе компании после пожара в мельбурнском дата-центре, где размещено ее IT-оборудование.

Во время пожара данные не были потеряны или скомпрометированы, но работоспособность IT-инфраструктуры была нарушена. Из соображений безопасности представители UniSuper отказались делиться сведениями о том, в каком именно ЦОД произошел инцидент. Сообщается лишь, что он затронул арендованную серверную ферму, которая расположена рядом с портом.

Учитывая тот факт, что инцидент произошел в портовой зоне Мельбурна, местные журналисты пришли к выводу, что он затронул коммерческий ЦОД одного из следующих колокейшн-провайдеров: Vocus, NextDC и Equinix. Интересно, что компания UniSuper является инвестором Vocus и NextDC.

Как Amazon предотвращает перебои в работе с дата-центров?

Владельцы и операторы гипермасштабных дата-центров вроде гиганта электронной коммерции Amazon часто создают свои собственные инфраструктурные технологии и решения на их основе, если они пока еще недоступны на рынке, или когда компании вроде Amazon приходят к выводу о наличии возможности своими силами существенно удешевить инфраструктуру.

Одна из технологий, разработанных специалистами корпорации Amazon, предназначена для того, чтобы обойти некорректную расстановку приоритетов. Как отметил вице-президент и один из ведущих инженеров Amazon Джон Гамильтон, эта технология помогла его компании избежать проблем, которые вызвали уход в офлайн многих ЦОД.

Так, дата-центр авиакомпании Delta Airlines прошлым летом именно по этой причине утратил работоспособность из-за поломки электрораспределительной системы, на починку которой потребовалось очень много времени. В конечном счете, этот даунтайм обошелся авиакомпании в 150 миллионов долларов США.

Источник: TELECOMbloger

США, Emerson

01.06.2017, 2186 просмотров.