Оптимизация и реконструкция центра обработки данных: основные принципы

Эксперты рассказывают о правильных и ошибочных подходах к увеличению вычислительной мощности, энергетической и коммерческой эффективности дата-центров
09 сентября 2014, в 16:01

Многие центры обработки данных с точки зрения их владельцев недостаточно эффективны. Это относится и к коммерческим ЦОДам (предназначенным для оказания ИТ-услуг), и к корпоративным (предназначенным для внутренних нужд компании). Как правильно повышать вычислительную и коммерческую эффективность своего ЦОДа, оптимизируя затраты? В поисках решения этой проблемы iBusiness обратился к экспертам крупных российских ИТ-компаний.

Можно ли увеличить вычислительную мощность без крупных затрат?

Специалисты знают немало дешевых, но сомнительных методов повышения мощности. Простейший из них — это исключение из технологических процессов «необязательных» операций, без которых предоставление услуг с точки зрения пользователей не меняется, но значительная часть ресурсов высвобождается.

Например, очень ресурсоемки дисковые операции и перемещения больших объемов данных по сети. Чем чаще выполняется резервирование данных и чем больше доля резервируемых данных в общем объеме дата-центра, тем больше ресурсов тратится на эти операции — особенно при сложных логических схемах резервирования с большой глубиной бэкапов.

В принципе, можно резервировать все содержимое всех жестких дисков через каждые 10 минут с неограниченной глубиной архива. Но это абсурдное решение недопустимо снижает полезную мощность дата-центра, вызывает повышенный износ дисков и рост энергопотребления. И наоборот, полный отказ от всех бэкапов, столь же абсурдный, высвобождает много ресурсов, уменьшает износ и энергопотребление.

Балансируя между этими двумя крайностями, можно найти оптимальные схемы резервирования, равномерно распределяющие суточную нагрузку на систему и обеспечивающие максимум полезной мощности при достаточной надежности.

«Бесплатное» повышение мощности — без замены ПО или оборудования — почти всегда резко снижает надежность

«Бесплатное» повышение мощности — без замены ПО или оборудования — почти всегда резко снижает надежность. Кроме отказа от резервирования, повышения мощности можно достичь массовым включением дисков по схеме RAID-0, повышением температуры серверных помещений, прямой атмосферной вентиляцией с игнорированием нарастающего запыления, сокращением штата системных администраторов и объема профилактических работ с перераспределением средств на оборудование, «уплотнением» серверов множеством виртуальных машин до отказа и другими подобными методами. Их часто практикуют начинающие компании, всеми правдами и неправдами снижающие себестоимость своих услуг ради ценовой конкуренции с ветеранами рынка.

Эксперты не советуют использовать эти методы. Они могут показаться выгодными владельцу «сверхбюджетного» ЦОДа, но они безусловно невыгодны потребителям, рассчитывающим на надежное хранение своих данных.

Значительные ресурсы в дата-центре может высвободить оптимальный алгоритм ПО резервирования, исключающий избыточные операции и наложения пиковых нагрузок. То же самое относится и ко всему остальному ПО.

Значительные ресурсы в дата-центре может высвободить оптимальный алгоритм ПО резервирования, исключающий избыточные операции и наложения пиковых нагрузок

«Для повышения эффективности использования ЦОДа надо оптимально загружать вычислительные мощности и иметь хороший код, — рассказал Илья Шутов, начальник отдела решений OSS/BSS/ITSM «Техносерв». — «Кривой» алгоритм или «кривой» код могут снизить производительность вычислений в сотни и тысячи раз. Необходимо контролировать утилизацию оборудования, вовремя заниматься консолидацией, отключать неиспользуемую технику, своевременно переходить на инновационные типы оборудования и программы. Например, переход на SSD-накопители может дать многократный выигрыш: снижение электропотребления, многократное повышение производительности дисковой подсистемы с возможностью последующей оптимизации аппаратного комплекса, необходимого для работы информационной системы.

«Кривой» алгоритм или «кривой» код могут снизить производительность вычислений в сотни и тысячи раз

Оборудование ЦОДа должно быть загружено на пределе своих возможностей, но с необходимым запасом для обеспечения необходимого качества услуг (SLA). Даже мощное вычислительное средство может быть полностью «убито» неэффективным кодом или «узкими горлышками», например слабой шиной. Поэтому важно контролировать и соотносить эффективность использования аппаратных ресурсов, в первую очередь — самописного или заказного ПО с аналогичным промышленным».

Приобретение более современного ИТ-оборудования без модернизации инженерных систем здания — это относительно дешевый способ повышения мощности дата-центра. «Тщательный мониторинг энергопотребления позволяет найти резервы, за счет которых можно увеличить электрическую мощность, потребляемую вычислительным оборудованием, без существенного риска перегрузки инженерных систем, — рассказал Сергей Мищук, технический директор DataLine. — В этом случае осторожно расходуется запас по электрической мощности и охлаждению, обычно заложенный в проекте ЦОДа».

Практически все эксперты считают одним из лучших способов недорогого увеличения мощности дата-центра добавление к нему нового помещения малой площади с отдельными инженерными системами новейших моделей. Например, можно подготовить отдельную комнату без фальшпола, поставить в нее 4 – 6 стоек, собрать в них все самое горячее оборудование ЦОДа и обеспечить его интенсивное охлаждение с помощью внутрирядных кондиционеров и правильного разделения пространства на воздушные коридоры. Это избавит от самой затратной и рискованной работы — модернизации инженерных систем в действующем комплексе. В основном серверном зале высвободится значительная тепловая, электрическая и вычислительная мощность, а также множество мест в стойках.

Один из лучших способов недорогого увеличения мощности дата-центра — добавление к нему нового помещения малой площади с отдельными инженерными системами новейших моделей

Какие энергоэффективные технологии надо применять?

«Положительных результатов в энергосбережении можно добиться за счет использования технологии виртуализации и blade-систем, а также за счет балансировки нагрузки и активного управления приложениями, — уверен Илья Шутов. — Эти меры сокращают энергопотребление и тепловыделение основного оборудования на 10 – 20%, а значит, и расходы на охлаждение.

Основной идеей этого подхода является повышение загрузки оборудования без снижения качества услуг. Простаивающий сервер бесполезно тратит 15 – 30% от своей пиковой мощности. К этим пустым затратам добавляется нагрузка на систему охлаждения, блоки питания, систему резервирования и т.д. С помощью виртуализации можно разместить на одном физическом сервере несколько виртуальных. При грамотном мониторинге нагрузки или при построении вычислительных кластеров (объединение нескольких серверов в одну вычислительную ячейку) можно повысить загрузку оборудования, сократив не только прямые экономические потери на простоях, но и холостое потребление энергии.

Простаивающий сервер бесполезно тратит 15 – 30% от своей пиковой мощности

До 15% экономии электроэнергии дает выбор эффективной архитектуры кондиционирования помещения, до 12% — правильная планировка машинных залов, до 10% — выбор эффективного оборудования электропитания».

«Когда речь заходит об эффективном дата-центре, мы в первую очередь подразумеваем его инфраструктуру и коэффициент эффективности использования электроэнергии PUE, — рассказал Руслан Заединов, заместитель генерального директора и руководитель направления ЦОД и облачных вычислений компании КРОК. — Особенности работы системы холодоснабжения, длина электрических кабелей, компоновка — все эти архитектурные решения, принятые при строительстве, оказывают влияние на показатель PUE. ЦОД считается эффективным, когда PUE близок к единице. Чтобы этого добиться, необходимо хорошо продумать всю инфраструктуру дата-центра на этапе проектирования.

Максимальный эффект достигается за счет использования дизель-динамических ИБП и современных систем кондиционирования с утилизацией тепла — такое решение мы реализовали для ФСК ЕЭС в рамках проекта создания интеллектуального здания».

Максимальный эффект достигается за счет использования дизель-динамических ИБП и современных систем кондиционирования с утилизацией тепла

Какие проблемы бизнеса может решить виртуализация?

«Во-первых, виртуализация значительно увеличивает скорость развертывания новых вычислительных мощностей, — объясняет Сергей Мищук. — Это, в свою очередь, стимулирует развитие информационных систем, позволяет оперативнее реагировать на потребности бизнеса и быстрее выводить на рынок новые решения.

Во-вторых, виртуализация позволяет повысить среднюю загрузку оборудования и снизить стоимость вычислений. К сожалению, пока не все вычислительные системы хорошо виртуализируются (особенно высоконагруженные транзакционные системы). Возникают проблемы и с лицензированием программного обеспечения».

Не все вычислительные системы хорошо виртуализируются

«Сама по себе виртуализация не дает преимуществ бизнесу, — считает Илья Шутов. — Это обычный ИТ-инструмент. Он не позволяет решать проблемы бизнеса (такие как конкурентная борьба, соблюдение законодательства, логистика, плохие поставщики и т.п.). Зато виртуализация позволяет снизить затраты на поддержание ИТ-инфраструктуры и повысить отказоустойчивость за счет динамического управления виртуальной средой и упрощения процедур резервного копирования и восстановления».

Читать остальные материалы спецпроекта «Идеи для бизнеса: улучшаем центр обработки данных»