Азбука хранения данных: просто о сложном

1. Технологии хранения данных

Любая организация так или иначе работает с информацией, а значит, ей необходимо и надежное место для ее хранения. Количество информации сегодня растет с огромной скоростью. Согласно исследованиям ресурса TAdviser, c 2010 года объем хранящейся информации каждый год увеличивается на 50 %. При этом по-прежнему необходимо, чтобы хранение данных было надежным, а доступ к ним – быстрым.

Этим и объясняется популярность специальных программно-аппаратных комплексов – систем хранения данных (СХД). В настоящее время СХД используются почти везде, их используют для хранения документов, изображений, архивов самых разных компаний и учреждений – от небольшой сети магазинов до крупнейших государственных организаций, банков, предприятий и т. д. Кроме быстрого доступа к информации и ее защиты, они обеспечивают и возможность восстановления утраченных данных.

Хотя рыночный сегмент систем хранения информации весьма разнообразен, ведущие роли на нем играют хорошо известные многим крупные бренды. Большинство из них имеют большие партнерские и сервисные сети по всему миру. Кроме того, они имеют возможность инвестировать серьезные средства в разработку и продвижение своих решений. Около 80% рынка контролируют крупнейшие бренды, такие как Dell, EMC, Hewlett Packard Enterprise (HPE), , Fujitsu, Hitachi Data Systems, Veritas, Oracle, NetApp.

Специалисты делят СХД на три типа:

Дисковые – они считаются самыми популярными и экономичными. Тем не менее, они имеют ряд недостатков, главный из которых заключается в том, что они недостаточно быстрые в сравнении с СХД, построенными на flash.

Flash – самые быстрые системы хранения данных. На обработку запроса у таких СХД уходит всего 0,1 мс, тогда как у обычных дисковых средняя скорость 6-7 мс. Несмотря на их эффективность, flash-СХД долгое время не были особенно популярны ввиду их высокой стоимости и использовались в основном в гибридных системах вместе с дисковыми. В последние годы ситуация начала меняться. Flash-системы стабильно дешевеют и, соответственно, становятся все более массовыми. Кроме того, растет количество инфраструктур, построенных полностью на флеш – так называемых AFA-инфраструктур.

Ленточные – они отличаются стабильностью и возможностями длительного хранения, что вместе с относительно небольшой стоимостью делает их идеально подходящими для мультимедийных библиотек.

Другой способ классификации СХД - по типу архитектуры. Обычно таких типов тоже насчитывают три.

SAS (Server Attached Storage)

Хранилище, подсоединяемое к серверу или хранилище прямого доступа. В SAS устройства хранения являются частью хостинга, они связаны как с дисками, так и непосредственно с отдельным сервером или ленточными библиотеками. Этот вариант считается наиболее простым и экономичным. Является основой большинства систем хранения, работающих в современной ИТ-инфраструктуре.

NAS (Network Attached Storage)

NAS – это хранилище, подключаемое по сети, основным отличием которого является гибкость и централизованное управление. NAS-сети лучше всего подходят для небольших офисов или отделов предприятий, поскольку системы такого типа достаточно просто администрировать. Из недостатков стоит отметить зависимость от скорости сети и низкую масштабируемость.

SAN (Storage Area Network)

SAN – хранилище, использующее для подключения оптико-волоконный кабель. Поэтому, кроме плюсов, присущих NAS, имеет высокую скорость доступа. С помощью SAN любой сервер может получить доступ к любому накопителю, не перегружая при этом ни другие серверы, ни корпоративную локальную сеть. SAN-системы также обладают высокой гибкостью, масштабируемостью и отказоустойчивостью.

3. Оптимизация хранения данных

Оптимизация хранения данных повышает эффективность предприятия, что насущно всегда, а в кризис - особенно. Плюсами правильного подобранного СХД может стать существенное сокращение затрат на ИТ-инфраструктуру и администрирование, а также ускорение работы бизнес-приложений.

Чтобы хранение данных стало по-настоящему эффективным, нужно прежде всего изучить ситуацию – понять, где и как используется информация в компании, и расставить приоритеты. Исходя из этого анализа, можно определить, какие именно технологии целесообразно применить.

Наиболее эффективным способом оптимизации хранения данных является использование специального программного обеспечения, которое позволяет повысить надежность и производительность оборудования без его апгрейда - программно-определяемых хранилищ (SDS). Не меньшую эффективность демонстрирует и переход на облачные сервисы - это позволяет снять с используемой компанией аппаратной платформы значительную часть вычислительной нагрузки, тем самым оптимизировав работу всего офиса.

По мнению аналитиков, именно нацеленность компаний на экономичность станет основной тенденцией на ближайшие несколько лет. Требования к хранению данных продолжают постоянно повышаться, но, тем не менее, внимание компаний будет все больше сосредоточено на минимизацию затрат на развитие ИТ-инфраструктуры и ускорение окупаемости новых инвестиций до 6–8 месяцев.

Исходя из того, что мировой объем информации ежегодно увеличивается, для ее хранения нужны все более емкие и быстрые решения. Так что СХД развивается в первую очередь в сторону увеличения физической плотности записи на накопителях и технологии оптимизации хранения данных. Основной тренд сегодня – использование технологий дедупликации данных на прикладном и системном уровнях. Это позволяет обойтись системами хранения меньшей физической емкости и тем самым удешевляет их, избегая при этом снижения производительности. При этом активно используются средства виртуализации внешних хранилищ, технологии динамического выделения емкости приложениям, компрессия, высокоэффективное клонирование. Использование этих инструментов позволяет снизить потребность в дисковом пространстве и достичь существенной экономии объема накопителей – от 25 до 90 %.

При этом необходимо понимать, что эффективность от оптимизации хранения данных достигается не одним разовым действием - это постоянный комплексный процесс, включающий в себя оценку результативности использования своих ресурсов и улучшение этого использования, вводя новые технологии или более грамотно используя имеющиеся.

4. Оптимизация баз данных

Как правило, чем больше база данных, тем выше требования к ее оборудованию. Однако существуют и другие факторы – например, количество одновременных пользователей и сеансов, пропускная способность транзакций и типы операций, которые выполняются внутри базы. Требования к базе данных с редко меняющимися данными будут более скромными, чем к хранилищу объемом в терабайты, содержащему постоянно обновляющиеся сведения, такие как данные о продажах, товарах и клиентах крупной организации. Кроме пространства на диске, хранилищу требуются более быстрые процессоры, чтобы держать в памяти много данных и оперативнее обрабатывать запросы.

В целом, часто эффективным решением является изменение архитектуры и внутренней логики самой базы данных, которая используется для работы приложений. В ней удаляются неиспользуемые строки/ячейки, которые мешают быстрому получению оперативной и статистической отчетности. На первый взгляд, задача простая, но в реальности такую работу с базами данных могут проводить только квалифицированные инженеры, обладающие компетенцией и в области внедрения баз данных, и в сфере развертывания современных СХД.

Теперь вы в общих чертах представляете себе необходимость оптимизации хранения данных и рынок систем, предназначенных для этого. Выбор нужно именно для вашего бизнеса зависит во многом от его специфики и объема обрабатываемых данных.

Нашли опечатку? Выделите фрагмент и нажмите Ctrl+Enter.