КАДРОВАЯ ПОЛИТИКА ВО ВРЕМЯ КРИЗИСА: ВОЗМОЖНОСТИ И РИСКИ

7 владельцев самых больших массивов данных в мире

Один из ведущих специалистов по повышению эффективности бизнеса Бернард Марр предлагает воспользоваться опытом передовых компаний по части использования больших данных для достижения своих целей
16 февраля, в 17:45
Страница

Cloudera: строим каркас

Менее известная, чем другие компании, которые я здесь упомянул, Cloudera набрала популярность в последние годы как один из самых известных поставщиков решений Apache Hadoop. Apache Hadoop, как я уже говорил, — это программный каркас для обработки больших данных. Хотя Apache Hadoop — фреймворк с открытым исходным кодом (бесплатный) — предоставлялся в несколько сыром виде, бизнес быстро рос и развивался, обеспечивая компании системами, предназначенными для упрощения процесса сбора и анализа данных, которые могут быть настроены в зависимости от требований и масштабов бизнеса.

Cloudera является лидером в этом направлении, она также четко выполняет все обязательства по отношению к бесплатной технологии, на которой построена система, перечисляя часть своей прибыли в фонд, который поддерживает Hadoop.

Kaggle: соревнования по большим данным

Еще один новичок построил свой бизнес в сфере больших данных с нуля. Компания Kaggle впервые представила обработку и анализ данных как соревнование, как конкурс, предлагая вознаграждение за решение различных задач, стоящих перед отраслью.

Компании предоставляют выборки данных и задачи, которые они пытаются решить с помощью интеллектуального моделирования — например, сделать подборку фильмов на сервисе потокового просмотра кино в соответствии с тем, что клиент захочет посмотреть дальше. После поисков лучшей модели и оценки точности прогноза определяется победитель, которому компания-заказчик выплачивает вознаграждение.

Клиенты компании пользуются услугами 150-тысячной сильной армии ученых и специалистов по анализу и обработке данных — как профессионалов, так и любителей — к Kaggle можно обратиться за помощью с любой проблемой. Среди клиентов компании NASA, Google, Wikipedia и Microsoft. Более подробную информацию о Kaggle вы можете получить, прочитав мою статью: The Amazing Big Data World of Kaggle and the Crowd-Sourced Data Scientist («Удивительный мир больших данных Kaggle, или Обработка и анализ данных с помощью краудсорсинга»).

Бернард Марр — основатель и СЕО Advanced Performance Institute, автор бестселлеров о повышении эффективности бизнеса.

Оригинал публикации на английском языке

Страница