Eng
  • ссылка на telegram
  • Arenadata
  • Arenadata для инвесторов
  • Cluster Manager
  • ссылка на habr
  • ссылка на youtube
  • ссылка на ВКонтакте
  • ссылка на GitHab
  • ссылка на Linkedin
  • Карьера
  • Обучение
  • Партнёры
  • Документация
  • Техподдержка Получить консультацию
    ArenaData логотип ArenaData логотип

    по нашим данным

    время быть лидером

  • О группе
    По нашим данным
    Время быть лидером
    О Группе Подробнее
  • О компании
  • Работа в Arenadata
  • Партнёры
  • Мероприятия
  • Сотрудничество с вузами
  • Маркетинговые материалы
  • Новости
  • Arenadata в СМИ
  • Блог
  • Сертификаты
  • Следите за Аrenadata
  • Контакты
  • Платформа
    По нашим данным
    Все впереди
    Платформа Подробнее
    Cloud Native
  • Arenadata One (AD.ONE)
  • Хранение и обработка
  • Arenadata DB (ADB)
  • Arenadata Hadoop (ADH)
  • Arenadata QuickMarts (ADQM)
  • Arenadata Prosperity (ADP)
  • Arenadata Postgres (ADPG)
  • Picodata (PD)
  • Загрузка и трансформация
  • Arenadata Streaming (ADS)
  • Управление данными и контроль их качества
  • Arenadata Catalog (ADC)
  • Arenadata Harmony MDM (AD.MDM)
  • Data Quality Framework (DQF)
  • Гражданский фактор
  • Администрирование
  • Arenadata Cluster Manager (ADCM)
  • Дополнительно
  • Решения партнеров
  • Замещение иностранных СУБД
  • Облачные версии продуктов
  • Услуги
    По нашим данным
    Все получится
    Услуги Подробнее
  • Техническая поддержка
  • Технический аккаунт-менеджмент
  • Технический аудит
  • Надежный старт
  • Программа приоритетного внимания Arenadata DB
  • Клиенты и отрасли
    По нашим данным
    Вас ждет успех
    Клиенты и отрасли Подробнее
    Отрасли
  • Финансовые организации
  • РСХБ
  • Росбанк
  • Ак Барс Банк
  • Ритейл, электронная коммерция и FMCG
  • Магнит
  • X5 Group
  • Промышленность и энергетика
  • Газпром нефть
  • Государственный сектор
  • ФНС России
  • Счётная палата Российской Федерации
  • Департамент информационных технологий Москвы
  • Телекоммуникационные компании
  • Beeline KZ («КаР-Тел»)
  • Транспортные компании
  • Инвесторам
  • Подробнее
  • О компании
  • Работа в Arenadata
  • Партнёры
  • Мероприятия
  • Сотрудничество с вузами
  • Маркетинговые материалы
  • Новости
  • Arenadata в СМИ
  • Блог
  • Сертификаты
  • Следите за Аrenadata
  • Контакты
  • Подробнее
    Cloud Native
  • Arenadata One (AD.ONE)
  • Хранение и обработка
  • Arenadata DB (ADB)
  • Arenadata Hadoop (ADH)
  • Arenadata QuickMarts (ADQM)
  • Arenadata Prosperity (ADP)
  • Arenadata Postgres (ADPG)
  • Picodata (PD)
  • Загрузка и трансформация
  • Arenadata Streaming (ADS)
  • Управление данными и контроль их качества
  • Arenadata Catalog (ADC)
  • Arenadata Harmony MDM/
  • Data Quality Framework (DQF)
  • Гражданский фактор
  • Администрирование
  • Arenadata Cluster Manager (ADCM)
  • Дополнительно
  • Решения партнеров
  • Замещение иностранных СУБД
  • Облачные версии продуктов
  • Подробнее
  • Техническая поддержка
  • Технический аккаунт-менеджмент
  • Технический аудит
  • Надежный старт
  • Программа приоритетного внимания Arenadata DB
  • Подробнее
  • Финансовые организации
  • РСХБ
  • Росбанк
  • Ак Барс Банк
  • Ритейл, электронная коммерция и FMCG
  • Магнит
  • X5 Group
  • Промышленность и энергетика
  • Газпром нефть
  • Государственный сектор
  • ФНС России
  • Счётная палата Российской Федерации
  • Департамент информационных технологий Москвы
  • Телекоммуникационные компании
  • Beeline KZ («КаР-Тел»)
  • Транспортные компании
  • Инвесторам
  • Карьера
  • Обучение
  • Партнёры
  • Документация
    • ссылка на telegram
    • Arenadata
    • Arenadata для инвесторов
    • Cluster Manager
    • ссылка на habr
    • ссылка на youtube
    • ссылка на ВКонтакте
    • ссылка на GitHab
    • ссылка на Linkedin
    Техподдержка Получить консультацию
    Eng
    • Главная
    • О группе
    • Новости

    Hadoop для цифровой трансформации

    10.05.2017

    Три года назад Сергей Золотарев, глава представительства Pivotal в России и СНГ, на форуме BIG DATA 2014 говорил о том, как важно уметь «прикрутить» Hadoop к реальным корпоративным ИТ-средам (см. «BIG DATA 2014: интеграторы миров», «Computerworld Россия», 16 апреля 2014). В 2017 году на очередном форуме BIG DATA он, уже в качестве руководителя направления по разработке линейки собственных продуктов компании IBS для работы с данными, представил российскую версию дистрибутива Hadoop. В «Computerworld Россия» расспросили Золотарева о том, что произошло на российском и мировом рынке Hadoop за эти годы, для чего рынку еще один дистрибутив и чем российская разработка отличается от зарубежных (см. «Hadoop для цифровой трансформации», «Computerworld Россия», 10 мая 2017).

    Ситуация изменилась кардинально. Три-четыре года назад на Hadoop делались в основном пилотные проекты – крупные телеком-компании и банки только приглядывались к этой платформе. Сейчас крупнейшие игроки на рынке коммерческих приложений, такие как SAP, SAS, IBM, Tableau, стали использовать Hadoop в качестве стандартной платформы хранения данных наряду с традиционными СУБД. И это, безусловно, с одной стороны облегчило адаптацию Hadoop в корпоративную инфраструктуру, потому что за эту задачу взялись крупнейшие вендоры. С другой стороны, интерес гигантов дал зеленый свет для инвесторов, и в разработки вокруг Hadoop хлынули огромные инвестиции. Hadoop превратился в огромную экосистему, в разработку которой вложены сотни миллионов долларов и миллионы человеко-часов.

    Раньше Hadoop был отдельной системой для решения определенных задач, сейчас же его стандартно используют в связке с BI-системами в качестве платформы хранения, на его основе строят универсальные платформы хранения, к которым обращаются другие информационные системы. Это большой скачок.

    Поменялась парадигма. Раньше пытались интегрировать традиционные хранилища данных и Hadoop, причем хранилища были главными, теперь хранилища остались для решения старых задач, а под новые аналитические задачи строится платформа сбора и анализа данных на базе Hadoop. Если для решения этих задач нужны какие-то данные из хранилища, то они достаются из хранилища, которое становится всего лишь одним из источников данных для этой платформы.

    Отчасти поэтому, на мой взгляд, уходят из употребления такие термины, как «озера данных», и даже сам термин «Большие Данные». Все чаще в ходу понятие Data Platform, или Enterprise Data Platform – платформа работы с данными данных.

    Именно она становится основой цифрового бизнеса, цифровой трансформации. И те компании, которые в это вовремя осознали и начали строить свои платформы данных, как минимум на шаг опередили своих конкурентов.

    – Почему вы решили создать свою версию дистрибутива Hadoop?

    – В ходе проектов у заказчиков наша команда очень часто слышала, что в дистрибутиве Hadoop не хватает тех или иных компонентов, что версии компонентов, которые есть в базовой сборке, не устраивают и т. д. Удовлетворяя эти пожелания, дорабатывая дистрибутив, мы приобрели ценный опыт, а кроме того, поняли, как нужно правильно собирать дистрибутив и чего не хватает заказчику.

    Следующий важный момент – доступность сложной экспертизы по решению. И касается это не только России, но и Европы в целом. Для основных разработчиков дистрибутивов Hadoop главный рынок – это рынок США. А еще точнее – рынок Калифорнии, потом остальной американский рынок, потом Великобритании. Европа, и тем более Россия для них не так важны. Я могу это сказать по своему опыту, поскольку сам работал в крупном западном вендоре. Ресурсы на Европу и Россию выделяются крайне ограниченно, специалистов очень мало, поддержка доступна только удаленно, и к тому же такого качества, что не всегда позволяет устранить проблемы, возникающие в ходе комплексных проектов.

    В какой-то момент мы поняли, что недостатки имеющихся на рынке продуктов, в сочетании с высокими ценами на их доработку под заказчика и поддержку, создали нишу для отечественного дистрибутива Hadoop, и если его сделать, то он будет востребован рынком. В 2015 году мы присоединились к Open Data Platform Initiative, международному сообществу разработчиков программных продуктов с открытым кодом в области Больших Данных. В прошлом году созданный нами дистрибутив ArenaData Hadoop был сертифицирован по спецификации ODPi, сравнявшись в этом отношении с разработками крупнейших западных компаний.

    – Почему ваша команда вошла в состав IBS?

    – Мы искали партнера, который, с одной стороны, хорошо понимает данную проблематику и имеет сложившуюся практику по работе с данными, а с другой – сфокусирован на построении для своих клиентов универсальных платформ данных на основе проектов с открытым кодом. IBS заинтересована в развитии портфеля собственных решений, и наш проект является площадкой для разработки целой линейки новых продуктов.

    – В чем отличия вашего дистрибутива от иностранных аналогов?

    – «Технически» наш продукт от западных аналогов не отличается, да и не должен, потому что есть единая, утвержденная ODPi спецификация, как должен собираться дистрибутив Hadoop, и мы ей следуем. ArenaData Hadoop – полноценный корпоративный дистрибутив, в нем полный набор средств, позволяющих автоматизировать процесс установки и планирования кластера Hadoop, дальнейшие процессы, связанные с его мониторингом, администрированием, модернизацией и т. д. Для российских пользователей принципиальное преимущество использования нашего дистрибутива – это прежде всего доступная локально экспертиза по разработке архитектуры решения, русскоязычная документация, поддержка на русском языке, более доступные цены на специалистов и поддержку.

    Мы готовы предоставить ArenaData Hadoop не только как программное обеспечение, но и как программно-аппаратный комплекс на базе разработанной в IBS платформы «Скала-Р» с единой поддержкой всего комплекса. Последнее важно: я уже говорил, что большая наша проблема сейчас – отсутствие экспертизы, подкрепленной реальным опытом.

    Особого акцента на том, что это полностью российское, «импортозамещающее» решение, мы не делаем, но тем не менее это так. Это российский продукт, и для тех организаций, где этот момент важен, у нас есть теперь что предложить.

    Важная техническая особенность ArenaData – мы собрали все необходимые репозитории не только для Hadoop, но и для всего программного окружения в пакет, который можно развернуть без подключения к Интернету. Работая у крупнейших российских заказчиков, мы столкнулись с тем, что практически у всех создан закрытый контур, нет возможности выхода в Интернет из корпоративной сети, а все существующие на тот момент дистрибутивы предполагали, что установка идет в режиме онлайн и все вспомогательные утилиты, библиотеки и т. п. скачиваются с самых разных сетевых ресурсов.

    – Как потом продукт обновлять, тоже офлайн?

    – Да, тоже через съемные носители. Мы это предусматриваем при создании новых релизов продукта.

    – Насколько вырос спрос на Hadoop в России?

    – Если еще два-три года назад за проекты с использованием Hadoop у нас брались телекоммуникационные компании и банки из первой тройки, то сейчас в этих сферах, а также в ретейле, в промышленности задачи по его внедрению готовы ставить уже компании из первого десятка. Многие госкомпании так или иначе попробовали у себя эту технологию и нашли те задачи, которые можно эффективно решать с помощью Hadoop.

    Мы, конечно, по-прежнему еще отстаем от Запада, где у крупных компаний и банков Hadoop стал частью типовой ИТ-инфраструктуры. Даже если они еще не начали использовать Hadoop, в ИТ-стратегии есть пункт, касающийся внедрения этой технологии. Там понимают, что на сегодняшний день нет реальной альтернативы Hadoop для построения универсальной платформы данных.

    Автор: Дмитрий Гапотченко

    Читайте также

    07 Мая
    Группа Arenadata публикует промежуточные результаты за 1 квартал 2025 года
    29 Апреля
    Arenadata официально представила облачную платформу Arenadata One
    29 Апреля
    Как Data Governance меняет бизнес: кейсы и инсайты
    28 Апреля
    Когда данные подводят: как хаос в информации мешает бизнесу расти
    28 Апреля
    Сбить температуру: зачем компаниям охлаждать данные и как это делать эффективно
    25 Апреля
    Big Data больше не эксперимент: бизнес ждёт быстрых результатов
    25 Апреля
    DataCatalog и DBI стали партнёрами
    23 Апреля
    Группа Arenadata объявляет итоги Дня инвестора
    21 Апреля
    Группа Arenadata приобретает интеллектуальные права на продукт в сегменте СУБД общего назначения
    15 Апреля
    Совет директоров Группы Arenadata рекомендует дивиденды по итогам 2024 и 1 квартала 2025 года
    14 Апреля
    Группа Arenadata инвестировала в компанию-разработчика MDM-решений
    14 Апреля
    Управление данными в финансовом секторе. Как справиться с неопределенностью в цифровую эпоху

    Подпишитесь на нашу рассылку и получайте полезную информацию прямо на электронную почту

    Новостная рассылка 1 раз в месяц. Отправляем только самое интересное: топовые статьи в СМИ и на Хабре, записи мероприятий, приглашения на ивенты и самые важные новости.

    ошибка! проверьте правильно ли вы заполнили поля

    Спасибо, что подписались!

    Адрес офиса г. Москва, ул. Годовикова д. 9, стр. 17
    info@arenadata.io Подписаться на рассылку
    Техническая поддержка +7 (495) 260-20-25
  • Скачать ПО
  • Партнёры
  • Вакансии
  • Обучение
  • Инвесторам
  • Документация
  • Контакты
  • Платформа
  • Услуги
  • Техподдержка
  • О компании
    • ссылка на telegram
    • Arenadata
    • Arenadata для инвесторов
    • Cluster Manager
    • ссылка на habr
    • ссылка на youtube
    • ссылка на ВКонтакте
    • ссылка на GitHab
    • ссылка на Linkedin
    Политика конфиденциальности Политика в отношении обработки персональных данных Кодекс корпоративной этики и антикоррупционной политики Согласие на обработку персональных данных Сведения о сookies-файлах Результаты СОУТ Дисклеймер
  • Скачать ПО
  • Документация
  • Инвесторам
  • Вакансии
  • Обучение
  • Партнёры
  • Контакты
  • Платформа
  • Услуги
  • Техподдержка
  • О компании
  • Блог
  • Если вы обнаружили ошибку на сайте, напишите, пожалуйста, на web@arenadata.io

    © ООО «Аренадата Софтвер», 2025 Eng

    Спасибо, что написали нам!

    Мы обработаем заявку и свяжемся с вами в ближайшее время.

    Будем рады помочь!

    Отправьте ваш вопрос через форму ниже, и наши специалисты свяжутся с вами в ближайшее время.

    Фамилия *
    Имя *
    Эл. почта *
    Телефон *
    Наименование компании *
    Опишите ваш вопрос
    ошибка! проверьте правильно ли вы заполнили поля

    Этот сайт использует cookie-файлы и другие технологии, чтобы помочь вам в навигации, а также предоставить лучший пользовательский опыт, анализировать использование наших продуктов и услуг, повысить качество рекламных и маркетинговых активностей.

    Находясь на нашем сайте, вы соглашаетесь с тем, что мы используем куки-файлы

    Наша платформа вобрала в себя лучшие data-сервисы с открытым исходным кодом.
    понятно