История развития Arenadata Catalog
Arenadata Catalog — относительно новый продукт в портфеле Группы Arenadata, но стремительно развивающийся на волне импортозамещения. Он был создан на базе open source платформы OpenMetadata с учётом требований российских клиентов. Первая версия ADC появилась в конце 2021 года в ответ на спрос рынка на отечественный инструмент класса Data Governance. Быстрый цикл обновлений позволил к 2023 году существенно нарастить функциональность продукта: от поддержки расширенных типов бизнес-терминов и Data Lineage до интеграции с внешними системами и встроенных workflow-процессов Data Quality.
Важным этапом стало включение Arenadata Catalog в Единый реестр отечественного ПО, что подтвердило его статус российского продукта. Этот шаг укрепил доверие со стороны государственных и коммерческих заказчиков, которым важно использовать реестровые решения. В 2022–2023 годах Arenadata Catalog доказал свою готовность заменить зарубежные аналоги: рынку требовалась оперативная замена иностранных data-catalog-систем, и отечественный продукт быстро занял эту нишу. В составе дата-платформы Arenadata каталог данных интегрирован с другими её компонентами, такими как СУБД и средства потоковой обработки, что стало ещё одним драйвером развития.
В 2024–2025 годах Arenadata Catalog вышел на новый уровень: помимо получения высшей категории доверия по безопасности, продукт вошёл в масштабные проекты по построению корпоративных платформ данных в крупнейших компаниях страны.
Секрет популярности каталогов данных
Большинство крупных компаний уже оперируют терабайтами информации, но сам по себе объём данных не приносит пользы: ценность возникает только тогда, когда сведения точны, актуальны и легкодоступны. Ошибочные или устаревшие данные ведут к просчётам в планировании, потере лояльности клиентов и репутационным рискам. Решить задачу помогают каталоги данных (data catalog) — централизованные платформы, которые описывают все информационные активы предприятия и задают единые правила для их использования.
Data catalog не ограничивается регистрацией источников. Он связывает между собой базы данных, ETL-процессы, витрины, BI-дашборды и бизнес-пользователей, формируя сквозной контекст: от происхождения поля в таблице до конечного отчёта. Благодаря этому повышается качество данных, снижаются риски при принятии решений на основании недостоверной информации и упрощается соблюдение требований регуляторов и внутренних политик безопасности.
Эффективный каталог неизбежно становится центром экосистемы Data Governance. Data Governance — это специальный процесс, который помогает управлять качеством данных во всей компании. В рамках этой практики компания внедряет единые стандарты данных, проектирует архитектуру хранилищ с модулями контроля качества и устанавливает прозрачные правила доступа, ролей и ответственности. Каталог фиксирует, кто и как использует каждый набор данных, а инструменты качества отслеживают отклонения и запускают процессы исправления.
Сотни организаций в России и мире уже сделали каталог данных фундаментом своей стратегии data-driven: он выстраивает единую карту данных в компании, ускоряет вывод аналитических инициатив и минимизирует ошибки.
Основной функционал Arenadata Catalog
Arenadata Catalog — это полнофункциональный инструмент для организации совместной работы с данными и внедрения практик Data Governance в компании. Его ключевая ценность —объединение в одном интерфейсе всех знаний: технических метаданных, бизнес-терминов, показателей, правил качества и ответственности за данные.
Продукт обеспечивает ведение корпоративного глоссария, тесно интегрированного с каталогом данных. Термины, их определения, связи с системами и метриками — всё хранится централизованно, что устраняет разночтения и дублирование понятий. Пользователи получают удобный поиск информации о данных и связанных объектах, что ускоряет аналитику и разработку новых процессов. Удобство и скорость поиска бизнес-терминов значительно повышают эффективность работы.
Arenadata Catalog легко встраивается в существующий ландшафт компании. Он может сканировать и интегрировать метаданные из разных систем хранения и анализа. Доступны коннекторы к популярным СУБД (Greenplum/ADB, PostgreSQL, Oracle), BI-платформам и ETL-инструментам. Это позволяет собрать карту данных организации в одном месте. Каталог поддерживает визуализацию Data Lineage вплоть до колонки в таблице и бизнес-термина. Благодаря этому аналитики и дата-инженеры получают представление об источниках и происхождении данных, а подразделения — взаимосвязи метрик, что снижает риск ошибок и дублирования. Помимо описания данных, ADC помогает контролировать их качество. В системе ведётся реестр правил, результаты профилирования и даже журнал проверок, связанных с бизнес-терминами. С помощью интеграции с модулем Data Quality Framework или внешними DQ-инструментами каталог позволяет настроить выполнение проверок качества данных в таблицах и в процессе передачи данных. Встроенные механизмы workflow на базе Camunda дают возможность автоматизировать рутинные процессы управления: согласование терминов, назначение ответственных, обработку запросов на доступ и так далее. Автоматизация снимает нагрузку с сотрудников: типовые задачи выполняются быстрее и с меньшим числом ошибок. В продукте также продумана удобная система алертов, которая предупреждает о важных изменениях в ландшафте данных.
Разработчики Arenadata Catalog уделили особое внимание UX, чтобы бизнес-пользователи и аналитики без труда освоили новый инструмент. Интерфейс и вся документация полностью локализованы на русский язык. Система имеет простую ролевую модель разграничения прав, интегрируется с корпоративными системами единого входа для удобной аутентификации. Благодаря понятному веб-интерфейсу пользователи могут сами находить нужные данные, помечать наборы тегами (например, пометка персональных данных) и собирать словари терминов под свои задачи. Специалисты Arenadata обеспечивают качественную техническую поддержку на русском языке: доступен портал технической поддержки для оперативного получения консультаций и решения инцидентов. Уже создано несколько курсов по обучению как технических специалистов, так и рядовых пользователей, что даёт возможность компаниям в кратчайшие сроки начать использование продукта.
С самого начала разработки в ADC было уделено внимание информационной безопасности — это подтвердил и сертификат ФСТЭК. Система поддерживает все необходимые функции защиты от несанкционированного доступа (role-based access control, audit log, шифрование каналов), благодаря чему может эксплуатироваться даже в защищённых контурах. Для многих заказчиков из финансового сектора и госструктур критично, что Arenadata Catalog можно использовать для работы с персональными данными и другими конфиденциальными сведениями повышенного уровня защищённости.
Arenadata Catalog приносит бизнесу ощутимую пользу: ускоряет получение достоверной аналитики, повышает прозрачность и качество данных, сокращает операционные риски. Неслучайно более 60% клиентов Arenadata — это крупнейшие компании страны (из списка РБК 500), для которых управление данными стало стратегической задачей.
Клиентские кейсы
Один из ярких примеров использования Arenadata Catalog — банк ВТБ, который в 2024 году перевёл ведение бизнес-глоссария на решение Arenadata. Ранее в компании использовался западный продукт, содержавший свыше 37 тысяч терминов и 12 тысяч правил контроля качества данных. Однако в рамках стратегии импортозамещения ВТБ потребовалось отечественное решение, не уступающее по возможностям. Миграция прошла в короткие сроки: весь огромный глоссарий и реестр проверок качества были перенесены в ADC при поддержке интегратора Т1. Таким образом, Arenadata Catalog стал ключевым компонентом системы управления данными ВТБ, обеспечивая удобный поиск информации для тысячи сотрудников. Также существенно сократилось время на проектирование новых бизнес-процессов и повысилось качество использования данных в проектах банка.
Другой показательный пример — ФГ БКС («Брокеркредитсервис»). В 2023 году офис БКС запустил амбициозную программу трансформации Data Governance на фоне бурного роста клиентской базы. В компании остро встала задача повысить доступность и согласованность данных для разных бизнес-процессов, систематизировать накопленную информацию и извлечь из неё больше пользы для прибыли. Проанализировав лучшие практики рынка, команда БКС пришла к необходимости внедрения единого data catalog и бизнес-глоссария.
По итогам конкурсного отбора ФГ БКС выбрала Arenadata Catalog. Решающими факторами стали зрелость продукта, наличие крупных клиентов и внятная карта развития на ближайшие годы. Важным было и соответствие решения ряду требований: каталог должен сканировать физическую модель данных компании, позволять просматривать и редактировать описания объектов данных, визуализировать Data Lineage, назначать ответственных и так далее. В короткие сроки команда БКС развернула Arenadata Catalog, подключила его к источникам корпоративных данных, разработала методологию и всю документацию по работе с каталогом. Проект внедрения занял несколько месяцев, и в начале 2024 года система была введена в промышленную эксплуатацию.
Эффект от внедрения проявился сразу в нескольких плоскостях. Во-первых, удалось более чем в пять раз сократить время на поиск нужных данных и подготовку отчётности для бизнеса. Вместо ручного сбора информации аналитики теперь находят всё необходимое через каталог. Во-вторых, повысилась прозрачность и качество данных: вся модель, описание показателей, метки и владельцы собраны в одном инструменте, что устраняет нестыковки между подразделениями. Наконец, ADC дал синергию между командами данных и ИТ, став первым этапом на пути к полноценному Data Governance.
Сеть мебельных гипермаркетов Hoff в 2024 году также обратилась к Arenadata Catalog, чтобы навести порядок в данных и внедрить у себя подход data-driven. В бизнесе Hoff накопилось более 100 ТБ информации из разных источников: ERP-систем, систем онлайн-продаж, складского учёта, аналитических BI-систем. До внедрения ADC компания сталкивалась с проблемами: отсутствием единого описания данных, разрозненными excel-справочниками, дублированием показателей в разных отчётах — всё это замедляло подготовку отчётности и вызывало расхождения в цифрах. Поэтому понадобился специализированный инструмент с удобным интерфейсом и богатыми функциями. С помощью Arenadata Catalog компания начала выстраивать процессы Data Governance: теперь в компании все бизнес-термины и показатели описаны единообразно, дашборды и отчёты согласованы между разными департаментами. Одной из критически важных функций ADC для Hoff стала возможность находить и помечать отчёты, содержащие персональные данные клиентов. Используя механизм классификаторов, дата-стюарды автоматически отмечают сотни таблиц и дашбордов с персональной информацией, а затем легко могут выяснить, кто из сотрудников имеет доступ к этим объектам. Такой подход существенно упростил соответствие требованиям законодательства по персональным данным и внутренним политикам безопасности.
Крупнейшая сеть ресторанов быстрого питания «Вкусно — и точка» в 2024–2025 годах построила с нуля новую платформу данных на российском технологическом стеке. После ухода зарубежных вендоров компания столкнулась с рисками, так как старое хранилище перестало обновляться и поддерживаться, ограничивая развитие аналитики. Для решения проблемы «Вкусно — и точка» внедрила современную платформу на продуктах Arenadata. В её основу легли СУБД Arenadata DB и Arenadata QuickMarts (ADQM), Arenadata Streaming и Arenadata Catalog как единый каталог данных и бизнес-глоссарий.
Проект имел целью создать полностью импортонезависимую инфраструктуру данных, способную охватить потребности стремительно растущего бизнеса «Вкусно — и точка». В феврале 2025 года новая платформа была запущена в эксплуатацию. Arenadata Catalog в её составе отвечает за управление метаданными и терминологией: все данные, отчёты, витрины и модели описаны в каталоге, что обеспечивает единое понимание информации в ИТ и бизнесе. Благодаря продуктам Arenadata удалось не просто перенести старый функционал, но существенно его улучшить. Бизнес получил новые аналитические возможности, система также позволила загружать и обрабатывать большие данные из различных источников.
На пути к Data Governance
В эпоху data-driven-решений Arenadata Catalog закрывает критическую нишу — помогает организациям навести порядок в своих данных и повысить отдачу от них. Кейсы ВТБ, БКС, Hoff, «Вкусно — и точка» и других показывают, что инвестиции во внедрение Data Governance окупаются многократно: уменьшаются операционные издержки, ускоряется аналитика, повышается доверие к данным, появляются новые инсайты для бизнеса. Сейчас Arenadata Catalog — это целостное решение для управления корпоративной информацией, объединяющее людей, процессы и технологии вокруг ценности данных. ADC продолжает развиваться и вносит вклад в цифровую трансформацию российских компаний, делая их по-настоящему data-driven.
Автор статьи:

Игорь Моисеев
Директор по развитию бизнеса DataCatalog (входит в Группу Arenadata)