Релиз Arenadata Streaming: CDC «из коробки», многоуровневое хранение в Kafka и новый сервис мониторинга

15.01.2025
Arenadata обновила продукт для потоковой передачи и обработки данных Arenadata Streaming (ADS). Новая версия получила функциональность захвата изменений данных (change data capture, CDC) и сервис мониторинга на базе Prometheus. Кроме того, теперь Arenadata Streaming поддерживает концепцию «многослойного» хранения Kafka Tiered Storage и протокол согласования Kafka Raft.
Релиз Arenadata Streaming: CDC «из коробки», многоуровневое хранение в Kafka и новый сервис мониторинга

Для реализации CDC в состав дистрибутива Arenadata Streaming включены два source-коннектора Debezium для сервиса Kafka Connect, предназначенные для захвата изменений в базах данных PostgeSQL и Microsoft SQL Server. Они собирают изменения данных в СУБД, записывая их в топики Kafka, а затем различные sink-коннекторы могут передавать эти данные в другие базы и хранилища. Предусмотрена возможность использовать доступные «из коробки» коннекторы Debezium, добавлять собственные и настраивать их из веб-интерфейса ADS Control — системы для управления кластерами потоковой передачи.


Новая версия Arenadata Streaming реализует концепцию Tiered Storage — «многослойного» хранения данных в топиках Kafka. Поступающие «горячие» данные располагаются в локальной файловой системе, а далее, согласно заданным политикам, переносятся во внешнюю систему, которая лучше адаптирована для долгосрочного хранения «холодных» данных. В качестве внешней системы Arenadata Streaming поддерживает HDFS1 и S3.

Александр Анисимов, технический руководитель продукта Arenadata Streaming
Александр Анисимов
Технический руководитель продукта Arenadata Streaming

Концепция Tiered Storage позволяет сократить расходы и предоставить дополнительную гибкость, когда требуется хранение исторических данных. Благодаря ограниченному набору локальных сегментов снижается потребность в преждевременном масштабировании, уменьшается время на расширение и ребалансировку кластера, а также на его восстановление после сбоев и обслуживания

В Arenadata Streaming включён новый сервис мониторинга. Он разворачивает в ADS свой сервер Prometheus, который собирает и хранит метрики мониторинга кластера (системные, а также метрики сервисов Kafka, ZooKeeper, Kafka REST Proxy, Schema-registry, ksqlDB, NiFi, MiNiFi, Kafka Connect). Просматривать и анализировать собранные данные можно в веб-интерфейсе Prometheus или в веб-приложении Grafana.

Новая версия Arenadata Streaming поддерживает протокол согласования Kafka Raft (KRaft), который позволяет управлять метаданными внутри Kafka, устраняя зависимость от внешнего сервиса ZooKeeper. Благодаря KRaft использование Kafka становится проще, сокращается целевое время восстановления системы (RTO) и кратно увеличивается доступное число партиций, поддерживаемых одним кластером. В текущей версии продукта функционал предоставляется в режиме превью и не предназначен для использования в продуктивной среде.

По ссылке можно ознакомиться с полным списком изменений версии Arenadata Streaming 3.6.2.2.b1.

Возможности Arenadata Streaming

Arenadata Streaming — масштабируемая отказоустойчивая система для потоковой обработки данных в режиме реального времени, адаптированная для корпоративного использования и построенная на базе Apache Kafka и NiFi. Продукт включает графический пользовательский веб-интерфейс для управления кластерами потоковой передачи (ADS Control, ADSC), поддержку расширенной безопасности (Arenadata Platform Security, ADPS), а также ряд дополнительных инструментов для реализации репликации, проверки качества данных и других необходимых для продуктовой эксплуатации функций.

Arenadata Streaming позволяет:
  • в реальном времени строить потоковые конвейеры данных, надёжно передающих данные между системами или приложениями;
  • в реальном времени разрабатывать потоковые приложения, преобразующие потоки данных или реагирующие на них;
  • хранить потоки записей отказоустойчивым долговечным способом;
  • разграничивать права доступа к потокам данных.
На Arenadata Streaming получено свидетельство о государственной регистрации программы для ЭВМ. Продукт включён в единый реестр российских программ для электронных вычислительных машин и баз данных.


1. Минимальная версия Arenadata Hadoop для импорта HDFS при настройке многоуровневого хранилища — ADH 3.3.6.2.b1.

Спасибо, что написали нам!

Мы обработаем заявку и свяжемся с вами в ближайшее время.

Будем рады помочь!

Отправьте ваш вопрос через форму ниже, и наши специалисты свяжутся с вами в ближайшее время.

Фамилия *
Имя *
Эл. почта *
Телефон *
Наименование компании *
Опишите ваш вопрос
ошибка! проверьте правильно ли вы заполнили поля

Этот сайт использует cookie-файлы и другие технологии, чтобы помочь вам в навигации, а также предоставить лучший пользовательский опыт, анализировать использование наших продуктов и услуг, повысить качество рекламных и маркетинговых активностей.