ARENADATA Academy

Аналитическая платформа с открытым кодом

Обучающие курсы

Эксплуатация Arenadata DB


       Даты курса    Ссылка 
По запросу  Заказать


Обучающий курс «Эксплуатация Arenadata DB» предназначен для системных администраторов, архитекторов, разработчиков, аналитиков, использующих Arenadata DB (ADB). Курс даёт необходимые знания для эффективной и безопасной эксплуатации ADB в продуктовых средах, загрузке, обработке и выгрузке данных, настройках безопасности и дополнительных расширениях. Освоение каждой практической темы подкрепляется лабораторной работой.

Курс проводится очно. Длительность курса составляет 4 дня. По окончанию курса проводится экзамен, по результатам сдачи которого выдаётся сертификат от вендора.

Программа курса

 День 1:

  • Обзор архитектуры ADB – 40 минут
    Концепция MPP и её имплементация в ADB. Терминология и архитектура СУБД. Интерконнект. Выполнение запросов. Отказоустойчивость.
  • Окружение СУБД – 30 минут
    Основные директории СУБД. Логи. Конфигурационные файлы. Файлы данных БД. Переменные окружения. Процессы СУБД.
  • Управление БД – 10 минут
    Запуск, остановка, проверка статуса СУБД. 
    Лабораторная работа – 10 минут
  • Подключение к БД – 10 минут
    Реквизиты. Доступы. psql.
    Лабораторная работа – 10 минут
  • GUC – 10 минут
    Управление параметрами СУБД.
    Лабораторная работа – 10 минут
  • Устройство БД – 20 минут
    Шаблоны БД. Логическая схема данных. Обзор дефолтных схем. Основные объекты для работы с БД.
    Лабораторная работа – 20 минут
  • Отказоустойчивость – 20 минут
    Принципы безотказного функционирования БД. Спилл-файлы. Восстановление сегмента. Восстановление мастера.
    Лабораторная работа – 20 минут
  • Создание таблицы в БД – 60 минут
    Основные правила создания таблиц. Типы данных. Распределение таблицы. Skew. Констрейнты. Тип хранения данных. Компрессия.
    Лабораторная работа – 30 минут

День 2:

  • Выполнение запросов – 20 минут
    Получение плана. Оптимизаторы. Статистика выполнения. Разбор плана запроса. Redistribute и Broadcast. Поиск узких мест.
    Лабораторная работа – 20 минут
  • Партиционирование таблицы – 40 минут
    Создание партиционированных таблиц. Ключ партиционирования. Разные типы хранения. Файлспейсы и тейблспейсы. Мульти-партиционирование. Удаление. Разбиение. Обмен партиций. Внешние таблицы. Загрузка в партиционированные таблицы.
    Лабораторная работа – 30 минут
  • Индексы – 20 минут
    Применимость индексов. Типы. Best practices. Управление индексами. Основные параметры управления индексами в запросе.
    Лабораторная работа – 10 минут
  • MVCC – 20 минут
    Цели. Реализация. Bloat. VACUUM. VACUUM FULL. Пример. Регламенты.
    Лабораторная работа – 20 минут
  • Транзакции – 20 минут
    Обзор. Уровни изоляции. CAP-теорема. 
    Лабораторная работа – 10 минут
  • Статистика – 10 минут
    Цели. Сбор статистики.
    Лабораторная работа – 10 минут
  • COPY – 10 минут
    Синтаксис. Пример.
    Лабораторная работа – 10 минут
  • Ресурсные группы – 30 минут
    Обзор. Ограничиваемые ресурсы. Сценарии использования. GUCs.
    Лабораторная работа – 20 минут

День 3: 

  • Внешние таблицы – 10 минут.
    Обычные внешние таблицы. Web-внешние таблицы.
  • GPFDIST – 30 минут
    Сценарии. Сервер gpfdist. Создание внешних таблиц. Опции LOCATION. Достижение лучшей производительности. Параметры GUC. Примеры.
    Лабораторная работа – 20 минут
  • GPLOAD – 20 минут
    Использование утилиты
    Лабораторная работа – 20 минут
  • PXF – 60 минут
    Архитектура. Директории сервиса. Конфигурационные файлы. Логи. Управление сервисом. HDFS. HBASE. Hive. JDBC. Pushdown. Batching. Pooling. User impersonation.
    Лабораторная работа – 30 минут
  • UDF – 40 минут
    Цели. PL/SQL. PL/python. C-функции. PLContainer. Волатильность функций. Доверенность функций. 
    Лабораторная работа – 30 минут
  • Apache Madlib – 20 минут
    Обзор расширения. Пример использования.
    Лабораторная работа – 10 минут
  • PostGIS – 10 минут
    Обзор расширения. Пример использования.

День 4: 

  • Пользователи и группы – 30 минут
    Роль и пользователь, группы. Доступы. Создание пользователей, управление. Интеграция с LDAP.
    Лабораторная работа – 20 минут
  • Бекапы –30 минут
    Принципы бекапов. gp_dump/gp_restore. gpbackup/gprestore. Директории и файлы. Сжатие бекапов. Перенос бекапов между разными кластерами. Внешние таблицы.
    Лабораторная работа – 20 минут
  • Мониторинг – 60 минут.
    Архитектура. Diamond. Carbon. Graphite. Grafana. Директории. Собираемые метрики. Best practices по анализу данных мониторинга. Алерты.
    Лабораторная работа – 20 минут
  • gpperfmon – 20 минут
    Архитектура. Каталог. Полезные таблицы. 
    Лабораторная работа – 10 минут
  • Консоль администратора (Zeppelin) – 30 минут
    Архитектура. Директории. Конфигурационные файлы. Управление. Обзор ноутбуков. Подсчёт skew на основе ФС.
    Лабораторная работа – 20 минут
  • Обновление СУБД – 10 минут
    Процесс минорного обновления СУБД.
    Лабораторная работа – 10 минут
  • Обзор утилит, входящих в поставку СУБД – 20 минут