ARENADATA Academy

Аналитическая платформа с открытым кодом

Обучающие курсы

Эксплуатация Arenadata DB


       Даты курса    Ссылка 
22.10.2018 -  25.10.2018  Заказать


Обучающий курс «Эксплуатация Arenadata DB» предназначен для системных администраторов, архитекторов, разработчиков, аналитиков, использующих Arenadata DB (ADB). Курс даёт необходимые знания для эффективной и безопасной эксплуатации ADB в продуктовых средах, загрузке, обработке и выгрузке данных, настройках безопасности и дополнительных расширениях. Освоение каждой практической темы подкрепляется лабораторной работой.

Курс проводится очно. Длительность курса составляет 4 дня. По окончанию курса проводится экзамен, по результатам сдачи которого выдаётся сертификат от вендора.

Программа курса

 День 1:

  • Обзор архитектуры ADB – 40 минут
    Концепция MPP и её имплементация в ADB. Терминология и архитектура СУБД. Интерконнект. Выполнение запросов. Отказоустойчивость.
  • Окружение СУБД – 30 минут
    Основные директории СУБД. Логи. Конфигурационные файлы. Файлы данных БД. Переменные окружения. Процессы СУБД.
  • Управление БД – 10 минут
    Запуск, остановка, проверка статуса СУБД. 
    Лабораторная работа – 10 минут
  • Подключение к БД – 10 минут
    Реквизиты. Доступы. psql.
    Лабораторная работа – 10 минут
  • GUC – 10 минут
    Управление параметрами СУБД.
    Лабораторная работа – 10 минут
  • Устройство БД – 20 минут
    Шаблоны БД. Логическая схема данных. Обзор дефолтных схем. Основные объекты для работы с БД.
    Лабораторная работа – 20 минут
  • Отказоустойчивость – 20 минут
    Принципы безотказного функционирования БД. Спилл-файлы. Восстановление сегмента. Восстановление мастера.
    Лабораторная работа – 20 минут
  • Создание таблицы в БД – 60 минут
    Основные правила создания таблиц. Типы данных. Распределение таблицы. Skew. Констрейнты. Тип хранения данных. Компрессия.
    Лабораторная работа – 30 минут

День 2:

  • Выполнение запросов – 20 минут
    Получение плана. Оптимизаторы. Статистика выполнения. Разбор плана запроса. Redistribute и Broadcast. Поиск узких мест.
    Лабораторная работа – 20 минут
  • Партиционирование таблицы – 40 минут
    Создание партиционированных таблиц. Ключ партиционирования. Разные типы хранения. Файлспейсы и тейблспейсы. Мульти-партиционирование. Удаление. Разбиение. Обмен партиций. Внешние таблицы. Загрузка в партиционированные таблицы.
    Лабораторная работа – 30 минут
  • Индексы – 20 минут
    Применимость индексов. Типы. Best practices. Управление индексами. Основные параметры управления индексами в запросе.
    Лабораторная работа – 10 минут
  • MVCC – 20 минут
    Цели. Реализация. Bloat. VACUUM. VACUUM FULL. Пример. Регламенты.
    Лабораторная работа – 20 минут
  • Транзакции – 20 минут
    Обзор. Уровни изоляции. CAP-теорема. 
    Лабораторная работа – 10 минут
  • Статистика – 10 минут
    Цели. Сбор статистики.
    Лабораторная работа – 10 минут
  • COPY – 10 минут
    Синтаксис. Пример.
    Лабораторная работа – 10 минут
  • Ресурсные группы – 30 минут
    Обзор. Ограничиваемые ресурсы. Сценарии использования. GUCs.
    Лабораторная работа – 20 минут

День 3: 

  • Внешние таблицы – 10 минут.
    Обычные внешние таблицы. Web-внешние таблицы.
  • GPFDIST – 30 минут
    Сценарии. Сервер gpfdist. Создание внешних таблиц. Опции LOCATION. Достижение лучшей производительности. Параметры GUC. Примеры.
    Лабораторная работа – 20 минут
  • GPLOAD – 20 минут
    Использование утилиты
    Лабораторная работа – 20 минут
  • PXF – 60 минут
    Архитектура. Директории сервиса. Конфигурационные файлы. Логи. Управление сервисом. HDFS. HBASE. Hive. JDBC. Pushdown. Batching. Pooling. User impersonation.
    Лабораторная работа – 30 минут
  • UDF – 40 минут
    Цели. PL/SQL. PL/python. C-функции. PLContainer. Волатильность функций. Доверенность функций. 
    Лабораторная работа – 30 минут
  • Apache Madlib – 20 минут
    Обзор расширения. Пример использования.
    Лабораторная работа – 10 минут
  • PostGIS – 10 минут
    Обзор расширения. Пример использования.

День 4: 

  • Пользователи и группы – 30 минут
    Роль и пользователь, группы. Доступы. Создание пользователей, управление. Интеграция с LDAP.
    Лабораторная работа – 20 минут
  • Бекапы –30 минут
    Принципы бекапов. gp_dump/gp_restore. gpbackup/gprestore. Директории и файлы. Сжатие бекапов. Перенос бекапов между разными кластерами. Внешние таблицы.
    Лабораторная работа – 20 минут
  • Мониторинг – 60 минут.
    Архитектура. Diamond. Carbon. Graphite. Grafana. Директории. Собираемые метрики. Best practices по анализу данных мониторинга. Алерты.
    Лабораторная работа – 20 минут
  • gpperfmon – 20 минут
    Архитектура. Каталог. Полезные таблицы. 
    Лабораторная работа – 10 минут
  • Консоль администратора (Zeppelin) – 30 минут
    Архитектура. Директории. Конфигурационные файлы. Управление. Обзор ноутбуков. Подсчёт skew на основе ФС.
    Лабораторная работа – 20 минут
  • Обновление СУБД – 10 минут
    Процесс минорного обновления СУБД.
    Лабораторная работа – 10 минут
  • Обзор утилит, входящих в поставку СУБД – 20 минут