Это четырёхдневный практический курс по основам Apache Spark, слушатели которого с нуля научатся использовать современные инструменты для разработки (IDE, интерактивные), сборки (Maven, sbt) и запуска приложений Apache Spark на языке программирования Scala (Python, Java), включая различные режимы и способы размещения приложений в Arenadata Hadoop.
В рамках курса участники получат теоретические знания и практический опыт по:
- основам языка Scala и инструментам разработки;
- архитектуре Apache Spark и базовым возможностям RDD, DataFrame, DataSet;
- настройке производительности и управлению памятью;
- обработке данных из различных источников (файлы, СУБД, потоки);
- дополнительным возможностям обработки и алгоритмам Spark GraphX и Spark MLlib
Отметим, что «Основы работы с Apache Spark в экосистеме Arenadata Hadoop» стал нашим третьим курсом по Arenadata Hadoop — преподаватели учебного центра Arenadata уже читают курсы «Эксплуатация Arenadata Hadoop» и «Управление информационной безопасностью кластера Arenadata Hadoop».
«Запуск нового курса — результат огромной проделанной работы всей команды Arenadata и нашего учебного центра. Приятно, что слушатели смогут глубже познакомиться с экосистемой Arenadata Hadoop на примере фреймворка Apache Spark. Курс стал ответом на многочисленные запросы со стороны клиентов, которые высказывали большую заинтересованность получить знания и практический опыт работы с Apache Spark».