12.05.2025 - 04.08.2025 15.05.2025 - 07.08.2025
Форма обучения:
Дистанционная
Вид мероприятия:
Повышение квалификации
Тип мероприятия:
Открытые
Для разработчиков Apache Spark, дата инженеров и аналитиков данных, Data Scientist’ов и других специалистов Big Data.
Михаил Королев
4-дневный практический курс для тех, кто использует или планирует использовать Spark для обработки и анализа больших данных.
1. Обзор Apache Spark
Архитектура Spark
Обзор компонентов Spark и их назначения
Spark API и разработка программ.
2. Основные абстракции – знакомство со Spark RDD и Dataframe
Low Level API, использование Resilient Distributed Dataset
Structured API и основная абстракция Spark – Dataframe
Основные трансформации и действия.
3. Работа с источниками данных
Ввод и вывод данных в Spark
Работа с файлами и базами данных
Совместная работа с Apache Hive
4. Apache Spark SQL
Получение данных из SQL-источников
Обработка данных с помощью Spark SQL
Интероперабельность Dataframe и SQL
5. Основы настройки и конфигурирования
Знакомство с основными Shell
Запуск приложений с помощью spark-submit
Конфигурирование Spark
Планы запросов и Web GUI
1. Обзор Apache Spark
Архитектура Spark
Обзор компонентов Spark и их назначения
Spark API и разработка программ.
2. Основные абстракции – знакомство со Spark RDD и Dataframe
Low Level API, использование Resilient Distributed Dataset
Structured API и основная абстракция Spark – Dataframe
Основные трансформации и действия.
3. Работа с источниками данных
Ввод и вывод данных в Spark
Работа с файлами и базами данных
Совместная работа с Apache Hive
4. Apache Spark SQL
Получение данных из SQL-источников
Обработка данных с помощью Spark SQL
Интероперабельность Dataframe и SQL
5. Основы настройки и конфигурирования
Знакомство с основными Shell
Запуск приложений с помощью spark-submit
Конфигурирование Spark
Планы запросов и Web GUI
Коммерсант Ксения Лебедева Info@bigdataschool.ru+7 99
показать номер
←Вернуться