У вас уже есть заявка на текущий период.
Если вы хотите, чтобы данная программа участвовала в розыгрыше гранта в этом месяце, необходимо добавить ее в папку "Интересные мероприятия".
Или создайте заявку на другой период.
12.05.2022 - 13.05.2022 19.09.2022 - 20.09.2022 12.12.2022 - 13.12.2022 Уточните расписание у организатора. Возможно он не успел обновить расписание.
Форма обучения:
Дистанционная
Вид мероприятия:
Вебинар
Тип мероприятия:
Открытые
Целевая аудитория
Для разработчиков Apache Spark, дата инженеров и аналитиков данных, Data Scientist’ов и других специалистов Big Data, которые используют или планируют использовать Spark для обработки и анализа больших данных
Преподаватель
Михаил Королев
Анонс программы
Практический курс по потоковой обработке с использованием Спарк рассчитан на специалистов, которые хотят получить опыт настройки и использования механизмов потоковой обработки в спарк, с видами источников и нюансами практического использования Structured Streaming.
Описание программы
1. Введение в потоковую обработку
Потоковая и пакетная обработка данных
Особенности потоковой обработки
Надежность и потоковая обработка.
2. Потоковая обработка в Apache Spark
Два вида потоков (на основе RDD и Dataframe)
Парадигма потоковой обработки в Structured Streaming
Источники (sources и sink).
3. Совместное использование Batch и Streaming
Трансформации и действия в Apache Spark
Объединение данных в Spark (join)
Особенности использования трансформаций при работе с потоковыми данными
4. Источники потоковых данных
Файловый источник данных
Apache Kafka как источник данных
Другие источники потоковых данных
5. Обеспечение надежности потоковой обработки в Apache Spark
Механизм checkpoint в Apache Spark
Настройка streaming checkpoint
1. Введение в потоковую обработку
Потоковая и пакетная обработка данных
Особенности потоковой обработки
Надежность и потоковая обработка.
2. Потоковая обработка в Apache Spark
Два вида потоков (на основе RDD и Dataframe)
Парадигма потоковой обработки в Structured Streaming
Источники (sources и sink).
3. Совместное использование Batch и Streaming
Трансформации и действия в Apache Spark
Объединение данных в Spark (join)
Особенности использования трансформаций при работе с потоковыми данными
4. Источники потоковых данных
Файловый источник данных
Apache Kafka как источник данных
Другие источники потоковых данных
5. Обеспечение надежности потоковой обработки в Apache Spark