У вас уже есть заявка на текущий период.
Если вы хотите, чтобы данная программа участвовала в розыгрыше гранта в этом месяце, необходимо добавить ее в папку "Интересные мероприятия".
Или создайте заявку на другой период.
16.05.2022 - 18.05.2022 18.07.2022 - 22.07.2022 28.11.2022 - 02.12.2022 Уточните расписание у организатора. Возможно он не успел обновить расписание.
Форма обучения:
Очная/дневная
Вид мероприятия:
Вебинар
Тип мероприятия:
Открытые
Целевая аудитория
Системные администраторы, системные архитекторы, разработчики Hadoop, желающие получить теоретические знания и практические навыки по установке, настройке и использованию кластера Hadoop с использованием дистрибутивов Cloudera и HortonWorks.
Преподаватель
Николай Комиссаренко
Анонс программы
Курс "Основы Hadoop" представляет сокращенную версию курса "Администрирование кластера Hadoop" и проводится параллельно с данным курсом в 3 дня, согласно утвержденной программе, на платформе Cloudera, HortonWorks или ArenaData Hadoop по выбору.
Описание программы
Основы Hadoop и Big Data
Что такое Big Data. Понимание проблемы Big Data. Эволюция систем распределенных вычислений Hadoop. Концепция Data Lake.
Архитектура Apache Hadoop
Hadoop сервисы и основные компоненты: Name node, Data Node, YARN, HDFS.
Отказоустойчивость и высокая доступность.
Batch процессинг.
Потоковая обработка
Распределенная файловая система HDFS
Основы HDFS: Блоки HDFS. Основные команды работы с HDFS. Операции чтения и записи, назначения HDFS. Дисковые квоты.
Архитектура HDFS. Управление репликацией. Политики гибридного хранения данных HDFS.
Основные форматы хранения данных TXT, AVRO, ORC, Parquet, Sequence файлы.
Влияние компрессии на производительность. Кодеки компрессии.
Импорт(загрузка) ...
Подробнее о программе
Основы Hadoop и Big Data
Что такое Big Data. Понимание проблемы Big Data. Эволюция систем распределенных вычислений Hadoop. Концепция Data Lake.
Архитектура Apache Hadoop
Hadoop сервисы и основные компоненты: Name node, Data Node, YARN, HDFS.
Отказоустойчивость и высокая доступность.
Batch процессинг.
Потоковая обработка
Распределенная файловая система HDFS
Основы HDFS: Блоки HDFS. Основные команды работы с HDFS. Операции чтения и записи, назначения HDFS. Дисковые квоты.
Архитектура HDFS. Управление репликацией. Политики гибридного хранения данных HDFS.
Основные форматы хранения данных TXT, AVRO, ORC, Parquet, Sequence файлы.
Влияние компрессии на производительность. Кодеки компрессии.
Импорт(загрузка) данных на HDFS
MapReduce
Ведение в MapReduce. Компоненты MapReduce. Работа программ MapReduce. YARN MapReduce v2. Ограничения и параметры MapReduce и YARN. Управление запуском пользовательских задач (jobs) под MapReduce.