У вас уже есть заявка на текущий период.
Если вы хотите, чтобы данная программа участвовала в розыгрыше гранта в этом месяце, необходимо добавить ее в папку "Интересные мероприятия".
Или создайте заявку на другой период.
30.03.2020 - 03.04.2020 01.06.2020 - 05.06.2020 28.09.2020 - 02.10.2020 30.11.2020 - 04.12.2020 Уточните расписание у организатора. Возможно он не успел обновить расписание.
Форма обучения:
Очная/дневная
Вид мероприятия:
Курсы
Тип мероприятия:
Открытые
Целевая аудитория
Для руководителей, менеджеров и специалистов, желающих получить расширенные знания по инструментам и методам анализа больших данных для участия в проектах больших данных.
Преподаватель
Николай Комиссаренко
Анонс программы
5 дней практического обучения Администрированию кластера Hadoop, установке и настройке кластера Hadoop под управлением Apache Ambari на платформе HortonWorks Data Platform или Arenadata Hadoop;
Описание программы
Введение в Big Data и администрированию кластера Hadoop
Что такое Big Data. Понимание проблемы Big Data
Эволюция систем распределенных вычислений Hadoop
Принципы формирование pipelines и Data Lake
Архитектура Apache Hadoop
Hadoop сервисы и основные компоненты. Name node. Data Node. YARN сервис
Планировщик
HDFS
Отказоустойчивость и высокая доступность
Hadoop Distributed File System
Блоки HDFS. Основные команды работы с HDFS. Операции чтения и записи, назначения HDFS. Архитектура HDFS
Дисковые квоты
Поддержка компрессии
Основные форматы хранения данных TXT, AVRO, ORC, Parquet, Sequence файлы
Импорт(загрузка) данных на HDFS
Map Reduce
Ведение в MapReduce. Компоненты MapReduce. Работа программ MapReduce. YARN MapReduce v2
Ограничения и параметры MapReduce и YARN
Управление ...
Подробнее о программе
Введение в Big Data и администрированию кластера Hadoop
Что такое Big Data. Понимание проблемы Big Data
Эволюция систем распределенных вычислений Hadoop
Принципы формирование pipelines и Data Lake
Архитектура Apache Hadoop
Hadoop сервисы и основные компоненты. Name node. Data Node. YARN сервис
Планировщик
HDFS
Отказоустойчивость и высокая доступность
Hadoop Distributed File System
Блоки HDFS. Основные команды работы с HDFS. Операции чтения и записи, назначения HDFS. Архитектура HDFS
Дисковые квоты
Поддержка компрессии
Основные форматы хранения данных TXT, AVRO, ORC, Parquet, Sequence файлы
Импорт(загрузка) данных на HDFS
Map Reduce
Ведение в MapReduce. Компоненты MapReduce. Работа программ MapReduce. YARN MapReduce v2
Ограничения и параметры MapReduce и YARN
Управление запуском пользовательских задач (jobs) под MapReduce
Дизайн кластера Hadoop
Сравнение дистрибутивов и версий Hadoop 2/3 (HortonWorks Data Platform, Cloudera Distributed Hadoop, MapR, Arenadata Hadoop): различия и ограничения.
Требования программного и аппаратного обеспечения. Планирование кластера. Масштабирование кластера Hadoop. Отказоустойчивость Hadoop. Federated NameNode. Hadoop в облаке.
Сравнение Cloud решений для Hadoop. Amazon EMR.
Интеграция с другими решениями: streaming (DataFlow), NoSQL
Установка кластера
Установка Hadoop кластера. Выбор начальной конфигурации. Оптимизация уровня ядра для узлов. Начальная конфигурация HDFS и MapReduce. Файлы логов и конфигураций. Установка Hadoop клиентов. Установка Hadoopкластера в облаке.
Автоматическая установка.
Установка и настройка кластера Hadoop в изолированном окружении (offline).
Операции обслуживания кластера Hadoop
Дисковая подсистема
Квоты
Остановка, запуск, перезапуск
Управление узлами
Сетевая топология
Управление обновлениями и создание локального репозитория.
Оптимизация и управление ресурсами
Поиск узких мест.
Производительность
Файловая система
Data Node
Сетевая производительность
Планировщики: FIFO scheduler. Планировщик емкости (Capacity scheduler). Гранулярное управление ресурсами (Fair scheduler). Защита очередей и доминантное управление ресурсами DRF.
Управление кластером Hadoop с использованием Apache Ambari
Установка Apache Ambari. Интерфейс управления Apache Ambari. Базовые операции обслуживания и управление задачами с использованием Apache Ambari. Диагностика и trobleshooting с Apache Ambari.
Безопасность Hadoop
Безопасность по умолчанию. Встроенные компоненты безопасности дистрибутива HortonWorks/ ArenadataHadoop: Apache Ranger, Apache Atlas, Apache Knox.
Многопользовательский режим. Аутентификация и авторизация. Kerberos, keytabs, principals. Установка и конфигурирование Kerberos в Hadoop. Аудит доступа.
Резервное копирование и аварийное восстановление. Репликация данных и snapshoting. Конфигурирование высокой доступности Name node (HA).
Best practices HortonWorks / Arenadata Hadoop.
Мониторинг и администрирование кластера Hadoop
Apache Zookeeper. Встроенные средства мониторинга Apache Ambari Metrics. Логи сервисов и компонент. Внешние системы мониторинга: Zabbix, JMX.