I. Введение в data science, основные инструменты (24 ч.)
Что такое data science, big data, как это работает. Экспресс-обучение основным инструментам: Python 3, numpy, pandas, scikit-learn. Эксплоративный анализ и библиотеки визуализации данных. Hadoop и его экосистема, кластерные вычисления. Настройка кластеров и загрузка данных в них.
II. Базовые алгоритмы и понятия ML (28 ч.)
Деревья решений. Метод k ближайших соседей. Линейный классификатор, логическая регрессия. Проверка точности модели, переобучение, регуляризация. Борьба с переобучением, ансамблирование. Кластеризация.
III. Feature engineering (12 ч.)
Проблемы качества и размерности данных. Уменьшение размерности данных. Методы декомпозиции. Cпрямляющие пространства.
IV. Рекомендательные системы (32 ч.)
Введение в рекомендательные системы. Неперсонализированные рекомендации. Персонализированные рекомендации. Развитие рекомендательных систем.
V. Распознавание изображений, машинное зрение (40 ч.)
Базовая теория. Обзор кейсов применения. Нейросети. Рукописный ввод. Детекция и сегментация объектов на изображении.
VI. Обработка естественного языка (32 ч.)
Введение в обработку текста. Обзор существующих библиотек, их использование и доработка. Использование внешних ресурсов. Грязные тексты. Дистрибутивная семантика. Чатботы (генерация текстов). Нейросети для NLP. Применение NLP для обработки логов (кликстрима).
VII. Анализ временных рядов, прогнозирование стоимости акций и других товаров (20 ч.)
Временные ряды, модели ARMA/ARIMA. Сложные модели прогнозирования. Эксплоративный анализ временных рядов. Инвестиционный анализ, финансовые прогнозы.
VIII. Общение с заказчиком (16 ч.)
Проекты машинного обучения: требования, их формализация и оценка. Составление отчетов по исследованиям. Визуализация данных. Презентация проекта.
IX. Дополнительные инструменты, среды (20 ч.)
Инструменты HP для работы с большими данными. Решения Google для работы с большими данными. Clickhouse. Решения Oracle для работы с большими данными.
X. Data Science в цифровом маркетинге и e-commerce проектах (24 ч.)
Цели, задачи, решения и критерии успешности применения Data Science. Маркетинг Data-Driven vs интуиция. Типы данных и примеры датасетов. Методы сбора из разных источников. Подготовка и обработка данных, извлечение смысла и визуализация. Мастер-класс по атрибуции маркетинговых расходов для увеличения дохода интернет-магазина.
XI. Дипломная работа (60 ч.)
Разработка и внедрение собственного ML-решения/проекта либо разработка предложенного нами кейса
Что даст вам этот курс:
Не только алгоритмы, библиотеки и инструменты
-
Кроме технических навыков, каждому специалисту важно понимать поставленную задачу и доносить результаты своей работы до заказчика. Вы будете практиковаться в формализации требований, визуализации данных, составлении отчетов и презентаций для заказчика.
Очное обучение у профессионалов и практиков
-
Преподаватели каждый день работают с большими данными, обучают машины и решают задачи, с которыми вам предстоит разобраться. Каждый преподаватель — профессионал с хорошей репутацией в профессиональном сообществе. Многие из них преподают в университетах и на открытых курсах по data science.
Карьерный и финансовый рост, диплом о переподготовке
-
Вы получите диплом о профессиональной переподготовке по специальности «Аналитик данных/Специалист по машинному обучению». С ним Вы сможете претендовать на позицию «Аналитик данных», «Разработчик big data» с зарплатой от 120 тысяч рублей.
Требования к студентам:
-
Владеть хотя бы одним языком программирования на начальном уровне, предпочтительно — Python
-
Знать математику на уровне старшей школы: функции одной и нескольких переменных, производные, векторная и матричная алгебра, тригонометрия
Режим занятий: 3 занятия в неделю. Вторник, четверг с 19:00 до 22:00 и суббота с 10:30 до 13:30
Беспроцентная рассрочка на 6 месяцев.