День 1. Азы эконометрического анализа. Подготовка данных. Анализ пространственных выборок
Этапы эконометрического исследования
Виды эконометрических моделей, классификация методов их построения
Типы данных, используемых для моделирования, временные ряды и пространственные выборки
Основные статистические показатели и графики:
-
среднее значение, медиана, квартили, стандартное отклонение, стандартная ошибка, размах
-
гистограмма (histogram), вероятностный график (Q-Q plot), ящичная диаграмма (boxplot), диаграмма последовательности (sequence chart), диаграмма рассеяния (scatterplot)
Методы проверки гипотез при сравнении:
-
средних (t-test, Anova F-test)
-
медиан (Wilcoxon/Mann-Whitney, Kruskal-Wallis)
-
дисперсий (F-test, Siegel-Tukey, Bartlett, Brown-Forsethe)
Многофакторный регрессионный анализ для пространственных выборок:
-
требования к виду и количеству исходных данных
-
необходимые и достаточные теоретические основы, идеи и принципы, плюсы и минусы подхода
-
требования к факторам, которые планируется учитывать в анализе
-
особенности моделирования при недостатке информации о факторах, техника dummy-переменных
-
пошаговый алгоритм регрессионного анализа
-
способ проверки адекватности модели
-
интерпретация результатов: как влияют факторы на отклик, ранжирование по силе влияния
Кейсы:
-
Пример в SPSS. Изучаем изменчивость цен по регионам. Рассчитываем и интерпретируем основные статистические показатели. Строим графики.
-
Пример в SPSS. Изучаем динамику продаж. Учимся анализировать колебания продаж и формировать правильные ожидания
-
Пример в SPSS. Проводим графический анализ динамики числа клиентов. Самостоятельно учимся определять наличие тренда, сезонности, структурных сдвигов и выбросов.
-
Пример в SPSS. Проводим сезонную декомпозицию на основе истории продаж. Учимся интерпретировать результаты.
-
Пример в SPSS. Проводим сезонную декомпозицию и строим прогноз на несколько месяцев. Оцениваем качество построенной модели.
День 2. Моделирование временных рядов на основе метода наименьших квадратов (LS): многофакторная регрессия и ARIMA
Компоненты временного ряда: тренд, сезонность и ее типы, структурные сдвиги, выбросы и т.п. Способы идентификации (графический анализ, сезонная декомпозиция)
Особенности регрессионного анализа для временных рядов:
-
способы учета компонент временного ряда в модели
-
учет в модели сезонности различного типа
-
интерпретация результатов
-
оценки точности модели: MAPE, MAE, RMSE
-
процедуры анализа остатков: тесты на нормальность (Jarque-Bera), автокорреляцию (Correlogram, Serial Correlation LM Test) и гетеросекдастичность (Breush-Pagan-Godfrey, Harvey, Glejser)
Моделирование методом ARIMA (AutoRegressive Integrated Moving Average, модель Бокса – Дженкинса):
-
требования к виду и количеству исходных данных
-
понятие стационарного временного ряда, тесты на стационарность (тесты единичного корня, Unit Root Test)
-
необходимые и достаточные теоретические основы, идеи и принципы, плюсы и минусы подхода
-
алгоритм выбора параметров модели ARIMA
-
динамический и статический методы прогнозирования
Графический анализ исходных данных с целью выявления тренда, сезонности и других компонент
Доверительный интервал прогноза
Точность модели и точность прогнозов. Показатели: MAPE, MAD и другие
Подходы к выбору адекватного показателя оценки точности модели и прогноза
Прогнозирование на основе метода сезонной декомпозиции:
-
пошаговый алгоритм прогнозирования в SPSS
-
правила выбора вида тренда и типа сезонности
-
сезонные факторы и их практическое использование
-
плюсы и минусы подхода
Оценка качества прогнозной модели. Правила графического анализа остатков: histogram, scatterplot, график автокорреляции (ACF plot)
Прогнозирование на основе метода экспоненциального сглаживания:
-
идея метода: четыре параметра сглаживания
-
пошаговый алгоритм в SPSS
-
оценка адекватности моделей: критерий Льюинга-Бокса, значимость параметров
-
влияние горизонта прогноза на точность прогнозов
-
плюсы и минусы подхода
Критерии выбора между экспоненциальным сглаживанием и сезонной декомпозицией
Многофакторный регрессионный анализ: идея и требования к исходным данным
Пошаговый алгоритм прогнозирования на основе регрессионного анализа в SPSS
Диагностика и решение проблемы взаимозависимых факторов (мультиколлинеарность)
Правила оценки качества модели:
-
анализ остатков
-
ANOVA
-
R-квадрат и скорректированный R-квадрат
План действий при «плохих» остатках модели
Интерпретация коэффициентов регрессионного уравнения:
-
как влияют факторы на отклик
-
ранжирование факторов по силе влияния
Учет в регрессии сезонности разного типа
Плюсы и минусы прогнозирования на основе регрессионного анализа
Кейсы:
-
Пример в SPSS. Строим прогноз на несколько месяцев с помощью экспоненциального сглаживания. Оцениваем качество модели и прогноза.
-
Пример в SPSS. На основе истории продаж по товарной группе строим прогноз на 12 месяцев двумя способами (на основе сезонной декомпозиции и методом экспоненциального сглаживания). Оцениваем качество моделей и выбираем наиболее адекватный подход.
-
Пример в SPSS. Анализируем влияние макроэкономических факторов на цену недвижимости.
-
Пример в SPSS. Анализируем влияние кризиса; изменения ассортимента; числа торговых точек и т.п. на динамику прогнозируемого показателя.
День 3. Прогнозирование с использованием авторегрессионного анализа. Метод ARIMA
Авторегрессионные модели прогнозирования: идея и реализация
Плюсы и минусы прогнозирования на основе авторегрессионного анализа
Правила перехода от регрессии к авторегрессии
Особенности прогнозирования при недостатке информации о факторах. Техника фиктивных (dummy) переменных
Авторегрессионные модели интегрированного скользящего среднего (ARIMA)
-
o требования к исходным данным
-
o условия применимости метода, понятие стационарного временного ряда
-
o шесть параметров модели: алгоритм выбора на основе графиков (ACF plot, partial ACF plot)
-
o оценка адекватности моделей: критерий Льюинга-Бокса, Байесовский информационный критерий (BIC), значимость параметров
Улучшение моделей экспоненциального сглаживания и ARIMA по результатам автоматического поиска выбросов и структурных сдвигов.
Кейсы:
-
Пример в SPSS. Прогнозируем продажи с использованием фиктивных переменных методом авторегрессии.
-
Пример в SPSS. Анализируем влияние погодных условий на прогнозируемый показатель.
-
Пример в SPSS. Проводим сравнительный анализ прогнозов, полученных методами регрессии и авторегрессии.
-
Пример в SPSS. Прогнозируем поток клиентов на основе метода ARIMA: выбираем параметры моделей с помощью графиков, выбираем лучшую модель, получаем прогноз на ее основе.
-
Пример в SPSS. Строим прогноз потребления ресурса всеми изученными способами и выбираем наиболее адекватный подход (самостоятельно).
ДЕНЬ 4. Адаптация рассмотренных методов к практическим задачам прогнозирования
Особенности учета факторов в ARIMA
Учет запаздывающего влияния факторов при прогнозировании -Использование регрессионного и авторегрессионного анализа для оценки:
-
o нелинейного влияния факторов
-
o эффектов акций
-
o эффекта «каннибализма»
-
o влияния праздничного спроса
Структура ошибки прогноза
Алгоритм выявления источников ошибки прогноза и оценка всех ее компонентов
Кейсы:
-
Пример в SPSS. Оцениваем эффекты акций в зависимости от имеющейся информации.
-
Пример в SPSS. Анализируем продажи по SKU и измеряем эффекта «каннибализма».
-
Пример в SPSS. Учитываем влияние выходных и праздничных дней при прогнозировании потребления продукта.
-
Пример в SPSS. Анализируем временную задержку (лаг) в росте продаж при росте рекламного бюджета.
-
Пример в SPSS. Прогнозируем продажи с учетом нелинейного влияния рекламного бюджета.
-
Примеры в SPSS. Получаем и анализируем прогнозы на основе данных слушателей. Изучаем потенциальные возможности улучшения прогнозов.
После обучения Вы получите:
-
Пошаговые инструкции по применению каждого эконометрического метода
-
Сертификат на 4-месячную бесплатную консультационную поддержку
Требования к участникам:
-
Высшее образование
-
Опыт работы в Excel на уровне пользователя