Система Прогнозирования Спроса

Ансамблевые ML-модели для 400 000+ товаров

Автоматизированная система использует ансамбль из 15+ моделей машинного обучения для расчёта месячного спроса на каждый артикул. Горизонт прогнозирования — до 15 месяцев с учётом сезонности, трендов и доступности товара.

400K+
Уникальных товаров
90%
WAPE 1-3 месяца
15 мес
Горизонт прогноза
15+
Моделей в ансамбле

Исходная ситуация

Задачи бизнеса

  • • Прогноз спроса на 400 000+ уникальных товаров на 15 месяцев
  • • Учёт периодов отсутствия товара на складе (out-of-stock)
  • • Работа с разреженными данными и нерегулярными продажами
  • • Прогнозирование для новых товаров с минимальной историей
  • • Выявление и учёт сезонных паттернов на длительном периоде
  • • Ежемесячное обновление с еженедельными корректировками

Исходные данные

  • • История продаж с 2017 года (7+ лет данных)
  • • 400 000+ активных артикулов в каталоге
  • • Данные об остатках на складе и доступности товаров
  • • Кластеры товаров-аналогов для анализа трендов
  • • Ценовая информация, скидки и промо-акции
  • • Иерархическая структура категорий и подкатегорий

Зачем это бизнесу?

Точный прогноз спроса — основа для оптимизации закупок, управления складом и финансового планирования.

Оптимизация закупок

Система предсказывает, сколько единиц каждого товара потребуется в следующие 15 месяцев. Это позволяет планировать закупки, избегая дефицита и переизбытка.

Пример: прогноз показывает рост спроса на товарную категорию на 25% в следующем месяце — вы заранее увеличиваете заказ у поставщиков.

Снижение неликвида

Прогноз выявляет товары с падающим спросом. Вы не закупаете их впрок, освобождая оборотный капитал для более ходовых позиций.

Пример: прогноз спроса на товар упал с 50 до 10 шт/мес — вы сокращаете заказ и не замораживаете деньги в неликвиде.

Учёт сезонности

Система автоматически выявляет сезонные паттерны на основе многолетней истории. Это критично для товаров с выраженной сезонностью.

Пример: сезонные товары показывают пик спроса в определённые месяцы — система учитывает это при прогнозе на следующий год.

Прогноз для новых товаров

Даже для новых товаров без истории система строит прогноз на основе поведения аналогов в том же кластере и категории.

Пример: новый товар в категории получает прогноз на основе продаж 5 похожих товаров с учётом доли рынка 8-12%.

📊

Точность прогноза по горизонтам

Система обеспечивает точность 90% (WAPE) на горизонте 1-3 месяца, 80% на 6 месяцев и 75% на 12 месяцев.

Это означает, что отклонение фактических продаж от прогноза минимально, что критично для планирования закупок и финансовых показателей.

Как это работает технически

Система использует ансамбль из 15+ моделей: от простых статистических до градиентного бустинга. Каждая модель обучается на 12 временных интервалах с последующим усреднением весов через Ridge Regression.

Используемые модели

Статистические модели

  • AutoETS — экспоненциальное сглаживание с автоподбором компонент
  • DynamicOptimizedTheta — комбинация экспоненциального сглаживания и линейной регрессии
  • SeasonalNaive — наивная модель с учётом сезонности
  • ADIDA — для работы с разреженными данными
  • RandomWalkWithDrift — случайное блуждание с трендом

ML и простые модели

  • Gradient Boosting — XGBoost с автоподбором гиперпараметров
  • ADD — Average Daily Demand с учётом доступности
  • Скользящие средние — за 3/6/9/12/24 месяца
  • Сезонные модели — учёт сезонности и тренда
  • Ridge Regression — ансамблирование всех моделей
1

Подготовка данных

Обработка исторических данных и расчёт признаков

Система анализирует историю продаж с 2017 года, учитывая только дни с доступностью товара. Это критически важно: если товара не было на складе, его отсутствие не должно снижать прогноз будущего спроса.

Входные признаки
  • • История продаж по дням с учётом доступности
  • • Принадлежность к кластеру товаров-аналогов
  • • Ценовая динамика и промо-акции
  • • Сезонные коэффициенты по подкатегориям
Особенности обработки
  • • Выявление сезонных колебаний на 3-5 летнем периоде
  • • Удаление сезонной компоненты перед обучением
  • • Расчёт ADU (Average Daily Usage) за 6 месяцев
  • • Анализ трендов по кластерам аналогов
2

Процесс валидации

12 интервалов обучения для стабильности модели

Система использует rolling window валидацию на 12 периодах со сдвигом в 1 месяц. Это обеспечивает стабильность прогнозов и учёт различных сезонных паттернов.

Временная структура:
├── Валидационный набор (12 интервалов)
│ ├── Обучение: 24 месяца
│ └── Валидация: 6 месяцев (для расчёта RMSE)
├── Тестовый набор: 12 месяцев
└── Период прогнозирования: 15 месяцев

Веса моделей определяются на основе качества прогнозирования на 6-месячном окне валидации. Ближайшие месяцы получают больший вес.

3

Ансамблирование моделей

Ridge Regression для объединения всех моделей

Ridge Regression автоматически подбирает веса для каждой модели, минимизируя RMSE с двойным штрафом за недопрогноз. Это критично для бизнеса: лучше немного переоценить спрос, чем столкнуться с дефицитом.

15+
Моделей в ансамбле
Штраф за недопрогноз
L2
Регуляризация весов
4

Новые товары

Прогноз на основе товаров-аналогов в кластере. Система анализирует средние продажи похожих товаров и применяет минимальные пороги доли рынка (3-15% в зависимости от сегмента).

Еженедельное обновление прогноза при появлении первых продаж.

5

Разреженные данные

Применение сглаживания на основе 24-месячного периода с учётом только дней доступности. Корректировка на основе кластера аналогов.

Модели ADIDA и SeasonalExponentialSmoothing специализируются на таких случаях.

Технологический стек

Python 3.8+

scikit-learn, XGBoost, statsmodels

PostgreSQL

Хранение исторических данных и прогнозов

ClickHouse

Аналитические запросы для агрегации продаж

Apache Airflow

Оркестрация ежемесячных перерасчётов

XGBoost

Gradient Boosting с автоподбором гиперпараметров

Statsmodels

ETS, ARIMA, сезонная декомпозиция

Pandas/NumPy

Обработка временных рядов

FastAPI

REST API для получения прогнозов

Результаты проекта

Ключевые достижения системы прогнозирования спроса

400 000+
товаров прогнозируется ежемесячно

Автоматизированный прогноз на горизонте до 15 месяцев для каждого артикула с учётом сезонности, трендов и доступности

Метрики точности (WAPE)

90%
Горизонт 1-3 месяца
Высокая точность для краткосрочного планирования
80%
Горизонт 6 месяцев
Надёжные прогнозы для закупок
75%
Горизонт 12 месяцев
Стратегическое планирование
400K+
Уникальных товаров
15 мес
Максимальный горизонт прогноза
15+
Моделей в ансамбле
12×
Интервалов валидации
7+ лет
История продаж для обучения
Ежемес.
Полный перерасчёт прогнозов
Еженед.
Обновление новых товаров
±5%
Целевой Bias (смещение)

Контроль качества и мониторинг

Метрики оценки

  • WAPE (Weighted Absolute Percentage Error) — основная метрика точности
  • Bias — контроль систематических ошибок (переоценка/недооценка)
  • RMSE — средняя величина ошибки с двойным штрафом за недопрогноз
  • • Анализ изменений ADD (Average Daily Demand) между версиями
  • • Мониторинг влияния на бизнес-метрики (оборачиваемость, дефициты)

Уровни контроля

  • • Автоматический расчёт метрик качества после каждого обновления
  • • Анализ изменений прогнозов на уровне категорий товаров
  • • Выявление причин существенных изменений ADD
  • • Классификация изменений по типам (тренд, сезонность, аномалия)
  • • Дашборды для визуализации качества прогнозов

Нужна система прогнозирования спроса?

Создадим промышленную систему прогнозирования для вашего ассортимента. Настроим ансамбль моделей, интеграцию с DWH и обучим команду работе с прогнозами.

Что входит в проект

• Анализ данных о продажах и доступности товаров
• Разработка пайплайна подготовки данных
• Настройка ансамбля из 15+ моделей (ETS, ARIMA, XGBoost и др.)
• Реализация rolling window валидации
• Расчёт сезонных коэффициентов по категориям
• Алгоритмы для новых товаров и разреженных данных
• Ансамблирование через Ridge Regression
• Интеграция с PostgreSQL/ClickHouse
• REST API для получения прогнозов
• Настройка Apache Airflow для автоматизации
• Дашборды для мониторинга качества (WAPE, Bias, RMSE)
• Обучение команды работе с системой (8 часов)
• Техподдержка 3 месяца
• Документация и инструкции
От 550 000 ₽

Стоимость зависит от количества товаров, горизонта прогноза и требований к интеграции

Анализ данных — 1-2 недели
Подготовка моделей — 2-3 недели
Разработка пайплайна — 4-5 недель
Тестирование и запуск — 2 недели

Почта: info@bi-ai.ru • Telegram: @bi_ai_team • Контакты