Система Прогнозирования Спроса
Ансамблевые ML-модели для 400 000+ товаров
Автоматизированная система использует ансамбль из 15+ моделей машинного обучения для расчёта месячного спроса на каждый артикул. Горизонт прогнозирования — до 15 месяцев с учётом сезонности, трендов и доступности товара.
Исходная ситуация
Задачи бизнеса
- • Прогноз спроса на 400 000+ уникальных товаров на 15 месяцев
- • Учёт периодов отсутствия товара на складе (out-of-stock)
- • Работа с разреженными данными и нерегулярными продажами
- • Прогнозирование для новых товаров с минимальной историей
- • Выявление и учёт сезонных паттернов на длительном периоде
- • Ежемесячное обновление с еженедельными корректировками
Исходные данные
- • История продаж с 2017 года (7+ лет данных)
- • 400 000+ активных артикулов в каталоге
- • Данные об остатках на складе и доступности товаров
- • Кластеры товаров-аналогов для анализа трендов
- • Ценовая информация, скидки и промо-акции
- • Иерархическая структура категорий и подкатегорий
Зачем это бизнесу?
Точный прогноз спроса — основа для оптимизации закупок, управления складом и финансового планирования.
Оптимизация закупок
Система предсказывает, сколько единиц каждого товара потребуется в следующие 15 месяцев. Это позволяет планировать закупки, избегая дефицита и переизбытка.
Пример: прогноз показывает рост спроса на товарную категорию на 25% в следующем месяце — вы заранее увеличиваете заказ у поставщиков.
Снижение неликвида
Прогноз выявляет товары с падающим спросом. Вы не закупаете их впрок, освобождая оборотный капитал для более ходовых позиций.
Пример: прогноз спроса на товар упал с 50 до 10 шт/мес — вы сокращаете заказ и не замораживаете деньги в неликвиде.
Учёт сезонности
Система автоматически выявляет сезонные паттерны на основе многолетней истории. Это критично для товаров с выраженной сезонностью.
Пример: сезонные товары показывают пик спроса в определённые месяцы — система учитывает это при прогнозе на следующий год.
Прогноз для новых товаров
Даже для новых товаров без истории система строит прогноз на основе поведения аналогов в том же кластере и категории.
Пример: новый товар в категории получает прогноз на основе продаж 5 похожих товаров с учётом доли рынка 8-12%.
Точность прогноза по горизонтам
Система обеспечивает точность 90% (WAPE) на горизонте 1-3 месяца, 80% на 6 месяцев и 75% на 12 месяцев.
Это означает, что отклонение фактических продаж от прогноза минимально, что критично для планирования закупок и финансовых показателей.
Как это работает технически
Система использует ансамбль из 15+ моделей: от простых статистических до градиентного бустинга. Каждая модель обучается на 12 временных интервалах с последующим усреднением весов через Ridge Regression.
Используемые модели
Статистические модели
- • AutoETS — экспоненциальное сглаживание с автоподбором компонент
- • DynamicOptimizedTheta — комбинация экспоненциального сглаживания и линейной регрессии
- • SeasonalNaive — наивная модель с учётом сезонности
- • ADIDA — для работы с разреженными данными
- • RandomWalkWithDrift — случайное блуждание с трендом
ML и простые модели
- • Gradient Boosting — XGBoost с автоподбором гиперпараметров
- • ADD — Average Daily Demand с учётом доступности
- • Скользящие средние — за 3/6/9/12/24 месяца
- • Сезонные модели — учёт сезонности и тренда
- • Ridge Regression — ансамблирование всех моделей
Подготовка данных
Обработка исторических данных и расчёт признаков
Система анализирует историю продаж с 2017 года, учитывая только дни с доступностью товара. Это критически важно: если товара не было на складе, его отсутствие не должно снижать прогноз будущего спроса.
Входные признаки
- • История продаж по дням с учётом доступности
- • Принадлежность к кластеру товаров-аналогов
- • Ценовая динамика и промо-акции
- • Сезонные коэффициенты по подкатегориям
Особенности обработки
- • Выявление сезонных колебаний на 3-5 летнем периоде
- • Удаление сезонной компоненты перед обучением
- • Расчёт ADU (Average Daily Usage) за 6 месяцев
- • Анализ трендов по кластерам аналогов
Процесс валидации
12 интервалов обучения для стабильности модели
Система использует rolling window валидацию на 12 периодах со сдвигом в 1 месяц. Это обеспечивает стабильность прогнозов и учёт различных сезонных паттернов.
Веса моделей определяются на основе качества прогнозирования на 6-месячном окне валидации. Ближайшие месяцы получают больший вес.
Ансамблирование моделей
Ridge Regression для объединения всех моделей
Ridge Regression автоматически подбирает веса для каждой модели, минимизируя RMSE с двойным штрафом за недопрогноз. Это критично для бизнеса: лучше немного переоценить спрос, чем столкнуться с дефицитом.
Новые товары
Прогноз на основе товаров-аналогов в кластере. Система анализирует средние продажи похожих товаров и применяет минимальные пороги доли рынка (3-15% в зависимости от сегмента).
Еженедельное обновление прогноза при появлении первых продаж.
Разреженные данные
Применение сглаживания на основе 24-месячного периода с учётом только дней доступности. Корректировка на основе кластера аналогов.
Модели ADIDA и SeasonalExponentialSmoothing специализируются на таких случаях.
Технологический стек
Python 3.8+
scikit-learn, XGBoost, statsmodels
PostgreSQL
Хранение исторических данных и прогнозов
ClickHouse
Аналитические запросы для агрегации продаж
Apache Airflow
Оркестрация ежемесячных перерасчётов
XGBoost
Gradient Boosting с автоподбором гиперпараметров
Statsmodels
ETS, ARIMA, сезонная декомпозиция
Pandas/NumPy
Обработка временных рядов
FastAPI
REST API для получения прогнозов
Результаты проекта
Ключевые достижения системы прогнозирования спроса
Автоматизированный прогноз на горизонте до 15 месяцев для каждого артикула с учётом сезонности, трендов и доступности
Метрики точности (WAPE)
Контроль качества и мониторинг
Метрики оценки
- • WAPE (Weighted Absolute Percentage Error) — основная метрика точности
- • Bias — контроль систематических ошибок (переоценка/недооценка)
- • RMSE — средняя величина ошибки с двойным штрафом за недопрогноз
- • Анализ изменений ADD (Average Daily Demand) между версиями
- • Мониторинг влияния на бизнес-метрики (оборачиваемость, дефициты)
Уровни контроля
- • Автоматический расчёт метрик качества после каждого обновления
- • Анализ изменений прогнозов на уровне категорий товаров
- • Выявление причин существенных изменений ADD
- • Классификация изменений по типам (тренд, сезонность, аномалия)
- • Дашборды для визуализации качества прогнозов
Нужна система прогнозирования спроса?
Создадим промышленную систему прогнозирования для вашего ассортимента. Настроим ансамбль моделей, интеграцию с DWH и обучим команду работе с прогнозами.
Что входит в проект
Стоимость зависит от количества товаров, горизонта прогноза и требований к интеграции
Почта: info@bi-ai.ru • Telegram: @bi_ai_team • Контакты