Метод экспоненциального сглаживания. Тема: Методы экспоненциального сглаживания

02.04.2011 – Стремление человека приподнять завесу грядущего и предвидеть ход событий имеет такую же длинную историю, как и его попытки, понять окружающий мир. Очевидно, что в основе интереса к прогнозу лежат достаточно сильные жизненные мотивы (теоретические и практические). Прогноз выступает в качестве важнейшего метода проверки научных теорий и гипотез. Способность предвидеть будущее является неотъемлемой стороной сознания, без которой была бы невозможна сама человеческая жизнь.

Понятие “прогнозирование” (от греч. prognosis – предвидение, предсказание) означает процесс разработки вероятностного суждения о состоянии какого-либо явления или процесса в будущем, это познание того, чего еще нет, но что может наступить в ближайшее или отдаленное время.

Прогноз по своему содержанию более сложен, чем предсказание. Он, с одной стороны, отражает наиболее вероятное состояние объекта, а с другой – определяет пути и средства достижения желаемого результата. На основе полученной прогнозным путем информации по достижению желаемой цели, принимаются определенные решения.

Необходимо отметить, что динамика экономических процессов в современных условиях отличается нестабильностью и неопределенностью, что затрудняет применение традиционных методов прогнозирования.

Модели экспоненциального сглаживания и прогнозирования относятся к классу адаптивных методов прогнозирования, основной характеристикой которых является способность непрерывно учитывать эволюцию динамических характеристик изучаемых процессов, подстраиваться под эту динамику, придавая, в частности, тем больший вес и тем более высокую информационную ценность имеющимся наблюдениям, чем ближе они расположены к текущему моменту времени. Смысл термина состоит в том, что адаптивное прогнозирование позволяет обновлять прогнозы с минимальной задержкой и с помощью относительно несложных математических процедур.

Метод экспоненциального сглаживания был независимо открыт Брауном (Brown R.G. Statistical forecasting for inventory control, 1959) и Хольтом (Holt C.C. Forecasting Seasonal and Trends by Exponentially Weighted Moving Averages, 1957). Экспоненциальное сглаживание, как и метод скользящих средних, для прогноза использует прошлые значения временного ряда.

Сущность метода экспоненциального сглаживания заключается в том, что временной ряд сглаживается с помощью взвешенной скользящей средней, в которой веса подчиняются экспоненциальному закону. Взвешенная скользящая средняя с экспоненциально распределенными весами характеризует значение процесса на конце интервала сглаживания, то есть является средней характеристикой последних уровней ряда. Именно это свойство и используется для прогнозирования.

Обычное экспоненциальное сглаживание применяется в случае отсутствия в данных тренда или сезонности. В этом случае прогноз является взвешенной средней всех доступных предыдущих значений ряда; веса при этом со временем геометрически убывают по мере продвижения в прошлое (назад). Поэтому (в отличие от метода скользящего среднего) здесь нет точки, на которой веса обрываются, то есть зануляются. Прагматически ясная модель простого экспоненциального сглаживания может быть записана следующим (по представленной ссылке можно скачать все формулы статьи):

Покажем экспоненциальный характер убывания весов значений временного ряда – от текущего к предыдущему, от предыдущего к пред–предыдущему и так далее:

Если формула применяется рекурсивно, то каждое новое сглаженное значение (которое является также прогнозом) вычисляется как взвешенное среднее текущего наблюдения и сглаженного ряда. Очевидно, что результат сглаживания зависит от параметра адаптации альфа . Его можно интерпретировать как коэффициент дисконтирования, характеризующий меру девальвации данных за единицу времени. Причем влияние данных на прогноз экспоненциально убывает с “возрастом” данных. Зависимость влияния данных на прогноз при разных коэффициентах альфа приведена на рисунке 1.

Рисунок 1. Зависимость влияния данных на прогноз при разных коэффициентах адаптации

Следует заметить, что значение сглаживающего параметра не может равняться 0 или 1, так как в этом случае сама идея экспоненциального сглаживания отвергается. Так, если альфа равняется 1, то прогнозное значение F t+1 совпадает с текущим значением ряда Хt , при этом экспоненциальная модель стремится к самой простой “наивной” модели, то есть в этом случае прогнозирование является абсолютно тривиальным процессом. Если альфа равняется 0, то начальное прогнозное значение F 0 (initial value ) одновременно будет являться прогнозом для всех последующих моментов ряда, то есть прогноз в этом случае будет выглядеть в виде обычной горизонтальной линии.

Тем не менее, рассмотрим варианты сглаживающего параметра, близкие к 1 или 0. Так, если альфа близко к 1, то предыдущие наблюдения временного ряда практически полностью игнорируются. В случае если альфа близко к 0, то игнорируются уже текущие наблюдения. Значения альфа между 0 и 1 дают промежуточные результаты. По мнению ряда авторов, оптимальное значение альфа находится в пределах от 0,05 до 0,30. Однако иногда альфа , большее 0,30, дает лучший прогноз.

В целом лучше оценивать оптимальное альфа по исходным данным (при помощи поиска по сетке), а не использовать искусственные рекомендации. Тем не менее, в случае если значение альфа , превышающее 0,3, минимизирует ряд специальных критериев, то это указывает на то, что другая техника прогнозирования (с применением тренда или сезонности) способна обеспечить еще более точные результаты. Для нахождения оптимального значения альфа (то есть минимизации специальных критериев) используется квазиньютоновский алгоритм максимизации правдоподобия (вероятности), который эффективнее обычного перебора на сетке.

Перепишем уравнение (1) в виде альтернативного варианта, позволяющего оценить, как модель экспоненциального сглаживания “обучается” на своих прошлых ошибках:

Из уравнения (3) ярко видно, что прогноз на период t+1 подлежит изменению в сторону увеличения, в случае превышения фактического значения временного ряда в период t над прогнозным значением, и, наоборот, прогноз на период t+1 должен быть уменьшен, если Х t меньше, чем F t .

Отметим, что при использовании методов экспоненциального сглаживания важным вопросом всегда является определение начальных условий (начального прогнозного значения F 0 ). Процесс выбора начального значения сглаженного ряда называется инициализацией (initializing ), или, иначе, “разогревом” (“warming up ”) модели. Дело в том, что начальное значение сглаженного процесса может существенным образом повлиять на прогноз для последующих наблюдений. С другой стороны, влияние выбора уменьшается с длиной ряда и становится некритичным при очень большом числе наблюдений. Браун впервые предложил использовать в качестве стартового значения среднее динамического ряда. Другие авторы предлагают использовать в качестве начального прогноза первое фактическое значение временного ряда.

В середине прошлого века Хольт предложил расширить модель простого экспоненциального сглаживания за счет включения в нее фактора роста (growth factor ), или иначе тренда (trend factor ). В результате модель Хольта может быть записана следующим образом:

Данный метод позволяет учесть присутствие в данных линейного тренда. Позднее были предложены другие виды трендов: экспоненциальный, демпфированный и др.

Винтерс предложил усовершенствовать модель Хольта с точки зрения возможности описания влияния сезонных факторов (Winters P.R. Forecasting Sales by Exponentially Weighted Moving Averages, 1960).

В частности, он далее расширил модель Хольта за счет включения в нее дополнительного уравнения, описывающего поведение сезонной компоненты (составляющей). Система уравнений модели Винтерса выглядит следующим образом:

Дробь в первом уравнении служит для исключения сезонности из исходного ряда. После исключения сезонности (по методу сезонной декомпозиции Census I ) алгоритм работает с “чистыми” данными, в которых нет сезонных колебаний. Появляются они уже в самом финальном прогнозе (15), когда “чистый” прогноз, посчитанный почти по методу Хольта, умножается на сезонную компоненту (индекс сезонности ).

Насколько Forecast NOW! лучше модели Экспоненциального сглаживания (ES) вы можете увидеть на графике ниже. По оси X - номер товара, по оси Y - процентное улучшение качества прогноза. Описание модели, детальное исследование, результаты экспериментов читайте ниже.

Описание модели

Прогнозирование методом экспоненциального сглаживания является одним из самых простых способов прогнозирования. Прогноз может быть получен только на один период вперед. Если прогнозирование ведется в разрезе дней, то только на один день вперед, если недель, то на одну неделю.

Для сравнения прогнозирование проводилось на неделю вперед в течение 8 недель.

Что такое экспоненциально сглаживание?

Пусть ряд С представляет исходный ряд продаж для прогнозирования

С(1)- продажи в первую неделю, С (2) во второй и так далее.

Рисунок 1. Продажи по неделям, ряд С

Аналогично, ряд S представляет собой экспоненциально сглаженный ряд продаж. Коэффициент α находится от нуля до единицы. Получается он следующим образом, здесь t - момент времени (день, неделя)

S (t+1) = S(t) + α *(С(t) - S(t))

Большие значения константы сглаживания α ускоряют отклик прогноза на скачок наблюдаемого процесса, но могут привести к непредсказуемым выбросам, потому что сглаживание будет почти отсутствовать.

Первый раз после начала наблюдений, располагая лишь одним результатом наблюдений С (1) , когда прогноза S(1) нет и формулой (1) воспользоваться еще невозможно, в качестве прогноза S(2) следует взять С (1) .

Формула легко может быть переписана в ином виде:

S(t+1) = (1 - α)* S(t) + α * С(t) .

Таким образом, с увеличением константы сглаживания доля последних продаж увеличивается, а доля сглаженных предыдущих уменьшается.

Константа α выбирается опытным путем. Обычно строится несколько прогнозов для разных констант и выбирается наиболее оптимальная константа с точки зрения выбранного критерия.

Критерием может выступать точность прогнозирования на предыдущие периоды.

В своем исследовании мы рассмотрели модели экспоненциального сглаживания, в которых α принимает значения {0.2, 0.4, 0.6, 0.8}. Для сравнения с алгоритмом прогнозирования Forecast NOW! для каждого товара строились прогнозы при каждом α, выбирался наиболее точный прогноз. В действительности же, ситуация обстояла бы гораздо более сложная, пользователю не зная наперед точности прогноза нужно определиться с коэффициентом α, от которого очень сильно зависит качество прогноза. Вот такой замкнутый круг.

Наглядно

Рисунок 2. α =0.2 , степень экспоненциального сглаживания высокая, реальные продажи учитываются слабо

Рисунок 3. α =0.4 , степень экспоненциального сглаживания средняя, реальные продажи учитываются в средней степени

Можно видеть как с увеличением константы α сглаженный ряд все сильнее соответствует реальным продажам, и если там присутствуют выбросы или аномалии, мы получим крайне неточный прогноз.

Рисунок 4. α =0.6 , степень экспоненциального сглаживания низкая, реальные продажи учитываются значительно

Можем видеть, что при α=0.8 ряд почти в точности повторяет исходный, а значит прогноз стремится к правилу «будет продано столько же, сколько и вчера»

Стоит отметить, что здесь совершенно нельзя ориентироваться на ошибку приближения к исходным данным. Можно добиться идеального соответствия, но получить неприемлемый прогноз.

Рисунок 5. α =0.8 , степень экспоненциального сглаживания крайне низкая, реальные продажи учитываются сильно

Примеры прогнозов

Теперь давайте посмотрим на прогнозы, которые получаются с использованием различных значений α. Как можно видеть из рисунка 6 и 7, чем больше коэффициент сглаживания, тем точнее повторяет реальные продажи с опозданием на один шаг, прогноз. Такое опоздание на деле может оказаться критичным, поэтому нельзя просто выбирать максимальное значение α. Иначе получится ситуация, когда мы говорим, что будет продано ровно столько, сколько было продано в прошлый период.

Рисунок 6. Прогноз метода экспоненциального сглаживания при α=0.2

Рисунок 7. Прогноз метода экспоненциального сглаживания при α=0.6

Давайте посмотрим, что получается при α = 1.0. Напомним, S - прогнозируемые (сглаженные) продажи, C - реальные продажи.

S(t+1) = (1 - α)* S(t) + α * С(t) .

S(t+1) = С(t) .

Продажи в t+1 день согласно прогнозу равны продажам в предыдущий день. Поэтому к выбору константы надо подходить с умом.

Сравнение с Forecast NOW!

Теперь рассмотрим данный метод прогнозирования в сравнении с Forecast NOW!. Сравнение велось на 256 товарах, которые имеют различные продажи, с сезонностью краткосрочной и долгосрочной, с «плохими» продажами и дефицитом, акциями и прочими выбросами. Для каждого товара был построен прогноз по модели экспоненциального сглаживания, для различных α, выбирался лучший и сравнивался с прогнозом по модели Forecast NOW!

В таблице ниже вы видите значение ошибки прогноза для каждого товара. Ошибка здесь считалась как RMSE. Это корень из среднеквадратичного отклонения прогноза от реальности. Грубо говоря, показывает, на сколько единиц товара мы отклонились в прогнозе. Улучшение показывает, на сколько процентов прогноз Forecast NOW! лучше, если цифра положительная, и хуже, если отрицательная. На рисунке 8 по оси X отложены товары, по оси Y указано насколько прогноз Forecast NOW! лучше, чем прогнозирование методом экспоненциального сглаживания. Как можно видеть из этого графика, точность прогнозирования Forecast NOW! почти всегда в два раза выше и почти никогда не хуже. На деле это означает, что использование Forecast NOW! позволит в два раза сократить запасы или снизить дефицит.

Сервис позволит провести сглаживание временного ряда y t экспоненциальным методом, т.е. простроить модель Брауна (см. пример).

Инструкция . Укажите количество данных (количество строк), нажмите Далее. Полученное решение сохраняется в файле Word .

Количество строк (исходных данных)

Особенность метода экспоненциального сглаживания заключается в том, что в процедуре нахождения сглаженного уровня используются значения только предшествующих уровней ряда, взятые с определенным весом, причем вес уменьшается по мере удаления его от момента времени, для которого определяется сглаженное значение уровня ряда. Если для исходного временного ряда y 1 , y 2 , y 3 ,…, y n соответствующие сглаженные значения уровней обозначить через S t , t = 1,2,...,n , то экспоненциальное сглаживание осуществляется по формуле:

S t = (1-α)yt + αS t-1

В некоторых источниках приводится другая формула:

S t = αyt + (1-α)S t-1

Где α - параметр сглаживания (0 В практических задачах обработки экономических временных рядов рекомендуется (необоснованно) выбирать величину параметра сглаживания в интервале от 0.1 до 0.3 . Других точных рекомендаций для выбора оптимальной величины параметра α пока нет. В отдельных случаях предлагается определять величину α исходя их длины сглаживаемого ряда: α = 2/(n+1).
Что касается начального параметра S 0 , то в задачах его берут или равным значению первого уровня ряда у 1 , или равным средней арифметической нескольких первых членов ряда. Если при подходе к правому концу временного ряда сглаженные этим методом значения при выбранном параметре α начинают значительно отличаться от соответствующих значений исходного ряда, необходимо перейти на другой параметр сглаживания. Достоинством этого метода является то, что при сглаживании не теряются ни начальные, ни конечные уровни сглаживаемого временного ряда.

Сглаживание экспоненциальным методом в Excel

Для вычисления каждого прогноза MS Excel использует отдельную, но алгебраически эквивалентную формулу. Оба компонента – данные предыдущего наблюдения и предыдущий прогноз – каждого прогноза умножаются на коэффициент, отображающий вклад данного компонента в текущий прогноз.
Активизировать средство Экспоненциальное сглаживание можно, выбрав команду Сервис/Анализ данных после загрузки надстройки Пакет анализа ().

Пример . Проверить ряд на наличие выбросов методом Ирвина, сгладить методом экспоненциального сглаживания (α = 0.1).
В качестве S 0 берем среднее арифметическое первых 3 значения ряда.
S 0 = (50 + 56 + 46)/3 = 50.67

t y S t Формула
1 50 50.07 (1 - 0.1)*50 + 0.1*50.67
2 56 55.41 (1 - 0.1)*56 + 0.1*50.07
3 46 46.94 (1 - 0.1)*46 + 0.1*55.41
4 48 47.89 (1 - 0.1)*48 + 0.1*46.94
5 49 48.89 (1 - 0.1)*49 + 0.1*47.89
6 46 46.29 (1 - 0.1)*46 + 0.1*48.89
7 48 47.83 (1 - 0.1)*48 + 0.1*46.29
8 47 47.08 (1 - 0.1)*47 + 0.1*47.83
9 47 47.01 (1 - 0.1)*47 + 0.1*47.08
10 49 48.8 (1 - 0.1)*49 + 0.1*47.01

Экстраполяция - это метод научного исследования, который основан на распространении прошлых и настоящих тенденций, закономерностей, связей на будущее развитие объекта прогнозирования. К методам экстраполяции относятся метод скользящей средней, метод экспоненциального сглаживания, метод наименьших квадратов.

Метод экспоненциального сглаживания наиболее эффективен при разработке среднесрочных прогнозов. Он приемлем при прогнозировании только на один период вперед. Его основные достоинства простота процедуры вычислений и возможность учета весов исходной информации. Рабочая формула метода экспоненциального сглаживания:

При прогнозировании данным методом возникает два затруднения:

  • выбор значения параметра сглаживания α;
  • определение начального значения Uo.

От величины α зависит , как быстро снижается вес влияния предшествующих наблюдений. Чем больше α, тем меньше сказывается влияние предшествующих лет. Если значение α близко к единице, то это приводит к учету при прогнозе в основном влияния лишь последних наблюдений. Если значение α близко к нулю, то веса, по которым взвешиваются уровни временного ряда, убывают медленно, т.е. при прогнозе учитываются все (или почти все) прошлые наблюдения.

Таким образом, если есть уверенность, что начальные условия, на основании которых разрабатывается прогноз, достоверны, следует использовать небольшую величину параметра сглаживания (α→0). Когда параметр сглаживания мал, то исследуемая функция ведет себя как средняя из большого числа прошлых уровней. Если нет достаточной уверенности в начальных условиях прогнозирования, то следует использовать большую величину α, что приведет к учету при прогнозе в основном влияния последних наблюдений.

Точного метода для выбора оптимальной величины параметра сглаживания α нет. В отдельных случаях автор данного метода профессор Браун предлагал определять величину α, исходя из длины интервала сглаживания. При этом α вычисляется по формуле:

где n – число наблюдений, входящих в интервал сглаживания.

Задача выбора Uo (экспоненциально взвешенного среднего начального) решается следующими способами:

  • если есть данные о развитии явления в прошлом, то можно воспользоваться средней арифметической и приравнять к ней Uo;
  • если таких сведений нет, то в качестве Uo используют исходное первое значение базы прогноза У1.

Также можно воспользоваться экспертными оценками.

Отметим, что при изучении экономических временных рядов и прогнозировании экономических процессов метод экспоненциального сглаживания не всегда «срабатывает». Это обусловлено тем, что экономические временные ряды бывают слишком короткими (15-20 наблюдений), и в случае, когда темпы роста и прироста велики, данный метод не «успевает» отразить все изменения.

Пример применения метода экспоненциального сглаживания для разработки прогноза

Задача . Имеются данные, характеризующие уровень безработицы в регионе, %

  • Постройте прогноз уровня безработицы в регионе на ноябрь, декабрь, январь месяцы, используя методы: скользящей средней, экспоненциального сглаживания, наименьших квадратов.
  • Рассчитайте ошибки полученных прогнозов при использовании каждого метода.
  • Сравните полученные результаты, сделайте выводы.

Решение методом экспоненциального сглаживания

1) Определяем значение параметра сглаживания по формуле:

где n – число наблюдений, входящих в интервал сглаживания. α = 2/ (10+1) = 0,2

2) Определяем начальное значение Uo двумя способами:
І способ (средняя арифметическая) Uo = (2,99 + 2,66 + 2,63 + 2,56 + 2,40 + 2,22 + 1,97 + 1,72 + 1,56 + 1,42)/10 = 22,13/10 = 2,21
II способ (принимаем первое значение базы прогноза) Uo = 2,99

3) Рассчитываем экспоненциально взвешенную среднюю для каждого периода, используя формулу

где t – период, предшествующий прогнозному; t+1 – прогнозный период; Ut+1 - прогнозируемый показатель; α - параметр сглаживания; Уt - фактическое значение исследуемого показателя за период, предшествующий прогнозному; Ut - экспоненциально взвешенная средняя для периода, предшествующего прогнозному.

Например:
Uфев = 2,99*0,2 +(1-0,2) * 2,21 = 2,37 (І способ)
Uмарт = 2,66*0,2+(1-0,2) * 2,37 = 2,43 (І способ) и т.д.

Uфев = 2,99*0,2 +(1-0,2) * 2,99 = 2,99 (II способ)
Uмарт = 2,66*0,2+(1-0,2) * 2,99 = 2,92 (II способ)
Uапр = 2,63*0,2+(1-0,2) * 2,92 = 2,86 (II способ) и т.д.

4) По этой же формуле вычисляем прогнозное значение
Uноябрь= 1,42*0,2+(1-0,2) * 2,08 = 1,95 (І способ)
Uноябрь= 1,42*0,2+(1-0,2) * 2,18 = 2,03 (ІІ способ)
Результаты заносим в таблицу.

5) Рассчитываем среднюю относительную ошибку по формуле:

ε = 209,58/10 = 20,96% (І способ)
ε = 255,63/10 = 25,56% (ІІ способ)

В каждом случае точность прогноза является удовлетворительной поскольку средняя относительная ошибка попадает в пределы 20-50%.

Решив данную задачу методами скользящей средней и наименьших квадратов , сделаем выводы.

9 5. Метод экспоненциального сглаживания. Выбор постоянной сглаживания

При использовании метода наименьших квадратов для определения прогнозной тенденции (тренда) заранее предполагают, что все ретроспективные данные (наблюдения) обладают одинаковой информативностью. Очевидно, логичнее было бы учесть процесс дисконтирования исходной информации, то есть неравноценность этих данных для разработки прогноза. Это достигается в методе экспоненциального сглаживания путем придания последним наблюдения динамического ряда (то есть значениям, непосредственно предшествующим периоду упреждения прогноза) более значимых «весов» по сравнению с начальными наблюдениями. К достоинствам метода экспоненциального сглаживания следует также отнести простоту вычислительных операций и гибкость описания различных динамик процесса. Наибольшее применения метод нашел для реализации среднесрочных прогнозов .

5.1. Сущность метода экспоненциального сглаживания

Сущность метода состоит в том, что динамический ряд сглаживается с помощью взвешенной «скользящей средней», в которой веса подчиняются экспоненциальному закону. Другими словами, чем дальше от конца временного ряда отстоит точка, для которой вычисляется взвешенная скользящая средняя, тем меньше «участия она принимает» в разработке прогноза.

Пусть исходный динамический ряд состоит из уровней (составляющих ряда) y t , t = 1 , 2 ,...,n . Для каждыхm последовательных уровней этого ряда

(m

динамическому ряду с шагом, равным единице. Если m – нечетное число, а предпочтительно брать нечетное число уровней, поскольку в этом случае расчетное значение уровня окажется в центре интервала сглаживания и им легко заменить фактическое значение, то для определения скользящей средней можно записать следующую формулу:

t+ ξ

t+ ξ

∑ y i

∑ y i

i= t− ξ

i= t− ξ

2ξ + 1

где y t – значение скользящей средней для моментаt (t = 1 , 2 ,...,n );y i – фактическое значение уровня в моментi ;

i – порядковый номер уровня в интервале сглаживания.

Величина ξ определяется из продолжительности интервала сглаживания.

Поскольку

m =2 ξ +1

при нечетном m , то

ξ = m 2 − 1 .

Расчет скользящей средней при большом числе уровней можно упростить, определяя последовательные значения скользящей средней рекурсивно:

y t= y t− 1 +

yt + ξ

− y t − (ξ + 1 )

2ξ + 1

Но исходя из того, что последним наблюдениям необходимо придать больший «вес», скользящее среднее нуждается в ином толковании. Оно заключается в том, что полученная с помощью усреднения величина заменяет не центральный член интервала усреднения, а его последний член. Соответственно этому последнее выражение можно переписать в виде

M i = Mi + 1

y i− y i− m

Здесь скользящая средняя, относимая к концу интервала, обозначена новым символом M i . По существу,M i равноy t , сдвинутому наξ шагов вправо, то естьM i = y t + ξ , гдеi = t + ξ .

Учитывая, что M i − 1 является оценкой величиныy i − m , выражение (5.1)

можно переписать в виде

y i+ 1

M i − 1 ,

M i , определяемой выражением (5.1).

где M i является оценкой

Если вычисления (5.2) повторять по мере поступления новой информации

и переписать в ином виде, то получим сглаженную функцию наблюдений:

Q i= α y i+ (1 − α ) Q i− 1 ,

или в эквивалентной форме

Q t= α y t+ (1 − α ) Q t− 1

Вычисления, проводимые по выражению (5.3) с каждым новым наблюдением, называются экспоненциальным сглаживанием. В последнем выражении для отличия экспоненциального сглаживания от скользящего среднего введено обозначение Q вместоM . Величинаα , являющаяся

аналогом m 1 , называется постоянной сглаживания. Значенияα лежат в

интервале [ 0 , 1 ] . Еслиα представить в виде ряда

α + α(1 − α) + α(1 − α) 2 + α(1 − α) 3 + ... + α(1 − α) n ,

то нетрудно заметить, что «веса» убывают по экспоненциальному закону во времени. Например, для α = 0 , 2 получим

0,2 + 0,16 + 0,128 + 0,102 + 0,082 + …

Сумма ряда стремится к единице, а члены суммы убывают со временем.

Величина Q t в выражении (5.3) представляет собой экспоненциальную среднюю первого порядка, то есть среднюю, полученную непосредственно при

сглаживании данных наблюдения (первичное сглаживание). Иногда при разработке статистических моделей полезно прибегнуть к расчету экспоненциальных средних более высоких порядков, то есть средних, получаемых путем многократного экспоненциального сглаживания.

Общая запись в рекуррентной форме экспоненциальной средней порядка k имеет вид

Q t (k)= α Q t (k− 1 )+ (1 − α ) Q t (− k1 ).

Величина k изменяется в пределах1, 2, …, p ,p+1 , гдеp – порядок прогнозного полинома (линейного, квадратичного и так далее).

На основе этой формулы для экспоненциальной средней первого, второго и третьего порядков получены выражения

Q t (1 )= α y t + (1 − α ) Q t (− 1 1 );

Q t (2 )= α Q t (1 )+ (1 − α ) Q t (− 2 1 ); Q t (3 )= α Q t (2 )+ (1 − α ) Q t (− 3 1 ).

5.2. Определение параметров прогнозной модели методом экспоненциального сглаживания

Очевидно, что для разработки прогнозных значений на основе динамического ряда методом экспоненциального сглаживания необходимо вычислить коэффициенты уравнения тренда через экспоненциальные средние. Оценки коэффициентов определяются по фундаментальной теореме БраунаМейера, связывающей коэффициенты прогнозирующего полинома с экспоненциальными средними соответствующих порядков:

(− 1 )

aˆ p

α (1 − α )∞

−α )

j (p − 1 + j ) !

∑ j

p= 0

p! (k− 1 ) !j = 0

где aˆ p – оценки коэффициентов полинома степенир .

Коэффициенты находятся решением системы (p + 1 ) уравнений сp + 1

неизвестными.

Так, для линейной модели

aˆ 0 = 2 Q t (1 ) − Q t (2 ) ; aˆ 1 = 1 − α α (Q t (1 )− Q t (2 )) ;

для квадратичной модели

aˆ 0 = 3 (Q t (1 )− Q t (2 )) + Q t (3 );

aˆ 1 =1 − α α [ (6 −5 α ) Q t (1 ) −2 (5 −4 α ) Q t (2 ) +(4 −3 α ) Q t (3 ) ] ;

aˆ 2 = (1 − α α ) 2 [ Q t (1 )− 2 Q t (2 )+ Q t (3 )] .

Прогноз реализуется по выбранному многочлену соответственно для линейной модели

ˆyt + τ = aˆ0 + aˆ1 τ ;

для квадратичной модели

ˆyt + τ = aˆ0 + aˆ1 τ + aˆ 2 2 τ 2 ,

где τ – шаг прогнозирования.

Необходимо отметить, что экспоненциальные средние Q t (k ) можно вычислить только при известном (выбранном) параметре, зная начальные условияQ 0 (k ) .

Оценки начальных условий, в частности, для линейной модели

Q (1 )= a

1 − α

Q(2 ) = a− 2 (1 − α ) a

для квадратичной модели

Q (1 )= a

1 − α

+ (1 − α )(2 − α ) a

2(1− α )

(1− α )(3− 2α )

Q 0(2 ) = a 0−

2α 2

Q (3 )= a

3(1− α )

(1 − α )(4 − 3 α ) a

где коэффициенты a 0 иa 1 вычисляются методом наименьших квадратов.

Величина параметра сглаживания α приближенно вычисляется по формуле

α ≈ m 2 + 1 ,

где m – число наблюдений (значений) в интервале сглаживания. Последовательность вычисления прогнозных значений представлена на

Расчет коэффициентов ряда методом наименьших квадратов

Определение интервала сглаживания

Вычисление постоянной сглаживания

Вычисление начальных условий

Вычисление экспоненциальных средних

Вычисление оценок a 0 , a 1 и т.д.

Расчет прогнозных значений ряда

Рис. 5.1. Последовательность вычисления прогнозных значений

В качестве примера рассмотрим процедуру получения прогнозного значения безотказной работы изделия, выражаемой наработкой на отказ.

Исходные данные сведены в табл. 5.1.

Выбираем линейную модель прогнозирования в виде y t = a 0 + a 1 τ

Решение осуществим со следующими значениями начальных величин:

a 0 , 0 = 64, 2; a 1 , 0 = 31, 5; α = 0, 305.

Таблица 5.1. Исходные данные

Номер наблюдения, t

Длина шага, прогнозирования, τ

Наработка на отказ, y (час)

При этих значениях вычисленные «сглаженные» коэффициенты для

величины y 2 будут равны

= α Q (1 )− Q (2 )= 97 , 9 ;

[ Q (1 )− Q (2 )

31, 9 ,

1− α

при начальных условиях

1 − α

A 0 , 0 −

a 1, 0

= −7 , 6

1 − α

= −79 , 4

и экспоненциальных средних

Q (1 )= α y + (1 − α ) Q (1 )

25, 2;

Q (2 )

= α Q (1 )

+ (1 −α ) Q (2 ) = −47 , 5 .

«Сглаженная» величина y 2 при этом вычисляется по формуле

Q i (1 )

Q i (2 )

a 0 ,i

a 1 ,i

ˆyt

Таким образом (табл. 5.2), линейная прогнозная модель имеет вид

ˆy t + τ = 224, 5+ 32τ .

Вычислим прогнозные значения для периодов упреждения в 2 года (τ = 1 ), 4 года (τ = 2 ) и так далее наработки на отказ изделия (табл. 5.3).

Таблица 5.3. Прогнозные значенияˆy t

Уравнение

t + 2

t + 4

t + 6

t + 8

t + 20

регрессии

(τ = 1 )

(τ = 2 )

(τ = 3 )

(τ = 5 )

τ =

ˆy t = 224, 5+ 32τ

Следует отметить, что суммарный «вес» последних m значений временного ряда можно вычислить по формуле

c = 1 − (m (− 1 ) m ) . m+ 1

Так, для двух последних наблюдений ряда (m = 2 ) величинаc = 1 − (2 2 − + 1 1 ) 2 = 0 , 667 .

5.3. Выбор начальных условий и определение постоянной сглаживания

Как следует из выражения

Q t= α y t+ (1 − α ) Q t− 1 ,

при проведении экспоненциального сглаживания необходимо знать начальное (предыдущее) значение сглаживаемой функции. В некоторых случаях за начальное значение можно взять первое наблюдение, чаще начальные условия определяются согласно выражениям (5.4) и (5.5). При этом величины a 0 , 0 ,a 1 , 0

и a 2 , 0 определяются методом наименьших квадратов.

Если мы не очень доверяем выбранному начальному значению, то, взяв большое значение постоянной сглаживания α черезk наблюдений, мы доведем

«вес» начального значения до величины (1 − α ) k << α , и оно будет практически забыто. Наоборот, если мы уверены в правильности выбранного начального значения и неизменности модели в течение определенного отрезка времени в будущем,α может быть выбрано малым (близким к 0).

Таким образом, выбор постоянной сглаживания (или числа наблюдений в движущейся средней) предполагает принятие компромиссного решения. Обычно, как показывает практика, величина постоянной сглаживания лежит в пределах от 0,01 до 0,3.

Известно несколько переходов, позволяющих найти приближенную оценку α . Первый вытекает из условия равенства скользящей и экспоненциальной средней

α = m 2 + 1 ,

где m – число наблюдений в интервале сглаживания. Остальные подходы связываются с точностью прогноза.

Так, возможно определение α исходя из соотношения Мейера:

α ≈ S y ,

где S y – среднеквадратическая ошибка модели;

S 1 – среднеквадратическая ошибка исходного ряда.

Однако использование последнего соотношения затруднено тем, что достоверно определить S y иS 1 из исходной информации весьма сложно.

Часто параметр сглаживания, а заодно и коэффициенты a 0 , 0 иa 0 , 1

подбирают оптимальными в зависимости от критерия

S 2 = α ∑ ∞ (1 − α ) j [ yij − ˆyij ] 2 → min

j= 0

путем решения алгебраической системы уравнений, которую получают, приравнивая к нулю производные

∂ S2

∂ S2

∂ S2

∂ a 0, 0

∂ a 1, 0

∂ a 2, 0

Так, для линейной модели прогнозирования исходный критерий равен

S 2 = α ∑ ∞ (1 − α ) j [ yij − a0 , 0 − a1 , 0 τ ] 2 → min.

j= 0

Решение этой системы с помощью ЭВМ не представляет никаких сложностей.

Для обоснованного выбора α также можно использовать процедуру обобщенного сглаживания, которая позволяет получить следующие соотношения, связывающие дисперсию прогноза и параметр сглаживания для линейной модели:

S п 2 ≈[ 1 + α β ] 2 [ 1 +4 β +5 β 2 +2 α (1 +3 β ) τ +2 α 2 τ 3 ] S y 2

для квадратичной модели

S п 2≈ [ 2 α + 3 α 3+ 3 α 2τ ] S y 2,

где β = 1 α ;S y – СКО аппроксимации исходного динамического ряда.