Методы сглаживания временных рядов. Методы сглаживания и выравнивания динамических рядов

Эконометрика 1 модуль
1. В каком законе выяснялись закономерности спроса на основе соотношений между урожаем зерновых и ценами на зерно?
в законе Кинга
2. Как называется мера разброса случайной величины?
дисперсия
3. При исследований каких моделей эконометрическое исследование может включать в себя выявление трендов, лагов, циклической компоненты?
моделей временных рядов
4. Какая из перечисленных шкал не относится к основным шкалам качественных признаков?
шкала отношений
5. Кто основал журнал «Эконометрика»?
Р. Фриш
6. Что из перечисленного может включать эконометрическое исследование на современном этапе развития при исследовании моделей по независимым неупорядоченным наблюдениям?
оценку параметров модели
7. В какой шкале есть естественная единица измерения, но нет естественного начала отсчета?
в шкале разностей
8. Кто из ученых создал теорию интегрированных моделей авторегрессии ¾ скользящего среднего?
Дж. Бокс и Г. Дженкинс
9. В какой системе каждая объясняемая переменная рассматривается как функция одного и того же набора факторов?
в системе независимых уравнений
10. Какая шкала измерений относится к шкалам количественных признаков?
шкала интервалов
11. Какие эконометрические модели разработали в 80 - в начале 90-х гг. Р.Э. Игл, Т. Боллеслев и Нельсон?
модели авторегрессионной условной гетероскедастичности
12. Какие шкалы измерений являются наиболее распространенными и удобными?
шкалы отношений
13. Какому ученому в 1980 г. присуждена Нобелевская премия за применение эконометрических моделей к анализу экономических колебаний и в экономической политике?
Л. Клейну
14. В какой стране было создано первое международное эконометрическое общество?
в США
15. Что из перечисленного является постоянной составляющей случайной величины?
среднеарифметическое значение
16. Что является целью эконометрики как науки? (по Э. Маленво)
эмпирический анализ экономических законов
17. Кто из исследователей придавал широкое толкование эконометрике, интерпретируя ее как любое применение математики или статистических методов к изучению экономических явлений?
Э. Маленво
18. Какие компоненты входят в состав случайных величин в процессе анализа?
постоянная и случайная компоненты
19. Чему равно среднее случайной компоненты, или остатка?
0
20. Кто впервые ввел термин «эконометрия»?
П. Цьемпа
21. Кто из отечественных ученых на союзном уровне описал динамику урожайности зерновых культур уравнениями с малым числом параметров?
В. Обухов
22. Какие разделы содержит эконометрика?
моделирование данных, неупорядоченных во времени, и теория временных рядов
23. Какие характеристики экономики невозможно измерить непосредственно?
латентные характеристики
24. Кто из ученых занимался проблемой цикличности?
К. Жюгляр
25. Кто является автором первой книги по эконометрике «Законы заработной платы: эссе по статистической экономике»?
Г. Мур

2 модуль
1. Если регрессия значима, то
Fнабл>Fкрит
2. Что показывает величина коэффициента регрессии?
среднее изменение результата с изменением фактора на одну единицу
3. Что означает совпадение среднего от выборочной оценки с искомой неизвестной величиной соответствующего параметра для генеральной совокупности?
несмещенность
4. Какой является регрессия, если k= 2?
множественной
5. Чем характеризуется рассеяние (отклонение) точек наблюдения относительно кривой регрессии?
остаточной регрессией
6. Какой коэффициент является показателем тесноты связи?
линейный коэффициент корреляции
7. Какая величина равна просто средней от суммы квадратов остатков (отклонений)?
остаточная регрессия
8. Каким выражением определяется коэффициент корреляции, являющийся мерой линейной связи между случайными величинами x и y?
r(x, y)=…
9. Какого значения не должна превышать средняя ошибка аппроксимации?
7-8%
10. Кто ввел термин «регрессия»?
Ф. Гальтон
11. Какой коэффициент в функции потребления используется для расчета мультипликатора?
коэффициент регрессии
12. С помощью какого коэффициента определяется качество подбора линейной функции?
с помощью коэффициента детерминации
13. Каким выражением определяется выборочный коэффициент корреляции?
r(x,y) с квадратами
14. Что называют результативным признаком в регрессионном анализе?
зависимую переменную
15. Дисперсию какой переменной исследует дисперсионный анализ?
зависимой переменной
16. Какая регрессия характеризуется прозрачной интерпретацией параметров модели?
линейная регрессия
17. Какой коэффициент характеризует долю дисперсии, объясняемую регрессией, в общей дисперсии результативного признака y?
коэффициент детерминации
18. Какой коэффициент показывает, на сколько процентов в среднем по совокупности изменится результат y от своей средней величины при изменении фактора x на 1% от его (фактора x) среднего значения?
коэффициент эластичности
19. Чему равна величина остаточной дисперсии, если фактические значения результативного признака совпадают с теоретическими или расчетными значениями?
0
20. Какой метод применяют для оценки параметров a, b уравнения регрессии?
метод наименьших квадратов (МНК)
21. Какой метод основан на требовании минимизации суммы квадратов отклонений фактических значений результативного признака от расчетных?
метод наименьших квадратов
22. При каком значении k регрессия называется парной?
k= 1
23. Что из перечисленного не относится к нелинейным регрессиям по оцениваемым параметрам?
показательная функция
24. Суть какой теоремы в том, что если случайная величина является общим результатом взаимодействия большого числа других случайных величин, ни одна из которых не оказывает преобладающего влияния на общий результат, то такая результирующая случайная величина будет описываться приблизительно нормальным распределением?
центральной предельной теоремы
25. Каким уравнением описывается линейная регрессия?
y = a + bx + ε
(3 ошибки)

3 модуль ()1 ошибка
1. Как проверяется гетероскедастичность моделей в асимптотическом тесте Бреуша и Пагана?
по критерию c2(r)
2. Какой критерий позволяет выбирать наилучшую модель из множества различных спецификаций и численно построен так, чтобы учесть влияние на качество подгонки модели двух противоположных тенденций?
критерий Шварца
3. По какой величине судят о качестве модели?
по средней относительной ошибке аппроксимации
4. Каким выражением описывается условие однородности (гомоскедастичности) наблюдений?
s2(yu) =s2(hu+eu) =s2(eu) =s2
5. Какой метод применим при условии диагональности матрицы ковариаций вектора ошибок?
метод наименьших квадратов
6. Каким выражением определяется абсолютная ошибка аппроксимации?
yi-y1i=e
7. Что понимается под мультиколлинеарностью?
высокая степень коррелированности объясняющих переменных
8. Какие переменные представляют собой исходные переменные, из которых вычитаются соответствующие средние, а полученная разность делится на стандартное отклонение?
стандартизованные переменные
9. Какая ошибка на контрольной выборке свидетельствует о хорошем качестве построенной модели?
4-9%
10. Каким методом может быть проведена оценка значимости мультиколлинеарности факторов?
методом испытания гипотезы о независимости переменных
11. Какая переменная должна выражаться в виде линейной функции от неизвестной переменной?
замещающая переменная
12. Дисперсии и ковариации ошибок наблюдений в обобщенной линейной модели множественной регрессии
могут быть произвольными
13. В чем заключается второй подход к решению проблемы гетероскедастичности?
в построении моделей, учитывающих гетероскедастичность ошибок наблюдений
14. Чем в простейшем случае парной регрессии является стандартизованный коэффициент регрессии?
линейным коэффициентом корреляции
15. Что из перечисленного используют для проверки гипотезы, если исследователь предполагает, что за время наблюдений произошли резкие структурные изменения в виде связей между зависимой и независимыми переменными?
тест Чоу
16. Чему равен определитель матрицы, если между факторами имеется полная линейная зависимость и все коэффициенты корреляции равны 1?
0
17. По какой формуле производят расчет коэффициентов модели при использовании метода гребневой регрессии?
bгр= (XTX+DгрIk+ 1)-1XTY
18. По какой формуле, согласно теореме Айткена, производится оценка коэффициентов модели?
b= (X¢W-1X)-1X¢W-1Y
19. Какой из перечисленных тестов не требует предположения о нормальности распределения регрессионных остатков?
тест ранговой корреляции Спирмена
20. Как называют переменную, которая должна быть в модели согласно правильной теории?
существенной
21. Чем ближе к единице значение определителя матрицы межфакторной корреляции, тем
меньше мультиколлинеарность факторов
22. Какой критерий используется для оценки значимости уравнения регрессии в целом?
F-критерия Фишера
23. Какой показатель фиксирует долю объясненной вариации результативного признака за счет рассматриваемых в регрессии факторов?
показатель детерминации
24. Какие коэффициенты позволяют исключать из модели дублирующие факторы?
коэффициенты интеркорреляции
25. Чему равно число степеней свободы остаточной суммы квадратов при линейной регрессии?
n- 2
Модуль 4
1. Какие этапы включает в себя процесс структурного моделирования?
все перечисленные этапы
2. Суть какого метода заключается в частичной замене непригодной объясняющей переменной на такую переменную, которая не коррелирована со случайным членом?
метода инструментальных переменных
3. Что представляет переменная x, входящая в выражение?
возмущающий процесс
4. При каком условии общее решение разностного уравнения вида носит «взрывной» характер?
при |a1|> 2
5. Как называются взаимозависимые переменные, которые определяются внутри модели (внутри самой системы) и обозначаются у?
эндогенными переменными
6. В какой модели на основе коэффициентов приведенной формы можно получить два или более значений одного структурного коэффициента?
в сверхидентифицируемой
7. Какие коэффициенты называются структурными коэффициентами модели?
коэффициенты при эндогенных и экзогенных переменных в структурной форме модели
8. Какой метод при ограниченной информации, называется методом наименьшего дисперсионного отношения?
метод максимального правдоподобия
9. Как называются переменные, относящиеся к предыдущим моментам времени?
лаговыми переменными
10. Если набор чисел X связан с другим набором чисел Y зависимостью Y= 4X, то дисперсия Y должна быть
в 16 раз больше, чем дисперсия X
11. Какой метод применяется для решения идентифицируемой системы?
косвенный метод наименьших квадратов
12. Какие переменные понимаются под предопределенными переменными?
экзогенные переменные и лаговые эндогенные переменные
13. Какой метод используют, если нужно всего лишь уточнить характер связей переменных?
метод путевого анализа
14. Что позволяет сделать построение моделей корреляционной структуры?
проверить гипотезу о том, что матрица корреляции имеет определенный вид
15. Какой является модель, если все ее структурные коэффициенты однозначно определяются по коэффициентам приведенной формы модели и при этом число параметров в обеих формах модели одинаково?
идентифицируемой
16. Каким выражением определяется зависимость потребления в год с номером t от дохода в предыдущий период y(t- 1)?
C(t) =b+cy(t- 1)
17. Как называются независимые переменные, которые определяются вне системы и обозначаются как х?
экзогенными переменными
18. При каком условии вся модель считается идентифицируемой?
если идентифицируемо хотя бы одно уравнение системы
19. В каком случае модель является неидентифицируемой?
если число приведенных коэффициентов меньше числа структурных коэффициентов
20. Какие переменные часто приходится вводить для учета влияния качественных факторов?
фиктивные переменные
21. Что позволяет сделать построение моделей структуры средних?
исследовать структуру средних одновременно с анализом дисперсий и ковариаций
22. Какие переменные могут включать в себя причинные модели?
явные и латентные переменные
23. При каком условии уравнение неидентифицируемо?
если число предопределенных переменных, отсутствующих в уравнении, но присутствующих в системе, увеличенное на единицу, меньше числа эндогенных переменных в уравнении
24. При решении выражения способом движения «назад» ошибки ei
накапливаются
25. Что позволяет сделать моделирование ковариационной структуры?
проверить гипотезу о том, что матрица ковариации имеет определенный вид

4 модуль
1. О чем свидетельствуют большие значения, близкие к 1, величины (1 -а1) модели корректировки ошибок (МКО)?
о том, что экономические факторы сильно изменяют результат
2. На какое количество участков разбивается последовательность для проверки условия стационарности ряда?
на два участка
3. Для уменьшения амплитуды колебаний у сглаженного ряда Y(t)необходимо
увеличивать ширину интервала сглаживания m
4. Какое предположение является одним из априорных предположений при применении параметрических тестов для проверки стационарности?
предположение о нормальном законе распределения значений временного ряда
5. Что называется временным рядом?
последовательность значений признака, принимаемых в течение нескольких последовательных моментов времени или периодов
6. Как изменяется дисперсия сглаженного по квадратичному полиному ряда Y(t) при увеличении числа m уравнений?
уменьшается
7. Какие тренды коррелируют между собой?
временные
8. Что из перечисленного используют для проверки стационарности временного ряда?
сериальный критерий стационарности
9. Как называют корреляционную зависимость между последовательными уровнями временного ряда?
автокорреляцией уровней ряда
10. Как называется случайная переменная с переменной дисперсией?
гетероскедастической
11. При каком условии сглаживание ряда называется центрированным?
при k=l
12. Каким путем может быть исключен временной тренд из результирующей переменной?
путем построения регрессии этой переменной по времени и перехода к остаткам, которые образуют новую стационарную переменную, уже свободную от тренда
13. По какой формуле рассчитываются коэффициенты,если в качестве сглаживающего многочлена взять прямую?
ar= 1/m
14. Какая компонента объясняет отклонения от тренда с периодичностью от 2 до 10 лет?
циклическая компонента
15. Что в выражении обозначают параметром L?
функцию правдоподобия
16. Какая последовательность является белым шумом?
если каждая случайная величина последовательности имеет нулевое среднее и некоррелирована с другими элементами последовательности
17. К какому классу принадлежит ряд, если он содержит единичные корни и интегрируем с порядком d?
I(d)
18. Как называется стохастическая переменная с постоянной дисперсией?
гомоскедастическая переменная
19. Какой принцип разработки прогнозов предполагает соответствие, максимальное приближение теоретических моделей к реальным производственно-экономическим процессам?
адекватность прогнозирования
20. Как называется число значений исходного ряда, одновременно участвующих в сглаживании?
шириной интервала сглаживания
21. Что относится к основным принципам разработки прогнозов?
системность, адекватность, альтернативность
22. Для чего применяется сериальный критерий стационарности?
для проверки стационарности временного ряда
23. Как называется модель вида?
авторегрессионной условной гетероскедастической моделью (АРУГ-моделью)
24. Что представляет уравнение?
АРСС-процесс для {et2}-последовательности
25. Какие переменные используются в процессе случайного блуждания?
некоррелированные нестационарные переме

Экстраполяция - это метод научного исследования, который основан на распространении прошлых и настоящих тенденций, закономерностей, связей на будущее развитие объекта прогнозирования. К методам экстраполяции относятся метод скользящей средней, метод экспоненциального сглаживания, метод наименьших квадратов.

Метод скользящих средних является одним из широко известных методов сглаживания временных рядов. Применяя этот метод, можно элиминировать случайные колебания и получить значения, соответствующие влиянию главных факторов.

Сглаживание с помощью скользящих средних основано на том, что в средних величинах взаимно погашаются случайные отклонения. Это происходит вследствие замены первоначальных уровней временного ряда средней арифметической величиной внутри выбранного интервала времени. Полученное значение относится к середине выбранного интервала времени (периода).

Затем период сдвигается на одно наблюдение, и расчет средней повторяется. При этом периоды определения средней берутся все время одинаковыми. Таким образом, в каждом рассматриваемом случае средняя центрирована, т.е. отнесена к серединной точке интервала сглаживания и представляет собой уровень для этой точки.

При сглаживании временного ряда скользящими средними в расчетах участвуют все уровни ряда. Чем шире интервал сглаживания, тем более плавным получается тренд. Сглаженный ряд короче первоначального на (n–1) наблюдений, где n – величина интервала сглаживания.

При больших значениях n колеблемость сглаженного ряда значительно снижается. Одновременно заметно сокращается количество наблюдений, что создает трудности.

Выбор интервала сглаживания зависит от целей исследования. При этом следует руководствоваться тем, в какой период времени происходит действие, а следовательно, и устранение влияния случайных факторов.

Данный метод используется при краткосрочном прогнозировании. Его рабочая формула:

Пример применения метода скользящей средней для разработки прогноза

Задача . Имеются данные, характеризующие уровень безработицы в регионе, %

  • Постройте прогноз уровня безработицы в регионе на ноябрь, декабрь, январь месяцы, используя методы: скользящей средней, экспоненциального сглаживания, наименьших квадратов.
  • Рассчитайте ошибки полученных прогнозов при использовании каждого метода.
  • Сравните полученные результаты, сделайте выводы.

Решение методом скользящей средней

Для расчета прогнозного значения методом скользящей средней необходимо:

1. Определить величину интервала сглаживания, например равную 3 (n = 3).

2. Рассчитать скользящую среднюю для первых трех периодов
m фев = (Уянв + Уфев + У март)/ 3 = (2,99+2,66+2,63)/3 = 2,76
Полученное значение заносим в таблицу в средину взятого периода.
Далее рассчитываем m для следующих трех периодов февраль, март, апрель.
m март = (Уфев + Умарт + Уапр)/ 3 = (2,66+2,63+2,56)/3 = 2,62
Далее по аналогии рассчитываем m для каждых трех рядом стоящих периодов и результаты заносим в таблицу.

3. Рассчитав скользящую среднюю для всех периодов, строим прогноз на ноябрь по формуле:

где t + 1 – прогнозный период; t – период, предшествующий прогнозному периоду (год, месяц и т.д.); Уt+1 – прогнозируемый показатель; mt-1 – скользящая средняя за два периода до прогнозного; n – число уровней, входящих в интервал сглаживания; Уt – фактическое значение исследуемого явления за предшествующий период; Уt-1 – фактическое значение исследуемого явления за два периода, предшествующих прогнозному.

У ноябрь = 1,57 + 1/3 (1,42 – 1,56) = 1,57 – 0,05 = 1,52
Определяем скользящую среднюю m для октября.
m = (1,56+1,42+1,52) /3 = 1,5
Строим прогноз на декабрь.
У декабрь = 1,5 + 1/3 (1,52 – 1,42) = 1,53
Определяем скользящую среднюю m для ноября.
m = (1,42+1,52+1,53) /3 = 1,49
Строим прогноз на январь.
У январь = 1,49 + 1/3 (1,53 – 1,52) = 1,49
Заносим полученный результат в таблицу.

Рассчитываем среднюю относительную ошибку по формуле:

ε = 9,01/8 = 1,13% точность прогноза высокая.

Далее решим данную задачу методами экспоненциального сглаживания и наименьших квадратов . Сделаем выводы.

таблице 4.

Таблица 4.

Для данного ряда:К=8, L=-8.

8 3.703 3,46

Находим теоретические значения характеристики с (n-2) степенями

t 0,95,n 2=2,365,

т.е. с вероятностью

утверждать, что

имеется тенденция в дисперсии (t K t теор ) и имеется тенденция в среднем, так какt L t теор . Следовательно, можно говорить о наличии тренда во временном

Метод средних

5.3. Методы механического сглаживания временного ряда

Очень часто уровни экономических рядов динамики колеблются, при

этом тенденция развития экономического явления во времени скрыта случайными отклонениями уровней в ту или иную сторону. С целью более четкого выявления тенденции развития исследуемого процесса, в том числе для дальнейшего применения методов прогнозирования на основе трендовых

моделей, производят сглаживание (выравнивание) временных рядов.

Сглаживание всегда включает некоторый способ локального усреднения данных, при котором несистематические компоненты взаимно погашают друг друга.

Методы сглаживания временных рядов делятся на две основные группы:

1) механическое выравнивание отдельных уровней временного ряда с

использованием фактических значений соседних уровней.

2) аналитическое выравнивание с использованием кривой, проведенной

между конкретными уровнями ряда так, чтобы она отображала тенденцию, присущую ряду, и одновременно освобождала его от незначительных

колебаний;

Суть методов механического сглаживания заключается в следующем.

Берется несколько первых уровней временного ряда, образующих интервал сглаживания. Для них подбирается полином, степень которого должна быть меньше числа уровней, входящих в интервал сглаживания; с помощью полинома определяются новые, выровненные значения уровней в середине

Метод простой скользящей средней.

Самый простой метод сглаживания - скользящее среднее, в котором

дних членов, где m - ширина интервала сглаживания. Вместо среднего можно использовать медиану значений, попавших в интервал сглаживания.

Если необходимо сгладить мелкие беспорядочные колебания, то интервал сглаживания берут по возможности большим. Если нужно сохранить более мелкие колебания, интервал сглаживания уменьшают. При прочих равных условиях интервал сглаживания рекомендуется брать нечетным.

Для вычисления сглаженных уровней ряда Y t применяется формула:

Где p m 1 (при нечетномт);

В результате такой процедуры получаются (n-m+1 )сглаженных значений уровней ряда; при этом первыер и последниер уровней ряда теряются (не сглаживаются). -

При четных значениях т, после процедуры сглаживания обычно поводят центрирование полученного ряда (находят средние значения двух последовательных скользящих средних).

Данный метод применим применим лишь для рядов, имеющих линейную

тенденцию. Если для процесса характерно нелинейное развитие, то простая скользящая средняя может привести к существенным искажениям.

Когда тренд выравниваемого ряда имеет изгибы и для исследователя желательно сохранить волны, то предпочтительной является взвешенная

скользящая средняя. При построении взвешенной скользящей средней на

каждом интервале сглаживания значение центрального уровня заменяется на расчетное, определяемое по формуле взвешенной средней арифметической:

y tw i

где w i - весовые коэффициенты, определяемы методом наименьших

квадратов, при этом выравнивание на каждом интервале сглаживания осуществляется чаще всего с применением полиномов второго или третьего порядков11 .Например, весовые коэффициенты для интервала 5 будут

следующие: 35 1 [ 3, 12, 17, 12, 3] , а для интервала 7: 21 1 [ 2, 3, 6, 7, 6, 3, 2]

Пример . Задан временной ряд объема выпуска продукции (в тыс. руб). Уровни ряда Y (t ) приведены в таблице 5.

Выберем интервал сглаживания m=3 и проведем сглаживание простой скользящей средней (третья строка таблицы) После сглаживания явно видна возрастающая тенденция.

11 Михтарян В.С., Архипова М.Ю. и др. Эконометрика.: учеб./ под ред. Михтарян В.С. М.: ООО

«Проспект»,2008 , стр. 293

Таблица 5

S(t)ср

S(t)вз

интервал сглаживания

проведем

сглаживание

взвешенной

скользящей средней на основе полинома второй степени

(четвертая

таблицы), используя приведенные

выше весовые

коэффициенты.

Метод экспоненциального сглаживания.

При исследовании экономических данных иногда важным является влияние на процесс более поздних наблюдений. Этот вопрос решает метод

экспоненциального сглаживания. В этом случае текущее значение временного

ряда сглаживается с учетом сглаживающей константы (веса), обычно

обозначаемой. Расчет проводится по следующей формуле:

S t Y t (1) S t 1 , (5.4),

Рассматривая рекуррентный процесс разложения для величин S t 1 ,S t 2 и

т.д. по формуле (5.4), получим:

) j Y t j (1)t Y 0

S t(1

где j – число периодов отставания от моментаt . Согласно формуле (5.5)

относительный вес каждого предшествующего уровня снижается по экспоненте по мере удаления от момента, для которого вычисляется сглаженное значение.

Отсюда и название данного метода.

При практическом использовании метода возникают проблемы выбора параметра и определения начального уровня Y 0 . Чем больше значение

параметра, тем меньше сказывается влияние предшествующих уровней В каждом конкретном случае необходимо выбирать наиболее приемлемое

значение. Чаще всего это делается на основе проверки нескольких значений.

Задачу выбора начального значения Y 0 решают следующим образом: заY 0

принимается первое значение временного ряда или среднее арифметическое

нескольких первых членов ряда.

Рассмотрим предыдущий пример. Проведем экспоненциальное

сглаживание временного ряда (третья строка табли цы)

Первое сглаженное значение равняется первому уровню ряда.. Следующее сглаженное значение рассчитываем согласно формуле (5.3), где

Боярышник обыкновенный Боярышник обыкновенный Научная классификация Царство: Растения … Википедия

Экспоненциальное сглаживание метод математического преобразования используемый при прогнозировании временных рядов … Википедия

Индикатор Стохастик - (Stochastic Oscillator) Стохастический осциллятор, описание Stochastic, версии трендового индикатора Stochastic, Торговые сигналы индикатора Стохастик Добавление индикатора Stochastics на график торгового терминала Metatrader (MT), настройка… … Энциклопедия инвестора

Содержание: I. Физический очерк. 1. Состав, пространство, береговая линия. 2. Орография. 3. Гидрография. 4. Климат. 5. Растительность. 6. Фауна. II. Население. 1. Статистика. 2. Антропология. III. Экономический очерк. 1. Земледелие. 2.… …

I КАРТА ЯПОНСКОЙ ИМПЕРИИ. Содержание: I. Физический очерк. 1. Состав, пространство, береговая линия. 2. Орография. 3. Гидрография. 4. Климат. 5. Растительность. 6. Фауна. II. Население. 1. Статистика. 2. Антропология. III. Экономический очерк. 1 … Энциклопедический словарь Ф.А. Брокгауза и И.А. Ефрона

I Урал территория, расположенная между Восточно Европейской и Западно Сибирской равнинами и вытянутая с С. на Ю. от Сев. Ледовитого океана до широтного участка р. Урал ниже г. Орска. Основной частью её является Уральская горная система,… …

Схизейные травянистые, реже лиановидные папоротники, преимущественно тропические и субтропические. Лишь немногие виды встречаются в умеренных областях Северной Америки и Японии, Чили, Новой Зеландии, Тасмании и Южной Африки. Схизейные,… … Биологическая энциклопедия

У этого термина существуют и другие значения, см. Поза (значения). Поза (из фр. pose через немецкий, ранее из лат. pono (супин positum) «класть, ставить») положение, принимаемое человеческим телом, положение тела, головы и… … Википедия

Поза (лат. positum класть, ставить; fr: pose) положение, принимаемое человеческим телом, положение тела, головы и конечностей по отношению к друг другу. Содержание 1 Общая характеристика позы … Википедия

Урал, территория, расположенная между Восточно Европейской и Западно Сибирской равнинами и вытянутая с С. на Ю. от Сев. Ледовитого океана до широтного участка р. Урал ниже г. Орска. Основной частью её является Уральская горная система,… … Большая советская энциклопедия

16.02.15 Виктор Гаврилов

38133 0

Временным рядом называется последовательность значений, изменяемых во времени. О некоторых простых, но эффективных подходах к работе с подобными последовательностями я попробую рассказать в данной статье. Примеров таких данных можно встретить очень много – котировки валют, объемы продаж, обращения клиентов, данные в различных прикладных науках (социология, метеорология, геология, наблюдения в физике) и многое другое.

Ряды являются распространенной и важной формой описания данных, так как позволяют наблюдать всю историю изменения интересующего нас значения. Это даёт нам возможность судить о «типичном» поведении величины и об отклонениях от такого поведения.

Передо мной встала задача выбрать набор данных, на котором можно было бы наглядно продемонстрировать особенности временных рядов. Я решил воспользоваться статистикой пассажиропотока на международных авиалиниях, поскольку этот набор данных весьма нагляден и стал своего рода стандартным (http://robjhyndman.com/tsdldata/data/airpass.dat , источник Time Series Data Library, R. J. Hyndman). Ряд описывает количество пассажиров международных авиалиний в месяц (в тысячах) за период с 1949 по 1960 года.

Поскольку у меня всегда под рукой , в которой есть интересный инструмент « » для работы с рядами, я воспользуюсь именно им. Перед импортом данных в файл нужно добавить столбец с датой, чтобы была привязка значений ко времени, и столбец с именем ряда для каждого наблюдения. Ниже видно, как выглядит мой исходный файл, который я импортировал в Prognoz Platform с помощью мастера импорта непосредственно из инструмента анализа временных рядов.

Первое, что мы обычно делаем с временным рядом, это отображаем его на графике. Prognoz Platform позволяет построить график, просто «перетащив» ряд в рабочую книгу.

Временной ряд на графике

Символ ‘M’ в конце имени ряда означает, что ряд имеет месячную динамику (интервал между наблюдениями равен одному месяцу).

Уже из графика мы видим, что ряд демонстрирует две особенности:

  • тренд – на нашем графике это долгосрочный рост наблюдаемых значений. Видно, что тренд практически линейный.
  • сезонность – на графике это периодические колебания величины. В следующей статье на тему временных рядов мы узнаем, как можно вычислить период.

Наш ряд достаточно «аккуратный», однако часто встречаются ряды, которые помимо двух описанных выше характеристик демонстрируют ещё одну – наличие «шума», т.е. случайных вариаций в той или иной форме. Пример такого ряда можно увидеть на графике ниже. Это синусоидальный сигнал, смешанный со случайной величиной.

При анализе рядов нас интересует выявление их структуры и оценка всех основных компонентов – тренда, сезонности, шума и других особенностей, а также возможность строить прогнозы изменения величины в будущих периодах.

При работе с рядами наличие шума часто затрудняет анализ структуры ряда. Чтобы исключить его влияние и лучше увидеть структуру ряда, можно использовать методы сглаживания рядов.

Самый простой метод сглаживания рядов – скользящее среднее. Идея заключается в том, что для любого нечётного количества точек последовательности ряда заменять центральную точку на среднее арифметическое остальных точек:

где x i – исходный ряд, s i – сглаженный ряд.

Ниже можно увидеть результат применения данного алгоритма к двум нашим рядам. Prognoz Platform по умолчанию предлагает использовать сглаживание с размером окна в 5 точек (k в нашей формуле выше будет равно 2). Обратите внимание, что сглаженный сигнал уже не так подвержен влиянию шума, однако вместе с шумом, естественно, пропадает и часть полезной информации о динамике ряда. Также видно, что у сглаженного ряда отсутствуют первые (и также последние) k точек. Это связано с тем, что сглаживание выполняется для центральной точки окна (в нашем случае для третьей точки), после чего окно сдвигается на одну точку, и вычисления повторяются. Для второго, случайного ряда, я использовал сглаживание с окном равным 30, чтобы лучше выявить структуру ряда, так как ряд «высокочастотный», точек очень много.

Метод скользящего среднего имеет определённые недостатки:

  • Скользящее среднее неэффективно в вычислении. Для каждой точки среднее необходимо перевычислять по новой. Мы не можем переиспользовать результат, вычисленный для предыдущей точки.
  • Скользящее среднее нельзя продлить на первые и последние точки ряда. Это может вызвать проблему, если нас интересуют именно эти точки.
  • Скользящее среднее не определено за пределами ряда, и как следствие, не может использоваться для прогнозирования.

Экспоненциальное сглаживание

Более продвинутый метод сглаживания, который также можно использовать для прогнозирования – экспоненциальное сглаживание, также иногда называемое методом Хольта-Уинтерса (Holt-Winters) в честь имён его создателей.

Существует насколько вариантов данного метода:

  • одинарное сглаживание для рядов, у которых нет тренда и сезонности;
  • двойное сглаживание для рядов, у которых есть тренд, но нет сезонности;
  • тройное сглаживание для рядов, у которых есть и тренд, и сезонность.

Метод экспоненциального сглаживания вычисляет значения сглаженного ряда путём обновления значений, рассчитанных на предыдущем шаге, используя информацию с текущего шага. Информация с предыдущего и текущего шагов берётся с разными весами, которыми можно управлять.

В простейшем варианте одинарного сглаживания соотношение такое:

Параметр α определяет соотношение между несглаженным значением на текущем шаге и сглаженным значением с предыдущего шага. При α =1 мы будем брать только точки исходного ряда, т.е. никакого сглаживания не будет. При α =0 ряд мы будем брать только сглаженные значения с предыдущих шагов, т.е. ряд превратится в константу.

Чтобы понять, почему сглаживание называется экспоненциальным, нам нужно раскрыть соотношение рекурсивно:

Из соотношения видно, что все предыдущие значения ряда вносят вклад в текущее сглаженное значение, однако их вклад угасает экспоненциально за счёт роста степени параметра α .

Однако, если в данных есть тренд, простое сглаживание будет «отставать» от него (либо придётся брать значения α близкими к 1, но тогда сглаживание будет недостаточным). Нужно использовать двойное экспоненциальное сглаживание.

Двойное сглаживание использует уже два уравнения – одно уравнение оценивает тренд как разницу между текущим и предыдущим сглаженным значениями, потом сглаживает тренд простым сглаживанием. Второе уравнение выполняет сглаживание как в случае простого варианта, но во втором слагаемом используется сумма предыдущего сглаженного значения и тренда.

Тройное сглаживание включает ещё один компонент – сезонность, и использует ещё одно уравнение. При этом различаются два варианта сезонного компонента – аддитивный и мультипликативный. В первом случае амплитуда сезонного компонента постоянна и со временем не зависит от базовой амплитуды ряда. Во втором случае амплитуда меняется вместе с изменением базовой амплитуды ряда. Это как раз наш случай, как видно из графика. С ростом ряда амплитуда сезонных колебаний увеличивается.

Так как наш первый ряд имеет и тренд, и сезонность, я решил подобрать параметры тройного сглаживания для него. В Prognoz Platform это довольно просто сделать, потому что при обновлении значения параметра платформа сразу же перерисовывает график сглаженного ряда, и визуально можно сразу увидеть, насколько хорошо он описывает наш исходный ряд. Я остановился на следующих значениях:

Как я вычислил период, мы рассмотрим в следующей статье о временных рядах.

Обычно в качестве первых приближений можно рассматривать значения между 0,2 и 0,4. Prognoz Platform также использует модель с дополнительным параметром ɸ , который дэмпфирует тренд так, что он приближается к константе в будущем. Для ɸ я взял значение 1, что соответствует обычной модели.

Также я сделал прогноз значений ряда данным методом на последние 2 года. На рисунке ниже я пометил точку начала прогноза, проведя через неё черту. Как видно, исходный ряд и сглаженный весьма неплохо совпадают, в том числе и на периоде прогнозирования – неплохо для такого простого метода!

Prognoz Platform также позволяет автоматически подобрать оптимальные значения параметров, используя систематический поиск в пространстве значений параметров и минимизируя сумму квадратов отклонений сглаженного ряда от исходного.

Описанные методы весьма просты, их легко применять, и они являются хорошей отправной точкой для анализа структуры и прогнозирования временных рядов.

Еще больше о временных рядах читайте в следующей статье.



Вверх