Прогнозирование - Forecasting

Прогнозирование - это процесс прогнозирования, основанный на прошлых и настоящих данных и чаще всего путем анализа тенденций. Обычным примером может быть оценка некоторой интересующей переменной на определенную дату в будущем. Прогнозирование - похожий, но более общий термин. Оба могут относиться к формальным статистическим методам, использующим временные ряды , поперечные или продольные данные, или, в качестве альтернативы, к менее формальным оценочным методам. Использование может различаться в зависимости от области применения: например, в гидрологии термины «прогноз» и «прогнозирование» иногда зарезервированы для оценок значений в определенные конкретные моменты времени в будущем , в то время как термин «прогноз» используется для более общих оценок, таких как количество наводнений, которые будут происходить в течение длительного периода.

Риск и неопределенность играют центральную роль в прогнозировании и прогнозировании; Обычно считается хорошей практикой указывать степень неопределенности прогнозов. В любом случае данные должны быть актуальными, чтобы прогноз был максимально точным. В некоторых случаях данные, используемые для прогнозирования интересующей переменной, сами по себе являются прогнозными.

Категории методов прогнозирования

Качественные и количественные методы

Методы качественного прогнозирования субъективны, основаны на мнении и суждениях потребителей и экспертов; они уместны, когда прошлые данные недоступны. Обычно они применяются к средним или долгосрочным решениям. Примерами методов качественного прогнозирования являются информированное мнение и суждение, метод Дельфи , исследование рынка и аналогия с историческим жизненным циклом.

Модели количественного прогнозирования используются для прогнозирования будущих данных как функции прошлых данных. Их уместно использовать, когда доступны прошлые числовые данные и когда есть основания предположить, что некоторые закономерности в данных, как ожидается, сохранятся в будущем. Эти методы обычно применяются для принятия краткосрочных или промежуточных решений. Примерами методов количественного прогнозирования являются спрос за последний период, простые и взвешенные скользящие средние за N периодов , простое экспоненциальное сглаживание , прогнозирование на основе модели процесса Пуассона и мультипликативные сезонные индексы. Предыдущие исследования показывают, что разные методы могут приводить к разному уровню точности прогнозов. Например, было обнаружено , что нейронная сеть GMDH имеет лучшую производительность прогнозирования, чем классические алгоритмы прогнозирования, такие как Single Exponential Smooth, Double Exponential Smooth, ARIMA и нейронная сеть с обратным распространением.

Средний подход

В этом подходе прогнозы всех будущих значений равны среднему значению прошлых данных. Этот подход можно использовать с любыми данными, для которых доступны прошлые данные. В обозначении временных рядов:

где прошлые данные.

Хотя здесь использовались обозначения временных рядов, подход среднего значения также можно использовать для перекрестных данных (когда мы прогнозируем ненаблюдаемые значения; значения, которые не включены в набор данных). Тогда прогноз для ненаблюдаемых значений представляет собой среднее значение наблюдаемых значений.

Наивный подход

Наивные прогнозы являются наиболее рентабельной моделью прогнозирования и служат эталоном, с которым можно сравнивать более сложные модели. Этот метод прогнозирования подходит только для данных временных рядов . Используя наивный подход, составляются прогнозы, которые равны последнему наблюдаемому значению. Этот метод довольно хорошо работает для экономических и финансовых временных рядов, которые часто имеют закономерности, которые сложно надежно и точно предсказать. Если предполагается, что временные ряды имеют сезонность, сезонный наивный подход может быть более подходящим, когда прогнозы равны значениям за прошлый сезон. В обозначении временных рядов:

Метод дрейфа

Вариант наивного метода состоит в том, чтобы позволить прогнозам увеличиваться или уменьшаться с течением времени, где величина изменения во времени (называемая дрейфом ) устанавливается равной среднему изменению, наблюдаемому в исторических данных. Таким образом, прогноз на время дается выражением

Это эквивалентно проведению границы между первым и последним наблюдением и ее экстраполяции на будущее.

Сезонный наивный подход

Сезонный наивный метод учитывает сезонность, устанавливая каждый прогноз равным последнему наблюдаемому значению того же сезона. Например, значение прогноза для всех последующих месяцев апреля будет равно предыдущему значению, наблюдаемому для апреля. Прогноз времени является

где = сезонный период и является наименьшим целым числом больше, чем .

Сезонный наивный метод особенно полезен для данных с очень высоким уровнем сезонности.

Методы временных рядов

В методах временных рядов используются исторические данные в качестве основы для оценки будущих результатов. Они основаны на предположении, что история спроса в прошлом является хорошим индикатором спроса в будущем.

например, Бокс – Дженкинс
Сезонный ARIMA или SARIMA или ARIMARCH,

Реляционные методы

Некоторые методы прогнозирования пытаются определить основные факторы, которые могут повлиять на прогнозируемую переменную. Например, включение информации о климатических моделях может улучшить способность модели прогнозировать продажи зонтиков. Модели прогнозирования часто учитывают регулярные сезонные колебания. Помимо климата, такие колебания также могут быть связаны с праздниками и обычаями: например, можно предсказать, что продажи одежды для американского футбола будут выше во время футбольного сезона, чем в межсезонье.

Некоторые неформальные методы, используемые в причинно-следственном прогнозировании, не полагаются исключительно на результаты математических алгоритмов , но вместо этого используют суждение прогнозиста. Некоторые прогнозы учитывают прошлые отношения между переменными: если одна переменная, например, была приблизительно линейно связана с другой в течение длительного периода времени, может быть целесообразно экстраполировать такую ​​взаимосвязь на будущее, не обязательно понимая причины отношение.

Причинные методы включают:

Количественные модели прогнозирования часто сравниваются друг с другом путем сравнения их среднеквадратичной ошибки в выборке или вне выборки , хотя некоторые исследователи не рекомендуют этого. Различные подходы к прогнозированию имеют разную точность. Например, в одном контексте было обнаружено, что GMDH имеет более высокую точность прогнозов, чем традиционный ARIMA.

Оценочные методы

Методы оценочного прогнозирования включают интуитивное суждение, мнения и оценки субъективной вероятности . Оценочное прогнозирование используется в случаях отсутствия исторических данных или при совершенно новых и уникальных рыночных условиях.

К оценочным методам относятся:

Методы искусственного интеллекта

Часто это делается сегодня с помощью специализированных программ, имеющих вольную маркировку.

Геометрическая экстраполяция с предсказанием ошибок

Может быть создан с 3 точками последовательности и «моментом» или «индексом», этот тип экстраполяции дает 100% точность прогнозов в большом проценте базы данных известных серий (OEIS).

Другие методы

Точность прогнозов

Ошибка прогноза (также известная как остаток ) - это разница между фактическим значением и прогнозным значением для соответствующего периода:

где E - ошибка прогноза в период t, Y - фактическое значение в период t, а F - прогноз на период t.

Хороший метод прогнозирования дает некоррелированные остатки . Если есть корреляции между остаточными значениями, то в остатках остается информация, которую следует использовать при вычислении прогнозов. Это может быть достигнуто путем вычисления ожидаемого значения остатка как функции известных прошлых остатков и корректировки прогноза на величину, на которую это ожидаемое значение отличается от нуля.

Хороший метод прогнозирования также будет иметь нулевое среднее значение . Если остатки имеют среднее значение, отличное от нуля, то прогнозы смещены и могут быть улучшены путем корректировки метода прогнозирования с помощью аддитивной константы, которая равна среднему значению нескорректированных остатков.

Меры совокупной ошибки:

Масштабно-зависимые ошибки

Ошибка прогноза E находится в том же масштабе, что и данные, как таковые, эти меры точности зависят от масштаба и не могут использоваться для сравнения рядов в разных масштабах.

Средняя абсолютная ошибка (MAE) или среднее абсолютное отклонение (MAD):

Среднеквадратичная ошибка (MSE) или среднеквадратичная ошибка прогноза (MSPE):

Среднеквадратичная ошибка (RMSE):

Среднее значение ошибок (E):

Ошибки в процентах

Они чаще используются для сравнения эффективности прогнозов между различными наборами данных, поскольку они не зависят от масштаба. Однако у них есть недостаток в том, что они очень большие или неопределенные, если Y близко или равно нулю.

Средняя абсолютная процентная ошибка (MAPE):

Среднее абсолютное процентное отклонение (MAPD):

Масштабированные ошибки

Hyndman и Koehler (2006) предложили использовать масштабированные ошибки в качестве альтернативы процентным ошибкам.

Средняя абсолютная масштабированная ошибка (MASE):

где m = сезонный период или 1, если несезонный

Прочие меры

Навык прогнозирования (СС):

Бизнес-прогнозисты и практики иногда используют разную терминологию. Они называют PMAD MAPE, хотя вычисляют его как MAPE, взвешенную по объему. Для получения дополнительной информации см. Расчет точности прогноза спроса .

При сравнении точности различных методов прогнозирования на конкретном наборе данных показатели совокупной ошибки сравниваются друг с другом, и предпочтение отдается методу, который дает наименьшую ошибку.

Тренировочные и тестовые наборы

При оценке качества прогнозов нельзя смотреть, насколько хорошо модель соответствует историческим данным; Точность прогнозов может быть определена только путем рассмотрения того, насколько хорошо модель работает с новыми данными, которые не использовались при подборе модели. При выборе моделей обычно используется часть доступных данных для подгонки, а остальные данные используются для тестирования модели, как это было сделано в приведенных выше примерах.

Перекрестная проверка

Перекрестная проверка - это более сложная версия обучения тестового набора.

Для перекрестных данных один подход к перекрестной проверке работает следующим образом:

  1. Выберите наблюдение i для тестового набора и используйте оставшиеся наблюдения в обучающем наборе. Вычислите ошибку на тестовом наблюдении.
  2. Повторите вышеуказанный шаг для i = 1,2, ..., N, где N - общее количество наблюдений.
  3. Вычислите меры точности прогноза на основе полученных ошибок.

Это позволяет эффективно использовать доступные данные, поскольку на каждом этапе пропускается только одно наблюдение.

Для данных временных рядов обучающий набор может включать только наблюдения до набора тестов. Следовательно, при построении прогноза нельзя использовать какие-либо будущие наблюдения. Предположим , что для получения надежного прогноза необходимо k наблюдений; тогда процесс работает следующим образом:

  1. Начиная с i = 1, выберите наблюдение k + i для тестового набора и используйте наблюдения в моменты времени 1, 2, ..., k + i –1 для оценки модели прогнозирования. Вычислите ошибку прогноза для k + i .
  2. Повторите вышеуказанный шаг для i = 2, ..., T – k, где T - общее количество наблюдений.
  3. Вычислите точность прогноза по всем ошибкам.

Эту процедуру иногда называют «исходной точкой скользящего прогнозирования», поскольку «исходная точка» ( k + i -1), на которой основан прогноз, перемещается вперед во времени. Кроме того, прогнозы на два шага вперед или, в общем, на p -шаг вперед могут быть вычислены, сначала прогнозируя значение сразу после обучающего набора, затем используя это значение со значениями обучающего набора для прогнозирования на два периода вперед и т. Д.

Смотрите также

Сезонность и цикличность

Сезонность

Сезонность - это характеристика временного ряда, в котором данные подвергаются регулярным и предсказуемым изменениям, которые повторяются каждый календарный год. Любое предсказуемое изменение или шаблон во временном ряду, который повторяется или повторяется в течение одного года, можно назвать сезонным. Обычно во многих ситуациях - например, в продуктовом магазине или даже в офисе судебно-медицинской экспертизы - спрос зависит от дня недели. В таких ситуациях процедура прогнозирования вычисляет сезонный индекс «сезона» - семь сезонов, по одному на каждый день, - который представляет собой отношение среднего спроса в этом сезоне (которое рассчитывается с помощью скользящего среднего или экспоненциального сглаживания с использованием исторических данных, соответствующих только в этот сезон) к среднему спросу за все сезоны. Индекс выше 1 означает, что спрос выше среднего; индекс меньше 1 означает, что спрос ниже среднего.

Циклическое поведение

Циклическое поведение данных имеет место, когда есть регулярные колебания в данных, которые обычно длятся в течение интервала не менее двух лет, и когда продолжительность текущего цикла не может быть заранее определена. Циклическое поведение не следует путать с сезонным поведением. Сезонные колебания следуют постоянной схеме каждый год, поэтому период всегда известен. Например, в период Рождества запасы в магазинах имеют тенденцию увеличиваться, чтобы подготовиться к рождественским покупкам. В качестве примера циклического поведения популяция конкретной природной экосистемы будет демонстрировать циклическое поведение, когда популяция уменьшается по мере того, как уменьшается ее естественный источник пищи, и как только популяция становится низкой, источник пищи восстанавливается, и популяция снова начинает расти. Циклические данные не могут быть учтены с использованием обычной сезонной корректировки, поскольку они не привязаны к фиксированному периоду.

Приложения

Прогнозирование имеет приложения в широком диапазоне областей, где полезны оценки будущих условий. Не все можно надежно спрогнозировать, если факторы, относящиеся к прогнозируемому, известны и хорошо изучены, и есть значительный объем данных, которые можно использовать, часто можно получить очень надежные прогнозы. Если это не так или прогнозы влияют на фактический результат, надежность прогнозов может быть значительно ниже.

Изменение климата и рост цен на энергию привели к использованию Egain Forecasting для зданий. Это пытается уменьшить энергию, необходимую для обогрева здания, тем самым уменьшая выбросы парниковых газов. Прогнозирование используется при планировании потребительского спроса в повседневной работе производственных и сбытовых компаний.

Хотя достоверность прогнозов фактической доходности акций оспаривается из-за ссылки на гипотезу эффективного рынка , прогнозирование общих экономических тенденций является обычным явлением. Такой анализ предоставляется как некоммерческими группами, так и коммерческими частными организациями.

Прогнозирование движения иностранной валюты обычно достигается с помощью комбинации диаграмм и фундаментального анализа . Существенное различие между анализом графиков и фундаментальным экономическим анализом состоит в том, что составители графиков изучают только движение цены на рынке, в то время как фундаменталисты пытаются найти причины, лежащие в основе этого действия. Финансовые учреждения объединяют доказательства, предоставленные их фундаментальными исследователями и аналитиками, в одну записку, чтобы предоставить окончательный прогноз по рассматриваемой валюте.

Прогнозирование также используется для прогнозирования развития конфликтных ситуаций. Синоптики проводят исследования, в которых используются эмпирические результаты для оценки эффективности определенных моделей прогнозирования. Однако исследования показали, что нет большой разницы между точностью прогнозов экспертов, разбирающихся в конфликтной ситуации, и прогнозов людей, знающих гораздо меньше.

Точно так же эксперты в некоторых исследованиях утверждают, что ролевое мышление не способствует точности прогноза. Дисциплина планирования спроса, также иногда называемая прогнозированием цепочки поставок, включает как статистическое прогнозирование, так и процесс консенсуса. Важным, хотя часто игнорируемым аспектом прогнозирования, является его связь с планированием . Прогнозирование можно охарактеризовать как предсказание того, как будет выглядеть будущее , тогда как планирование предсказывает, как должно выглядеть будущее . Не существует единого правильного метода прогнозирования. Выбор метода должен основываться на ваших целях и ваших условиях (данные и т. Д.). Хороший способ найти метод - это посетить дерево выбора. Пример дерева выбора можно найти здесь. Прогнозирование применяется во многих ситуациях:

Ограничения

Ограничения создают препятствия, за пределами которых методы прогнозирования не могут надежно предсказывать. Есть много событий и ценностей, которые нельзя надежно спрогнозировать. Такие события, как бросок кубика или результаты лотереи, невозможно предсказать, потому что они являются случайными событиями и в данных нет значимой взаимосвязи. Когда факторы, которые приводят к тому, что прогнозируется, неизвестны или хорошо изучены, например, прогнозы фондовых и валютных рынков часто неточны или ошибочны, поскольку данных обо всем, что влияет на эти рынки, недостаточно, чтобы прогнозы были надежными, Кроме того, результаты прогнозов этих рынков изменяют поведение участников рынка, что еще больше снижает точность прогнозов.

Концепция «саморазрушающихся предсказаний» касается того, каким образом некоторые предсказания могут подорвать себя, влияя на социальное поведение. Это потому, что «предикторы являются частью социального контекста, относительно которого они пытаются сделать прогноз, и могут влиять на этот контекст в процессе». Например, прогноз о том, что большой процент населения станет ВИЧ-инфицированным на основе существующих тенденций, может побудить большее количество людей избегать рискованного поведения и, таким образом, снизить уровень заражения ВИЧ, что приведет к недействительности прогноза (который мог бы остаться верным, если бы он не был общеизвестный). Или предсказание того, что кибербезопасность станет серьезной проблемой, может побудить организации принять дополнительные меры безопасности кибербезопасности, тем самым ограничив проблему.

Пределы производительности уравнений гидродинамики

Как было предложено Эдвардом Лоренцем в 1963 году, долгосрочные прогнозы погоды, сделанные с интервалом в две недели и более, невозможно окончательно предсказать состояние атмосферы из-за хаотической природы рассматриваемых уравнений гидродинамики . Чрезвычайно небольшие ошибки в исходных данных, таких как температура и ветер, в численных моделях удваиваются каждые пять дней.

Смотрите также

использованная литература

  • Армстронг, Дж. Скотт , изд. (2001). Принципы прогнозирования: Справочник для исследователей и практиков . Норвелл, Массачусетс: Kluwer Academic Publishers. ISBN 978-0-7923-7930-0.
  • Эллис, Кимберли (2010). Планирование производства и инвентаризация . Макгроу-Хилл. ISBN 978-0-412-03471-8.
  • Гейссер, Сеймур (июнь 1993 г.). Прогнозный вывод: введение . Чепмен и Холл, CRC Press. ISBN 978-0-390-87106-0.
  • Гилкрист, Уоррен (1976). Статистическое прогнозирование . Лондон: Джон Вили и сыновья. ISBN 978-0-471-99403-9.
  • Гайндман, Роб Дж .; Келер, Энн Б. (октябрь – декабрь 2006 г.). «Еще один взгляд на меры точности прогнозов» (PDF) . Международный журнал прогнозирования . 22 (4): 679–688. CiteSeerX  10.1.1.154.9771 . DOI : 10.1016 / j.ijforecast.2006.03.001 .
  • Макридакис, Спирос; Wheelwrigt, Стивен; Гайндман, Роб Дж. (1998). Прогнозирование: методы и приложения . Джон Вили и сыновья. ISBN 978-0-471-53233-0.
  • Малакути, Бехнам (февраль 2014 г.). Операционные и производственные системы с множеством целей . Джон Вили и сыновья. ISBN 978-0-470-03732-4.
  • Калигасидис, Анджела Сашич; Теслер, Роджер; Андерссон, Кари; Норд, Маргитта (август 2006 г.). «Модернизированный прогноз погоды в системах отопления зданий». В Fazio, Пол (ред.). Исследования в области строительной физики и строительной техники . Тейлор и Фрэнсис, CRC Press. С. 951–958. ISBN 978-0-415-41675-7.
  • Кресс, Джордж Дж .; Снайдер, Джон (май 1994). Методы прогнозирования и анализа рынка: практический подход . Книги кворума. ISBN 978-0-89930-835-7.
  • Решер, Николас (1998). Предсказание будущего: введение в теорию прогнозирования . Государственный университет Нью-Йорка Press. ISBN 978-0-7914-3553-3.
  • Теслер, Роджер (1991). «Управление климатом и энергопотреблением в зданиях». Энергия и здания . 15 (1-2): 599–608. DOI : 10.1016 / 0378-7788 (91) 90028-2 .
  • Турчин, Питер (2007). «Научное предсказание в исторической социологии: Ибн Халдун встречает Аль Сауд». История и математика: историческая динамика и развитие сложных обществ . Москва: КомКнига. С. 9–38. ISBN 978-5-484-01002-8.
  • Патент США 6098893 , Берглунд, Ulf Stefan & Lundberg, Bjorn Генри, «Система управления Комфорт включения прогноз погоды данных и способ функционирования такой системы», выданном 8 августа 2000  .

внешние ссылки