Временные ряды являются одним из самых базовых и универсальных математических инструментов, используемых в бизнесе. Простыми словами, временной ряд состоит из серии данных, индексированных по времени. Временной ряд может моделировать все, начиная от развития продаж компании до цен на их продукты, на годовой, месячной, ежедневной или даже почасовой основе. Временные ряды особенно интуитивны, что делает их идеальными для описания, визуализации, моделирования и, наконец, прогнозирования ряда переменных.
Описательная статистика с временными рядами
Основное применение временных рядов - это описательная статистика. Временные ряды могут сжать большое количество информации в одном графике или таблице. Однако, поскольку временные ряды особенно интуитивны, люди могут легко упрощать или неправильно их интерпретировать. Одной из причин неправильной интерпретации является временная агрегация, используемая во временных рядах. Месяцы нашего календаря являются относительно произвольным способом разделения времени, и нельзя полагаться на то, что наши месяцы однородны с бизнес-точки зрения. Неравное количество дней и выходных в месяце может объяснить то, что на первый взгляд может показаться расхождениями в данных. Другие явления объясняют цикличность в вариации данных. Например, праздники, такие как Рождество или Черная пятница, систематически вызывают всплески продаж, а также начало месяца - дни выплаты зарплаты. Однако такая цикличность не всегда соответствует нашему календарю. Традиции, такие как Рамадан или Китайский Новый год, вызывают циклические изменения в данных, хотя цикл не является месячным или годовым. Кроме того, необходимо быть осторожным при делании поспешных выводов из временных рядов или установлении слишком простых корреляций между графиками. Поэтому важно помнить, что отличает одну переменную от другой (продажи от спроса или прибыли).
Визуализация временных рядов
Временные ряды также часто используются для чтения и визуализации данных, а также для сравнения разных рядов. Однако, снова же, подводные камни таких графиков заключаются в их видимой простоте. Для достижения наилучшей визуализации данных могут использоваться различные техники отображения. Например, проведение линий между точками данных создает впечатление непрерывности. Это может быть полезно, когда требуется отобразить, например, часовую динамику цен на акции.
Однако в случае особенно несвязанных данных более подходящим может быть график с разделением на интервалы.
При чтении временного ряда также необходимо обратить внимание на ось x. Некоторые графики фокусируются на небольших интервалах значений, чтобы подчеркнуть вариации данных, с риском того, что эти вариации будут переоценены. Другие явления, такие как экспоненциальный рост, также неправильно отображаются на линейной шкале оси x. Поэтому можно выбрать использование логарифмической шкалы, где начальные стадии роста могут быть восприняты так же хорошо, как и последующие.
Моделирование и прогнозирование
Временные ряды часто используются для поддержки статистических моделей. Цель этих моделей двояка: объяснить прошлое и предсказать будущее. В цепочке поставок прогнозирование будущего спроса необходимо для определения заказов на закупку и производство и для минимизации рисков избыточных запасов. Обычно во временном ряду выделяют первичный уровень, называемый базовым уровнем, долгосрочную эволюцию, называемую трендом, циклические или периодические вариации, называемые сезонностью, и другие случайные вариации, которые мы называем шумом. Это позволяет нам различать вариации данных, связанные с регулярными циклами, от основного убывающего или возрастающего тренда. Эти закономерности являются основой для экономических прогнозов.
Существует три основных типа прогнозов, каждый из которых служит разным целям.
- Точечные прогнозы предназначены для предоставления одного “лучшего” будущего значения переменной в соответствии с заданной метрикой ошибки. Так, например, в случае прогноза погоды для каждого дня предсказывается одно значение температуры. Точечный прогноз не стремится точно представить эволюцию этой переменной (читатель хорошо знает, что температура, скорее всего, будет изменяться вокруг предсказанного значения), но служит полезным указанием для читателя и надежной основой для его будущих выборов.
- Вероятностные прогнозы предоставляют полные вероятностные распределения будущего значения. Для визуализации таких прогнозов часто используются доверительные интервалы. Такие прогнозы могут, например, быть полезными для спекулятивных целей.
- Генеративные прогнозы делают эволюцию переменной “естественной” или “правдоподобной”, позволяя определенной степени контингентности и случайной эволюции. Эта “генеративная перспектива” может быть полезна при проведении симуляций.
Экосистема программного обеспечения для временных рядов
Сейчас используется множество типов программного обеспечения, чтобы учесть сложности, связанные с временными рядами, и предоставить модели или прогнозы, которые наилучшим образом служат целям их пользователей. Можно найти базы данных, инструменты с открытым исходным кодом и даже языки программирования, полностью посвященные временным рядам. Было разработано множество методов прогнозирования. Например, некоторое программное обеспечение просто оценивает будущие значения с помощью скользящего среднего, в то время как другие типы программного обеспечения предпочитают экспоненциальное сглаживание, что означает, что вес прошлых значений экспоненциально уменьшается по мере удаления этих значений во времени.
Таким образом, временные ряды являются особенно гибким абстрактным и базовым статистическим инструментом. Однако их видимая простота может ввести в заблуждение. Несколько факторов могут изменить способ представления данных или объяснить заметные вариации в данных. Поэтому важно знать, как собираются данные и быть в курсе вышеупомянутых факторов.