预测技术的常见问题

关于预测技术的常见问题


预测技术 » 此处

本页概述了经典预测技术的 FAQ(常见问题)。实际上,分位数预测分位数网格的表现都远超经典预测。分位数网格于 2013 年 3 月推出,这是一种由 Lokad 提供的卓越预测技术。只要涉及到库存,我们都会建议您采用分位数网格来获取最佳结果。


具体细节

视频简介



您使用哪些预测模式?

这个问题很棘手,原因有二:首先,我们的预测技术是一项核心知识产权 (IP) 资产,因此不想详细透露;其次,我们的技术很复杂,支持多种模式。这就是说,Lokad 利用的是统计学习理论这种知名理论。该理论囊括大部分现代预测方法,例如支持向量回归、贝叶斯网络、混合法、增强法以及元启发式(包括神经网络或遗传算法)等等。再者,我们也没有摒弃经典:线性自回归、移动平均数、(二次、三次)指数平滑、博克思-詹金斯法、Holt-Winters 法、ARMA、ARIMA。但是,在利用时序之间的关联时,这些经典往往表现欠佳。

预测准确度如何?

预测准确性高度依赖于所考量的特定数据集。我们遇到过误差 0.5% 被视为很差的情况(例如提前 24 小时预测全国每小时用电量),也遇到过误差 80% 被视为很好的情况(例如在产品投放市场期间开展的某类促销运作)。准确度高度依赖于水平线:越是提前预测,预测准确度越低。但准确度也与聚合水平紧密相关:预测聚合越多,预测准确度越高。

在预测竞争中,你们的技术进行过任何学术界的检验吗?

数据挖掘竞争每年都在上演。在 Lokad,我们通常会密切留意这些活动,并且在数据适用于 Lokad 时(例如我们只处理时序,不处理图片或客户资料),一般会针对这些竞争数据集来对我们的预测技术进行基准测试。但迄今为止,我们尚未发现任何公开的数据挖掘竞争能够体现我们日常面临的种种挑战。首先,学术界的数据集往往较小,时序数目不到数百,时序长,每个时序有几百个数据点。这与我们在零售业中观察到的情况几乎相反:即便没有上百万的时序也有成千上万的时序,而且这些时序非常短,因为产品寿命较短。这就是说,Lokad 通常在这些竞争方面表现优异,如果考虑到立即就能获得结果且无需掌握专业知识就能生成结果,那么 Lokad 可以说就是非常优异了。

你们会评估预测的准确度吗?

是的,当然会。我们的核心技术中有一半就是用我们的预测技术来准确定量评估预测准确度。在此我们不会太过详细地介绍,但可以说这是一项巨大挑战,不仅对于创建实际拟合您的数据的模式是如此,对于您尚未具备的数据(例如未来的数据)更是如此。另请参阅Overfitting: when accuracy measure goes wrong。Lokad 研发团队典型的日常工作就包括对客户的数据集反复运行我们的预测引擎、测量预测误差并努力降低误差。我们的技术还有另外一个值得注意的方面,那就是您不仅会获得预测,而且对于每个预测出来的值,您还会获得以 MAPE 误差表示的该值的预期准确度。因此,您不必等到最后才发现预测不可靠,Lokad 会提前告知您以便您相应调整战略。

你们需要多少历史数据?

我们对历史数据量没有最低要求。这就是说,Lokad 提供的是统计技术,所以历史数据越多,预测越准确。实际上,提供 2 年的历史数据就可以了,提供 3 年或 3 年以上的历史数据当然更好了。如果您只有不到 1 年的历史数据,那么 Lokad 将无法通过 季节性(这对于很多企业而言是一种很重要的模式)来进一步提炼预测。另外,要利用季节性,Lokad 不需要对每个时序(例如产品销售量)都提供 1 年以上的历史数据,我们只需要有几个 1 年以上历史记录的时序就能确定贵公司的季节性情况。对于创业型公司和新兴公司,非常适合从一开始就使用 Lokad。实际上,我们不仅提供预测,也会提供预期的预测准确度。所以,第一次预测一般误差较大,但随着时间的变化会逐步改善。Lokad 也会为您提供量化不确定性的途径。

一般模式

如何处理宏观趋势(如金融危机)?

我们认为对宏观趋势存在两点有代表性的误解。其一,只有在可以准确预测宏观趋势本身的前提下,才能运用宏观趋势来进一步提炼需求预测。如果银行能够预见金融危机,那么就不会发生金融危机了。预测宏观趋势的难度通常远高于预测普通产品需求的难度,所以说这种情况非常难以处理。其次,每年衰退 -3% 就被视为是一种宏观趋势了,但在每周层面上这相当于产生 -0.06% 的影响。相比之下,我们经常会观察到这周与下周的产品销售量变化 20%。Lokad 非常适合用于短期预测,往前预测几周,宏观趋势的影响通常会因为促销、相互蚕食、广告活动等微观经济因素而显得微乎其微。总而言之,Lokad 一般会忽略大部分宏观趋势,但根据我们的经验,这对于 99% 的情况都是很合理的。

如何处理季节性、趋势?

我们自动检测基于日历的模式。您不必告知 Lokad 某款产品的季节性,季节性是我们的预测技术提供的常用模式之一。事实上,季节性远比大多数人所想的复杂。在我们看来,并非只存在一种季节性,而是存在许多以多种方式相互影响的周期模式。有一年一度的季节性,一周当中的不同日期效应,在每月层面上有薪水支票效应,还有类每年一度的季节性,例如美国有庆祝五月第二个星期天的母亲节等等。此外,在考虑销售点级别的销售预测时,产品的周期模式会结合销售点本身的周期模式。每个销售点又有或多或少的独特环境,从而会生成其特有的需求模式。因此,季节性并不只在于提供“是/否”的标志,它更是一套非常复杂、相互依赖的模式。好消息是 Lokad 会为您管理这种复杂性。

如何处理复活节、斋月、母亲节以及其他类季节性活动?

有些日历模式用 Lokad 的话说属于类季节性:这些模式每年都在重复,但按公历(也称为“西方日历”或“基督教日历”)来说并非严格的一年一次。复活节、斋月、春节、母亲节等等都是类季节性模式。Lokad 会自动检测类季节性模式,因此您不必花费任何精力来处理这些模式。然后,Lokad 会按照与标准季节性极其类似的方式,主要依靠多个时序分析来检测具有相似类季节性模式的时序,从而进一步提炼这种模式的分析。

如何处理产品生命周期和产品投放?

大部分消费品都会经历生命周期。产品会经历投放市场、发展、衰退直至最终从市场淘汰出局的过程。只要提供投放日期,Lokad 可以在产品投放时预测销售。很明显,在产品即将投放市场时,该产品是没有现成的销售数据用以支持预测的。但是,相比传统的预测工具包,Lokad 并非只是传统时序预测。具体地说,产品可以通过标签来描述。一个标签可以表示产品的任意属性:类别、子类别、系列、品牌、颜色、尺码等等。要预测所投放产品的销售量,Lokad 将分析相似产品的历史投放数据,然后根据为每种产品提供的标签来评估相似性。我们也为其他生命周期模式应用相同原理。

如何处理间歇式产品/低量产品?

如果您有每年只销售一次的产品,那么,就统计预测而言所能做的甚少。在实践中,店内只有 1 件产品更倾向于一种营销选择。在这种周转极慢的产品与畅销产品之间,是偶尔销售产品的灰色地带,但是,这些产品仍需要频繁进行库存优化。大部分传统预测工具包对于间歇式销售的表现较差。在 Lokad,我们在这种需求模式上花费了巨大精力,因为很多企业(例如电子商务)高度依赖于长尾效应来实现盈利。但是,周转较慢的产品如果不谨慎管理,就有可能生成比畅销产品更大的库存。为了处理这些周转较慢的产品,我们建议实施分位数预测

如何处理气候?

在特定业务(例如食杂店)领域,气候是一个非常重要的需求因素。迄今为止,Lokad 尚未在预测技术中纳入气候预测。但是,这一项已纳入我们的中间路线图。我们的目标是不仅纳入气候,而且要实现此过程的广泛自动化,这样我们的客户基本上不需要花费任何努力便能获得更高一层的准确度。

假性需求

如何处理因缺货造成的滞销?

销售量不等同于需求。缺货是一种使销售量偏离原始需求的假象。实际上,缺货会导致销售量下降,但需求是始终保持稳定的。相比传统预测工具包,使用 Lokad 时您无需为了表示如不发生缺货时的销售量而刻意更改或调整您的历史数据。相反,您可以使用事件来指示发生缺货的时间。缺货信息可以用于更准确地评估所有受影响的模式(季节性、趋势等等)。如果没有通过事件来对缺货进行此类标记,Lokad 将把这些模式作为无用数据过滤出去。虽然最好是跟踪缺货,但使用 Lokad 时这并非一项硬性要求。

如何处理畅销项目?

根据您的行业,您的业务中可能会存在畅销项目的情况。由于此类销售的规模非常大,因此一般通过纯统计方法可以直接看出来。所以,我们建议不要调整您的历史数据来清除这些畅销项目。首先是浪费时间,其次是畅销项目本身具备有助于预测需求的宝贵信息。再者,Lokad 无法预测未来独立的畅销项目 – 这可能取决于谈判等结果。如果事先存在已知的畅销项目,我们建议使用这些信息手动覆盖 Lokad 的预测结果。

从上至下还是从下至上聚合?

有些公司会预测群组或系列级别的需求,然后将这些预测拆分到独立的产品。这就是产品从上至下预测法。这一观点同样适用于预测频率:有些公司先是按每周预测,然后再应用星期系数。这种情况就是频率从上至下预测法。相反,通过对每日预测求和可以生成每周预测。在 Lokad,我们建议调整您的预测以尽量符合您的运营需要:如果供应链需要对每种产品执行每周预测,可以从 Lokad 请求对每种产品实施每周预测。请求每日预测然后再对这些预测求和并不能提高准确度。同样,要 Lokad 在产品组级别预测销售,然后针对每个 SKU 手动拆分预测并非好主意,因为通过拆分有可能引入较大的预测误差。Lokad 内部采用多种聚合/解聚算法,并且我们一般采用最精细化的数据。比方说,我们会利用每日销售数据来提供每月预测。但一个月可能有 4 个周末或 5 个周末,这对大部分零售企业的影响相当大。一般来说,您不必担心聚合水平,Lokad 会处理好您的要求。