全渠道杂货零售中的预测错误代价高昂,因为它们会导致库存不匹配、浪费、配送问题以及人员安排和促销策略的失误,尤其是当实体店同时承担配送职能时(Fildes等人,2022年)。由于顾客在线下和线上渠道之间流动,这种溢出风险更大;因此,一个渠道的需求冲击或预测错误可能会迅速波及另一个渠道。随着消费者在实体店、电子商务网站和社交媒体之间无缝切换,对于那些线上线下业务结构不同的零售商来说,整合这些购物流程变得非常具有挑战性。虽然全渠道策略可以提高顾客满意度,但它们也使需求预测变得更加复杂,因为购物行为在不同渠道之间存在显著差异(Bell等人,2014年;Sarkar和Das,2017年)。例如,线上属性如产品评论和价格比较工具会影响线上购物行为(Gligorijevic和Luck,2012年;Yaylc和Bayram,2012年),而线下购物行为则受到感官刺激的影响,这些刺激会引发购买冲动和心理上的归属感(Biswas,2019年)。
因此,全渠道杂货零售的预测应围绕特定渠道的需求驱动因素和运营特点来设计,而不是基于单一的汇总需求信号。当实体店同时作为顾客接触点和配送中心时,管理者需要能够转化为具体渠道决策的预测结果,包括补货、配送能力、人员安排和促销活动。这种观点与预测系统在低利润率零售业中的实际作用是一致的(Fildes等人,2022年;Petropoulos等人,2022年)。
越来越多的证据表明,线上和线下杂货购物不仅在购买商品上存在差异,在购买行为的连贯性上也有所不同。Chintala等人(2024年)发现,线上购物篮子的购买行为在多次购物之间具有更高的相似性和更强的惯性购买模式,即使对于经验丰富的线上顾客也是如此。Pozzi(2012年)发现线上购物存在强烈的状态依赖性,而Danaher等人(2003年)报告称线上渠道的顾客品牌忠诚度更高。这些行为规律对需求可预测性有直接影响:如果线上顾客的购买模式更加稳定,那么杂货零售商拥有的购买历史数据应该能够更准确地预测线上销售。
基于这些行为特征,本研究探讨了三个问题:(1)哪种预测因子组合对每个渠道的预测准确性最有帮助?(2)线上销售的预测性是否高于线下销售?(3)不同渠道下最具信息量的行为信息层次是否存在差异——即线上预测是否更依赖于较宽的类别级别信号,而线下预测是否更依赖于更细的产品级别信号?
我们将这些问题转化为三个假设,并使用来自韩国一家大型杂货连锁店的面板数据集进行验证,该数据集涵盖了每个渠道约2500名顾客在一年内的购买记录。数据通过该连锁店的会员计划收集,涵盖了大约92%的总交易量。由于其在处理大规模数据集时的高效性和良好性能,我们采用了极端梯度提升(XGBoost)算法来建模销售数据(Massaro等人,2021年)。与现有文献一致,我们使用滞后销售数据作为基线预测因子,并加入了三类常见的额外预测因子:竞争对手信息、顾客购买数据和促销活动信息(例如Cheriyan等人,2018年;Pavlyshenko,2019年)。我们使用Shapley加性解释(SHAP)方法来评估每个预测因子组的相对贡献,并揭示这些贡献在不同渠道间的差异。为了确保结果的可解释性,我们采用了基于SHAP的解释方法,这与最近关于可解释零售预测的研究成果一致(Gür Ali和Gürlek,2020年)。
我们发现,顾客购买记录是两个渠道预测准确性的最大贡献因素(假设1)。线上销售的预测准确性高于线下销售,这与假设2相符。SHAP分析显示,线上销售的预测能力主要集中在类别级别(类别),而线下销售的预测能力主要集中在子类别级别(子类)(假设3)。机制检验确认了这些预测模式基于可观察到的购买行为:在同一家庭内,线上购物在类别层面的相似性比线下购物高26.3%,并且这种惯性在两个渠道中都存在,但在线上更为明显。
我们的贡献有三个方面:(1)我们证明了购买历史数据在两个渠道中都对预测准确性具有显著影响,因为它们编码了杂货购物的惯性模式,且这种影响在线上更为显著。(2)我们提供了新的证据,表明线上销售的预测性更强。我们将这种差异归因于线上购物中更为明显的惯性购买行为。(3)我们展示了最具信息量的预测信号存在于产品层次结构的不同层面——线上为类别级别,线下为子类别级别,并解释了这种模式与特定渠道购物过程之间的联系。这些结果为全渠道预测系统提供了一个实用的设计原则:根据渠道差异分别建立模型,并使规划粒度与渠道特性相匹配。
本文的其余部分安排如下:第2节回顾了零售预测和全渠道顾客行为的相关文献,将我们的研究置于这些研究框架中,并提出了三个将特定渠道行为与预测模型联系起来的假设。第3节描述了数据收集方法。第4节介绍了预测模型和评估设计。第5节报告了研究结果,包括预测性能、SHAP特征重要性分析和机制检验。第6节讨论了管理启示以及我们的预测方法可能表现不佳的情景。第7节总结了本文。