全渠道食品杂货预测：不同渠道在预测能力和预测信号方面的差异

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Journal of Retailing and Consumer Services》：Omni-channel grocery forecasting: Channel differences in forecastability and predictive signals

【字体：大中小】 时间：2026年04月26日 来源：Journal of Retailing and Consumer Services 13.1

编辑推荐：

　　全渠道生鲜零售中顾客购买行为与销售预测关系研究。基于韩国某大型连锁超市的会员消费数据，结合竞争对手信息和促销活动，运用XGBoost算法和SHAP解释技术，发现购买历史数据对线上线下销售预测均起主导作用，但线上预测准确率更高，且品类层级存在差异：线上依赖大类特征，线下依赖子类特征。这源于线上购物更强的惯性购买行为。研究为全渠道库存管理和促销策略提供了分级决策依据。

Boram Lim | Sofia Cavieres | Wen Jing Han | Hyeong-Tak (Tak) Lee

汉阳大学商学院，首尔，04763，韩国

摘要

全渠道杂货零售中的顾客行为给预测带来了挑战，因为顾客会在线下和线上渠道之间切换。我们收集了一家韩国大型杂货零售商的会员交易数据，并结合竞争对手信息和促销活动数据，以评估不同渠道的销售可预测性。基于最新研究结果表明，线上杂货购物比线下购物更倾向于形成惯性购买模式，我们提出了三个假设，将特定渠道的顾客行为与预测模型联系起来。通过使用XGBoost算法并进行严格的样本外测试以及基于SHAP的解释方法，我们得出了三个主要发现来支持这些假设。首先，随着特征数量的增加，预测准确性提高，其中顾客购买历史数据的贡献最大。其次，线上销售的预测性高于线下销售。第三，可预测性受到产品分类的影响：线上销售更易于用较宽的产品类别（类别）来解释，而线下销售则更适合用较细的产品子类别（子类）来解释。这些发现支持了我们的观点，即购买历史数据最为重要，因为它直接反映了惯性购买模式；线上渠道的预测性更强，因为其购买行为具有更高的连贯性；分类结构的差异反映了每个渠道中购买惯性的强度。零售商应在线上层面进行类别级别的规划，在实体店层面进行子类别级别的商品管理，以优化商品组合、促销活动和减少浪费。

引言

全渠道杂货零售中的预测错误代价高昂，因为它们会导致库存不匹配、浪费、配送问题以及人员安排和促销策略的失误，尤其是当实体店同时承担配送职能时（Fildes等人，2022年）。由于顾客在线下和线上渠道之间流动，这种溢出风险更大；因此，一个渠道的需求冲击或预测错误可能会迅速波及另一个渠道。随着消费者在实体店、电子商务网站和社交媒体之间无缝切换，对于那些线上线下业务结构不同的零售商来说，整合这些购物流程变得非常具有挑战性。虽然全渠道策略可以提高顾客满意度，但它们也使需求预测变得更加复杂，因为购物行为在不同渠道之间存在显著差异（Bell等人，2014年；Sarkar和Das，2017年）。例如，线上属性如产品评论和价格比较工具会影响线上购物行为（Gligorijevic和Luck，2012年；Yaylc和Bayram，2012年），而线下购物行为则受到感官刺激的影响，这些刺激会引发购买冲动和心理上的归属感（Biswas，2019年）。

因此，全渠道杂货零售的预测应围绕特定渠道的需求驱动因素和运营特点来设计，而不是基于单一的汇总需求信号。当实体店同时作为顾客接触点和配送中心时，管理者需要能够转化为具体渠道决策的预测结果，包括补货、配送能力、人员安排和促销活动。这种观点与预测系统在低利润率零售业中的实际作用是一致的（Fildes等人，2022年；Petropoulos等人，2022年）。

越来越多的证据表明，线上和线下杂货购物不仅在购买商品上存在差异，在购买行为的连贯性上也有所不同。Chintala等人（2024年）发现，线上购物篮子的购买行为在多次购物之间具有更高的相似性和更强的惯性购买模式，即使对于经验丰富的线上顾客也是如此。Pozzi（2012年）发现线上购物存在强烈的状态依赖性，而Danaher等人（2003年）报告称线上渠道的顾客品牌忠诚度更高。这些行为规律对需求可预测性有直接影响：如果线上顾客的购买模式更加稳定，那么杂货零售商拥有的购买历史数据应该能够更准确地预测线上销售。

基于这些行为特征，本研究探讨了三个问题：（1）哪种预测因子组合对每个渠道的预测准确性最有帮助？（2）线上销售的预测性是否高于线下销售？（3）不同渠道下最具信息量的行为信息层次是否存在差异——即线上预测是否更依赖于较宽的类别级别信号，而线下预测是否更依赖于更细的产品级别信号？

我们将这些问题转化为三个假设，并使用来自韩国一家大型杂货连锁店的面板数据集进行验证，该数据集涵盖了每个渠道约2500名顾客在一年内的购买记录。数据通过该连锁店的会员计划收集，涵盖了大约92%的总交易量。由于其在处理大规模数据集时的高效性和良好性能，我们采用了极端梯度提升（XGBoost）算法来建模销售数据（Massaro等人，2021年）。与现有文献一致，我们使用滞后销售数据作为基线预测因子，并加入了三类常见的额外预测因子：竞争对手信息、顾客购买数据和促销活动信息（例如Cheriyan等人，2018年；Pavlyshenko，2019年）。我们使用Shapley加性解释（SHAP）方法来评估每个预测因子组的相对贡献，并揭示这些贡献在不同渠道间的差异。为了确保结果的可解释性，我们采用了基于SHAP的解释方法，这与最近关于可解释零售预测的研究成果一致（Gür Ali和Gürlek，2020年）。

我们发现，顾客购买记录是两个渠道预测准确性的最大贡献因素（假设1）。线上销售的预测准确性高于线下销售，这与假设2相符。SHAP分析显示，线上销售的预测能力主要集中在类别级别（类别），而线下销售的预测能力主要集中在子类别级别（子类）（假设3）。机制检验确认了这些预测模式基于可观察到的购买行为：在同一家庭内，线上购物在类别层面的相似性比线下购物高26.3%，并且这种惯性在两个渠道中都存在，但在线上更为明显。

我们的贡献有三个方面：（1）我们证明了购买历史数据在两个渠道中都对预测准确性具有显著影响，因为它们编码了杂货购物的惯性模式，且这种影响在线上更为显著。（2）我们提供了新的证据，表明线上销售的预测性更强。我们将这种差异归因于线上购物中更为明显的惯性购买行为。（3）我们展示了最具信息量的预测信号存在于产品层次结构的不同层面——线上为类别级别，线下为子类别级别，并解释了这种模式与特定渠道购物过程之间的联系。这些结果为全渠道预测系统提供了一个实用的设计原则：根据渠道差异分别建立模型，并使规划粒度与渠道特性相匹配。

本文的其余部分安排如下：第2节回顾了零售预测和全渠道顾客行为的相关文献，将我们的研究置于这些研究框架中，并提出了三个将特定渠道行为与预测模型联系起来的假设。第3节描述了数据收集方法。第4节介绍了预测模型和评估设计。第5节报告了研究结果，包括预测性能、SHAP特征重要性分析和机制检验。第6节讨论了管理启示以及我们的预测方法可能表现不佳的情景。第7节总结了本文。

章节摘录

渠道差异作为预测不确定性的来源

全渠道零售通过顾客在线上和线下渠道之间的切换以及运营整合，给零售商带来了预测和规划方面的挑战。本研究扩展了现有的全渠道营销研究，重点考察了不同购物渠道对顾客行为的影响（Cui等人，2018年）。大量研究还探讨了线上和线下渠道的互动方式，以及渠道整合如何改变顾客行为和企业运营

顾客购买数据

数据来自一家在韩国运营着284家实体店和一体化在线平台的大型杂货连锁店。各渠道的产品组合和定价基本保持一致，只有少数商品仅在实体店销售。

预测模型和评估设计

为了利用广泛的特征集预测各渠道的每周店铺销售额，我们采用了机器学习方法。具体来说，我们使用了极端梯度提升（XGBoost）算法，该算法因其计算效率和强大的预测能力而非常适合预测任务。XGBoost在模拟非线性需求动态方面表现出色（Ben Taieb和Hyndman，2014年），并在预测应用中得到了广泛应用

每周销售预测

该模型的目标是最小化平方误差（RMSE），即预测误差的平均幅度，较低的RMSE值表示更高的预测准确性。所有预测因子都是基于截至

t ? 1

周的数据构建的，用于预测

t

周的销售数据，样本外评估窗口也严格保持独立。除了RMSE之外，我们还报告了无量纲指标NRMSE（RMSE除以平均销售额）

管理启示

研究发现，不同渠道下最具信息量的预测信号位于不同的层次结构中（假设3），这意味着运营规划应根据产品聚合的层次来进行调整。

对于线上业务，类别级别的广度是主要的预测因素，因此关键的操作杠杆是类别级别的商品组合规划和配送能力分配。线上配送经理可以利用类别级别的预测结果来制定相应的策略

结论

本研究表明，渠道环境改变了杂货需求最易预测的层次——线上为较宽的类别决策，线下为更细的产品级别决策——从而将全渠道顾客行为直接与预测系统设计联系起来。我们的发现支持了所有三个假设：购买历史数据在两个渠道中都对预测准确性具有显著影响，因为它们编码了惯性购买模式（假设1）；线上销售的预测性更强

CRediT作者贡献声明

Boram Lim：方法论、研究设计、数据分析、概念化。Sofia Cavieres：方法论、数据分析。Wen Jing Han：方法论、数据分析。Hyeong-Tak (Tak) Lee：写作与编辑、验证、监督、方法论、研究设计、数据分析、概念化。

利益冲突声明

作者声明他们没有已知的财务利益冲突或个人关系可能影响本文的研究结果。

联系信箱：

粤ICP备09063491号

摘要

引言