《Journal of Engineering and Technology Management》:When algorithms become travel planners: Benchmarking Agentic Ai in Web 3.0 Tourism
编辑推荐:
本研究对比分析代理式AI(aAI)、生成式AI(GenAI)和Web 2.0平台在五个旅游场景中的性能,发现aAI在行程可行性、可验证性及上下文适应性方面表现最优,尤其在成本优化、时间效率、可持续性和约束处理上显著优于其他系统,为旅游行业数字化转型提供了实证依据。
Samiha CHEMLI|Alessandra VITALE|Shekhar|Marco VALERI
西班牙德乌斯托大学
摘要
本研究旨在探讨代理型人工智能(aAI)系统作为自主旅行规划器的表现,与生成型人工智能(GenAI)和Web 2.0平台进行对比,以评估增加自主性是否能够提高效率、可持续性和个性化,或者仅仅是放大了偏见和不透明度。研究采用了跨五种旅行场景的比较性能分析方法,对所有三个系统使用相同的输入数据,以确保方法论的一致性。结果表明,aAI生成的行程计划最具可行性、可验证性和情境意识,在成本优化、时间效率、可持续性和约束处理方面优于其他系统。通过提供实证基准,本研究扩展了以往主要停留在理论层面的研究,为人工智能驱动的旅游规划提供了实际见解。研究结果还突出了关键的政策启示:需要加强公共和私人利益相关者之间的合作,并要求政策制定者提高商业数据(尤其是小型企业和本地提供商的数据)的可访问性和机器可读性,以促进其在人工智能驱动的旅行推荐中的参与度,减少更显眼行为者的主导地位。
引言
旅游业长期以来一直是数字创新的试验场(Buhalis和Law,2008;Fakir等人,2025;Skeja等人,2025;Xiang等人,2017)。从在线预订系统到人工智能驱动的个性化服务,旅游业反映了数字经济的广泛变革。
从以用户生成内容和社交互动为特征的Web 2.0向以人工智能(AI)、自动化和去中心化为特征的Web 3.0的转变,不仅代表了技术上的进化,也重新配置了决策过程中的主体性和平台商业模式逻辑(Fasano等人,2025)。在这个新格局中,算法成为塑造旅行选择的重要因素。旅游业对可见性、搜索和比较的依赖使其特别容易受到算法不对称性的影响。像TripAdvisor、Booking.com和Expedia这样的Web 2.0平台虽然普及了信息,但控制权却集中在由不透明排名系统管理的中介手中(Raguseo等人,2017)。正如Bilgihan等人(2025)和Arora与Bawa(2025)所指出的,竞争力主要取决于信息的可见性而非服务质量,算法成为了发现和信任的把关者。这一过程反映了平台化趋势的扩展,这些趋势重塑了整个旅游生态系统的信息流动和治理结构(Gretzel等人,2015;Mariani,2020)。这种加速发展源于数据驱动创新的日益重要性,大数据资源和分析能力正在塑造组织发现机会和产生创新成果的方式(Cappa等人,2026)。
随着人工智能的兴起,这一变革进程进一步加快,早期的基于规则的系统旨在优化用户体验并减少信息过载(Aggarwal等人,2025;Yannacopoulou和Kallinikos,2025)。随着机器学习和自然语言处理(NLP)的发展,人工智能具备了解释能力,能够通过文本、视觉和情感线索来影响旅游目的地形象(TDI)和旅客行为(Pompurová等人,2025;Tselempi等人,2025)。随后,生成型人工智能(GenAI)的出现引入了一种新的创造性和互动模式,大型语言模型(LLMs)和多模态系统能够生成叙述、行程规划和对话,结合了搜索和内容生成功能(Sihombing等人,2024;Rahman和Mia,2025)。这些系统提升了个性化体验和用户参与度,但它们仍然依赖于人类的提示和监督。Nilashi等人(2022)和Pop等人(2022)指出,GenAI的创造性模拟缺乏明确的意图或方向。
下一阶段的进化是代理型人工智能(aAI),其特征是自主性、目标导向和自适应学习。与仅响应提示的GenAI不同,aAI系统能够解释目标、规划任务并在动态环境中行动(Dwivedi等人,2023;Dwivedi等人,2025;Huang等人,2025)。这标志着一个质的飞跃,从辅助人类转变为部分替代人类的决策能力。在旅游业中,这意味着规划、推荐和消费方式的重组,因为算法开始作为能够代表旅客执行决策的运营主体(Kim等人,2025)。然而,尽管aAI具有巨大的变革潜力,但在实证研究方面仍相对不足。现有研究主要集中在概念层面,探讨其有用性、信任度或伦理问题,而较少测试其实际性能(Tripathi和Manhas,2023;Stylos等人,2025;Valeri,2025)。
目前尚无研究将aAI作为旅行规划器与GenAI或Web 2.0平台进行基准测试。这种缺乏比较证据的情况限制了我们对自主性是否能够提高效率、可持续性和个性化,或者仅仅是放大偏见和不透明度的理解。为填补这一空白,本研究通过性能分析实证比较了三种不同的智能系统(Web 2.0、GenAI和aAI)。因此,本研究的问题是:aAI系统作为自主旅行规划器的表现如何,与GenAI和传统在线平台相比有何不同?这又揭示了Web 3.0时代旅游业面临的机会和挑战是什么?
尽管人工智能驱动的旅游规划受到了越来越多的关注,但现有研究大多仍处于概念阶段,很少在单一实证框架内同时比较Web 2.0平台、生成型人工智能和代理型人工智能。此外,Web 3.0导向的代理型架构在旅游规划中的作用仍未超出理论讨论的范围。本研究通过提供受控的、基于场景的实证基准测试,初步探讨了代理型人工智能如何在旅游决策中实现新兴的Web 3.0原则,如自动化、互操作性和任务级自主性。
部分摘录
从Web 2.0到Web 3.0在旅游业中的应用
从Web 2.0的交互式范式向Web 3.0的数据驱动架构的转变彻底重塑了旅游业的中介方式和消费模式。Web 2.0推动了信息的民主化,用户生成的内容(UGC)、在线评论和社交媒体改变了旅游价值链,使旅客成为意义和声誉的共同创造者(Popescu等人,2016)。积极地参与数字互动能够增强人们对真实性和信任感的认知。
方法论
本研究旨在比较和测试代理型人工智能(aAI)作为旅行规划器的表现,与生成型人工智能(GenAI)和Web 2.0平台进行对比。与以往主要基于用户感知或解释现有技术差异的研究相比,这是一种新的方法。数据是通过针对本研究专门设计的5个旅行场景进行测试收集的,这些场景使用了前述技术。
研究
案例场景
本研究设计的5个场景虽然涵盖了旅游业的真实市场细分,但并未涵盖所有可能的旅行情况;它们旨在为行业专业人士提供可借鉴的见解。表2列出了这5个具有不同旅行需求、动机、预算、停留时间和约束条件的场景。
结果与讨论
比较性能分析比较了研究中使用的三种系统生成的结果:aAI(代理型人工智能的自动化层面)、Web 2.0(包括Trip.com、Booking.com等平台)和ChatGPT-5在五个场景中的表现。这些场景代表了具有实际操作约束的旅游行程计划。为了确保可比性,三种系统使用了相同的输入数据,输出结果通过五个核心指标进行了评估。
启示
管理方面的启示强调了旅游业企业需要具备“算法准备度”。企业需要创建一个新的环境,让旅客和算法共同做出决策。正如研究结果所示,aAI能够根据碳足迹、成本和文化相关因素等情境数据来解释和采取行动,而不仅仅是展示这些数据。这将取决于公司数据的结构及其处理方式,从而影响其竞争力。
结论、局限性与未来研究
本研究首次对代理型人工智能、生成型人工智能和Web 2.0系统在旅游规划中的应用进行了比较基准测试。它扩展了关于人工智能在旅游业中应用的理论研究,进一步探讨了代理能力如何从描述性智能发展到操作性智能。研究表明,虽然Web 2.0系统主要负责数据聚合,GenAI模型侧重于语言描述,但aAI展现了解释用户偏好和约束条件以及响应情境信息的能力。