一种用于智能制造决策支持的市场情绪分析框架：来自特种车辆的实证研究

《Machine Learning with Applications》：A Market Sentiment Analytics Framework for Intelligent Manufacturing Decision Support: Evidence from Special-Purpose Vehicles

【字体：大中小】 时间：2026年04月29日 来源：Machine Learning with Applications 4.9

编辑推荐：

　　张恩明|张婵娟|陈叶叶武汉理工大学机械与电子工程学院，中国武汉 **摘要** 大规模的专业机电制造面临着来自小批量订单、工艺多样化以及下游市场条件不确定性的日益增加的挑战。在这种情况下，及时识别外部市场信号对于支持智能制造中的相关决策至关重要。本研究提出了一种基于

　　张恩明|张婵娟|陈叶叶
武汉理工大学机械与电子工程学院，中国武汉

**摘要**
大规模的专业机电制造面临着来自小批量订单、工艺多样化以及下游市场条件不确定性的日益增加的挑战。在这种情况下，及时识别外部市场信号对于支持智能制造中的相关决策至关重要。本研究提出了一种基于文本的市场情绪分析框架，该框架利用多源文本数据提取与决策相关的情绪信号。通过整合主题建模、上下文语义表示、序列学习和结构化预测，开发了一种名为LBBC的混合框架，以捕捉市场情绪的时间动态。以工程型专用车辆为例，该框架分析了来自新闻报道、行业分析和专家评论的情绪信息。实验结果表明，LBBC框架在情绪分类任务中始终优于几种基于文本的基线模型。

为了进一步考虑提取的情绪信号的实际相关性，讨论了与工程型专用车辆相关的下游市场活动指标的聚合月度情绪分数。分析表明，情绪序列可以为解释外部市场条件和支持不确定性下的相关决策提供有用的上下文信息。总体而言，所提出的框架旨在作为决策支持工具，而不是独立的需求预测模型，并为将基于文本的市场情报整合到智能制造系统中提供了实际基础。

**1. 引言**
随着工业发展的不断进步，大规模的专业机电产品变得越来越多样化，其生产规模也大幅扩大。由于这些产品体积庞大、结构复杂且制造要求苛刻，它们对智能生产规划和运营控制提出了相当大的挑战。在这种情况下，制造企业越来越需要及时了解市场状况和外部信号，以支持数据驱动的生产规划和资源分配（Berdyugina & Cavallucci, 2023; Zhang & Song, 2024）。通过整合外部文本信息（如行业新闻报道和专家分析），企业可以在不确定性下提高决策的稳健性，从而降低运营风险，并更好地支持制造环境中的规划和资源分配（A. & C., 2020; Wang et al., 2022; Y. et al., 2024）。在这些产品中，专用车辆代表了一个高度多样化且实际重要的类别。不同类型车辆之间的原材料、产品配置和制造工艺的差异增加了生产组织的复杂性，可能导致规划和资源利用的低效率。在这种情况下，从外部文本数据中提取市场情绪动态可以为材料准备、生产线配置和产能规划提供与决策相关的信号（A. V. et al., 2024; Chutia & Baruah, 2024）。通过将情绪相关信息纳入制造管理，企业可以在不确定性下提高规划相关决策的响应性和稳健性。先前的研究表明，新闻报道和专家评论可以提供有关市场预期和趋势变化的有用信号（Li et al., 2020; Zhao et al., 2022）。与直接预测定量市场需求相比，此类文本数据可用于建模市场情绪动态和外部预期，为战略和运营决策提供有价值的上下文信息。因此，本研究采用专用车辆作为代表案例，探讨了基于文本的情绪分析如何为智能制造系统提供与决策相关的信号（Farbiz et al., 2023; Rai et al., 2021）。所提出的方法旨在支持企业层面的风险缓解和适应性规划，同时也提供了对行业层面更广泛市场条件的分析洞察。近年来，机器学习技术越来越多地应用于从文本数据中提取和分析市场相关信息。在这种情况下，从新闻报道和专家评论中建模市场信号可以被视为一个重要的自然语言处理任务。现有研究主要集中在基于主题的方法和文档级序列建模方法上（Birjali et al., 2021; Rodríguez-Ibánez et al., 2023; Wankhade et al., 2022; Zhu et al., 2023）。一种代表性的主题建模方法是潜在狄利克雷分配（LDA），它已被广泛用于识别大规模文本语料库中的潜在主题结构。例如，Polyzos和Wang（2022）应用LDA从与能源市场相关的扩展Twitter数据集中提取主题模式，并利用所得主题信息分析市场相关波动（Polyzos & Wang, 2022）。同样，Bai等人（2022）使用LDA从新闻文本中提取主题信息，并利用所得主题特征分析原油价格波动（Bai et al., 2022）。尽管主题建模方法适用于大规模文本分析，但它们在捕获细粒度语义信息方面存在固有局限性，这可能降低其在市场信号提取和情绪相关任务中的有效性（Yu & Xiang, 2023）。文档级序列建模方法（如长短期记忆（LSTM）网络）已被广泛用于捕获文本数据中的序列模式。例如，Gülmez（2023）展示了基于LSTM的建模在分析金融市场股价波动中的有效性（Gülmez, 2023）。同样，Zhong等人（2023）使用基于LSTM的建模分析加密货币价格趋势，表明序列神经架构可用于从时间敏感数据中提取市场相关动态（Zhong et al., 2023）。Dontu等人（2024）表明，经过TPE优化的基于自注意力的BiLSTM模型在复杂和异构的IIoT环境中表现有效，进一步证明了基于BiLSTM的架构在处理多源和异构数据方面的适用性（Dontu et al., 2024）。尽管LSTM有效缓解了长序列建模中的梯度消失和爆炸问题，但它仍存在一些局限性，包括高计算成本、有限的并行化能力、容易过拟合以及处理复杂上下文依赖关系的灵活性降低（K. et al., 2024; Lindemann et al., 2021）。近年来，学者们越来越多地应用先进的上下文语言模型（如BERT）从文本数据中提取市场相关信息。例如，Zhao等人（2022）使用BERT结合专家评论和社交媒体文本来建模股市和比特币相关趋势信号（Zhao et al., 2022）。同样，Zou和Herremans（2023）使用基于BERT的模型结合社交媒体数据分析比特币市场价格波动（Zou & Herremans, 2023）。尽管BERT在捕获上下文语义信息方面表现良好，但它仍存在一些局限性，包括固定的最大输入长度为512个令牌、需要截断较长文本以及在处理具有复杂长距离依赖关系的长文档时的有效性降低（D. et al., 2022; Ettinger, 2020; Rasmy et al., 2021）。现有的基于文本的市场相关分析模型在处理异构文本数据时仍面临准确性和泛化方面的局限性。这些挑战促使开发了一种混合框架，以更好地整合互补表示并提高从专用车辆相关文本中提取情绪相关市场信号的能力。

本研究探讨了如何利用多源文本数据来建模市场情绪动态并支持智能制造中的相关决策。为此，开发了一种名为LBBC（LDA-BERT-BiLSTM-CRF）的混合框架，从新闻报道和专家评论中提取细粒度的情绪相关信息。该框架专注于情绪表示和分类，从而解决了现有基于文本的方法在处理异构和长格式文本数据时的局限性。具体来说，文本输入首先通过LDA-BERT组件进行处理，生成增强主题的上下文表示。然后将这些表示输入到BiLSTM（双向长短期记忆）层中，以捕获双向序列依赖关系。最后，引入CRF（条件随机场）层来建模标签级依赖关系并提高情绪相关序列标签的一致性（Aslan et al., 2021; Peng et al., 2021）。CRF层通过联合优化序列级分数来解码最终标签序列，从而提高标签一致性并增强情绪提取的可靠性（J. et al., 2021; T. et al., 2022; Z. et al., 2022）。此外，还使用一种情绪量化方法进一步分析来自三个来源的文本数据，该方法结合了基本极性评分、加性调整和否定处理。这一过程使得可以计算聚合情绪分数并分析与专用车辆相关的时间情绪动态。所得情绪信号提供了辅助的上下文信息，可以支持智能制造系统中的相关决策。总体而言，本研究开发了一种用于制造相关背景下的情绪信息提取和时间情绪分析的基于文本的框架。本研究的主要贡献总结如下：
（1）开发了一种名为LBBC的混合框架，用于从与专用车辆相关的多源文本数据中提取和建模情绪信息。通过整合主题建模、上下文语义表示、序列学习和结构化预测，该框架增强了异构文本输入的情绪表示。
（2）针对几种基线和基于文本的混合模型进行了全面的比较实验，以评估所提出框架在多个文本来源的情绪分类任务中的有效性。
（3）进一步开发了一种情绪量化和时间分析方法，以聚合市场情绪信号，并讨论了其与下游市场活动指标的实际相关性，展示了基于文本的情绪信息如何在不确定性下作为制造决策支持的辅助输入。

本文的其余部分组织如下。第2节介绍了所提出的基于文本的情绪分析框架及其组成部分。第3节描述了数据来源、数据收集程序、文本预处理步骤以及用于定量分析的下游市场活动指标。第4节报告了实验设置、评估指标和比较结果。第5节展示了聚合市场情绪的时间演变，并进一步探讨了其与制造相关背景下的下游市场活动指标的关系。最后，第6节总结了本文并讨论了研究的局限性和未来研究方向。表1提供了本手稿中使用的缩写列表，以便参考。

**表1. 缩写词表**
| 缩写 | 全称 |
| --- | --- |
| LDA | 潜在狄利克雷分配 |
| BERT | 双向编码器表示 |
| BiLSTM | 双向长短期记忆 |
| CRF | 条件随机场 |
| LBBC | LDA-BERT-BiLSTM-CRF |

**2. 方法**
2.1. 潜在狄利克雷分配（LDA）
潜在狄利克雷分配（LDA）是一种用于发现文档语料库中潜在主题结构的生成概率模型。它假设每个文档由多个主题组成，每个主题由单词的概率分布表示。作为一种无监督学习方法，LDA特别适合从大规模未标记的文本数据中识别粗粒度主题信息。在本研究中，LDA用于从多源文本中捕获主题级上下文信息，从而为后续情绪建模提供主题特征。
形式上，LDA模型以D×V的文档-单词矩阵作为输入，其中D表示文档数量，V表示词汇表大小。它估计两个潜在矩阵θ和Φ，θ是文档-主题分布矩阵，其行表示文档的主题分布；Φ是主题-单词分布矩阵，其行表示主题的单词分布。通过最大化观察到的语料库的似然性，LDA估计每个文档的潜在主题分布和每个主题的相应单词分布。在本研究中，这些主题级特征用于捕获多源文本数据中的粗粒度主题结构，并为后续情绪建模提供上下文支持。

2.2. 双向编码器表示（BERT）
双向编码器表示（BERT）是一种预训练的上下文语言模型，通过大规模无监督训练捕获双向语义信息。通过学习上下文依赖的单词表示，BERT可以编码文本数据中的微妙语义关系和上下文细微差别。在所提出的LBBC框架中，BERT用于生成细粒度的令牌级上下文嵌入，为后续序列建模和情绪提取提供语义基础。在微调过程中，预训练的BERT表示使用标记数据适应特定领域的情绪分析任务，使模型能够更好地捕获与情绪相关的上下文信息。BERT的一个实际局限性是其固定的最大输入长度，通常限制为512个令牌。因此，较长的文档必须被截断，这可能导致长格式文本数据中的部分信息丢失。

如图1所示，BERT架构包括一个输入表示模块和多个堆叠的Transformer编码器层。输入表示由令牌嵌入、段落嵌入和位置嵌入组成。每个编码器层包含一个多头自注意力机制和一个前馈神经网络，使模型能够捕获不同语义级别的上下文依赖关系。在本研究中，编码器层产生的上下文表示作为BERT的语义输出，并作为后续情绪建模的输入特征。

**图1. BERT模型架构**
LDA-BERT组件为每个文本实例生成两种互补的表示：一种是从LDA派生的主题分布向量，另一种是由BERT生成的上下文语义嵌入。主题分布向量反映了文本与潜在主题之间的概率关联，而BERT表示则捕捉了细粒度的上下文语义。为了整合这些互补特征，将主题分布向量与相应的BERT嵌入连接起来，形成一个统一的表示。由此产生的复合向量共同编码了主题级别的主题信息和上下文语义信息，从而为后续的序列建模和情感分析提供了丰富的输入特征。

2.3. 双向长短期记忆（BiLSTM）
双向长短期记忆（BiLSTM）是一种序列建模架构，旨在通过从两个相反的方向处理输入序列来捕捉序列数据中前后的上下文依赖关系。在提出的LBBC框架中，使用BiLSTM来建模由LDA-BERT组件生成的上下文表示之间的序列依赖关系，从而增强情感承载文本中的上下文连贯性表示。具体来说，BiLSTM层包括一个前向LSTM和一个后向LSTM。前向LSTM从左到右处理输入序列，而后向LSTM则从右到左处理相同的序列。通过门控记忆机制（包括输入门、遗忘门和输出门），模型能够保留长序列中的重要上下文信息。通过结合两个方向获得的隐藏状态，BiLSTM生成了更具信息量的序列表示，并为LBBC框架中的后续情感提取和分类任务提供了有效支持。

BiLSTM的计算过程基于一个输入序列，如方程所示：
X=[x1,x2,...,xt]。
基于这个输入，前向LSTM计算每个时间步的前向隐藏状态和单元状态，如方程ht→=LSTM(ht?1→,xt)所描述；而后向LSTM计算相反方向上的相应隐藏状态和单元状态，如方程ht←=LSTM(ht+1←,xt)所描述。从两个方向获得的隐藏表示在每个时间步被连接起来，生成最终的输出表示，如方程ht=[ht→;ht←]所示。

2.4. 条件随机场（CRF）
条件随机场（CRF）是一种广泛用于结构化序列标注任务的判别概率图模型。在提出的LBBC框架中，CRF被用来捕捉输出序列中相邻位置之间的标签级依赖关系，从而强制情感相关标注的全局一致性。通过联合建模BiLSTM层生成的局部发射分数和相邻标签之间的转换关系，CRF层减少了标签不一致性，并提高了序列级情感提取的可靠性。

在条件随机场（CRF）中，节点对应于与输入序列的标签相关联的随机变量，边则编码了这些变量之间的依赖关系。对于序列标注任务，图结构通常是一个线性链，其中相邻的标签节点是相连的。在这样的链结构CRF中，每个标签节点yt取决于输入序列的特征yt?1。

CRF模型的主要公式如下：
给定一个输入序列X=(x1,x2,...,xT)及其对应的标签序列Y=(y1,y2,...,yT)，CRF模型如下建模条件概率分布：
(1) P{Y|X}=1/Z(x)exp(∑t?1T∑kλkfk(yt?1,yt,x,t)
其中fk(yt?1,yt,x,t)表示描述当前标签yt、前一个标签yt?1和位置t的观察序列x之间关系的特征函数。λk表示相应的特征权重，Z(x)是确保所有可能的标签序列的条件概率之和为一的归一化因子：
(2) P(yt|X)=∑yxep(∑t=1T∑kλkfk(yt?1,yt,x,t))
CRF模型不仅建模了观察序列与输出标签之间的依赖关系，还捕捉了相邻标签之间的转换关系。通过联合利用上下文信息和标签级约束，它减少了标签不一致性，并提高了情感相关序列标注的可靠性。

2.5. LDA-BERT-BiLSTM-CRF模型
从LDA和BERT提取的特征通过特征级别的向量连接进行融合，从而用主题级别的上下文信息丰富了语义表示。与简单堆叠独立模型不同，提出的LBBC框架采用了一种分层集成策略，将主题建模、上下文表示、序列依赖建模和结构化标注统一在单个处理流程中，用于基于文本的情感分析。具体来说，LDA组件为每个文本实例生成主题分布向量，反映了输入文本与潜在主题之间的概率关联，而BERT为相同的文本输入生成了具有上下文意识的语义嵌入。然后将这两种表示对齐并连接起来，形成复合特征向量，它们共同编码了来自LDA的潜在主题信息和来自BERT的细粒度上下文语义信息。随后，这些复合向量被输入到BiLSTM层中，以建模序列依赖关系并捕捉情感承载文本中的上下文连贯性。最后，BiLSTM层的输出特征被传递到CRF层，在那里标签依赖关系被联合优化，以生成最可能的情感标签序列，从而提高情感提取的一致性和可靠性。

如图2所示，LBBC模型将主题建模、上下文语义表示、序列建模和结构化标注集成到一个统一的架构中，用于基于文本的情感分析。该模型利用了从潜在主题到上下文语义和序列依赖关系的多层次文本信息，以增强从多源文本数据中提取情感相关信息的表示和提取能力。LBBC的分层集成策略使得能够互补地使用主题级上下文、语义嵌入、序列依赖关系和标签级约束。与简单的堆叠或部分融合方法相比，这种架构提高了情感提取的粒度和可靠性。

下载：下载高分辨率图像（491KB）
下载：下载全尺寸图像
图2. LBBC模型架构。

3. 数据
3.1. 数据获取
本研究使用LBBC（LDA-BERT-BiLSTM-CRF）框架从多源文本数据中提取和分析与特种车辆相关的情感信号。文本语料库来自三个主要来源：特种车辆网络、Google Scholar和Google Search。选择这些来源是因为它们提供了互补形式的信息，包括行业导向的新闻报道、公开可用的网络内容和学术导向的专家讨论。文本数据是使用与特种车辆相关的一组关键词检索的，如表2所列。对于新闻报道和基于网络的文本材料，采用了自动化收集程序；而学术文档则以PDF格式获取，并使用标准文档解析方法转换为纯文本。随后使用该语料库进行情感提取、情感分类和与特种车辆市场相关的时间序列情感分析。

表2. 特种车辆搜索关键词
序号关键词
1 民用工程车辆
2 混凝土搅拌车
3 道路维护车辆
4 清扫车
5 垃圾车
6 油罐车

3.2. 实验数据
实验数据集包括与特种车辆相关的新闻文章和专家评论文本，这些数据来自2020年12月至2023年11月期间的特种车辆网络、Google Scholar和Google Search。每个文本实例被分配到两个情感类别之一，即乐观（Optimistic）和悲观（Unoptimistic）。悲观类别结合了中性和悲观表达，以在二元情感分类设置中表示非积极的市场情感。情感标签是通过基于预定义的情感标准的手动筛选和注释过程分配的。为了提高模型训练和评估的鲁棒性，在数据集构建过程中通过控制样本选择来缓解类别不平衡。对于模型开发，收集的文本被分为训练集、验证集和测试集，分别包含300,000、7,500和1,500个文本实例。

3.3. 情感分析子集
工程型特种车辆主要用于基础设施建设，因此代表了特种车辆行业中的一个主要应用类别。为了支持时间序列情感动态的案例级分析，构建了一个专门针对工程型特种车辆的新闻报道和专家评论文本的子集。这些文本来自三个相应的来源：特种车辆网络、Google Scholar和Google Search，分别代表行业导向的新闻平台、学术文献来源和一般的基于网络的信息渠道。数据收集期间覆盖了2020年12月至2023年11月。经过预处理和数据清洗后，共保留了43,018个有效的文本条目，用于后续的情感量化和时间分析。

3.4. 数据预处理
为了确保下游建模的一致性和鲁棒性，收集的文本数据经过了标准化的预处理程序。主要的预处理步骤总结如下：
(1) 删除重复项和停用词过滤。从语料库中移除了完全重复的文本。进一步过滤掉了高频功能词和语义上无信息的标记，以减少噪声并提高表示质量。
(2) 实体规范化。为了减少指代歧义，根据上下文信息将泛指车辆实体的表达替换为明确的车辆类别名称。
(3) 文本去噪。移除了非语义元素，如图表引用、多余的空白字符和与语义内容无关的编辑注释，以获得更干净的文本输入。
(4) 句子分割。将长句子沿着标点符号边界分割成较短的单元，以避免过长的输入序列，从而提高训练稳定性并减少截断效应。

3.5. 下游市场活动指标
为了进一步评估汇总的情感信号的实际相关性，本研究引入了与工程型特种车辆需求环境密切相关的下游市场活动指标。由于公司级别的运营指标无法公开获取，因此使用公开可用的房地产指标作为下游市场条件的外部代理变量。选择了两个月度指标：房地产开发投资和新开工的建筑面积。前者反映了下游建筑市场的整体投资强度和项目进展，而后者更直接地捕捉了新建筑活动的启动，这与工程型特种车辆的潜在需求密切相关。这些指标的收集时间与情感数据集相同，涵盖了2021年1月至2023年12月的月度汇总情感序列。在时间对齐后，每个月都由一个汇总的情感分数以及选定的下游指标的相应值表示。所得到的对齐数据集用于支持第5.3节关于文本衍生情感信号在下游市场背景中的实际相关性的讨论。应当注意的是，这些指标是外部需求侧的代理变量，而不是公司级别制造绩效的直接衡量指标。它们的使用旨在为制造相关规划的文本衍生情感信号的实际相关性提供初步的定量评估。

4. 实验与分析
4.1. 实验环境
实验在配备有Intel(R) Core(TM) i7-6700HQ CPU @ 2.60 GHz和24.0 GB RAM的系统上使用Python实现。

4.2. 模型性能评估指标
为了全面评估所提出模型的分类性能，采用了多种评估指标，包括准确率（ACC）、F1分数、特异性（SP）、Cohen’s Kappa系数和Matthews相关系数（MCC）。这些指标提供了关于预测可靠性的互补视角，特别是在潜在类别不平衡的情况下。准确率（ACC）衡量正确分类样本的总体比例：
ACC=TP/(TP+TN+FP+FN)
精确度（P）和召回率（R）定义为：
P=T/(TP+FP)
F1分数平衡了精确度和召回率，计算公式为：
F1=2*(P*R)/(P+R)
特异性（SP），也称为真正率，反映了模型正确识别负样本的能力：
SP=T/(TN+FN)
Cohen’s Kappa系数（κ）最初由Jacob Cohen提出，衡量了预测分类和实际分类之间的一致性，同时考虑了偶然一致性：
κ=1?(P/E)/(Po/P)
其中P表示观察到的共识，E表示偶然的一致性。
Matthews相关系数（MCC）由Brian W. Matthews引入，即使在类别分布不平衡的情况下也能提供平衡的评估：
MCC=TP·TN/(FP·FN)/(TP+FN)/(TN+FP)
MCC的范围是从-1到1，其中1表示完美预测，0表示不比随机分类好，-1表示完全不一致。

4.3. 实验超参数设置
在本文中，为LBBC融合模型设置了实验超参数，实验超参数如表3所示：
表3. 实验超参数
| 超参数 | 数值 |
|-------------|-------------------|
| Epochs | 7 |
| Batch Size | 16 |
| BERT-num-hidden-layers | 12 |
| BiLSTM-learning-rate | 1.5e-3 |
| CRF-learning-rate | 1.5e-4 |

4.4. 实验结果与分析
在本节中，进行了受控实验来评估所提出的LBBC框架的有效性。主要目标是确定所提出的融合架构是否比基线和混合基于文本的模型具有更好的情感分类性能。具体来说，实验重点评估LBBC框架内多级特征融合的贡献。通过比较LBBC与各种中间融合配置，本研究检查了主题建模、上下文表示、序列依赖建模和结构化预测的联合集成是否导致情感分类性能的一致性改进，从而为下游情感解释提供了更强的基础。为了提供全面的评估，将所提出的LBBC框架与几个代表性的基线和混合模型进行了比较，包括BERT、LB（LDA-BERT）、BC（BERT-CRF）、BiC（BiLSTM-CRF）、LBB（LDA-BERT-BiLSTM）、LBC（LDA-BERT-BiLSTM）和BBC（BERT-BiLSTM-CRF）。比较结果如表4所示。使用特殊车辆网络数据集的情感分类模型性能比较。序号模型F1分数ACCSPκMCC1BERT0.72730.88160.91610.76370.76412LB0.73550.89210.92260.78410.78523BC0.74470.90120.93170.80250.80374BiC0.74610.90430.93520.80960.81095LBB0.74730.90520.93670.81060.81126LBC0.74350.89860.92920.79730.79867BBC0.75260.91330.94440.82710.82828LBBC0.75960.91820.94810.83650.837表4比较了基线和混合模型在特殊车辆网络数据集上的性能，结果显示提出的LBBC框架取得了最佳的整体结果。具体来说，LBBC的F1分数为0.7596，准确率为0.9182，优于单一模型基线和中间混合架构。这些结果证明了在统一框架内整合基于LDA的主题建模、基于BERT的上下文表示、基于BiLSTM的序列特征提取和基于CRF的结构化解码的有效性。此外，LBBC的特异性为0.9481，Cohen’s Kappa和MCC分别为0.8365和0.8370。这些结果表明一致性超出偶然性，并且分类性能平衡。Kappa和MCC之间的一致性进一步表明观察到的性能提升是稳定的，并不是由类别不平衡驱动的，从而支持了所提出的多层次特征融合策略的稳健性和可靠性。为了进一步评估所提出框架的泛化能力和稳健性，在特殊车辆网络语料库之外，还对从Google Search和Google Scholar收集的数据集进行了额外的跨源实验。对于Google Search数据集，随机抽取了与特殊车辆相关的网页文本并进行情感分类标注。对于Google Scholar数据集，检索了与特种车辆相关的学术文本并使用相同的标注标准进行标注。相应的比较结果分别展示在表5和表6中。表5. 使用Google Search数据集的情感分类模型性能比较。序号模型F1分数ACCSPκMCC1BERT0.71350.86730.90910.73590.73672LB0.72230.87610.91660.75220.75393BC0.72360.87450.91440.74930.75014BiC0.71060.86420.90620.72860.72935LBB0.72730.88670.92560.77370.77416LBC0.72510.88240.92120.76520.76667BBC0.74300.89720.93450.79410.79528LBBC0.74430.90920.94530.81830.8193表6. 使用Google Scholar数据集的情感分类模型性能比较。序号模型F1分数ACCSPκMCC1BERT0.61310.76220.84930.52410.52562LB0.63610.79080.87410.58280.58373BC0.64060.79710.88020.59410.59564BiC0.64370.80120.88440.60260.60395LBB0.64520.80310.88620.60650.60736LBC0.63770.79440.87820.58930.59097BBC0.65110.80620.88960.61280.61378LBBC0.66780.82290.90220.64610.6473表5展示了在Google Search数据集上的比较结果，该数据集包含更多异构和动态生成的基于网页的内容，因此用于评估所提出框架的泛化能力。如表5所示，LBBC模型再次取得了最佳的整体性能，F1分数为0.7443，准确率为0.9092，优于独立的基线和其他混合变体。尽管绝对性能略低于在特殊车辆网络数据集上获得的性能，但模型的一致排名表明了所提出的融合架构的结构稳定性和跨源适应性。此外，LBBC的特异性为0.9453，Cohen’s Kappa和MCC分别为0.8183和0.8193。这些结果表明一致性超出偶然性，并且分类性能平衡。LBBC在ACC、F1、SP和MCC上的一致优势表明，主题建模和上下文语义表示的多层次整合对泛化有积极贡献，并支持在独立收集的基于网页的文本数据上的稳定性能。表6报告了在Google Scholar数据集上的比较结果，该数据集包含学术结构化的文本，具有更高的语义抽象性和更隐含的情感表达。正如预期的那样，所有模型在这个数据集上的整体性能都低于前两个数据集。尽管如此，所提出的LBBC框架仍然保持明显优势，F1分数为0.6678，准确率为0.8229，一致优于基线和中间混合模型，包括BERT（F1=0.6131，ACC=0.7622）。此外，LBBC获得了最高的特异性（0.9022），而Cohen’s Kappa和MCC分别为0.6461和0.6473。这些结果表明尽管学术结构化文本中情感的显著性相对较弱，但一致性适中到显著，并且分类性能平衡。总体而言，结果表明所提出的多层次融合策略在正式结构化和隐含表达的文本中增强了语义区分能力，并在更具挑战性的文本条件下支持稳定的情感分类性能。表4、表5和表6的跨数据集比较进一步表明，所提出的LBBC框架在特殊车辆网络、Google Search和Google Scholar数据集上的F1分数、准确率、Cohen’s Kappa和MCC方面始终优于其他方法。尽管从特定领域的特殊车辆网络数据集到更异构的Google Search数据集以及更具语义抽象性的Google Scholar数据集，绝对性能逐渐下降，但这种趋势与文本输入的语言复杂性增加一致，而不是模型的结构不稳定。Kappa和MCC之间的一致性进一步表明，观察到的改进主要不是由类别不平衡驱动的，而是反映了平衡和稳健的分类能力。总体而言，LBBC框架在多样化的文本来源上展示了稳定和可泛化的情感分类性能，支持了其在特殊车辆相关文本中提取市场信号的多层次融合策略的有效性。如图3所示，从LBBC框架中移除任何单个组件都会导致F1分数的可测量下降，表明每个模块都对情感分类性能有积极贡献。这些结果表明，所提出的融合架构受益于主题建模、上下文表示、序列建模和结构化预测的互补作用，而不是依赖于任何单一的主导组件。通过提高情感分类的准确性和稳定性，LBBC框架为提取情感信号提供了更可靠的基础，这可以作为市场不确定性下制造相关规划的辅助上下文输入。下载：下载高分辨率图像（1MB）下载：下载全尺寸图像图3. 模型性能比较。5. 聚合情感的时间分析5.1. 情感评分构建方法为了构建用于后续时间分析的定量情感指标，本研究采用基于规则的情感组合方法来估计新闻报道和专家评论文本中表达的情感的极性和相对强度。情感评分是从文本中情感对象、带情感的形容词、程度副词及其句法关系的结构化组合中得出的。规则设计遵循一个可解释的加权方案，用于处理极性、强度修改和否定。具体来说，情感值是通过三种预定义的组合模式计算得出的，即基本组合、累积组合和否定组合。情感组合方法包括三种模式：基本组合、累积组合和否定组合。在基本组合模式中，情感强度是由情感对象、带情感的形容词和程度副词的组合决定的。例如，在句子“市场非常好”中，提取的三元组包括“市场”作为情感对象，“好”作为带情感的形容词，“非常”作为程度副词。在累积组合模式中，多个情感对象可以共享相同的带情感表达。例如，在句子“市场和前景非常好”中，提取的元素包括“市场”和“前景”作为情感对象，“好”作为带情感的形容词，“非常”作为程度副词。因为两个情感对象形成了平行的句法结构，它们的感情贡献根据预定义的累积规则进行聚合，从而使得句子的整体情感强度更高。第三种模式是否定组合模式。例如，考虑句子“市场不是非常好”和“市场非常糟糕”。在这两种情况下，识别出的情感对象都是“市场”，而“好”和“糟糕”作为由程度副词和否定词（如“不”和“非常”）修饰的带情感的形容词。“非常糟糕”表达的情感强度比“不非常好”更强，表明情感强度不仅受程度副词和否定词的存在影响，还受它们在句子中的位置顺序影响。因此，本研究为程度副词和否定词定义了一个基于规则的加权方案，如表7所示，并制定了相应的情感强度计算规则，如下所述。表7. 度数副词和否定词的初始基于规则的权重。部分技术名称数值负词程度副词反向-1非常1.5更多1.2有点0.8不足0.5分配给程度副词和否定词的权重是作为可解释的基于规则的系数，反映了情感表达中的相对强度排序。这些值用于支持透明的情感量化，而不是数据驱动的参数优化。第一个否定组合公式，对应于N+D结构，定义如下：(10)Q=(-1)|N|×(1WD)×QST第二个否定组合公式，对应于D+N结构，定义如下：(11)Q=(-1)|N|×(WD×QS)这两种公式明确考虑了否定词和程度副词之间的排序差异，这对自然语言表达中的情感强度有可测量的影响。在这些公式中，N表示否定词，D表示程度副词，S表示带情感的形容词，Q表示计算出的情感强度值|N|表示参与情感组合过程的否定词的数量，WD表示分配给程度副词的权重，QS表示带情感的形容词的极性值，其中正面情感词被赋值为+1，负面情感词被赋值为-1。通过整合基本、累积和否定组合模式，可以系统地计算和表示情感值，而不仅仅是限于离散的情感类别。这种连续评分策略使得情感强度的量化更加细致，并提供了对市场相关情感动态的更富有表现力的表示。5.2. 聚合情感值的时间演变工程型特种车辆是特种车辆行业中最重要的应用类别之一，因此适合作为时间情感分析的案例。使用这一类别作为示例，本研究应用情感组合方法来量化多个时间阶段的情感强度，从而生成可以用于分析市场预期变化的时间情感趋势。从2020年12月到2023年11月收集的新闻报道和专家评论文本被组织成三个连续阶段，对应于2021年、2022年和2023年的观察期。对于每个阶段，计算并聚合了情感强度值，结果趋势在图4中以视觉形式呈现，显示了市场情感的时间演变。下载：下载高分辨率图像（425KB）下载：下载全尺寸图像图4. 2021年的月度聚合情感趋势。如图4所示，2021年的聚合情感序列显示出明显的月度波动，而不是稳定的上升趋势。这种模式与疫情后时期的宏观经济不确定性和不均衡的恢复情况大体一致。特别是，需求的下行压力、供应方面的中断以及市场预期的减弱继续影响更广泛的经济环境，而房地产开发氛围相对低迷。鉴于工程型特种车辆与建筑相关活动之间的密切关系，这些外部条件可能影响了市场情绪和下游需求预期。在2021年内，几个月（包括3月、6月、11月和12月）观察到情感强度的暂时增加，而其余月份的情感水平相对较弱。这些波动可能反映了公共卫生条件的周期性改善、短期政策调整和下游市场变化的综合效应。总体而言，2021年的情感模式表明，市场对工程型特种车辆的预期对外部经济条件仍然敏感，并没有遵循统一的恢复路径。如图5所示，2022年的聚合情感序列继续显示出显著的月度波动，表明市场对工程型特种车辆的预期全年都不稳定。这种模式可以在反复的疫情中断、持续的需求侧压力、供应链限制和下游市场信心疲弱的背景下进行解释。2022年期间，更广泛的经济环境进一步受到外部不确定性和国内冲击的影响，而房地产开发投资相对于前一年有所下降，表明建筑相关市场条件持续疲软。鉴于工程型特种车辆与下游建筑活动之间的密切联系，这些因素可能导致了观察到的情感强度的变化。包括2月和3月在内的几个月显示出相对较强的情感值，而9月、11月和12月也观察到了较小的反弹。相比之下，其他时期的情绪相对低迷。这些波动可能反映了短期政策干预、季节性调整和下游市场条件变化的综合效应。总体而言，2022年的情感模式表明，市场对工程型特种车辆的预期仍然脆弱，对外部冲击敏感，没有遵循稳定的恢复轨迹。下载：下载高分辨率图像（436KB）下载：下载全尺寸图像图5. 2022年的月度聚合情感趋势。如图6所示，2023年的聚合情感序列显示出与早期相比有所改善的轻微恢复模式，尽管整体改进仍然有限。这种模式与更广泛的经济环境逐渐稳定一致，但也表明市场对工程型特种车辆的预期保持谨慎，而不是强烈扩张。在此期间，土地交易活动依然疲软，制造业采购经理指数（PMI）在一年中的部分时间低于扩张阈值，表明下游市场条件的复苏仍然受到限制。下载：下载高分辨率图片（419KB）下载：下载全尺寸图片图6. 2023年每月汇总的情绪趋势。自2023年8月底以来，房地产领域的政策放松带动了与住房相关的市场指标逐渐回升，这可能有助于当年后期情绪强度的适度改善。然而，整体情绪变化相对温和，表明市场信心的根本驱动力仍然较弱。总体而言，2023年的情绪趋势反映了市场预期的有限复苏，而非强劲或持续的反弹。

在本节中，应用了情绪组成方法（包括基本模式、累积模式和否定模式）来分析新闻报道和专家评论文本中量化情绪的时间演变。观察到的情绪序列在不同时期表现出明显的波动，表明市场对工程类专用车辆的预期对外部经济环境的变化非常敏感。这些时间模式提供了一个可解释的情绪信号层，可以作为与制造业相关的规划的辅助背景信息。为了避免仅依赖视觉解释，第5.3节进一步讨论了汇总情绪序列在工程类专用车辆相关下游市场背景下的实际相关性。

5.3. 情绪信号在下游市场背景下的实际相关性
为了补充对情绪时间趋势的视觉解释，本研究进一步讨论了汇总情绪序列在与工程类专用车辆相关的下游市场背景下的实际相关性。由于公司层面的运营记录（如库存周转率和生产前置时间）无法公开获取，因此在本研究中无法直接与制造绩效指标进行验证。相反，考虑使用下游房地产活动指标作为解释与工程类专用车辆相关的更广泛市场状况的外部参考变量。这一选择是基于工程类专用车辆与建筑相关活动（包括项目启动、基础设施开发和现场运营）之间的密切关系。从这个意义上说，房地产开发投资和新启动的建筑面积的变化为理解从文本数据中提取的情绪波动是否与下游市场状况大体一致提供了间接参考信息。然而，由于这些指标是外部需求侧的代理指标，而非公司层面制造绩效的直接衡量标准，本研究并不将它们视为运营验证的等效替代品。因此，应对汇总情绪序列的作用持谨慎和支持的态度来看待。所提出的框架提取的情绪信号旨在为不确定性下的规划相关决策支持提供辅助背景信息，而不是作为独立的预测机制。

未来的研究应在这些初步证据的基础上，结合直接的公司层面制造指标，并进行更系统的相关性分析、基于滞后的分析或预测分析，以进一步评估文本衍生情绪信号在智能制造环境中的实际效用。

6. 结论
本研究开发了一个LBBC融合框架，用于市场情绪分析，以支持智能制造决策。利用与专用车辆相关的多源文本数据，该框架在情绪分类任务中表现优于几种基线和混合模型。此外，引入了一种基于规则的情绪组成方法来量化汇总情绪信号的时间演变。所得情绪序列表现出阶段依赖的波动，并提供了市场预期变化的可解释表示。该框架旨在作为一种决策支持工具，在不确定性下为与制造相关的决策提供辅助情绪信号，而不是直接预测定量市场需求。为了进一步考虑其实际相关性，讨论了汇总情绪序列与下游市场活动指标（包括房地产开发投资和新启动的建筑面积）之间的关系。这些外部指标为解释与工程类专用车辆相关的更广泛市场环境提供了间接参考信息，尽管它们不构成直接的公司层面制造验证，也不应被解释为因果关系的证据。

尽管有这些贡献，本研究仍存在一些局限性。首先，文本语料库受到来源选择偏差的影响，并依赖于在特定市场条件下收集的历史文本数据。其次，情绪量化方法采用了可解释的基于规则的加权方案，虽然对当前分析有效，但可以通过更多数据驱动的校准策略进行改进。第三，下游的定量分析基于外部市场代理指标，而非直接的公司层面制造绩效指标。因此，未来的研究应强调实时行业验证、更广泛的跨领域适用性评估以及更大规模的多语言数据集的整合，以进一步提高所提出框架的稳健性、通用性和实际应用性。

CRediT作者贡献声明
张恩明：概念化、方法论、形式分析、软件开发、数据管理、验证、可视化、项目管理、监督、资金获取、初稿撰写、审阅与编辑。
张婵娟：调查、数据管理、资源获取、方法论、验证、可视化、审阅与编辑。
陈叶叶：调查、资源获取、数据管理、软件开发、验证、审阅与编辑。

热点排行