
-
生物通官微
陪你抓住生命科技
跳动的脉搏
在知识获取中运用多标签上下文运算符进行推理以建立泛化能力:一种多模态学习方法
《Journal of Geovisualization and Spatial Analysis》:Multi-label Contextual Operator Inference in Knowledge Acquisition for Building Generalization: A Multi-modal Learning Approach
【字体: 大 中 小 】 时间:2026年04月02日 来源:Journal of Geovisualization and Spatial Analysis 6.8
编辑推荐:
如何通过深度学习实现地图概括中的知识获取,提出多模态学习框架融合栅格与矢量数据,在瑞士1:25,000转1:50,000地图生产中验证,模型在除典型化外的操作符推断F1>0.80,多模态方法在多操作符组合时优于单模态。
在传统的地图概括过程中,知识获取指的是将各个概括操作符形式化,并将多个操作符链接成一个整体流程。这是实现地图概括自动化的关键步骤。迄今为止,包括高级深度学习(DL)在内的机器学习技术已被广泛用于实现单个操作符或端到端解决方案,从而减少甚至绕过了从专家制图师那里获取概括知识所需的大量工作。以地形图中建筑物的概括为例,我们关注的是相反的过程,即如何在基于深度学习的地图概括中执行制图知识获取,这一任务迄今为止尚未得到足够的重视。特别是,我们研究了“过程识别与建模”,并提出了一个决策机制,用于判断是否应对特定建筑物应用多个上下文概括操作符(包括“放大”、“聚合”、“类型化”和“位移”),这被视为一项“多标签上下文操作符推理”任务。我们没有使用栅格地图或矢量地图来学习地图概括,而是提出了一种“多模态”学习方法,以探索整合这两种地图数据格式的能力。我们使用瑞士的国家多尺度地图生产数据对这种方法进行了评估,评估对象是从1:25,000比例尺到1:50,000比例尺的地图转换。结果显示,训练有素的深度学习模型在操作符推理方面的F1分数均超过了0.80(“类型化”除外),这表明深度学习方法在获取建筑物概括过程知识方面具有很大的潜力。此外,通过更细致地评估不同操作符组合的表现,我们发现多模态方法在涉及多个操作符的过程识别与建模方面明显优于单模态学习方法。
在传统的地图概括过程中,知识获取指的是将各个概括操作符形式化,并将多个操作符链接成一个整体流程。这是实现地图概括自动化的关键步骤。迄今为止,包括高级深度学习(DL)在内的机器学习技术已被广泛用于实现单个操作符或端到端解决方案,从而减少甚至绕过了从专家制图师那里获取概括知识所需的大量工作。以地形图中建筑物的概括为例,我们关注的是相反的过程,即如何在基于深度学习的地图概括中执行制图知识获取,这一任务迄今为止尚未得到足够的重视。特别是,我们研究了“过程识别与建模”,并提出了一个决策机制,用于判断是否应对特定建筑物应用多个上下文概括操作符(包括“放大”、“聚合”、“类型化”和“位移”),这被视为一项“多标签上下文操作符推理”任务。我们没有使用栅格地图或矢量地图来学习地图概括,而是提出了一种“多模态”学习方法,以探索整合这两种地图数据格式的能力。我们使用瑞士的国家多尺度地图生产数据对这种方法进行了评估,评估对象是从1:25,000比例尺到1:50,000比例尺的地图转换。结果显示,训练有素的深度学习模型在操作符推理方面的F1分数均超过了0.80(“类型化”除外),这表明深度学习方法在获取建筑物概括过程知识方面具有很大的潜力。此外,通过更细致地评估不同操作符组合的表现,我们发现多模态方法在涉及多个操作符的过程识别与建模方面明显优于单模态学习方法。