用于地图注释中点特征标签放置的渐进式强化学习
曹文(Wen Cao)、
张寅宝(Yinbao Zhang)、
李润生(Runsheng Li)、
任立秋(Liqiu Ren)和
陈赫(He Chen)
《ISPRS International Journal of Geo-Information》:Progressive Reinforcement Learning for Point-Feature Label Placement in Map Annotation
Wen Cao,
Yinbao Zhang,
Runsheng Li,
Liqiu Ren and
He Chen
【字体:
大
中
小
】
时间:2026年04月12日
来源:ISPRS International Journal of Geo-Information 2.8
编辑推荐:
摘要
(1) 背景:曲线数据压缩在高效存储、传输和多尺度可视化矢量空间数据方面发挥着关键作用,尤其是在处理复杂的地理边界时。在保持几何精度的同时实现高压缩效率仍然是一项具有挑战性的任务。
(2) 方法:本研究提出了一种基于卷积自编码器的矢量曲线压缩框架。首先对曲线数据进行分割和重
摘要
(1) 背景:曲线数据压缩在高效存储、传输和多尺度可视化矢量空间数据方面发挥着关键作用,尤其是在处理复杂的地理边界时。在保持几何精度的同时实现高压缩效率仍然是一项具有挑战性的任务。
(2) 方法:本研究提出了一种基于卷积自编码器的矢量曲线压缩框架。首先对曲线数据进行分割和重采样以统一网络输入,然后通过卷积层将坐标差序列编码为低维潜在向量,并通过对称解码器进行重构。
(3) 结果:在全局岛屿边界数据集上进行的实验表明,所提出的方法能够有效减少数据量并保持稳定的重构精度。具体来说,与经典的Douglas–Peucker(DP)算法、傅里叶级数(FS)方法和全连接自编码器(FCAs)相比,一维卷积自编码器(1D CAE)在高压缩比下表现出更优越且更稳健的重构性能。它实现了最低的位置偏差(PD = 42.41)和最高的空间保真度(IoU = 0.9991,相对面积误差仅为0.0067%),同时保持了较高的计算效率(57.32秒)。敏感性分析表明,1 × 7的卷积核大小和25公里的段长度在表示能力和模型稳定性之间取得了最佳平衡。
(4) 结论:所提出的方法能够实现高效的矢量曲线压缩和可靠的海岸线重构,特别适用于比例尺达到1:250 K的小型和中型地图应用。
1. 引言
矢量空间数据是地理信息系统(GIS)的基本组成部分,通常由点、线和多边形特征表示。从几何角度来看,线和多边形特征都可以表示为有序的坐标序列,其中多边形本质上形成封闭曲线。线和多边形数据共同构成了空间数据集的很大一部分,通常具有高顶点密度和复杂的几何结构。随着大规模地理数据库的不断增长,在有限的存储容量和网络带宽限制下,矢量线数据的存储、管理和传输变得越来越具有挑战性。因此,在保持基本几何特征的同时高效压缩矢量曲线数据已成为地理信息科学中的一个关键问题。传统上,矢量数据量的减少与多尺度地图表示密切相关。在地图制作中,同一地理特征必须根据地图比例尺以不同的细节级别进行表示,在从大比例尺转换为小比例尺表示时通常会应用几何简化。Douglas–Peucker(DP)算法是一种经典方法,它通过迭代移除与连接起点和终点的基线垂直距离低于预定义阈值的顶点,并因其简单性和有效性而被广泛使用[1]。许多研究进一步探讨和扩展了DP算法。Yang等人提出了一种递归实现方法,并引入了径向距离作为补充约束来控制面积误差,同时保持曲线平滑度[2]。他们还指出,经典DP算法中缺乏拓扑约束可能导致自相交,而阈值选择的不确定性会显著影响简化结果。随后,Li等人通过保留折线几何中的关键弯曲点来细化阈值搜索范围并提高简化性能[3]。Yu等人通过选择自然海岸线的凸顶点作为候选顶点,并使用角度和距离标准来确定分割顶点,从而提高了基于DP的简化效果,同时提高了压缩比和曲线精度[4]。除了基于DP的方法外,还提出了其他策略来实现数据减少。结合遗传算法和局部搜索策略的混合方法已被开发出来,以平衡形状保持和压缩效率[5]。然而,这些方法中使用固定编码长度可能会导致在处理密集曲线时增加存储和计算成本。基于重采样的技术是另一类方法,通过引入位于原始几何结构上或附近的新的顶点来压缩曲线。例如,Li–Openshaw算法通过在不同观察距离下保留细节来模拟人类视觉感知,而在较小尺度上仅保留宏观形状[6]。函数拟合方法通过用紧凑的参数形式表示线特征提供了不同的视角。基于傅里叶级数的方法[7,8,9,10]和小波拟合技术[11,12]在多个尺度上分解曲线几何结构,保留主要结构信息同时丢弃次要细节。尽管这些传统方法对于尺度依赖的表示是有效的,但它们主要是为地图概括设计的,其中数据减少服务于可视化和地图可读性目的。在这些方法中,压缩比通常是通过与尺度相关的阈值或感知标准间接确定的,而不是为了存储效率而明确优化的。此外,这些方法大多数本质上是丢失性的且不可逆的,使得从压缩表示中准确重构原始几何特征变得困难。这些限制限制了它们在以存储为导向的压缩场景中的适用性,在这些场景中,紧凑编码和忠实的几何恢复对于数据归档、传输和在GIS数据库中的重用同样重要。随着深度学习的快速发展,数据驱动的方法在空间数据处理中引起了越来越多的关注,并为直接从数据中学习几何表示提供了新的可能性。基于神经网络的方法已被应用于折线简化和几何特征提取,证明了基于学习的策略在曲线处理中的可行性[13]。卷积神经网络已被用于识别栅格化后的曲线特征,生成候选区域并移除冗余段[14]。其他研究探索了用于矢量数据压缩和重构的监督学习和无监督学习框架。编码器–解码器架构已被用于栅格化道路的集成[15],而生成对抗网络已被应用于从栅格图像中重构简化的矢量道路[16]。基于自编码器的模型进一步被研究用于多级曲线简化和顶点池化,实现了折线和建筑物轮廓的有效简化[17,18]。全连接自编码器已被应用于曲线数据压缩和重构,证实了神经网络捕捉形态特征以实现高效数据减少的能力[19]。虽然早期的深度学习方法为空间数据处理奠定了坚实的基础,但过去几年见证了向更复杂架构的重大转变,特别是图神经网络(GNNs)和Transformer[20]。Transformer凭借其强大的自注意力机制,越来越多地被用于直接从矢量线和多边形中提取全局几何特征[21]。此外,混合架构(如Conv-Transformers)已被提出,成功结合了局部卷积操作和全局上下文建模,用于矢量多边形分析和变化检测[22]。同时,GNNs在处理非欧几里得空间数据方面表现出卓越的能力,明确捕获了多尺度矢量空间线之间的复杂拓扑关系和匹配模式[23]。然而,尽管GNNs和Transformer具有强大的全局语义提取能力,但这些架构往往引入了大量的计算开销和结构复杂性。对于压缩岛屿边界矢量数据这一特定任务——该数据本质上由连续的、顺序排列的坐标点组成——主要目标是最小化直接位置偏差(PD)并保持高保真的宏观几何形状。在这种情况下,目标卷积自编码器(CAE)仍然具有显著优势。通过利用一维卷积,所提出的CAE有效地利用了边界曲线的固有线性序列和局部空间相关性。这种方法实现了精确的序列到序列重构和最佳压缩保真度,而不会带来完整图构建或全注意力建模相关的冗余复杂性。
本研究提出了一种基于1D CNN的有损压缩框架,专门针对矢量曲线数据。这项工作的一个关键贡献是明确证明了1D卷积架构在捕获压缩所需的基本几何结构方面比全连接自编码器(FCAs)和基于傅里叶的方法更有效,因为它能够高效捕获空间局部化的几何特征。虽然使用岛屿边界作为代表性案例进行了验证,但该框架本质上也适用于其他2D矢量多边形,如等高线和水文网络,它们具有类似的顺序特征。虽然傅里叶方法优先考虑全局轮廓,全连接自编码器缺乏空间局部性机制,但我们的架构利用1D卷积层高效学习空间局部化的几何特征,从而实现更紧凑的潜在表示和更高的重构精度。我们使用岛屿边界数据作为多边形的代表性案例来验证这一框架。实验结果证实,通过保持关键几何指标(如位置偏差(PD)、相对面积误差(RAE)和相对周长误差(RPE),所提出的方法实现了卓越的压缩性能,为GIS中的以存储为导向的矢量数据管理提供了稳健且高效的解决方案。
2. 模型和方法
为了实现具有受控几何失真的矢量曲线数据的存储导向压缩,本研究将矢量曲线压缩重新定义为在明确容量约束下的表示学习问题,而不是尺度驱动的几何简化任务。从理论角度来看,矢量曲线压缩的核心目标是构建一个紧凑的参数表示,该表示在最小化存储成本的同时保留必要的几何信息,并受到有界重构误差的限制。在这种意义上,压缩可以解释为一个平衡表示紧凑性和几何保真度的优化问题。矢量曲线本质上是有序的一维几何信号,其信息内容由局部几何变化和全局结构属性共同决定。传统的地图概括和基于规则的简化方法通过应用显式的几何启发式或尺度依赖的阈值来减少数据大小,这隐含地决定了压缩结果,并对存储效率和重构精度之间的权衡提供了有限的控制。相比之下,表示学习视角使得可以通过限制学习到的潜在空间的容量并以数据驱动的方式最小化重构失真来明确优化这种权衡。在这种表述中,矢量曲线压缩自然地被转化为编码–解码范式,其中编码器学习一个紧凑的潜在表示,该表示捕获了曲线的内在几何结构,解码器从这个表示中重构曲线。潜在空间的维度和信息容量直接对应于可实现的压缩比,从而为以存储为导向的压缩提供了一个明确且可解释的机制。基于矢量曲线的几何特性,采用了分层表示策略。通过对曲线应用卷积操作来建模局部几何连续性和细尺度变化,以统一曲线序列,而全连接层则捕获全局形状信息和长距离依赖性,执行整体聚合和紧凑编码。通过直接操作矢量表示而不进行栅格化,所提出的框架保持了几何精度,特别适合高保真度压缩复杂的地理曲线。
2.1. 问题表述和曲线表示
GIS中的矢量曲线数据通常表示为描述线性或边界特征的二维坐标的有序序列。给定一个矢量曲线C = {(x1,y1),(x2,y2)…,(xn,yn)},其中顶点沿曲线顺序排列,矢量曲线压缩的目标是在保持其基本几何特性的同时减少存储和传输C所需的数据量。在以存储为导向的压缩场景中,目标与尺度驱动的地图概括有根本不同。与基于感知或尺度依赖的阈值选择性地移除顶点不同,以存储为导向的压缩旨在将原始曲线编码为紧凑的表示z,以便在受控的几何失真下可以从z中忠实恢复重构曲线?????C。这个过程可以表述为一个编码–解码问题,其中编码函数f?( ?)将原始曲线C映射到潜在表示z = f?(C),解码函数g?( ?)将曲线重构为?????C =g?(??)。基于学习的矢量曲线压缩的一个关键挑战在于矢量曲线的长度可变性和非均匀采样。地理曲线通常表现出不规则的顶点间距和高度可变的几何复杂性,这使得直接应用需要固定长度输入的神经网络模型变得困难。为了解决这个问题,所提出的框架通过分割和重采样采用了统一的曲线表示。具体来说,在矢量数据的背景下,这种点级重采样使用等距插值方法将固定数量的坐标顶点均匀分布在每个曲线段的几何路径上。这个过程将由任意数量点组成的曲线转换为神经网络输入所需的统一、固定维度的矢量表示,同时严格保持它们的原始几何连续性和空间特性。这使得能够学习具有不同形状、点密度和长度的曲线的紧凑编码。
为了增强几何结构的建模,矢量曲线使用坐标差而不是绝对坐标来表示。具体来说,该曲线表示为连续顶点之间的增量位移序列,这强调了局部几何变化,并减少了对绝对位置的敏感性。这种表示方式有助于学习平移不变的几何模式,并通过从解码的位移序列中累积恢复顶点位置来支持高效重建。基于这种公式,向量曲线压缩被视为一个表示学习问题,其中编码器学习一个紧凑的潜在表示,该表示同时捕捉了局部几何细节和全局曲线结构。通过使用第3.3节中定义的几何误差度量来比较原始曲线C和重建曲线??????C来评估重建质量。这种公式为以下章节中描述的基于卷积自编码器的压缩框架提供了统一的基础。
2.2. 数据预处理
向量空间线数据通常表示为有序的笛卡尔坐标序列,表示为{(x1,y1),(x2,y2)……},其中每个点记录了其在曲线上的空间位置。虽然绝对坐标描述了位置信息,但曲线的几何特征(如方向变化和局部形状变化)通过相邻顶点之间的差异来更有效地捕捉。因此,本研究使用坐标增量来表示曲线几何,即连续顶点之间的笛卡尔坐标的增量变化。具体来说,对于每个曲线段,计算相邻顶点之间的坐标差异(d?xi,d?yi)。通过记录第一个点的绝对坐标并累积求和坐标增量,可以完全重建原始曲线几何。这种表示方式强调了局部几何变化,同时减少了对绝对位置的敏感性,使其非常适合基于学习的压缩。基于这一原则,坐标增量被用作特征向量并输入到卷积自编码器模型中进行训练。神经网络模型通常需要固定长度和一致结构的输入。然而,岛屿边界数据在曲线长度、形状复杂性和点分布方面表现出很大的变异性。为了解决这些挑战并确保数据一致性,应用了一个包括曲线分割、曲线重采样和数据标准化的预处理流程,如下所述。从表示学习的角度来看,这种差分编码将向量曲线转换为局部结构化的几何信号,使模型能够关注内在的形状特征而不是绝对空间位置。这种公式为后续的层次化特征学习建立了几何基础,在此过程中,首先对局部变化进行建模,然后将其整合到更高层次的表示中。
2.2.1. 曲线分割
在几何表示学习的背景下,分割不仅是一种输入统一的方式,也是一种控制学习局部几何模式的空间范围的机制。通过将长而异构的曲线分解为长度相当的部分,鼓励模型在有限的范围内捕捉一致的局部几何变化,从而促进稳定的卷积特征提取。岛屿边界曲线的总长度变化很大,部分长度的过度变化会导致几何复杂性的巨大差异,从而增加神经网络训练的难度。为了减少这种影响,每个总长度为??的边界曲线被划分为多个目标长度为??的子段。一般来说,如果?? >??,则曲线最初被划分为k =[L/l]个长度为??的子段,剩余部分长度为?? =?? ????? ?????。在本研究中,向量曲线表示为由直线段连接的有序顶点组成的多段线,这是大多数GIS向量线数据集的统一格式。因此,曲线长度计算为连续顶点之间的累积欧几里得距离。由于最后一个子段可能不符合目标长度,因此考虑了两种情况来处理剩余部分:如果?? <23???,则剩余部分足够短,与第k个段合并。在这种情况下,第k个段的调整后的长度变为???? =?? +??。如果?? ≥23???,则剩余部分作为额外的段保留,表示为第(k +1)个段,其长度为????+1 =??。这种分割策略确保了段长度相对一致,同时避免了过短的段,从而保留了原始边界曲线的几何特征。尽管固定长度的分割可能会削弱对整个边界曲线长距离依赖性和全局轮廓连续性的显式建模,但在所提出的框架中,这种限制在后续的表示阶段得到了缓解,其中通过全局编码层聚合段级特征来重建整体曲线结构。关于分割策略,需要注意的是,选择的段长度(以及随后等距重采样到固定数量的顶点)被设计为尺度不变的。分割大小不是基于绝对地理距离确定的——后者会高度依赖于原始数据的未知地图比例尺——而是根据捕捉足够的局部几何上下文的必要性来确定的。具体来说,段长度被校准以匹配CAE的感受野,确保每个输入张量包含有意义的地形变化,同时避免过度的结构复杂性。这使得网络能够有效地学习纯形状特征和局部曲率,而不受绝对空间尺度的影响。
2.2.2. 曲线重采样
分割后,各个曲线段在包含的顶点数量上可能仍然存在差异。由于神经网络需要统一大小的输入,因此应用重采样来统一各段之间的点分布。此外,段内不均匀的顶点间距可能会对模型训练产生不利影响。重采样将不规则采样的向量曲线转换为均匀参数化的几何信号。通过强制使用一致的采样方案,模型被引导基于内在的曲线几何而不是由不均匀顶点分布引入的伪影来学习形状特征。对于长度为????的曲线段,该段被重采样为??个等间隔,采样距离为????/??,产生?? +1个均匀分布的顶点。然后计算连续重采样顶点之间的坐标差异,得到一系列??个增量向量(d?xi,d?yi),其中?? =1,2,…,??。这个过程产生了一个固定长度的表示,保留了每个段的整体几何结构,同时提供了适合卷积特征提取的一致参数化。分割和重采样过程如图1所示。
2.2.3. 数据标准化
除了在训练期间提高数值稳定性外,标准化在减少尺度相关偏差和增强模型学习几何驱动模式的能力方面也起着重要作用,而不是依赖于幅度的变化。为了提高神经网络训练的效率和稳定性,在模型输入之前对坐标增量特征进行标准化。具体来说,使用最小-最大标准化将坐标差异缩放到[0, 1]的范围,如方程(1)所示:
△????=??????????????????????????????????????????
△????=??????????????????????????????????????????
其中???????????和???????????表示段内x坐标增量的最小值和最大值,???????????和???????????表示y坐标增量的相应值。通过确保曲线段之间特征缩放的一致性,标准化促进了更平衡的表示学习,并提高了不同段之间几何模式的可比性。
2.3. 基于卷积自编码器的压缩模型
2.3.1. 卷积自编码器
对于表示为有序一维几何序列的向量曲线数据,有效的压缩需要建模局部几何变化及其沿曲线的空间连续性。卷积神经网络[24]提供了一种通过共享权重过滤在有界邻域内捕获此类局部几何模式的自然机制。CNN的一般计算模型如方程(2)所示。在坐标差序列的背景下,卷积作为一个局部几何滤波器,它在滑动窗口内聚合方向和幅度变化,使网络能够学习与曲率、平滑度和方向连续性相关的模式。
??=??(??????+??) (2)
其中??表示输入,??表示卷积核,??表示偏置,h?( ?)表示激活函数,??表示输出。符号?表示卷积操作。通过适当的步长进行连续的卷积层处理,编码器逐步将局部几何信息聚合成更紧凑的表示,有效地减少了表示维度,同时保留了显著的几何结构。自编码器提供了一个无监督的学习框架,用于降维和数据重建,并已在表示学习[25]中得到广泛应用。自编码器由两个主要部分组成:编码器和解码器。编码器将高维输入数据(在我们的工作中表示为坐标差序列)映射到一个紧凑的潜在表示z,而解码器从z重构输入数据。在本研究的背景下,输入特别表示为高维的坐标差序列。通过最小化输入和输出之间的重建误差,自编码器学习了一个保留原始曲线基本几何特征的低维表示。在这种公式中,重建误差可以解释为几何失真的度量,使得压缩过程可以在明确的保真度约束下进行优化。卷积自编码器(CAE)通过在编码器中使用卷积层来利用坐标差序列中的局部空间依赖性,并在解码器中使用转置卷积层来恢复原始分辨率,从而扩展了这一框架。与纯全连接自编码器相比,CAE需要更少的参数,并且在保持沿曲线的局部几何结构方面更有效。然而,仅靠卷积层不足以将全局维度降低到紧凑的潜在向量。因此,在卷积编码器和解码器之间引入了全连接(FC)层来弥合这一差距。具体来说,编码器应用一维卷积层从输入(d?x,d?y)序列中提取局部几何特征。然后得到的特征图被展平并通过一个或多个全连接层,这些层执行全局特征聚合和维度压缩,产生潜在向量z。这种基于FC的瓶颈明确控制了潜在空间的维度,并作为曲线压缩的核心机制。在解码器中,一组对称的全连接层首先将z扩展回高维特征表示,然后重新塑形并输入到转置卷积层中以重构坐标差序列(d?????x,d?????y)。所提出的卷积自编码器的整体架构如图2所示。首先从原始曲线计算坐标差(d?x,d?y)作为网络输入。卷积层提取局部特征,然后全连接层将表示压缩为低维潜在向量z。解码器通过使用全连接层恢复全局结构,并使用转置卷积恢复局部细节,产生与输入具有相同维度的重建差分(d?????x,d?????y)。最后,通过累积求和重建的差分来恢复原始曲线坐标。如果(d?????x,d?????y)和(d?x,d?y)之间的差异在可接受的阈值范围内,潜在向量z可以被视为原始曲线段的有效压缩表示。
2.3.2. 使用卷积自编码器的数据压缩
卷积神经网络(CNN)在捕获局部结构模式的同时保持参数效率方面特别有效,因此非常适合建模序列几何数据。根据输入的维度,卷积操作可以以不同的形式实现。在本研究中,训练样本由来自分割和重采样曲线的有序坐标增量序列组成,这些序列自然对应于一维信号。因此,采用了一维卷积自编码器(CAE)来执行向量曲线压缩。基于CAE的压缩中的一个关键挑战在于仅使用卷积层来控制潜在表示的维度。为了明确调节压缩比,在编码器的最后一个卷积层之后引入了一个全连接层,将高维特征图映射到一个紧凑的潜在向量。为了保持架构对称性,在解码器的开始处放置了一个相应的全连接层。所提出模型的整体架构如图3所示。编码器由两个一维卷积层和一个全连接层组成,而解码器则采用相同的结构,包括一个全连接层和两个转置卷积层。编码器输出一个低维的潜在向量,作为曲线段的压缩表示,解码器则从这个潜在编码中重构坐标增量序列。由于输入特征被规范化到[0, 1]的范围,因此在所有隐藏层中使用了修正线性单元(ReLU)激活函数。重构精度通过均方根误差(RMSE)来衡量,该误差在训练过程中被用作损失函数。所提出的CAE可以处理从坐标序列派生的通用曲线表示,并且不依赖于特定地理对象的语义属性,因此适用于广泛的矢量线数据。图3. 基于卷积自编码器的岛屿边界线数据压缩模型。为了确保卷积感受野之间的充分重叠同时保持特征连续性,卷积层和转置卷积层的步长都被设置为核大小的一半。实验表明,1 × 7的卷积核大小能够获得最佳性能(第5.1节),而25公里的段长度则在几何一致性和压缩效率之间提供了最佳的折中(第5.2节)。第一个卷积层包含16个通道,第二个卷积层包含32个通道,解码器采用对称配置。输入特征向量的长度固定为200,它被压缩成一个维度为n的潜在向量,n可以调整以实现不同的压缩比。训练完成后,曲线数据集的压缩表示包括四个部分:(1)编码器产生的潜在向量,(2)每个曲线段的起始坐标,(3)用于逆变换的四个规范化参数dxmin、dxmax、dymin、dymax,以及(4)训练好的模型参数(权重和偏置)。模型参数在所有曲线段之间是共享的,因此只需存储一次。尽管它们形式上属于压缩数据集,但当段数足够多时,它们对总体存储成本的贡献可以忽略不计。在实际实验中,模型大小从几十字节到几百字节不等,与原始矢量数据的大小相比微不足道。压缩比(CR)定义为压缩数据大小与原始曲线数据大小之比,如公式(3)所示:\[ \mathcal{C}_R = \frac{2\mathcal{M}(\mathcal{N} + 6)}{\mathcal{N}} \],其中\(\mathcal{C}_R\)表示压缩比,\(\mathcal{M}\)是曲线段的数量,\(\mathcal{N}\)是每个段采样顶点的平均数量,分母中的常数6代表存储每个段的起始坐标(2个值)和规范化元数据(4个值)的开销,\(\mathcal{W}\)代表模型参数的总数。当\(M\)足够大时,\(W\)的影响可以忽略,从而得到公式(3)第二部分中的简化表达式。
2.3.3. 岛屿边界数据的恢复
曲线重构首先通过逆转预处理过程中应用的规范化来恢复坐标增量到它们的原始数值范围。逆规范化在公式(4)中定义:\[ \mathbf{d}_{\text{x}}_{\text{i}} = \left( \Delta\mathbf{x}_{\text{i}} + \Delta\mathbf{x}_{\text{m}}\mathbf{i}}\Delta\mathbf{x}_{\text{m}}\mathbf{a}\mathbf{x} - \Delta\mathbf{x}_{\text{m}}\mathbf{i}}\Delta\mathbf{x}_{\text{n}} \), \(\mathbf{d}_{\text{y}}_{\text{i}} = \left( \Delta\mathbf{y}_{\text{i}} + \Delta\mathbf{y}_{\text{m}}\mathbf{i}}\Delta\mathbf{y}_{\text{m}}\mathbf{a}\mathbf{x} - \Delta\mathbf{y}_{\text{m}}\mathbf{i}}\Delta\mathbf{y}_{\text{n}} \],其中\(\Delta\mathbf{x}_{\text{m}}\mathbf{i}}\)和\(\Delta\mathbf{x}_{\text{m}}\mathbf{a}\mathbf{x}\)表示曲线段内的最小和最大规范化x坐标增量,\(\Delta\mathbf{y}_{\text{m}}\mathbf{i}}\)和\(\Delta\mathbf{y}_{\text{m}}\mathbf{a}\mathbf{x}\)表示相应的y坐标增量。
由于在编码和解码过程中引入了重构误差,重构段的累积端点可能不会与原始曲线完全重合,导致边界不闭合。这个问题对于必须满足严格几何闭合约束的岛屿边界尤为重要。为了解决这个问题,应用了一种闭合误差校正程序。设\(d_{\text{x}}_{\text{i}}, d_{\text{y}}_{\text{i}}\)表示原始坐标增量,\(d_{\text{i}}_{\text{?}}_{\text{i}}, d_{\text{y}}_{\text{i}}_{\text{?}}_{\text{i}}\)表示重构后的增量。x和y方向的累积闭合误差分别计算为:\(f_x = \sum_{i=1}^{N}(d_{\text{x}}_{\text{i}} - d_{\text{i}}_{\text{?}}_{\text{i}})\),\(f_y = \sum_{i=1}^{N}(d_{\text{y}}_{\text{i}} - d_{\text{i}}_{\text{?}}_{\text{i}})\)。为了强制闭合,这些累积误差被均匀分配到所有增量上,得到校正项:\(v_x = -\frac{f_x}{N}\),\(v_y = -\frac{f_y}{N}\)。然后得到校正后的增量:\(d_{\text{i}}_{\text{?}} = d_{\text{i}}_{\text{?}}_{\text{i}} + v_x\),\(d_{\text{y}}_{\text{?}} = d_{\text{i}}_{\text{?}}_{\text{i}} + v_y\)。最后,校正后的坐标增量按相应的段长度\(l_i\)进行缩放,并从存储的段起始坐标开始顺序重构每个点的绝对坐标。
数据预处理、基于卷积自编码器的压缩以及几何恢复共同构成了一个完整的压缩-解压缩框架。在这个框架中,编码器作为一个压缩模块,将长的坐标序列转换为紧凑的潜在向量,这些潜在向量可以作为独立的压缩文件存储。解码器作为一个解压缩模块,从这些编码中重构矢量空间数据。尽管编码器和解码器是联合训练的,但在实际应用中可以独立部署,从而实现岛屿边界数据的高效存储和需要时的可靠重构。
3. 实验设置
3.1. 数据来源和预处理
为了评估所提出的框架,选择了Petal Maps [26]中的岛屿边界作为主要数据集。这些边界的特征是不规则形状、高顶点密度和闭合结构,使它们成为矢量曲线压缩的代表性测试平台。数据集统计:数据集包括98个全球岛屿,累积边界长度为402.78公里(图4)。图4. 岛屿边界线数据。(左上角的定位图显示了它们的全球分布。有些岛屿没有列出。)预处理:按照第2.2节中的程序,原始矢量线被分割、重采样和规范化。这产生了16,123个曲线段,每个段由长度为200的坐标增量特征向量表示。
3.2. 实现和训练设置
卷积自编码器(CAE)是使用PyTorch(版本2.7.1)[27]框架实现的。所有模型都在配备了Intel Core i7-10700 CPU(2.90 GHz)和NVIDIA GeForce GTX 1650 GPU的本地工作站上进行了训练和评估。需要注意的是,在分组数据时,类似岛屿的边界首先被分解成几个段,然后随机分配到训练集(70%)和测试集(30%)中。这种基于段的采样确保了来自同一原始岛屿结构的片段分布在两个数据集中,从而使模型能够在完整的局部几何模式集合上进行训练和评估。
3.3. 评估指标
数据压缩不可避免地会在空间数据中引入几何失真。在这项研究中,使用原始曲线顶点与重构曲线顶点之间的平均位置偏差(PD)来评估重构精度,这直接量化了由压缩-解压缩过程引起的空间位移。较大的偏差值表示较大的几何失真,而较小的值对应于更高的重构保真度。平均位置偏差定义为原始曲线和重构曲线上对应顶点之间的平均欧几里得距离,如公式(5)所示;它既是主要的训练目标,也是核心的精度指标:\[ \mathcal{R}_D = \sum_{i=1}^{N}\sqrt{(x_{\text{i}}_{\text{i}} - \bar{x}_{\text{i}})^2 + (y_{\text{i}}_{\text{i}} - \bar{y}_{\text{i}})^2} \],其中\(\mathcal{R}_D\)表示平均位置偏差误差,\(N\)是顶点的总数,\(x_{\text{i}}_{\text{i}}, y_{\text{i}}_{\text{i}}\)表示原始顶点的坐标,\(\bar{x}_{\text{i}}, \bar{y}_{\text{i}}\)表示重构后的坐标。
除了主要的PD指标外,我们还引入了一个多方面的评估框架,从不同的几何角度全面评估重构曲线的质量:
几何误差(RAE, RPE):为了评估曲线整体几何属性的保留情况,我们使用相对面积误差(RAE)和相对周长误差(RPE),如公式(6)所示。需要注意的是,由于单个曲线段无法封闭一个区域,这些指标只有在将重构段合并回完整的闭合岛屿多边形后才能计算:\[ \mathcal{R}_A_{\text{E}} = \sum_{i=1}^{N}\left|A_{\text{i}} - \bar{A}_{\text{i}}\right| \times 100\% \],\[ \mathcal{R}_A_{\text{E}} = \sum_{i=1}^{N}\left|T_{\text{i}} - \bar{T}_{\text{i}}\right| \times 100\% \],其中\(N\)是曲线段的总数;\(A_{\text{i}}\)和\(T_{\text{i}}\)分别表示第i个原始闭合岛屿的原始面积和周长;\(\bar{A}_{\text{i}}\)和\(\bar{T}_{\text{i}}\)表示第i个重构闭合岛屿的面积和周长。
交并比(IoU):为了量化原始曲线和重构曲线之间的空间重叠和位置对齐,使用了IoU指标。通过计算缓冲曲线区域的交集面积与并集面积的比率,IoU提供了一个标准化分数(范围从0到1),表示整体空间保真度,如公式(7)所示。较高的IoU表示更准确的空间一致性:\[ \mathcal{I}_O_{\text{U}} = \sum_{i=1}^{N}(A_{\text{i}}\cap \bar{A}_{\text{i}}) \]。
曲率变化(CC):为了评估形态和语义特征的保留情况,我们定义了曲率变化(CC)指标。它通过量化曲线的“形状特征”的偏差来评估其保真度,如公式(8)和(9)所示。对于由N个顶点组成的离散曲线,设\(p_{\text{i}} = (x_{\text{i}}, y_{\text{i}})\)是第i个顶点。顶点\(p_{\text{i}}\)的离散曲率\(\mu_{\text{i}}\)使用其相邻顶点\(p_{\text{i}} - 1\)和\(p_{\text{i}} + 1\)来近似:\[ \mu_{\text{i}} = 2\left| \mathbf{v}_1 \cdot \mathbf{v}_2 \right| \],其中\(\mathbf{v}_1 = p_{\text{i}} - p_{\text{i}} - 1\)和\(p_{\text{i}} + 1\)分别是\(p_{\text{i}}\)处的进入和离开向量,\(|\mathbf{v}_1 \cdot \mathbf{v}_2|\)表示它们的叉积大小。然后计算原始曲线和重构曲线的曲率序列之间的平均绝对差异作为整体曲率变化指标:\[ \mathcal{C}_C = \sum_{i=1}^{N}\left| \mu_{\text{i}}_{\text{i}} - \bar{\mu}_{\text{i}}_{\text{i}} \],其中\(\mu_{\text{i}}\)和\(\bar{\mu}_{\text{i}}\)分别表示原始曲线和重构曲线在第i个顶点的离散曲率。保持较低的CC对于确保重构曲线在视觉和结构上与原始曲线一致至关重要,特别是对于具有复杂蜿蜒度的地理特征。
在实践中,必须在压缩比和重构精度之间找到适当的平衡。在地图设计和地图可视化中,特征的可区分性受到人类视觉敏锐度和实际制图条件的限制。制图学的技术报告表明,在大约30厘米的典型观看距离下,小于约0.2毫米的地图特征通常难以可靠区分,这个值已被广泛采纳为符号大小和特征间距的经验下限[28]。本研究采用0.2毫米作为地图上的最小可辨识单元,并通过比例映射将其转换为相应的地面距离,以限制曲线数据重构的空间精度。这个阈值代表了基于视觉可区分性的工程尺度限制,而不是测量精度的理论上限,因此更适合确保多尺度空间数据重构过程中的视觉一致性。
3.4. 基线方法
在这项研究中,提出了一种用于压缩岛屿边界矢量数据的卷积自编码器(CAE)。编码器通过将坐标增量序列转换为紧凑的潜在向量来提取几何特征,从而实现有效的数据减少,而解码器在需要时从这些潜在表示中重构原始曲线。为了全面评估所提出的卷积自编码器(CAE)的性能,选择了三种代表性的基线方法进行比较:Douglas–Peucker(DP)算法、基于傅里叶级数的方法和全连接自编码器(FCA)。这些方法代表了传统的几何简化、经典的功能拟合和另一种深度学习架构。为了确保公平和客观的比较,所有基线方法和所提出的CAE都在相同的预处理数据集上,在一致的实验条件下进行了应用。使用第3.3节中定义的多方面评估框架(即PD、RAE、RPE、IoU和CC)定量评估了不同压缩比下的重构精度和几何保真度。
3.4.1. Douglas–Peucker算法
作为矢量空间数据简化的经典基线,Douglas–Peucker(DP)算法因其计算效率和几何保真度之间的平衡而广受认可。DP算法通过递归识别与连接多边形首尾点的线段垂直距离最大的顶点来操作。如果这个最大距离超过预定义的容忍阈值\(\delta\),则保留该点,并在该顶点处分割多边形以重复该过程;否则,所有中间顶点都被丢弃。这种机制有效地保留了岛屿边界的关键形状特征,如突出的海角和海湾,同时消除了冗余的共线点。为了定量评估算法的压缩性能,定义了压缩比(CR)为压缩前后的数据大小之比。在2D折线矢量数据的背景下,每个顶点占用固定的存储空间大小,CR被定义为 ?????=??????????????????????????????????? (10),其中 ???????????????? 表示原始矢量空间数据中的顶点总数,??????????????????? 表示简化输出中保留的顶点数量。较高的 ????? 表示数据量减少了更多。在我们的比较实验中,DP算法的容忍度 ?? 会动态调整,以适应特定的目标CR,确保在不同方法下,在相同的存储限制下公平地比较几何失真。
3.4.2 基于傅里叶级的曲线压缩
岛屿边界线数据通常在空间域中表示为有序的顶点集。傅里叶级数展开提供了一种从空间域到频率域的经典转换方法,它通过将周期函数表示为不同频率的正弦和余弦分量的加权和来实现。在这个框架下,矢量线数据的空间坐标可以解释为沿曲线长度的一维信号,原始曲线几何形状可以通过截断的傅里叶级数来近似,如方程(10)所示。应用傅里叶级数近似的先决条件是目标曲线必须是周期性的。然而,在实际实验中,分割的岛屿边界线是开放曲线,因此是非周期性的。为了满足周期性要求,采用了镜像策略。具体来说,每个分割的弧段都关于其端点进行对称镜像,然后将镜像后的曲线与原始段连接起来,形成一个闭合曲线。这个过程保留了原始段的局部几何特征,同时实现了傅里叶级数的表示。
???(??)≈????02+??∑??=1(????????????????2???????????+????????????????2???????????)???(??)≈????02+??∑??=1(????????????????2???????????+????????????????2???????????)?{ { { { { {? (11)
其中 ??????、??????、?????? 和 ?????? 分别表示x坐标和y坐标的傅里叶系数;?? 表示弧段的周期;?? 表示曲线长度参数;?? 表示保留的傅里叶展开项的数量。随着 ?? →+∞,傅里叶级数理论上可以无损失地重建原始曲线。实际上,较大的 ?? 可以获得更强的压缩效果,但会以牺牲几何保真度为代价。
在基于傅里叶级的曲线压缩方法中,压缩比(C?R)由保留的展开项数 N 控制。较小的 N 对应较低的压缩比,从而实现更高的数据减少程度。假设原始曲线包含 M 个采样顶点,压缩比(C?R)可以如方程(11)所示定义。
?????=2???4???+2≈??2??? (12)
3.4.3 基于全连接自编码器的压缩
与卷积自编码器类似,全连接自编码器(FCA)采用坐标增量序列作为输入,并通过学习输入空间和低维潜在空间之间的非线性映射来执行曲线压缩。在这个模型中,编码器和解码器都是使用多层感知器(MLPs)构建的,相邻层中的所有神经元都是全连接的。由于全连接层的全局连接性,FCAE能够捕捉输入序列的整体结构模式。
神经网络通常组织为多层架构,包括输入层、多个隐藏层和输出层。每个神经元从前一层接收加权输入,应用非线性激活函数,并将转换后的信号向前传播。虽然单个神经元的表示能力有限,但足够深和宽的网络可以近似复杂的非线性函数。在全连接自编码器框架中,编码器通过一系列全连接的隐藏层逐步将坐标增量序列映射到一个紧凑的潜在向量中,解码器则以对称的方式从这个潜在表示中重建原始序列。
与卷积架构相比,全连接自编码器不使用局部感受野或参数共享。因此,它通常涉及更多的可训练参数,并且对于相同维度的输入具有更高的计算成本。此外,由于没有明确建模空间局部性,沿曲线的局部几何连续性可能不如基于卷积的模型得到有效保留。尽管如此,全连接自编码器为评估卷积结构在矢量曲线压缩中的优势提供了一个有意义的基准。为了与卷积自编码器进行公平比较,全连接自编码器的压缩比也按照方程(3)中的方式定义,基于潜在向量相对于输入序列长度的维度。
4. 实验结果
4.1 模型准确性
为了说明模型性能,选择了一个压缩比为3.33的例子。图5显示了在这个压缩比下模型损失和平均点位移的变化。X轴表示训练周期数,每个周期对应于训练数据集的一次完整的前向和后向传播。右侧的Y轴表示模型损失。结果显示,在前20个周期内损失迅速减少,随后围绕一个稳定值波动,表明整体收敛。训练损失和测试损失保持接近,表明模型没有过拟合。左侧的Y轴表示平均点位移,以米为单位,反映了模型在实际应用中的位置精度。与损失曲线类似,平均点位移在前20个周期内急剧减少,然后在20到200个周期之间逐渐下降。
图5. 训练过程中重建损失和平均位置偏差的变化。位置偏差表示重建曲线与原始曲线之间的平均欧几里得距离。
4.2 压缩比的影响
训练后,保存了学习到的模型参数,并用于重建岛屿边界段以评估定量准确性。为了研究压缩比与重建精度之间的关系,潜在特征向量的维度被设置为100、80、60、40和20,分别对应于压缩比2、4、3.33、5和10。这里,压缩比定义为潜在向量长度与原始输入向量长度的比率。对于每个压缩设置,应用解码器来重建压缩特征,并计算平均位置偏差。使用表现最佳的模型参数获得的重建结果总结在表1中。
表1. 不同压缩比下的平均点位移(对应于1:1 M地图比例的距离)。如表1所示,当压缩比设置为2、2.5或3.3时,平均位置偏差保持在大约40–50米的范围内。相比之下,进一步增加压缩级别会导致重建精度明显下降。在压缩比为5时,平均位移增加到62.107米,在压缩比为10时,急剧增加到117.831米。这些结果表明,过度减少潜在特征维度显著削弱了模型保留细粒度几何细节的能力,导致位置失真增加。
为了对重建性能进行定性评估,图6展示了在不同压缩比下1:100,000地图比例下重建的岛屿边界曲线。在压缩比为2时,重建的曲线与原始边界的偏差很小,视觉上可以忽略不计。在压缩比为3.33时,局部偏差变得更加明显,但整体曲线形状与原始曲线仍然视觉上一致。相比之下,在压缩比为10时,可以观察到明显的几何失真,进一步证实了在高压缩级别下重建保真度的下降。这些视觉结果与定量准确性分析一致,展示了压缩效率与几何精度之间的权衡。
4.3 比较结果和讨论
为了评估不同曲线压缩策略的性能,使用第3.1节描述的部分岛屿边界数据集,采用了四种方法进行压缩:提出的卷积自编码器(CAE)、基于傅里叶级数的方法(FS)、全连接自编码器(FCA)和经典的Douglas–Peucker(DP)算法。使用第3.3节定义的平均位置偏差指标,在图7中定量比较了不同压缩比下的重建精度。
图7. 不同压缩比下四种方法的偏移值变化。结果表明,在较低的压缩级别(CR = 2和2.5)下,傅里叶级数方法和DP算法的平均位置偏差略低于卷积自编码器。对于FS方法,这种行为可以归因于低频傅里叶分量的强表示能力,适用于平滑且变化缓慢的曲线;对于DP算法,保留相对较多的原始顶点自然地保持了高保真度的几何轮廓。然而,随着压缩比的增加(CR = 3.33及以上),FS和DP方法的重建精度迅速下降。特别是DP算法,位置偏差呈指数级增加,在CR = 10时达到近400米,使其在严重压缩下成为最无效的方法。这种严重退化是因为DP依赖于点剔除;在极端压缩比下,丢弃大多数顶点迫使算法用长直线段来填补大间隙,导致非特征区域的显著几何失真。相比之下,卷积自编码器保持了相对稳定的性能。在这些高压缩场景下,CAE始终优于其他三种方法,显示出更好的鲁棒性和全局形状感知能力。在所有测试的压缩比下,CAE还实现了比FCA更低的重建误差,证实了局部卷积操作在提取空间曲线特征方面的有效性。
图8提供了在压缩比为2、3.33和10时重建的岛屿边界曲线的视觉比较,显示在1:50,000的地图比例下。每一行比较了相同压缩比下的四种方法,而每一列展示了同一地理区域在不同压缩级别下的效果。原始曲线以黑色显示,而由卷积自编码器(CAE)、傅里叶级数方法(FS)、全连接自编码器(FCA)和Douglas–Peucker(DP)算法生成的重建分别以红色、绿色、蓝色和黄色显示。为了突出结构差异,选择了四个具有代表性的局部几何特征——一个方向变化迅速的显著海角(a)、一个平滑变化的海岸线(b)和一个深凹的海湾(c)进行可视化。
图8. 不同压缩比下四种方法重建的岛屿边界曲线视觉比较。(a)方向变化迅速的显著海角;(b)平滑变化的海岸线;(c)深凹的海湾。行对应于这四个区域,而列从左到右分别代表压缩比(CR)为2、3.33和10。在较低的压缩比2时,所有四种方法都能重建与原始曲线偏差相对较小的岛屿边界,视觉差异通常很微妙。特别是DP算法,由于保留了足够的临界顶点,紧密贴合原始边界。然而,随着压缩比增加到3.33甚至10,重建误差变得越来越明显,揭示了每种压缩策略的独特特征。
在高压缩(CR = 10)下,卷积自编码器(CAE)始终产生与原始几何形状最接近的重建曲线。这一优势不仅适用于平坦段,也适用于包含更复杂局部几何变化的凹凸结构。相比之下,DP算法表现出严重的几何退化。因为DP严格依赖于点剔除和线性插值,将其压缩到高压缩比会导致重要形状描述符的激进修剪。这在图8c中最为明显,DP算法通过用一条直线完全失去了深湾的几何轮廓;在图8a中,它突然截断了海角。
全连接自编码器(FCA)也表现出较大的偏差,特别是在方向变化迅速的区域,表明在保持局部几何连续性方面效果有限。值得注意的是,在较低的压缩比(例如CR = 2)下,傅里叶级数(FS)方法仍然具有很高的竞争力。这很可能是因为许多岛屿部分的全球性、低频特征可以通过前几个傅里叶系数有效地捕捉到,而卷积自编码器(CAE)在这些较低的压缩级别可能会学习到更复杂且可能冗余的特征。然而,随着压缩程度的增加(CR = 10),傅里叶方法显示出显著的性能下降。在重建凹形和凸形轮廓时,傅里叶方法逐渐丢弃了表示局部曲率所需的高频成分,导致图(a)和(c)中出现的过度平滑和向内收缩的效果。这些视觉观察结果一致地验证了之前提出的定量指标,突显了卷积自编码器通过局部卷积操作和共享参数在保持复杂的高频地理细节方面的优越性,使其在极端压缩复杂矢量曲线时具有很高的鲁棒性。
5. 分析与讨论
5.1. 卷积自编码器的几何尺度敏感性
在卷积神经网络(CNN)中,整体性能由网络架构、层配置和超参数选择共同决定。在这些组成部分中,卷积核通过定义局部感受场的大小在特征提取中起着核心作用。通过与输入信号的逐元素乘法和求和,卷积核捕获局部模式,并将其聚合为更高层次的表示。对于一维序列数据,如本研究中使用的坐标增量序列,核的大小决定了模型感知曲线局部变化的几何尺度。从地理角度来看,这个过程可以类比为地图概括中空间特征的逐步扫描和抽象,其中局部几何细节在有限的上下文窗口内被感知。如果感受场太小,核可能无法捕捉到除了点对点波动之外的有意义的形状模式;如果太大,则可能会过度平滑或掩盖细小的几何变化。因此,适当的核大小对于平衡对局部几何的敏感性和对噪声的鲁棒性至关重要。
为了研究核大小对压缩性能的影响,在固定压缩比3.33的情况下,使用{4, 7, 9, 11, 13}的核大小进行了一系列实验。重建精度使用第3.3节中定义的平均位置偏差指标进行评估。结果总结在表2中。在测试的配置中,1 × 7的核大小实现了最低的平均位置偏差,表明在当前实验设置下,它在局部特征提取和几何连续性保持之间取得了最有效的平衡。
5.2. 段长对压缩稳定性和准确性的影响
段长决定了每次训练时传递给自编码器的曲线信息的几何范围,因此直接影响表示学习和重建精度。从建模的角度来看,段长控制着几何完整性和结构可变性之间的平衡:较短的段强调细小的局部细节,而较长的段则包含更广泛的上下文形状信息,但也引入了更大的形态复杂性。为了研究段长对压缩性能的影响,在固定压缩比3.33的情况下,评估了四种段长:15公里、25公里、50公里和75公里。重建精度使用第3.3节中描述的平均位置偏差指标进行评估。实验结果总结在表3中。如表3所示,随着段长从15公里增加到25公里,重建精度有所提高,表明非常短的段可能不包含足够的几何上下文,使得自编码器难以有效学习特征曲线模式。然而,当段长进一步增加到50公里和75公里时,重建精度明显下降。这种下降表明过长的段引入了过多的几何变化,使得模型更难以在不丢失细节的情况下将多样化的形状模式编码为固定长度的潜在表示。
5.3. 多尺度岛屿可视化的压缩比建议
使用解码器重建矢量曲线不可避免地会引入与原始数据的几何偏差,这些偏差通常随着压缩比的增加而增大。如表1所示,更高的压缩比会导致更大的平均位置偏差。然而,在实际的地图应用中,这种偏差的可接受性不仅取决于其在地面单位上的绝对大小,还取决于目标地图的尺度和人类视觉感知的极限。在地图学和地图可视化中,普遍认为在打印或显示的地图上,小于大约0.2毫米的位置偏差在典型观看条件下难以被人类观察者可靠地感知。这一经验阈值通常被用作评估多尺度映射中几何精度的一个实用标准。通过将这种地图空间容差转换为不同地图尺度的地面空间距离,可以得出可接受的偏差阈值,并用于指导压缩比的选择。表4总结了基于此视觉可辨识性标准的不同地图尺度下矢量曲线数据的推荐压缩比。对于大比例尺地图(1:100 K及更细),即使是在地面空间中相对较小的位置偏差也可能超出视觉容忍度,表明在这种情况下不适合进行过度压缩。然而,在中等到小比例尺下,允许的地面位移显著增加,使得更高的压缩比成为可能,而不会引入明显的视觉失真。具体来说,对于大约1:250 K的地图比例尺,大约30%的压缩比可以满足视觉精度要求;而在1:500 K的比例尺下,压缩率可以进一步提高到大约5%。对于小比例尺表示(如1:1 M),高达10的压缩比仍然在视觉上是可以接受的。这些结果表明,存在一个适中的段长,可以在几何表示性和模型可学习性之间提供有效的折中。在当前的实验配置中,大约25公里的段长产生了最低的平均位置偏差。这个距离可能代表了封装完整且具有代表性的几何特征的最佳空间尺度,而不会引入过度的结构复杂性,从而不会超出自编码器的处理能力。应当注意的是,这个值并不是一个普遍适用的最佳长度。相反,它反映了数据集和模型之间的局部几何连续性和全局形状复杂性之间的平衡。对于其他类型的矢量曲线或不同的采样密度,最佳段长可能会有所不同。尽管如此,观察到的趋势强调了在设计矢量曲线数据的压缩框架时,将段长与自编码器的表示能力对齐的重要性。
5.4. 不同模型的性能比较
为了全面评估所提出的基于1D CAE的压缩框架的有效性,将模型与三种基线方法进行了比较:全连接自编码器(FCA)、基于傅里叶级数的传统曲线拟合方法(FS)和经典的Douglas–Peucker(DP)算法。为了确保公平和有代表性的比较,在特定的压缩比3.33下评估了实验结果,并总结在表5中。表5显示,所提出的CAE模型在空间保真度方面表现出优越的性能,实现了最低的位置偏差(PD = 42.41)和最高的交并比(IoU = 0.9991)。相比之下,经典的DP算法表现出最高的位置偏差(PD = 81.98),因为丢弃了大量顶点会在非特征区域引入显著的点线投影误差。此外,虽然DP算法通过严格保留定义封闭岛屿宏观边界的临界结构顶点而实现了最低的相对面积误差(RAE = 0.0014%),但CAE仍然具有很高的竞争力(RAE = 0.0067%),并且显著优于其他基于学习的方法。这证实了1D卷积有效地利用了相邻顶点的局部空间相关性,从而比缺乏局部空间归纳偏见的FCA和倾向于过度平滑局部细节的FS更好地保持了整体空间范围。
在形态学和周长特征方面,传统的DP算法产生了最低的曲率变化(CC = 4.60 × 10^-5)和相对周长误差(RPE = 0.7576%)。这是因为DP将边界简化为临界节点之间的直线段,自然地最小化了复杂的局部曲率变化,并保持了离散的多边形周长。在其余的频谱和基于学习的方法中,传统的FS方法在保持曲线平滑性方面表现良好,因为它具有在频域中拟合全局轮廓的固有特性,产生了较低的曲率变化(CC = 2.06 × 10^-4)和相对周长误差(RPE = 0.9538%)。然而,所提出的CAE在这些指标上仍然具有很高的竞争力(RPE = 0.9919%,CC = 3.22 × 10^-4),并且显著优于FCA。FCA在保持几何形状方面表现最差(RPE = 1.8345%,CC = 3.52 × 10^-4),主要是因为将数据扁平化给全连接层会破坏1D坐标序列的空间连续性,导致重建过程中的不自然几何抖动。
在计算效率方面,像DP和FS这样的传统算法和频谱方法不需要 amortized 神经网络(即不涉及训练时间),尽管在执行过程中可能会产生不同的处理开销(例如,FS的复杂频域变换)。在深度学习模型中,简单的矩阵乘法使得FCA在训练期间稍微快一些(51.94秒)。然而,CAE(57.32秒)在重建精度上取得了显著改进,而计算开销可以忽略不计。总体而言,结果表明所提出的CAE在几何保真度、空间精度和计算效率之间实现了最佳的全面平衡。
6. 结论与未来工作
本研究提出了一个基于卷积自编码器的矢量曲线数据压缩框架,并通过针对复杂矢量线数据的系统实验证明了其有效性。通过将坐标序列转换为坐标增量表示,所提出的编码器学习了保留基本几何特征的紧凑潜在向量,而解码器则以高位置保真度重建曲线。实验结果证实,所提出的方法在压缩效率和重建精度之间取得了良好的平衡。训练好的编码器-解码器参数在大量曲线段之间共享和分布,因此不会随数据集大小而扩展,使得所提出的方法适用于以存储为导向的压缩场景。与经典的Douglas–Peucker(DP)算法、基于傅里叶级数的(FS)压缩和全连接自编码器(FCA)的比较分析表明,CAE在广泛的压缩比范围内始终表现出优越的性能。虽然像DP算法这样的传统启发式方法在低压缩级别通过直接保留临界顶点实现了高保真度,但它们对点裁剪的严格依赖性在过度压缩下会导致严重的几何失真和结构退化。另一方面,尽管频域方法在相对较低的压缩水平下可能实现略微更高的精度,但所提出的CAE在中等到高压缩比下表现出明显的优势,在这种压缩比下,使用传统的参数化表示方法更难以保留非线性的局部几何特征。此外,通过明确利用边界坐标的顺序性,所提出的架构避免了与图神经网络(GNNs)或基于Transformer的模型相关的大量计算开销和结构复杂性。结果进一步表明,在捕获矢量曲线数据中的局部几何连续性方面,卷积结构比全连接架构更有效。通过一系列敏感性分析,本研究强调了模型设计、数据表示和应用需求之间的尺度对齐的重要性。实验表明,卷积核的感受野和曲线段的几何范围显著影响重建性能,并且中等尺度在表示能力和模型稳定性之间提供了最有效的平衡。此外,通过将重建精度与地图视觉容差联系起来,建立了一种基于尺度的压缩策略,为多尺度地图可视化场景中选择压缩比提供了实际指导。所提出的方法特别适用于中小规模的地图应用,在这些应用中可以实现显著的数据减少而不会导致明显的视觉退化。
尽管取得了这些有希望的结果,但仍存在一些局限性。实验评估主要集中在单一类别的矢量曲线(即封闭的岛屿边界)上,当前框架强调几何重建,而没有明确建模拓扑一致性或语义属性。未来的工作将把所提出的方法扩展到更广泛的矢量数据集,包括交通网络和水文特征,并将研究考虑拓扑的约束和多任务学习策略,以进一步提高重建的鲁棒性和泛化能力。此外,集成自适应分割和基于尺度的模型配置是提高基于深度学习的矢量数据压缩在现实世界地理信息系统中灵活性的一个有前景的方向。
补充材料:
数据集(预处理过的岛屿和海岸线的矢量空间数据)和源代码(CAE的PyTorch实现,包括训练脚本和评估指标)是开源的,可在以下链接获取:https://github.com/20zsnormal/Island-Curve-Compression-CAE/tree/main(访问日期:2026年4月6日)。
数据集:预处理过的岛屿和海岸线的矢量空间数据。
源代码:CAE的PyTorch实现,包括训练脚本和误差评估指标。