帕金森病(PD)是一种进行性神经退行性疾病,严重影响患者的运动功能和生活质量。由运动障碍协会赞助的统一帕金森病评分量表(MDS-UPDRS)是评估PD严重程度和进展的临床金标准(Goetz等人,2008年)。在该量表中,坐立转换(STS)运动评估是一个特别关键的组成部分,因为它通过一个常见的日常活动全面捕捉了多种运动障碍方面。
STS运动涉及多个身体部位的复杂协调,需要适当的平衡控制、肌肉力量和关节灵活性。对于PD患者来说,由于各种运动症状(包括运动迟缓、僵硬和姿势不稳定),这项任务变得特别具有挑战性。Huang等人(2024年)观察到,在STS运动过程中姿势转换的微妙变化可以反映功能下降的显著变化。当前的临床实践在STS评估方面面临重大挑战:手动评估需要训练有素和经验丰富的神经科医生,但仍存在评分者间差异;而全面评估需要同时观察多个运动组成部分,这既耗时又受限于人类因素(Van Lummel等人,2016年;de Deus Fonticoba等人,2019年)。
为了解决这些限制,并受到自动化PD运动评估技术进步的启发(Morgan等人,2023a;Zhang等人,2023a;Zhang等人,2023a),研究人员探索了使用基于传感器和基于视觉的方法进行自动STS评估(Goyal等人,2020年;Gon?alves等人,2025年)。基于传感器的方法通过由惯性测量单元组成的身体传感器网络在STS分析中显示出潜力(Giuberti等人,2015年;Parisi等人,2015年;Marin等人,2022年)。这些系统可以在STS转换期间提取运动特征,捕捉关于角速度、加速度和运动持续时间的详细参数,Giuberti等人(2015年)和Parisi等人(2015年)使用PCA结合KNN分类器进行严重程度分类。然而,这些方法在临床应用中存在实际限制。传感器必须精确放置在患者身上,可能会影响自然运动模式,并且需要定期校准以保持准确性。这些因素降低了患者的依从性,并限制了其在非临床环境中的广泛采用。
基于视觉的评估提供了一种有前景的非侵入性替代方案,克服了基于传感器方法的许多限制。最初,使用专用摄像机的标记基运动捕捉系统被提出作为基于视觉的运动分析的早期尝试(Banerjee等人,2013年),但它们仍然需要受控的实验室环境和繁琐的设置程序。计算机视觉的最新进展,特别是在人体姿态估计和动作识别方面,为STS分析创造了新的机会。Yan等人(2018年)引入了时空图卷积网络(STGCNs),有效地模拟了骨骼运动数据中的时空依赖性。然而,开发有效的基于视觉的STS评估系统仍然具有挑战性。Morinan等人(2022年)尝试使用消费级相机进行STS分析,但获得可靠结果仍需要手动标注,限制了其临床应用性。Mehta等人(2021年)提出从2D坐标数据估计3D坐标用于STS分析,但这显著增加了模型的复杂性和计算要求。虽然Guo等人(2022年)使用自监督多模态图卷积网络(SSM-GCN)实现了70.60%的当前最佳准确率,但他们的评估仍局限于受控的实验室环境,并未解决现实世界的部署问题。
因此,我们在这项工作中致力于开发一个自动化的基于视觉的STS评估框架,但仍面临以下三个挑战:(1)关节运动和协调的复杂变化。在STS运动过程中,不同的身体部位(手臂、腿部、躯干和头部)必须以协调的方式协同工作。每个关节的运动范围、速度和流畅性可能会有所不同,特别是在PD患者中,不同身体部位的损伤程度可能不同。这些变化在不受控制的环境中更加明显。挑战在于捕捉不同身体部分之间的协调关系以及每个关节的个体运动特征,特别是当患者由于PD症状表现出不对称或补偿性运动模式时。(2)现实世界条件下的细微严重程度差异。如图1所示,与受控的实验室环境不同,现实世界的自由生活视频展示了多样的摄像机视角。这些可变的视角加上严重程度级别之间的细微差异,要求特征提取方法能够稳健地捕捉细微差异。挑战在于尽管存在这些环境变化,仍能可靠地区分相邻的严重程度级别。(3)在利用先进深度学习的同时保持临床相关性。尽管深度神经网络能够实现强大的时空建模,但实际应用要求特征与既定的评估协议保持一致。
为了解决这些挑战,我们提出了KiGA(Kinematic-Guided Assessment),这是一种基于视频的自动STS严重程度评估的新框架,适用于现实世界条件。我们的框架独特地结合了基于深度学习的时空建模和基于临床的信息的运动特征分析,通过三个关键创新:
(1)提出了一个动态的基于图的空间时间学习分支,它结合了自适应空间学习和多尺度时间卷积操作来处理原始骨骼序列数据,并通过有效提取视频中的时空细粒度特征自动捕捉复杂运动模式。
(2)提出了一个运动特征聚合分支,以提取与临床评估标准对齐的症状驱动的运动特征,模拟STS过程中的四个主要症状类别:姿势稳定性、身体运动迟缓、腿部僵硬和手臂僵硬。与使用一般运动测量或仅关注有限症状方面的先前方法不同,我们的运动特征聚合系统地解决了STS转换期间PD的所有四个主要运动症状领域。通过将这些特征直接与MDS-UPDRS量表中使用的临床评估标准对齐,并针对现实世界视频分析进行优化,我们提高了诊断准确性和临床相关性,同时使得评估在不同环境条件下更加可解释和稳健。
(3)设计了一种新的特定类别的对比学习策略,以帮助学习不同严重程度级别的区分性时空特征。这种学习方法鼓励模型关注区分相邻严重程度级别的细微运动特征,这在环境变化较大的现实世界环境中尤为重要。
简而言之,我们开发了一个使用自由生活摄像机录制的视频进行自动STS严重程度评估的框架,这对提高PD诊断效率和实现远程医疗应用具有重要意义。据我们所知,这是第一个开发用于现实世界STS严重程度评估的自动化系统。