
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于视频的协同语音整体3D动作生成及风格化处理
《Graphical Models》:Co-speech holistic 3D motion generation with style from video
【字体: 大 中 小 】 时间:2026年05月29日 来源:Graphical Models 2.2
编辑推荐:
张雅宇|文宇辉|李晨光|景丽萍|余健摘要基于语音驱动的3D动作生成技术近年来受到了越来越多的研究关注。然而,该技术在实现风格可控性方面面临重大挑战,主要原因是动作风格注释的匮乏。为了解决这一问题,我们提出了一种基于扩散算法的新框架,用于实现从视频中提取动作风格并进行整体动作生成。