-
通过跨模态对齐和图卷积实现手语翻译
跨模态对齐预训练结合动态双图时空聚合模块,提出无标注签字语翻译框架CMAG-Net。通过CMAE嵌入器同步优化语义重建与分布对齐损失,构建手势时序图与相似性图,抑制冗余帧干扰,提升翻译准确率与流畅度。实验表明,在PHOENIX-2014T等数据集上,BLEU-4较GFSLT-VLP提升5.19/5.95,接近有标注方法MMTLB的0.37/0.22差距。
来源:Neurocomputing
时间:2026-02-05
-
SSDMamba:一种用于高光谱图像分类的谱-空间双分支模型
高光谱图像分类中提出SSDMamba框架,通过DS Spatial Mamba分支捕获长程空间依赖,FFT Spectral Mamba分支建模光谱全局周期性,并设计动态交互融合模块优化特征交互。实验表明该方法在四大数据集上参数更少且精度更高。
来源:Neurocomputing
时间:2026-02-05
-
基于图像与文本的样式随机化方法,用于领域泛化的语义分割
语义分割模型面临异构域泛化不足的问题,本文提出两阶段框架:第一阶段通过图像-文本联合驱动的实例归一化(I-PIN)优化风格参数,减少语义干扰;第二阶段采用双路径风格不变特征学习(DSFL),结合跨风格一致性和单风格内空间一致性损失,提升模型在未知域的鲁棒性。实验表明,该方法在多个挑战性域中优于现有SOTA方法。
来源:Neurocomputing
时间:2026-02-05
-
探索基于物理优化的神经运算符在预测车辆-桥梁系统动力学中的应用:从1自由度(1-DOF)模型到13自由度(13-DOF)模型
车辆-桥梁耦合动力学(CVBD)预测中,Fourier神经网络算子(FNOs)作为代理模型被应用于1-DOF至13-DOF不同复杂系统。通过对比输入特征设计、输出策略和损失函数形式,研究发现:引入路面导数输入和扩大归一化范围可显著提升加速度响应预测精度;高维系统中联合预测位移、速度和加速度,采用加权数据损失函数无需额外物理约束即达最优性能。
来源:Journal of Sound and Vibration
时间:2026-02-05
-
基于PVO的可逆数据隐藏技术,采用灵活的条带移动方式,并结合基于分类的自适应预测机制,该机制由卷积神经网络(CNN)进行引导
可逆数据隐藏中提出基于深度神经网络的像素值排序方法,通过自适应预测器选择、全局PVO优化、灵活条带移动模式及单侧嵌入策略提升嵌入容量和图像保真度。
来源:Journal of Information Security and Applications
时间:2026-02-05
-
持续学习的实践指南
持续学习(CL)与流式机器学习(SML)分别解决知识保留与快速适应概念漂移的挑战,而提出的流式持续学习(SCL)旨在统一二者,通过平衡稳定性与可塑性实现动态数据流中的高效持续学习。
来源:Neurocomputing
时间:2026-02-05
-
SynHOI:一种多粒度GAN合成器,用于生成式零样本场景识别(HOI)任务
零样本人类-物体交互检测中,基于GANs的多粒度特征合成框架SynHOI通过生成对抗网络解决未见类别的视觉特征缺失问题。采用跨域组合转移策略,融合 seen 类别的语义特征和空间特征,结合双对比学习机制(ICCS和ICCD)提升生成特征的区分性和多样性。在HICO-DET和V-COCO数据集上验证,显著优于依赖外部知识的方法,且 seen/unseen 检测性能平衡最优。
来源:Neurocomputing
时间:2026-02-05
-
MAD-TCN:通过多尺度自适应依赖性时间卷积网络进行时间序列异常检测
针对工业物联网多变量时间序列异常检测中的复杂依赖、长时序建模及计算效率问题,提出MAD-TCN模型。其双分支结构结合局部与全局时序特征提取,自适应门控模块动态调整变量间依赖,实现轻量化设计(约0.026M参数),在四项基准数据集上AUC和F1值最高或次优,且训练与推理速度提升34%。
来源:Neurocomputing
时间:2026-02-05
-
基于物理信息神经网络的自监督学习方法,用于激光焊接过程的焊接穿透深度预测模型
本文提出SimPhysNet算法,通过融合物理约束的自监督学习与原型网络的小样本分类策略,有效解决了激光焊接穿透性预测中标注数据稀缺的问题。实验表明,仅需200张标注数据(总标注数据量的5%)即可达到96.06%的分类精度,显著优于传统监督学习方法。该方法创新性地将偏微分方程物理约束嵌入对比学习框架,结合图像增强任务和原型网络机制,实现了高精度、低成本的穿透性预测,为智能焊接自动化提供新思路。
来源:Journal of Manufacturing Processes
时间:2026-02-05
-
解耦分层蒸馏技术在多模态情感识别中的应用
多模态情感识别研究提出解耦分层蒸馏框架,通过自回归机制分离同质与异质特征,采用图蒸馏单元和跨模态字典匹配进行两阶段知识蒸馏,显著提升CMU数据集性能。
来源:IEEE Transactions on Pattern Analysis and Machine Intelligence
时间:2026-02-05
-
STIMI:一种用于时空风速重建的掩膜图像建模框架
时空图像重建框架STIMI通过互信息重索引将高维风速数据映射为二维图像,采用多尺度窗口自注意力机制捕捉时空依赖,结合均方误差与KL散度混合损失函数,有效解决大块缺失场景下的风功率预测难题,实验验证其可解释性优势。
来源:Neurocomputing
时间:2026-02-05
-
一种可解释的多视图表示融合学习框架,结合了混合元前缀网络(Hybrid MetaFormer),用于基于脑电图(EEG)的癫痫发作检测
本文提出一种基于混合MetaFormer的多视图 Representation Fusion Learning(XMVRF-HMF)框架,通过GASF和改进的Stockwell变换构建层次化多视图表示,并利用稀疏注意力机制实现跨视图特征融合,同时设计可解释性模块基于特征重要性评分,在CHB-MIT和Siena数据集上显著优于现有方法,平均准确率达95.5%±3.75%,并实现决策可解释。
来源:Neurocomputing
时间:2026-02-05
-
基于高斯采样和度量学习的细粒度图像分类
本文提出基于高斯采样不确定性的三元损失函数TL-GSU,结合改进的BNNeck特征减少结构,有效提升细粒度图像分类精度,并在三个数据集上验证其优于传统方法。
来源:Neurocomputing
时间:2026-02-05
-
OptimES:利用远程嵌入优化图神经网络的联邦学习
本文提出OptimES框架,通过远程邻居修剪、重叠嵌入推送与动态预取优化联邦GNN训练,减少通信成本,在四个数据集上比EmbC快3.5倍,准确性提升16%。
来源:Journal of Parallel and Distributed Computing
时间:2026-02-05
-
使用图注意力机制实现可解释的安卓恶意软件检测及恶意代码定位
恶意代码自动定位框架XAIDroid结合图神经网络与注意力机制,通过API调用图捕捉语义关系实现细粒度恶意代码定位,在合成与真实数据集上达到97.27%的类级召回率和96.02%的方法级召回率,支持未见过恶意变种的泛化。
来源:Journal of Information Security and Applications
时间:2026-02-05
-
CRColor:基于循环参考学习的方法,用于基于样本的图像着色
颜色保真度不足是现有基于示例的图像着色方法的核心问题,本文提出CRPSNR评估指标和CRColor网络结构,通过循环策略实现参考图像颜色信息的双向校验,在保持图像质量的同时显著提升颜色保真度,实验验证了方法的有效性。
来源:Neurocomputing
时间:2026-02-05
-
Anti-DETR:基于小波卷积的端到端反无人机视觉检测网络
小无人机空对空复杂场景检测方法,提出端到端Anti-DETR网络,通过小波卷积扩展感受野,多尺度特征金字塔增强细粒度特征,直方图自注意力机制抑制背景干扰,有效提升5×5像素级小目标检测精度。
来源:Neurocomputing
时间:2026-02-05
-
LumiGAN:基于记忆引导的双分支学习算法,用于现实世界的弱光图像增强
LumiGAN提出基于质量评估的双分支编码器与动态记忆银行模块,通过像素级质量引导和区域自适应增强策略,结合空间局部特征与频率全局特征提取,并利用仿生视觉记忆机制增强语义一致性,有效解决低光照图像的过曝/欠曝、噪声放大和语义失真问题。
来源:Neurocomputing
时间:2026-02-05
-
一种基于物理原理的混合模型,用于橡胶轮胎制造过程中的压延宽度预测
橡胶挤出压延宽度预测难题,提出TCN-BiLSTM-PINN混合模型,融合物理约束与数据驱动,动态加权策略平衡拟合与物理一致性,实验验证其优于纯数据模型,适应性强。
来源:Journal of Process Control
时间:2026-02-05
-
请描述这张图片:基于听觉掩蔽效应的可逆网络,用于渐进式的音频图像隐写技术
提出基于听觉掩蔽效应的可逆神经网络HIA-Net,分两阶段实现高隐蔽性图像嵌入:首先通过掩码音频提取算法生成高掩蔽能力音频,再利用可逆子网络分阶段嵌入图像并重构原始音频,显著提升PSNR至3.0dB以上。
来源:Journal of Information Security and Applications
时间:2026-02-05