《Visual Informatics》:A visual analysis approach for prevention and control of animal epidemic
编辑推荐:
动物疫病防控关乎公共卫生与畜牧业可持续发展。现有方法存在监测效率低、模型精度不足及缺乏专用可视化工具等局限。为此,研究人员联合中国动物卫生与流行病学中心,采集真实动物运输与死亡数据,并利用大语言模型(LLM)生成符合流行病学规律的合成数据。同时,通过纳入运输、
动物疫病防控关乎公共卫生与畜牧业可持续发展。现有方法存在监测效率低、模型精度不足及缺乏专用可视化工具等局限。为此,研究人员联合中国动物卫生与流行病学中心,采集真实动物运输与死亡数据,并利用大语言模型(LLM)生成符合流行病学规律的合成数据。同时,通过纳入运输、车辆媒介传播及空间交互等多重感染因子,改进经典易感-感染-恢复(SIR)模型。所构建的可视化分析系统包含六个联动视图与交互功能,支持疫情趋势分析、传播源追踪及运输与死亡相关性探索。研究人员采用统计指标对比合成数据与真实数据的分布以验证数据集有效性,并通过两个案例研究与专家访谈证实了系统的有效性与效率。
该研究针对动物疫病防控中监测低效、模型静态化及专用可视化工具缺失等痛点,由林子悦、梅淑红、李金明、林东与陈思明等研究人员合作完成,旨在突破传统防控手段在复杂场景下的局限性,成果发表于《Visual Informatics》。研究首先联合中国动物卫生与流行病学中心与中国动物疫病预防控制中心,获取某省份2023年全年农场级动物运输记录(含省内798,989条、跨省41,529条)及村级死亡记录(共673,249条),因数据敏感性构建LLaMA3驱动的合成数据集,并扩展经典SIR(Susceptible-Infected-Recovered)模型,纳入运输、车辆及空间三类传播路径,开发集成六视图的视觉分析系统,最终经统计检验、案例推演及专家评估验证效能。
关键技术方法涵盖四方面:一是数据层面,融合真实运输与死亡数据,通过高德地图API实现地理匹配,对齐农场与村级空间粒度,构建运输网络,并以三次样条插值填补缺失值,同时基于LLaMA3生成含3472个设施、1780条运输记录的合成数据集,经卡方检验(χ2=0.25,p=0.61)与KL散度(DKL=0.23)验证分布一致性;二是模型层面,扩展SIR框架,将易感群体动态拆解为运输输入、车辆污染、空间传播及自然感染四类过程,引入感染率λ、管理严格系数β、移除率μ等参数,分别量化运输路径感染(N(transportation)=∑(ni×πi)、车辆风险感染(fk=1?∏i(1?βke?λti))及空间邻近感染(fk=1?∏i=1n(1?φπidi?α));三是系统开发层面,前端基于Vue3、D3.js与G6,后端采用Python、Flask与PyTorch Geometric,构建含时间分布视图、拓扑结构视图、控制面板、网络视图、层级选择面板及关联视图的联动系统,其中拓扑视图支持前后向溯源,网络视图采用PageRank算法(PR(v)=(1?d)/N + d∑u∈In(v)PR(u)/OutDegree(u))评估节点重要性;四是验证层面,通过非洲猪瘟模拟案例、跨农场死亡时序关联分析及14年经验专家的深度评估完成效能校验。
研究结果分为七部分展开。引言部分明确工业化养殖背景下动物流动加剧导致疫病跨区域传播风险陡增,传统人工监测与静态模型难以捕捉运输网络的时空动态性,且通用可视化软件无法凸显高风险节点与路径,由此提出“模型增强-系统设计”双核心研究问题。相关工作梳理了动物运输网络的二部图/单部图拓扑特征(如小世界属性、度中心性、介数中心性)、时空可视化的时空立方体(Space-Time Cube)技术演进,以及现有疫病可视化工具多聚焦人类传染病、缺乏动物特异性建模的短板,确立研究创新点。数据描述与处理详细说明了真实数据的字段构成(运输日期、数量、类型、起止地;死亡日期、类型、数量),以及合成数据的生成规则——设施按98%农场、2%屠宰场配比,车辆分短途(80%-90%)与长途(10%-20%),运输关系按省内80%-90%、跨省10%-20%及场到场30%、场到屠宰场66%分配,确保贴合真实物流模式。需求分析通过与领域专家17轮迭代研讨,提炼出数据整合管理、动态时空网络建模、可视化交互、智能决策支持四大核心需求(R1-R4)。模型部分提出的扩展SIR框架,首次将车辆消毒状态(βk)、病原体环境存活衰减率(λ)、空间距离衰减系数(α)等实操参数纳入动力学方程,实现对运输网络传播机制的细粒度刻画。系统部分展示六视图协同机制:时间分布视图支持拖拽式时段筛选,层级选择面板实现省-市-县-农场四级穿透,控制面板允许自定义三类传播参数,拓扑结构视图以节点大小映射设施规模、边线虚实区分直接与间接连接,网络视图通过PageRank识别枢纽节点,关联视图支持死亡时序滞后分析。评估部分证实合成数据集与真实数据无统计学差异(p>0.05),案例1实现从济南疫源地向潍坊、临沂的传播路径推演,识别出未消毒车辆LUA3L8H5的跨场传播风险;案例2通过对比运输事件前后死亡峰值,锁定HW69654为NQ31330疫情的潜在源头;专家评估认可系统对“溯源-研判-阻断”全流程的支持效能,建议优化大规模数据加载性能。
讨论部分指出当前模型的局限在于未纳入品种、气候等环境变量,未来拟融合图神经网络(GNN)与大语言模型(LLM),构建半结构化文本(如消毒日志)与时空图特征的门控注意力对齐框架,同时需解决异构特征空间对齐、LLM实时推理算力瓶颈及兽医领域知识适配三大挑战。此外,受限于敏感地理信息合规要求,系统暂未集成地图可视化,后续将探索合规的空间表征方案。结论重申该研究通过多学科交叉创新,实现了动物运输全链条的追溯与监管能力提升,为畜牧业可持续发展与公共卫生安全提供了智能化技术支撑。