一种用于伪随机流生成的基于DNA局部特征且考虑约束的双头Transformer模型
《Entropy》:A DNA-Local, Constraint-Aware Dual-Head Transformer for Pseudorandom Stream Generation
【字体:
大
中
小
】
时间:2026年06月19日
来源:Entropy 2
摘要
在以脱氧核糖核酸(DNA)为对象的计算工作中,伪随机数生成器(PRNGs)通常先在比特域生成输出,再将其转换为DNA符号。这种间接方法可能会将DNA特有的约束条件,如GC平衡、同聚物限制以及短距离序列依赖性,与生成过程分开处理。本研究提出了一种具有约束感知能力的双头解码器型Transformer框架,可直接在腺嘌呤/胞嘧啶/鸟嘌呤/胸腺嘧啶(A/C/G/T)字母表中生成DNA相关的PRNG。该模型通过从八种等效的DNA到比特的编码规则中动态选择,来生成下一个DNA碱基并确定比特流。该框架在基于真实基因组数据的R1标准下进行了测试,同时以R1-ext作为独立验证,还基于合成数据进行了R2测试,以及在没有训练数据或参考数据的R3条件下进行了测试。每种测试条件下都进行了10次独立运行,每次运行都会生成一个50万碱基对的DNA序列以及100万比特的比特流。比特级评估采用了NIST SP 800-22标准、受SP 800-90B启发的最小熵/健康指标以及ENT指标,而DNA级评估则采用了GC平衡、同聚物控制以及符号结构指标。测试结果显示,所采用的NIST标准均满足要求,t元组最小熵下限在0.9955到0.9964比特/比特之间,且核心的DNA兼容性约束也得到了保持。多流分析以及精确匹配k-mer泄漏分析表明,不存在系统性的比特级依赖关系或直接的长片段复制现象。总体而言,该框架能够实现可重复的DNA相关PRNG生成,并支持多层验证。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号