一种用于伪随机流生成的基于DNA局部特征且考虑约束的双头Transformer模型

《Entropy》:A DNA-Local, Constraint-Aware Dual-Head Transformer for Pseudorandom Stream Generation

【字体: 时间:2026年06月19日 来源:Entropy 2

编辑推荐:

   摘要

  

摘要

在以脱氧核糖核酸(DNA)为对象的计算工作中,伪随机数生成器(PRNGs)通常先在比特域生成输出,再将其转换为DNA符号。这种间接方法可能会将DNA特有的约束条件,如GC平衡、同聚物限制以及短距离序列依赖性,与生成过程分开处理。本研究提出了一种具有约束感知能力的双头解码器型Transformer框架,可直接在腺嘌呤/胞嘧啶/鸟嘌呤/胸腺嘧啶(A/C/G/T)字母表中生成DNA相关的PRNG。该模型通过从八种等效的DNA到比特的编码规则中动态选择,来生成下一个DNA碱基并确定比特流。该框架在基于真实基因组数据的R1标准下进行了测试,同时以R1-ext作为独立验证,还基于合成数据进行了R2测试,以及在没有训练数据或参考数据的R3条件下进行了测试。每种测试条件下都进行了10次独立运行,每次运行都会生成一个50万碱基对的DNA序列以及100万比特的比特流。比特级评估采用了NIST SP 800-22标准、受SP 800-90B启发的最小熵/健康指标以及ENT指标,而DNA级评估则采用了GC平衡、同聚物控制以及符号结构指标。测试结果显示,所采用的NIST标准均满足要求,t元组最小熵下限在0.9955到0.9964比特/比特之间,且核心的DNA兼容性约束也得到了保持。多流分析以及精确匹配k-mer泄漏分析表明,不存在系统性的比特级依赖关系或直接的长片段复制现象。总体而言,该框架能够实现可重复的DNA相关PRNG生成,并支持多层验证。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号