中国科学院西北高原生物研究所公布藏羚首个染色体水平的高质量基因组
11月12日,中国科学院西北高原生物研究所研究员张同作联合青海大学副教授魏青等团队,成功组装了藏羚染色体级别的基因组,首次获得藏羚染色体水平的高质量基因组和注释信息,相关研究结果在《自然》旗下综合性科学期刊《科学数据》上发表。
研究团队基于PacBio HiFi三代基因组测序、Hi-C测序和DNBSEQ-T7二代基因组survey测序三种测序技术,成功组装了藏羚染色体级别的基因组。基于EDTA和RepeatModeler从头预测的藏羚基因组中重复序列注释结果表明,藏羚基因组重复序列主要由SINEs、LINEs、LTRs和DNA transposons四种类型组成,序列总长度为1.65Gb,占基因组的52.47%;基于蛋白同源预测、蛋白从头预测和深度学习等多种策略,在藏羚基因组上共注释到28330个功能基因。
研究团队首次获得藏羚染色体水平的高质量基因组和注释信息,为藏羚的适应进化遗传机制、保护遗传学研究及进一步探索物种迁徙行为的遗传机制提供了重要的基因组资源。