纳米孔测序推动早期被子植物演化研究:芡实与金鱼藻基因组高质量组装

  • 时间:
  • 浏览:216
  • 来源:世界杯买球盘口网址app

来自四川大学的杨勇志(现为兰州大学青年研究员)和华北理工大学的孙朋川等人使用纳米孔长读长测序和短读长测序,划分组装出芡实和金鱼藻的基因组序列,联合Hi-C数据,将基因组提升至染色体级别,评估显示了基因组组装的高度一连性、完整性和准确性。

2020年2月24日,Nature Plants以题为”Prickly waterlily and rigid hornwort genomes shed light on early angiosperm evolution”的文章刊登了该研究结果,该研究宣布了被子植物的两种早期演化分支代表种:芡实和金鱼藻的染色体水平基因组序列,通过与其它代表性陆生被子植物代表基因组举行了深入的比力分析,展现了早期被子植物的庞大演化历史。

被子植物,或称着花植物,是地球上多样化水平和物种富厚度最高的类群之一,早期被子植物的突然泛起和迅速多样化使被子植物的起源成为著名的达尔文“讨厌之谜”。几十年的努力已经极大地解决了被子植物的系统发育问题,可是主要分支之间的演化历史始终存在争议。例如,焦点被子植物的五大类群之间的系统发育关系仍存在模糊不清的地方。焦点被子植物包罗约99%的现存被子植物,分为真双子叶植物、票据叶植物、木兰类植物、金鱼藻目以及金粟兰目五大类群,现有研究凭据差别的形态学或分子层面证据,提出了差别的发育分支拓扑结构。

基因组数据能够提供越发富厚和有说服力的证据来解决物种进化分歧问题。本研究接纳三代Nanopore长读长测序数据和二代illumina短读长数据,划分组装出芡实(725.23Mb, Contig N50=4.75 Mb)和金鱼藻(733.26Mb, Contig N50=1.56 Mb)的基因组序列,随后联合Hi-C数据,将基因组提升至染色体级别。评估讲明两个基因组显示了高度的一连性、完整性和准确性(图1a),并与细胞学研究中获得的染色体数目相匹配。

随后研究者在芡实基因组中检测到两个多倍化事件,校正进化速率之后,预计芡实基因组中的两个多倍化事件划分发生在约莫16-18百万和94-106百万年前(Ma)。在金鱼藻中检测到三个多倍体化事件,预计划分发生在约莫13-15 Ma,127-143 Ma和157-177 Ma。而且被子植物的五个主要演化分支,金鱼藻、睡莲类、木兰类、票据叶植物和真双子叶植物中都发生了多个独立的多倍化事件(图1b),而且芡实最近还履历了一次基因组加倍。

图1 比力基因组分析。a芡实和金鱼藻基因组特征; b平均同义替换水平(Ks)在同位块间的漫衍。

研究者从13种被植物和1种裸子植物基因组序列中判定出1,374个单拷贝核基因用于构建系统发育树,首次涵盖两个基础被子植物类群(无油樟目无油樟、睡莲目芡实)以及焦点被子植物五大类群中的四个(4个真双子叶植物,3个票据叶植物,3个木兰类植物,金鱼藻目金鱼藻)。接纳两种方法毗连并分析卵白质编码区获得了两个数据集(SSCG-CDS 和SSCG-Codon12)构建进化树讲明,无油樟和睡莲类依次是其他被子植物的姐妹群,同时推测金鱼藻是真双子叶植物的姐妹群(图2a,b)。同时,研究者还使用OrthoMCL方法和新开发的物种发育树构建方法STAG证实了上述结论的可靠性(图2a)。

随后研究者使用DensiTree 对SSCG-CDS和SSCG-Codon12两个发育树举行可视化,发现二者存在普遍的拓扑冲突(图2c),无油樟目和睡莲目之间的拓扑分支冲突和金鱼藻系统发育位置的矛盾(图2d)。而且无油樟目和睡莲目的系统发育位置在基因树和物种树之间存在大量纷歧致(图2e)。这些分析讲明,在早期被子植物进化历程中可能存在大量的不完全谱系分选(ILS),造成主要分支之间基因树、或核基因组-叶绿体基因组系统发育树分支关系纷歧致。

图2 早期分化被子植物的系统基因组分析。a 基于MCMCTree推断的SSCG-CDS数据集的被子植物早分化年表;b DiscoVista物种树分析;c SSCG-CDS(红色)和SSCG-Codon12(橙色)叠加超矩阵基因树。d SSCG-CDS和SSCG-Codon12中物种树内部门支的三种拓扑的频率(q1-q3)。e 基因树的兼容性

总之,本研究组装出了两个早期水生被子植物——芡实和金鱼草的高质量染色体水平基因组,联合其他代表性被子植物主要类群,使用多个数据集和多种方法,深入剖析了被子植物的早期演化以及差别类群之间的系统发育关系。这些发现有助于研究被子植物中主要分支的演化序次和生境转变、植物生命之树重建,特别是水生被子植物适应性演化、差别类群的古多倍化等庞大进化历史。

关于纳米孔测序与植物研究

纳米孔测序能够准确组装庞大的、数Gb的植物基因组,并实时检测植物病原体。长测序读长(高达2 Mb)可以增进基因组组装,完整判定庞大的基因组区域,为植物生物学、进化和育种计谋提供新的看法。确定碱基修饰和核苷酸序列,并通过直接对天然DNA或RNA测序来探索表观遗传学的影响。

纳米孔测序应用于植物研究的优势:

简化大型基因组,以及修正参考基因组

弥合缺口:剖析重复区域和结构变异

按需、可扩展的测序:从现场到实验室

完全判定和量化植物转录物异构体

使用MinION,GridION或PromethION扩展需求