Hello, welcome to Benagen Technology
HOME > Resources > Company information >

全球粮食安全研究所使用纳米孔测序解析复杂作物基因组,比较组装及甲基化优势

 

经授权全文转载自 NanoporeTechnologies 公众号

 

摘要

全球粮食安全研究所(Global Institute of Food Security)的Andrew博士及团队利用纳米孔长读长序列为芸薹属作物生成连续组装,包括黑芥、芥花油、栽培扁豆、扁豆的野生亲缘植物和大麦。

  • 纳米孔测序可为较大型、复杂的植物基因组提供可靠组装。

  • 以不同基因型的黑芥基因组为研究对象,长读长序列在重复元件的组装结果优于短读长序列组装,并且能够解析短读长序列难以组装的重复区域和重排事件,挖掘出对作物性状可能有重要影响的结构变异。

  • 纳米孔测序甲基化检测 vs. 短读长亚硫酸氢盐测序:纳米孔测序无需扩增或化学处理,能够数据信号内免费识别甲基化。对黑芥品种Ni100基因组进行CpG甲基化分析,结果显示纳米孔测序与短读长亚硫酸氢盐测序一致性良好。

  • 使用纳米孔测序数据检测出可能影响作物性状的结构变异。

 

研究背景

芸薹属(Brassicas)物种的研究


 

芸薹属(Brassica)为十字花科植物,包含许多重要的蔬菜、油料和饲料作物。黑芥是芸薹属栽培种的三个基本种之一,基因组为BB,二倍体,8条染色体,包含埃塞尔比亚芥(Carinata)和芥菜(Juncea)两个物种各一半的基因组。植物基因组科学家对这种植物很感兴趣,尤其是新变异的来源,以及如何引入如抗虫性等理想性状。

“总体而言,纳米孔长读长测序为大型、较复杂植物基因组提供了可靠组装,且成功解析了包括着丝粒在内的重复区域,重要的结构变异可以通过纳米孔测序轻易获得。” ——Andrew Sharpe博士

长读长序列在重复元件的组装结果优于短读长组装

几年前,全球粮食安全研究所(Global Institute of Food Security)的Andrew博士及团队和加拿大农业于农业食品部(Agriculture and Agri-Food Canada)进行合作,用短读长测序技术生成了黑芥Ni100的基因组组装并识别到基因组上的表达基因、重复元件及CG、CHG、CHH三种甲基化修饰。

在纳米孔测序技术出现后,研究小组利用黑芥基因型(C115125)对纳米孔MinION测序仪进行了测试。他们在13次测序运行后,生成了约40-50x覆盖深度的高质量数据。利用SMART denovo组装软件进行组装,Canu软件矫正,最后生成基因组大小为536 Mb,Contig N50为289 kb,结合短读长染色质构象捕捉数据(Pilon矫正),Scaffold N50为44.6 Mb。通过Circos图(图1)对长读长组装和短读长组装进行比较后,显示长读长序列在重复元件的组装结果优于短读长序列组装。
 

图1 (左) Brassica nigra(C115125)短读长和长读长组装比较,右侧为短读长8条染色体组装;(右)其中B6染色体的短读长和长读长组装比较;绿色显示为重复元件。

基因组覆盖度和组装连续性更好,解析困难组装区域

“与短读长组装比较,纳米孔长读长组装得到的黑芥基因组可以更好地呈现全基因组,包括重复区域和对作物性状很重要的结构变异。”——Andrew Sharpe博士

Andrew和团队曾在几年前用短读长测序技术生成过一个黑芥(Brassica nigra)基因组(Ni100基因型)组装,获得的基因组大小为447Mb,跨越基因组的78%,Contig N50为30.2kb,而Scaffold N50仅仅为1.28Mb。为了进一步比较长读长和短读长序列组装,团队使用相同的基因组,利用上述方法生成了黑芥Ni100基因型的纳米孔长读长全基因组组装。

结果显示,纳米孔长读长测序更好地呈现了全基因组概况,包括重复区域和对作物性状很重要的结构变异(SV)。基因组覆盖度较短读长组装更好(88% vs. 78%),且反映出更多数量的高置信度基因(长读长组装57.8k vs 55.1k短读长组装),其中还发现了在B6染色体中短读长组装中存在的错误。


图2

长读长在组装的连续性方面也呈现出优势,解析短读长序列难以组装的重复区域和重排事件。以黑芥Ni100长读长基因组为例,短读长Contig N50仅为48 Kb,研究团队最近获得的纳米孔测序Contig N50 17.1Mb。值得注意的是,在另一个早先获得的黑芥C115125长读长基因组的Contig N50 为288,这也侧面体现出了纳米孔技术的改进和升级。 

与其他一系列测序技术生成的芸薹属和其他作物的组装相比,黑芥Ni100基因组组装的Contig N50在这些组装里呈现最高。



图3 黑芥Ni100基因组组装(B. nigra Ni100)在图中右上角以红色方块显示。

纳米孔测序甲基化检测 vs. 短读长亚硫酸氢盐测序

纳米孔数据信号内免费识别甲基化,结果与短读长亚硫酸氢盐测序一致性良好

碱基修饰在基因表达和功能中具有重要作用。在传统短读长测序技术中,对核酸扩增的要求抹去了这些碱基修饰,这意味着如果没有额外耗时并且低效的样本处理方法,就无法检测到这些碱基修饰。纳米孔测序的优势之一是能够在原始数据中直接进行甲基化识别,无需扩增或链合成,或是严苛的化学方式处理,能够在同一次测序运行中同时检测核苷酸序列及碱基修饰。

Andrew的团队对整个黑芥基因组Ni100及其重复区域进行了CpG位点的甲基化研究,并将纳米孔测序甲基化检测与短读长亚硫酸氢盐测序结果相比较,显示二者具有很好的相关性(图3)。有意思的是,他们还在有代表性的活性着丝粒处发现了甲基化下降,以及一类只与着丝粒相关特殊的重复序列(LTR- ALE),通过研究这些重复元件的结构可以彻底表征并追溯重复元件和嵌套事件(图4)。



图4



图5

使用纳米孔测序数据检测出可能影响作物性状的结构变异

结构变异是影响作物性状的关键。利用纳米孔长读长测序,Andrew的团队对两个黑芥基因组中的缺失、插入、倒位、复制、易位等结构变异事件进行了研究,目的了解他们的遗传关联性,找出可能影响性状的结构变异。

在他们所鉴定出的基因组事件中,包含了与基因区相关的结构变异,明确显示出它们可能会影响编码区域,从而影响农作物的性状。如图5中所示,Ni100基因组中鉴定出一段1102 bp的复制,以及C115基因组中一段741 bp的缺失。

 


图6

其他芸薹属基因组组装

Andrew和同事与Kirstin Bett实验室(萨斯喀彻温大学)合作,对栽培扁豆和兵豆进行纳米孔长读长测序组装,生成的Scaffold N50分别为482 Mb和396 Mb,每个组装分别有92.8%和96.1%被锚定在7个人工分子上。将这两个组装与苜蓿的组装进行比较发现的一些相似性和结构上的差异。与Curtis Pozniak实验室(萨斯喀彻温大学)合作组装大麦(Hordeum vulgare)的Marex品种,与现有的短读长Scaffold组装有很好的相关性。



图7

*资料来源:Andrew Sharpe演讲视频,扫描下方二维码报名观看本视频:



 

*Nanopore产品目前仅供研究使用

 

Copyright © 2018 Wuhan Benagen Technology Co., Ltd . All Rights Reserved.

TEL

027-62435310

WhatsApp

WhatsApp