English | 中文版 | 手机版 企业登录 | 个人登录 | 邮件订阅
当前位置 > 首页 > 技术文章 > “Range+T”模式,助力Pacbio HiFi测序高质量文库构建

“Range+T”模式,助力Pacbio HiFi测序高质量文库构建

浏览次数:763 发布日期:2023-6-29  来源:本站 仅供参考,谢绝转载,否则责任自负
Pippin 片段回收仪增加全新“Range+T”模式,助力Pacbio HiFi测序高质量文库构建
 
PacBio 独有的HiFi测序技术,可同时实现长读长和高准确性的DNA测序,在解析复杂的基因组区域、检测结构变异、揭示罕见变异和研究表观遗传学等多个领域有广泛应用。为了确保HiFi测序的产量和质量,需要将DNA文库大小控制在15-18kb范围内。因此,高精度的片段筛选是PacBio HiFi测序的关键步骤之一。Sage Science公司提供的Pippin系列全自动DNA片段回收仪--基于脉冲场电泳,可以实现上述需求,现已成为HiFi文库构建的金标准和建库必备工具之一。

为了获得更高质量的HiFi文库,Sage Science公司不断优化筛选方法,并于今年6月推出了全新的长片段回收模式“Range+T”。结合相对应的预制胶试剂盒,“Range+T”模式可有效提高9-30kb范围内片段筛选的分辨率,协助用户更精准的控制HiFi文库大小,实现片段读取长度和质量间的平衡,得到更好的基因组组装结果。

运用“Range+T”模式,只需设置回收范围起点DNA的bp值,以及回收时间(一般5-30min)即可,例如:15kb+10min。此模式的优点包括:(1)有效去除设置起点外的小片段DNA;(2)可以更精准的控制文库回收的上限;(3)可以更精准调整文库分布的宽度。近日,Sage Science公司携手亚利桑那大学基因组研究所,以植物基因组为样本,共同测试了“Range+T”模式对于增加PacBio HiFi文库平均读长的能力。由于植物基因组的复杂性更高(多倍体、重复序列、大小差异大等),因此更长的HiFi读取长度对植物基因组研究更重要。


“Range+T”片段筛选模式增加PacBio HiFi平均读长

研究成果:

1. 不同回收时间对回收得率和回收范围的影响

小麦基因组DNA经打断仪处理后,使用PippinHT回收目标片段。使用“Range+T”回收模式,不同样本的回收起点均设置为15kb,回收时间分别设置为13-30min。


图1“Range+T”模式回收的精确性

回收后检测结果显示,不同泳道回收起点的位置相同,回收的终点与设置的回收时间长短相关,设置30min的回收时间可以回收样品中更多的HWM DNA。

2. 小片段去除效果
图2“Range+T”模式小片段去除结果

如图2所示,SC28+29样品混合后(蓝色),PippinHT “Range+T”模式设置为13kb+30min进行片段回收,回收后样品有效去除回收起点以下的小片段DNA(红色),结果也在Pacbio测序结果中reads长度分布图(图2中测序结果图)得以体现。

3. 重复性测试
8个木薯样本的基因组DNA被打断成13-25kb(平均长度18kb),“Range+T”模式设置为13kb+30min进行片段回收,回收得率在33-45%之间,回收后平均片段长度在19-20kb之间,HiFi reads结果长度保持一致。


表1 “Range+T”模式重复性测试结果


图3 “Range+T”模式重复性测试Femto Pulse检测结果

4. 长片段回收能力
以3个玉米样本为例,基因组DNA打断成15-35kb片段(平均长度23-25kb)。“Range+T”模式回收起点分别设置在17kb-20kb,回收时间均为30min。结果表明DNA回收得率从17%到41%不等,可检测的最大片段长度约为50kb,提高回收起点会得到更大的片段分布,从而产生更长的平均HiFi read长度。


图4 “Range+T”模式长片段回收测试结果

5. 对测序质量影响
为了研究测序结果在产量、read质量和平均HiFi read长度之间得到更好的平衡,作者对比了PippinHT 之前软件版本9-13kb筛选模式的测序结果(图5中的蓝色符号)与最新“Range+T” 模式的测序结果(图5中的橙色符号)。使用“Range+T”模式,回收起点设置为15kb,其产生的reads平均长度在21-22kb以上,且30-40kb长度reads数量有显著提高。更重要的是,数据(图5a)表明在13kb至22kb的范围内,随着平均HiFi read长度的增加,HiFi测序数据产量几乎没有下降。由于PacBio测序中聚合酶读取长度有限,短的SMRTbell文库比长文库具有更高的QV分数,但此次实验中较长文库的最低平均QV分数仍然相当好,为28。88%的较长文库(橙色符号)的平均QV得分在30以上(图5.b-c)。
 
图5 不同设置HiFi测序产量及QV结果

为了更好地说明较长文库的质量结果,图6显示了一个平均subreads长度为22.6kb的玉米样本的reads质量分布,其中约40%的reads得分在Q30以上。


图6 玉米文库Read质量分布结果,平均长度为22.6kb

为了体现更长read对基因组组装的影响,作者组装了三个数据集。数据来自基于“Range+T”模式的PacBio-HiFi文库(表1的玉米样本)。文库的覆盖率为18×,平均HiFi read长度为20.6kb。生成了以下三个具有不同特征的数据集(表2):
  • “Small”数据集:从所有reads的3'端删除4000个bp。这使得reads保留了原始分布形状,但reads长度整体被缩短,平均长度为16kb。
  • “Long”数据集:将原始的20kb文库测序覆盖率调整为~14.5×,以匹配“Small”数据集的数据量。
  • “Narrow”数据集:所有最长reads被截断至约17kb,用以模拟窄分布的SMRTbell文库。为了与其他两个数据集相匹配,总体覆盖率也有所降低。

“Small”数据集代表PacBio文库制备的当前标准,而“Long”数据集结果证明了“Range+T”模式的优势。与其他数据集相比,“Long”数据集具有最低的contigs数量、最高的平均contigs长度和最高的Nx值(表2)。此外,开发“Narrow”数据集是为了研究更长read对改进组装效果的贡献。


表2 玉米M组装统计数据集

结论:
测试结果说明PippinHT最新的“Range+T”模式,可以更加灵活地选择PacBio HiFi文库的大小。“Range+T”模式具备较好的重复性,可以有效去除短片段,且使平均read长度超过当前标准。此外,新模式可以控制文库片段范围的上限,更长的文库并没有影响测序质量和产量。与较小的HiFi文库相比,更有助于大而复杂基因组的连续组装。
目前PippinHT “Range+T”模式的新版软件已经发布,Blue Pippin也将在近期发布,详细信息请联系:

▼环亚生物科技有限公司▼
地址:上海市闵行区友东路358号闵欣大厦1号楼701/703/705室
电话:021-54583565
邮箱:info@apgbio.com
网址:www.apgbio.com

Sage Science是全球领先的研发制造Pippin系列全自动核酸电泳片段回收仪的生产厂家,拥有美国技术专利,各个型号产品可以高效完成不同长度范围的DNA片段的精准回收,广泛用于二代测序、三代测序以及多种分子生物学相关领域。
环亚生物科技有限公司作为美国Sage Science公司在中国区的独家代理商,自2011年以来将Sage Science的产品线引入国内,一直为国内用户提供专业的全自动核酸片段回收系统的安装测试、应用培训,技术支持与售后维护工作,赢得客户的一致好评与信任。环亚生物科技有限公司将一如既往的支持越来越多的Sage Science用户。
来源:环亚生物科技有限公司
联系电话:021 54583565
E-mail:info@apgbio.com

用户名: 密码: 匿名 快速注册 忘记密码
评论只代表网友观点,不代表本站观点。 请输入验证码: 8795
Copyright(C) 1998-2025 生物器材网 电话:021-64166852;13621656896 E-mail:info@bio-equip.com