技术交流
扫描二维码
或添加“GeneGroup003”
获取更多更新资讯
商城订购
扫描二维码
或添加“基因商城(GeneMart)”
手机下单,快人一步
售后服务
扫描二维码
或添加“GeneGroup005”
获取更快速售后支持
重磅!高准确度长读长Iso-Seq实现对加州红杉的六倍体分型
加州红杉全长转录本测序
2020年,PacBio在PAG(动植物基因组会议)大会上展示的最新的HiFi技术,引发了广泛的关注,同时科学研究者对PacBio SMRT测序技术在超大基因组组装方面的表现有了更高的期待。于是就有了后来广为人知的两周时间组装完成加州红杉27G超大基因组的壮举。在此之后,Elizabeth Tseng进一步对加州红杉进行全长转录本测序,揭示了这个超大基因组的复杂可变剪切,实现了超大基因组的六倍体分型。
加州红杉,Sequoia sempervirens, 是地球上最高最古老的生物之一。它仅沿着太平洋沿岸的一小片土地生长,大部分在加利福尼亚州。树木高大宏伟,通常高达300英尺,基因组大小高达27G。
复杂的可变剪切 本次研究中,Iso-Seq文库构建和测序工作由美国特拉华大学DNA测序和基因分型中心完成,一共拿到530万全长转录本reads,比对到的转录本范围从50 bp到14.2 kb,平均长度为2.9 kb (Figure 1.)。虽然大多数基因座只有1-5个同工型,但许多位点显示出复杂的可变剪切模式,突出了全长转录本测序的功能(Figure 2a.)。 Figure 1. Mapped redwood Iso-Seq transcript length distribution and isoform complexity Iso-Seq数据一方面可以查看可变剪切的能力,另一方面可以直接根据序列预测ORF的能力。Figure 2b.中显示了一个非常有代表性的示例,基因PB.209显示了三个isoform,其中两个导致相同的ORF预测。BLASTN是针对“未知的mRNA”,但是当我使用预测的ORF进行BLASTP时,显示它与锌指蛋白的相似性高达50%。 Figure 2. Iso-Seq mapping example. (a) BLASTN hits a predicted DEAD-box ATP-dependent RNA helicase 20-like transcript. (b) Alternative splicing at a putative zinc finger locus resulted in predicted ORF changes. Iso-Seq可以实现六倍体分型?YES!!! Figure 3. 显示了将phase基因组与phase转录组结合的来进行六倍体分型的案例。该基因座有六个基因组单倍体,但其中两个仅在非编码区有差异,因此IsoPhase仅报告了5个等位基因。并不是所有的IsoPhase基因座都看起来很清晰,因为Iso-Seq群集旨在识别可变剪切(外显子)级别的差异。 Figure 3. IsoPhase showing 5 distinct alleles. (top track) genome haplotigs mapped back to the contig; (middle) Iso-Seq full-length reads grouped and colored by IsoPhase-inferred alleles; (bottom) Iso-Seq transcripts. Note that, while there are 6 genomic haplotigs, two alleles diverge only in SNPs in the non-coding region of this locus. 使用Iso-Seq评估基因组质量 为了寻找完全没有map到的基因或者缺失的基因,Liz T使用其自己开发的Cogent软件根据Iso-Seq转录本的k-mer相似性鉴定基因家族。确定基因家族之后,运行BLASTN来查看没有map或map不好的Iso-Seq基因家族是否在NR数据库有匹配。Figure 4.显示了一个Iso-Seq基因家族的例子,该家族包含两组转录本,间隔约300 kb。两组转录本均未完全map(soft-clipped at the end),并且对ATP依赖的解旋酶基因具有相同的BLASTN命中。基因组覆盖率显示该区域后半部分的覆盖率不均匀,表明存在潜在的组装问题。 Figure 4. Using Cogent to identify partially mapped Iso-Seq gene families that could identify genome assembly issues. (top) Mapped coverage and alignment of genomic HiFi reads, which were input to the Hifiasm assembly (bottom) Mapping of Iso-Seq transcripts. PacBio HiFi Reads HiFi Reads是PacBio测序平台推出的兼顾长读长和高准确度的测序技术。作为PacBio最新的数据类型,既兼顾读长(20kb的长度)又具有高准确度(大于99%准确率)的HiFi reads,不仅可以改善变异检测,减少组装时间,并能够识别复杂的基因组区域的细微差别,有助于增加基因组组装的连续性,准确性和完整性,可以实现多倍体基因分型,发现更多更完整的转录本,挖掘更多生物学信息。 Iso-Seq PacBio高准确度全长转录本测序Iso-Seq在RNA的相关研究方面,起到了重要的作用,具有不依赖于参考基因组,无需组装,直接反映了转录本亚型全貌的特点。Iso-Seq的数据可以多倍体物种进行分型分析,对于缺失的基因或者难以组装的基因可以通过Iso-Seq转录本进行组装,同时也可以对ORF进行预测。 短读长测序需要通过组装,来拼凑isoform之后再做进一步的生信分析及数据挖掘 PacBio HiFi reads 高准确度长读长Iso-Seq可以实现一条read即可覆盖完整的全长转录本isoform,避免组装过程中的错误及信息缺失 更多Iso-Seq资讯 参考: A Genome Fit for a Giant Sequencing the California Redwood Decoding A Coastal Giant: Full-Length Transcriptome of Sequoia sempervirens 红杉Iso-Seq数据发布地址如下,供各位科学研究者参考和使用:https : //downloads.pacbcloud.com/public/dataset/redwood2020/isoseq/ 为了更好的向您推送PacBio SMRT测序技术的最新进展,基因有限公司开辟了专门的企业微信账号,实时解读最新PacBio研究进展。 长按并识别二维码并添加联系人,您将了解到有关高准确度长读长测序技术的最新进展,以及我们即将举办的线上线下活动。 基因有限公司作为PacBio公司在中国区的独家代理商,自2011年以来将PacBio第三代单分子实时测序技术引入国内,一直为国内用户提供专业的三代测序系统的安装培训,技术支持,应用培训与售后维护工作,赢得客户的一致好评与信任。基因有限公司将一如既往的支持越来越多的PacBio用户。
欢迎关注我司“基因快讯”与“基因售后服务”官方微信
未经书面授权,所有页面内容、图片和设计不得以任何形式进行复制Copyright © 2025 genecompany,All Rights Reserved
武汉市东湖新技术开发区高新大道666号生物产业(九峰)创新基地B13栋3楼 电话:027-87166462