zoukankan      html  css  js  c++  java
  • 「基因组组装」三代组装多少深度比较合适

    「基因组组装」三代组装多少深度比较合适

     
    文章

    一句话总结,组装深度建议高于30X,N50建议高于11Kb,否则会出现严重的片段化。

    最初参加三代组装培训的时候,课程老师建议Canu使用所有数据进行组装会比较好。因为我组装基因组比较小,计算成本低,所以大部分的时候我都是用100X左右的数据进行纠错加组装。但是最近组装的时候,却发现如果我使用所有数据,最后结果会有更多的错误组装。这种错误可以用一个成语进行概括,“三人成虎”,也就是原本不应该连接的两个contig,如果有一个错误的read提示这两个contig有可能连接,或许我们还不相信,但是如果出现了4条(但是原来的阈值还是2),那么你就会认为这两个地方应该连在一起。

    最近区树俊博士发表在Nature Communication上文章从PacBio测序的深度和长度出发,测试了Canu、Falcon等软件的组装表现。

     
    统计表

    我比较关注是不同深度下的组装大小,从附录的表2里,我们不难发现,深度的增加会提高contig的总长度,例如Falcon从35X提高到44X之后,基因组增加了0.02G,也就是20M。

     
  • 相关阅读:
    Python 连接SQLite数据库 及基础操作
    删除爬取字符串中的特殊字符
    网页爬虫中xa0、u3000等字符的解释及去除
    File 文件操作及模式说明
    【re】模块运用,正则匹配操作 待编辑
    MySQL
    正则表达式的常用操作符
    pip操作
    Python 常见运算
    Python32 1.半连接数 2.粘包问题解决
  • 原文地址:https://www.cnblogs.com/wangprince2017/p/13821121.html
Copyright © 2011-2022 走看看