zoukankan      html  css  js  c++  java
  • 「基因组组装」三代组装多少深度比较合适

    「基因组组装」三代组装多少深度比较合适

     
    文章

    一句话总结,组装深度建议高于30X,N50建议高于11Kb,否则会出现严重的片段化。

    最初参加三代组装培训的时候,课程老师建议Canu使用所有数据进行组装会比较好。因为我组装基因组比较小,计算成本低,所以大部分的时候我都是用100X左右的数据进行纠错加组装。但是最近组装的时候,却发现如果我使用所有数据,最后结果会有更多的错误组装。这种错误可以用一个成语进行概括,“三人成虎”,也就是原本不应该连接的两个contig,如果有一个错误的read提示这两个contig有可能连接,或许我们还不相信,但是如果出现了4条(但是原来的阈值还是2),那么你就会认为这两个地方应该连在一起。

    最近区树俊博士发表在Nature Communication上文章从PacBio测序的深度和长度出发,测试了Canu、Falcon等软件的组装表现。

     
    统计表

    我比较关注是不同深度下的组装大小,从附录的表2里,我们不难发现,深度的增加会提高contig的总长度,例如Falcon从35X提高到44X之后,基因组增加了0.02G,也就是20M。

     
  • 相关阅读:
    动态规划Dynamic Programming: Rod-Cutting Problem
    递归详解,全排列问题
    获取网站根目录Url
    oracle中操作表和权限
    mongo简单封装
    dapper的简单封装
    反射做字段更新日志
    nopcommerce +autofac +owin +webapi
    批处理命令执行程序
    MSMQ的简单使用
  • 原文地址:https://www.cnblogs.com/wangprince2017/p/13821121.html
Copyright © 2011-2022 走看看