Genome Assembly using ABySS(ABySS组装软件进行序列拼接,从而得到对应
Genome Assembly using ABySS(ABySS组装软件进行序列拼接,从而得到对应

功能简介

分析模块,选定样品,选择对应的文库数据,利用ABySS组装软件进行序列拼接,从而得到对应样品的组装结果。


说明

ABySS组装,至少提供一个PE文库或SE文库。只提供SE文库,将会生成unitigs,至少提供一个PE文库,将会生成unitigs,contigs,scaffolds。

通常,绝大多数情况下,只需调整Kmer大小和构建scaffold的最少PE read pair数。如需进一步的参数设置,选择完整的参数设置。

组装结果统计信息, abyss-stats 中:

  1. E-size用于描述组装出来的基因是否能够完整的包含在一个scaffold或contig中,越大越好。文献参考:http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3290791/

  2. 其他指标含义,参考维基百科:https://en.wikipedia.org/wiki/N50,_L50,_and_related_statistics


分析模块引用了 abyss-1.9.0 软件(https://github.com/bcgsc/abyss)。

相关文献如下所示:

  1. Simpson, Jared T., et al. "ABySS: a parallel assembler for short read sequence data." Genome research 19.6 (2009): 1117-1123.

  2. Simpson, J. T., Wong, K., Jackman, S. D., Schein, J. E., Jones, S. J., & Birol, I. (2009). ABySS: a parallel assembler for short read sequence data. Genome research, 19(6), 1117-1123.

  3. Simpson, Jared T., Kim Wong, Shaun D. Jackman, Jacqueline E. Schein, Steven JM Jones, and Inan?? Birol. "ABySS: a parallel assembler for short read sequence data." Genome research 19, no. 6 (2009): 1117-1123.


ABySS整套分析流程如下所示:

/static/images/abyss/abyss.png