{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,2,7]],"date-time":"2026-02-07T18:13:14Z","timestamp":1770487994755,"version":"3.49.0"},"reference-count":40,"publisher":"Springer Science and Business Media LLC","issue":"1","funder":[{"name":"National Natural Science Foundation of China (CN)","award":["61771331"],"award-info":[{"award-number":["61771331"]}]}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["Algorithms Mol Biol"],"published-print":{"date-parts":[[2017,12]]},"DOI":"10.1186\/s13015-017-0116-x","type":"journal-article","created":{"date-parts":[[2017,9,29]],"date-time":"2017-09-29T19:23:10Z","timestamp":1506712990000},"update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":33,"title":["HAlign-II: efficient ultra-large multiple sequence alignment and phylogenetic tree reconstruction with distributed and parallel computing"],"prefix":"10.1186","volume":"12","author":[{"given":"Shixiang","family":"Wan","sequence":"first","affiliation":[]},{"given":"Quan","family":"Zou","sequence":"additional","affiliation":[]}],"member":"297","published-online":{"date-parts":[[2017,9,29]]},"reference":[{"key":"116_CR1","doi-asserted-by":"crossref","first-page":"368","DOI":"10.1016\/j.sbi.2006.04.004","volume":"16","author":"RC Edgar","year":"2006","unstructured":"Edgar RC, Batzoglou S. Multiple sequence alignment. Curr Opin Struct Biol. 2006;16:368\u201373.","journal-title":"Curr Opin Struct Biol"},{"key":"116_CR2","doi-asserted-by":"crossref","first-page":"2304","DOI":"10.1038\/ncomms3304","volume":"4","author":"N Segata","year":"2013","unstructured":"Segata N, B\u00f6rnigen D, Morgan XC, Huttenhower C. PhyloPhlAn is a new method for improved phylogenetic and taxonomic placement of microbes. Nat Commun. 2013;4:2304.","journal-title":"Nat Commun"},{"key":"116_CR3","doi-asserted-by":"crossref","unstructured":"Zhao G, Ling C, Sun D. Sparksw: scalable distributed computing system for large-scale biological sequence alignment. In: 2015 15th IEEE\/ACM international symposium on, cluster, cloud and grid computing (CCGrid). 2015. p. 845\u201352.","DOI":"10.1109\/CCGrid.2015.55"},{"key":"116_CR4","doi-asserted-by":"crossref","first-page":"29","DOI":"10.1007\/s00791-008-0120-2","volume":"13","author":"J T\u00f6lke","year":"2010","unstructured":"T\u00f6lke J. Implementation of a Lattice Boltzmann kernel using the compute unified device architecture developed by nVIDIA. Comput Vis Sci. 2010;13:29.","journal-title":"Comput Vis Sci"},{"key":"116_CR5","doi-asserted-by":"crossref","first-page":"315","DOI":"10.1186\/s12859-017-1725-6","volume":"18","author":"C Xi","year":"2017","unstructured":"Xi C, Chen W, Tang S, Yu C, Quan Z. CMSA: a heterogeneous CPU\/GPU computing system for multiple similar RNA\/DNA sequence alignment. BMC Bioinform. 2017;18:315.","journal-title":"BMC Bioinform"},{"key":"116_CR6","doi-asserted-by":"crossref","unstructured":"Harish P, Narayanan P. Accelerating large graph algorithms on the GPU using CUDA. In: International conference on high-performance computing. 2007. p. 197\u2013208.","DOI":"10.1007\/978-3-540-77220-0_21"},{"key":"116_CR7","doi-asserted-by":"crossref","first-page":"1585","DOI":"10.1093\/bioinformatics\/btg192","volume":"19","author":"K-B Li","year":"2003","unstructured":"Li K-B. ClustalW-MPI: clustalW analysis using distributed and parallel computing. Bioinformatics. 2003;19:1585\u20136.","journal-title":"Bioinformatics"},{"key":"116_CR8","doi-asserted-by":"crossref","first-page":"876","DOI":"10.1093\/bioinformatics\/bts054","volume":"28","author":"M Niemenmaa","year":"2012","unstructured":"Niemenmaa M, Kallio A, Schumacher A, Klemel\u00e4 P, Korpelainen E, Heljanko K. Hadoop-BAM: directly manipulating next generation sequencing data in the cloud. Bioinformatics. 2012;28:876\u20137.","journal-title":"Bioinformatics"},{"key":"116_CR9","doi-asserted-by":"crossref","first-page":"2475","DOI":"10.1093\/bioinformatics\/btv177","volume":"31","author":"Q Zou","year":"2015","unstructured":"Zou Q, Hu Q, Guo M, Wang G. HAlign: fast multiple similar DNA\/RNA sequence alignment based on the centre star strategy. Bioinformatics. 2015;31:2475\u201381.","journal-title":"Bioinformatics"},{"key":"116_CR10","doi-asserted-by":"crossref","unstructured":"Zou Q, Zeng X. HPTree: reconstructing phylogenetic trees for ultra-large unaligned DNA sequences via NJ model and Hadoop. In: 2016 IEEE international conference on bioinformatics and biomedicine (IEEE BIBM 2016). 2016. p. 53\u20138.","DOI":"10.1109\/BIBM.2016.7822492"},{"key":"116_CR11","doi-asserted-by":"crossref","first-page":"e98146","DOI":"10.1371\/journal.pone.0098146","volume":"9","author":"W-C Chung","year":"2014","unstructured":"Chung W-C, Chen C-C, Ho J-M, Lin C-Y, Hsu W-L, Wang Y-C, et al. CloudDOE: a user-friendly tool for deploying Hadoop clouds and analyzing high-throughput sequencing data with MapReduce. PLoS ONE. 2014;9:e98146.","journal-title":"PLoS ONE"},{"key":"116_CR12","doi-asserted-by":"crossref","first-page":"3014","DOI":"10.1093\/bioinformatics\/btt528","volume":"29","author":"H Nordberg","year":"2013","unstructured":"Nordberg H, Bhatia K, Wang K, Wang Z. BioPig: a Hadoop-based analytic toolkit for large-scale sequence data. Bioinformatics. 2013;29:3014\u20139.","journal-title":"Bioinformatics"},{"key":"116_CR13","doi-asserted-by":"crossref","first-page":"119","DOI":"10.1093\/bioinformatics\/btt601","volume":"30","author":"A Schumacher","year":"2014","unstructured":"Schumacher A, Pireddu L, Niemenmaa M, Kallio A, Korpelainen E, Zanetti G, et al. SeqPig: simple and scalable scripting for large sequencing data sets in Hadoop. Bioinformatics. 2014;30:119\u201320.","journal-title":"Bioinformatics"},{"key":"116_CR14","doi-asserted-by":"crossref","first-page":"789","DOI":"10.1016\/0167-8191(96)00024-5","volume":"22","author":"W Gropp","year":"1996","unstructured":"Gropp W, Lusk E, Doss N, Skjellum A. A high-performance, portable implementation of the MPI message passing interface standard. Parallel Comput. 1996;22:789\u2013828.","journal-title":"Parallel Comput"},{"key":"116_CR15","doi-asserted-by":"crossref","first-page":"S1","DOI":"10.1186\/1471-2105-11-S12-S1","volume":"11","author":"RC Taylor","year":"2010","unstructured":"Taylor RC. An overview of the Hadoop\/MapReduce\/HBase framework and its current applications in bioinformatics. BMC Bioinform. 2010;11:S1.","journal-title":"BMC Bioinform"},{"key":"116_CR16","doi-asserted-by":"crossref","first-page":"1193","DOI":"10.1093\/bioinformatics\/bth055","volume":"20","author":"J Ebedes","year":"2004","unstructured":"Ebedes J, Datta A. Multiple sequence alignment in parallel on a workstation cluster. Bioinformatics. 2004;20:1193\u20135.","journal-title":"Bioinformatics"},{"key":"116_CR17","unstructured":"Moritz P, Nishihara R, Stoica I, Jordan MI. Sparknet: training deep networks in spark. 2015. arXiv preprint arXiv:1511.06051 ."},{"key":"116_CR18","doi-asserted-by":"crossref","unstructured":"Vavilapalli VK, Murthy AC, Douglas C, Agarwal S, Konar M, Evans R, et al. Apache hadoop yarn: Yet another resource negotiator. In: Proceedings of the 4th annual symposium on cloud computing. 2013. p. 5.","DOI":"10.1145\/2523616.2523633"},{"key":"116_CR19","unstructured":"Zaharia M, Chowdhury M, Das T, Dave A, Ma J, McCauley M, et al. Resilient distributed datasets: A fault-tolerant abstraction for in-memory cluster computing. In: Proceedings of the 9th USENIX conference on networked systems design and implementation. 2012. p. 2."},{"key":"116_CR20","doi-asserted-by":"crossref","unstructured":"Gupta S, Dutt N, Gupta R, Nicolau A. SPARK: A high-level synthesis framework for applying parallelizing compiler transformations. In: Proceedings 16th international conference on VLSI design, 2003. 2003. p. 461\u20136.","DOI":"10.1109\/ICVD.2003.1183177"},{"key":"116_CR21","doi-asserted-by":"crossref","first-page":"2652","DOI":"10.1093\/bioinformatics\/btu343","volume":"30","author":"MS Wiewi\u00f3rka","year":"2014","unstructured":"Wiewi\u00f3rka MS, Messina A, Pacholewska A, Maffioletti S, Gawrysiak P, Okoniewski MJ. SparkSeq: fast, scalable, cloud-ready tool for the interactive genomic data analysis with nucleotide precision. Bioinformatics. 2014;30:2652\u20133.","journal-title":"Bioinformatics"},{"key":"116_CR22","doi-asserted-by":"crossref","first-page":"195","DOI":"10.1016\/0022-2836(81)90087-5","volume":"147","author":"TF Smith","year":"1981","unstructured":"Smith TF, Waterman MS. Identification of common molecular subsequences. J Mol Biol. 1981;147:195\u20137.","journal-title":"J Mol Biol"},{"key":"116_CR23","first-page":"406","volume":"4","author":"N Saitou","year":"1987","unstructured":"Saitou N, Nei M. The neighbor-joining method: a new method for reconstructing phylogenetic trees. Mol Biol Evol. 1987;4:406\u201325.","journal-title":"Mol Biol Evol"},{"key":"116_CR24","doi-asserted-by":"crossref","unstructured":"Shanahan JG, Dai L. Large scale distributed data science using apache spark. In: Proceedings of the 21th ACM SIGKDD international conference on knowledge discovery and data mining, 2015. p. 2323\u20134.","DOI":"10.1145\/2783258.2789993"},{"key":"116_CR25","doi-asserted-by":"crossref","first-page":"656","DOI":"10.1101\/gr.229202","volume":"12","author":"WJ Kent","year":"2002","unstructured":"Kent WJ. BLAT\u2014the BLAST-like alignment tool. Genome Res. 2002;12:656\u201364.","journal-title":"Genome Res"},{"key":"116_CR26","doi-asserted-by":"crossref","first-page":"e41","DOI":"10.1093\/nar\/gkr1246","volume":"40","author":"A Ahmadi","year":"2012","unstructured":"Ahmadi A, Behm A, Honnalli N, Li C, Weng L, Xie X. Hobbes: optimized gram-based methods for efficient read alignment. Nucleic Acids Res. 2012;40:e41.","journal-title":"Nucleic Acids Res"},{"key":"116_CR27","doi-asserted-by":"crossref","first-page":"2321","DOI":"10.1093\/bioinformatics\/btq414","volume":"26","author":"J Wang","year":"2010","unstructured":"Wang J, Cetindil I, Ji S, Li C, Xie X, Li G, et al. Interactive and fuzzy search: a dynamic way to explore MEDLINE. Bioinformatics. 2010;26:2321\u20137.","journal-title":"Bioinformatics"},{"key":"116_CR28","doi-asserted-by":"crossref","first-page":"127","DOI":"10.1002\/prot.20527","volume":"61","author":"JD Thompson","year":"2005","unstructured":"Thompson JD, Koehl P, Ripp R, Poch O. BAliBASE 3.0: latest developments of the multiple sequence alignment benchmark. Proteins Struct Funct Bioinform. 2005;61:127\u201336.","journal-title":"Proteins Struct Funct Bioinform"},{"key":"116_CR29","doi-asserted-by":"crossref","first-page":"1832","DOI":"10.1101\/gr.2286304","volume":"14","author":"M Tanaka","year":"2004","unstructured":"Tanaka M, Cabrera VM, Gonz\u00e1lez AM, Larruga JM, Takeyasu T, Fuku N, et al. Mitochondrial genome variation in eastern Asia and the peopling of Japan. Genome Res. 2004;14:1832\u201350.","journal-title":"Genome Res"},{"key":"116_CR30","doi-asserted-by":"crossref","first-page":"713","DOI":"10.1093\/bioinformatics\/17.8.713","volume":"17","author":"K Karplus","year":"2001","unstructured":"Karplus K, Hu B. Evaluation of protein multiple alignments by SAM-T99 using the BAliBASE multiple alignment test set. Bioinformatics. 2001;17:713\u201320.","journal-title":"Bioinformatics"},{"key":"116_CR31","doi-asserted-by":"crossref","first-page":"298","DOI":"10.1186\/1471-2105-6-298","volume":"6","author":"T Lassmann","year":"2005","unstructured":"Lassmann T, Sonnhammer EL. Kalign\u2014an accurate and fast multiple sequence alignment algorithm. BMC Bioinform. 2005;6:298.","journal-title":"BMC Bioinform"},{"key":"116_CR32","doi-asserted-by":"crossref","first-page":"592","DOI":"10.1093\/bioinformatics\/btq706","volume":"27","author":"KP Schliep","year":"2011","unstructured":"Schliep KP. Phangorn: phylogenetic analysis in R. Bioinformatics. 2011;27:592\u20133.","journal-title":"Bioinformatics"},{"key":"116_CR33","doi-asserted-by":"crossref","first-page":"1312","DOI":"10.1093\/bioinformatics\/btu033","volume":"30","author":"A Stamatakis","year":"2014","unstructured":"Stamatakis A. RAxML version 8: a tool for phylogenetic analysis and post-analysis of large phylogenies. Bioinformatics. 2014;30:1312\u20133.","journal-title":"Bioinformatics"},{"key":"116_CR34","doi-asserted-by":"crossref","first-page":"521","DOI":"10.1093\/protein\/gzm042","volume":"20","author":"A Trovato","year":"2007","unstructured":"Trovato A, Seno F, Tosatto SCE. The PASTA server for protein aggregation prediction. Protein Eng Des Sel. 2007;20:521\u20133.","journal-title":"Protein Eng Des Sel"},{"key":"116_CR35","doi-asserted-by":"crossref","first-page":"763","DOI":"10.1111\/j.1558-5646.2011.01476.x","volume":"66","author":"Y Wu","year":"2012","unstructured":"Wu Y. Coalescent-based species tree inference from gene tree topologies under incomplete lineage sorting by maximum likelihood. Evolution. 2012;66:763\u201375.","journal-title":"Evolution"},{"key":"116_CR36","doi-asserted-by":"crossref","first-page":"1429","DOI":"10.1038\/msb.2011.75","volume":"7","author":"F Sievers","year":"2011","unstructured":"Sievers F, Wilm A, Dineen D, Gibson TJ, Karplus K, Li W, et al. Fast, scalable generation of high-quality protein multiple sequence alignments using Clustal Omega. Mol Syst Biol. 2011;7:1429\u201332.","journal-title":"Mol Syst Biol"},{"key":"116_CR37","doi-asserted-by":"crossref","first-page":"1792","DOI":"10.1093\/nar\/gkh340","volume":"32","author":"RC Edgar","year":"2004","unstructured":"Edgar RC. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Res. 2004;32:1792\u20137.","journal-title":"Nucleic Acids Res"},{"key":"116_CR38","doi-asserted-by":"crossref","first-page":"3059","DOI":"10.1093\/nar\/gkf436","volume":"30","author":"K Katoh","year":"2002","unstructured":"Katoh K, Misawa K, Kuma KI, Miyata T. MAFFT: a novel method for rapid multiple sequence alignment based on fast Fourier transform. Nucleic Acids Res. 2002;30:3059\u201366.","journal-title":"Nucleic Acids Res"},{"key":"116_CR39","doi-asserted-by":"crossref","first-page":"268","DOI":"10.1093\/molbev\/msu300","volume":"32","author":"L-T Nguyen","year":"2015","unstructured":"Nguyen L-T, Schmidt HA, von Haeseler A, Minh BQ. IQ-TREE: a fast and effective stochastic algorithm for estimating maximum-likelihood phylogenies. Mol Biol Evol. 2015;32:268\u201374.","journal-title":"Mol Biol Evol"},{"key":"116_CR40","doi-asserted-by":"crossref","first-page":"1870","DOI":"10.1093\/molbev\/msw054","volume":"33","author":"S Kumar","year":"2016","unstructured":"Kumar S, Stecher G, Tamura K. MEGA7: molecular evolutionary genetics analysis version 7.0 for bigger datasets. Mol Biol Evol. 2016;33:1870\u20134.","journal-title":"Mol Biol Evol"}],"container-title":["Algorithms for Molecular Biology"],"original-title":[],"language":"en","link":[{"URL":"http:\/\/link.springer.com\/content\/pdf\/10.1186\/s13015-017-0116-x.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2019,10,4]],"date-time":"2019-10-04T03:31:30Z","timestamp":1570159890000},"score":1,"resource":{"primary":{"URL":"http:\/\/almob.biomedcentral.com\/articles\/10.1186\/s13015-017-0116-x"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2017,9,29]]},"references-count":40,"journal-issue":{"issue":"1","published-print":{"date-parts":[[2017,12]]}},"alternative-id":["116"],"URL":"https:\/\/doi.org\/10.1186\/s13015-017-0116-x","relation":{},"ISSN":["1748-7188"],"issn-type":[{"value":"1748-7188","type":"electronic"}],"subject":[],"published":{"date-parts":[[2017,9,29]]},"article-number":"25"}}