{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,11,11]],"date-time":"2025-11-11T22:23:12Z","timestamp":1762899792424,"version":"3.37.3"},"reference-count":27,"publisher":"Oxford University Press (OUP)","issue":"3","license":[{"start":{"date-parts":[[2019,8,10]],"date-time":"2019-08-10T00:00:00Z","timestamp":1565395200000},"content-version":"vor","delay-in-days":0,"URL":"http:\/\/creativecommons.org\/licenses\/by\/4.0\/"}],"funder":[{"name":"Swedish Cancer Fonden, the Swedish Research Council"},{"name":"Swedish Foundation for Strategic Research"},{"DOI":"10.13039\/501100004543","name":"China Scholarship Council","doi-asserted-by":"crossref","id":[{"id":"10.13039\/501100004543","id-type":"DOI","asserted-by":"crossref"}]}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2020,2,1]]},"abstract":"<jats:title>Abstract<\/jats:title>\n               <jats:sec>\n                  <jats:title>Motivation<\/jats:title>\n                  <jats:p>Estimation of isoform-level gene expression from RNA-seq data depends on simplifying assumptions, such as uniform read distribution, that are easily violated in real data. Such violations typically lead to biased estimates. Most existing methods provide bias correction step(s), which is based on biological considerations\u2014such as GC content\u2014and applied in single samples separately. The main problem is that not all biases are known.<\/jats:p>\n               <\/jats:sec>\n               <jats:sec>\n                  <jats:title>Results<\/jats:title>\n                  <jats:p>We have developed a novel method called XAEM based on a more flexible and robust statistical model. Existing methods are essentially based on a linear model X\u03b2, where the design matrix X is known and is computed based on the simplifying assumptions. In contrast XAEM considers X\u03b2 as a bilinear model with both X and \u03b2 unknown. Joint estimation of X and \u03b2 is made possible by a simultaneous analysis of multi-sample RNA-seq data. Compared to existing methods, XAEM automatically performs empirical correction of potentially unknown biases. We use an alternating expectation-maximization (AEM) algorithm, alternating between estimation of X and \u03b2. For speed XAEM utilizes quasi-mapping for read alignment, thus leading to a fast algorithm. Overall XAEM performs favorably compared to recent advanced methods. For simulated datasets, XAEM obtains higher accuracy for multiple-isoform genes. In a differential-expression analysis of a real single-cell RNA-seq dataset, XAEM achieves substantially better rediscovery rates in independent validation sets.<\/jats:p>\n               <\/jats:sec>\n               <jats:sec>\n                  <jats:title>Availability and implementation<\/jats:title>\n                  <jats:p>The method and pipeline are implemented as a tool and freely available for use at http:\/\/fafner.meb.ki.se\/biostatwiki\/xaem\/.<\/jats:p>\n               <\/jats:sec>\n               <jats:sec>\n                  <jats:title>Supplementary information<\/jats:title>\n                  <jats:p>Supplementary data are available at Bioinformatics online.<\/jats:p>\n               <\/jats:sec>","DOI":"10.1093\/bioinformatics\/btz640","type":"journal-article","created":{"date-parts":[[2019,8,9]],"date-time":"2019-08-09T19:15:39Z","timestamp":1565378139000},"page":"805-812","source":"Crossref","is-referenced-by-count":13,"title":["Alternating EM algorithm for a bilinear model in isoform quantification from RNA-seq data"],"prefix":"10.1093","volume":"36","author":[{"given":"Wenjiang","family":"Deng","sequence":"first","affiliation":[{"name":"Department of Medical Epidemiology and Biostatistics , Karolinska Institutet, Stockholm 17177, Sweden"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Tian","family":"Mou","sequence":"additional","affiliation":[{"name":"Department of Medical Epidemiology and Biostatistics , Karolinska Institutet, Stockholm 17177, Sweden"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Krishna R","family":"Kalari","sequence":"additional","affiliation":[{"name":"Department of Health Sciences Research , MN 55905, USA"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Nifang","family":"Niu","sequence":"additional","affiliation":[{"name":"Department of Molecular Pharmacology and Experimental Therapeutics , Mayo Clinic, Rochester, MN 55905, USA"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Liewei","family":"Wang","sequence":"additional","affiliation":[{"name":"Department of Molecular Pharmacology and Experimental Therapeutics , Mayo Clinic, Rochester, MN 55905, USA"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Yudi","family":"Pawitan","sequence":"additional","affiliation":[{"name":"Department of Medical Epidemiology and Biostatistics , Karolinska Institutet, Stockholm 17177, Sweden"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Trung Nghia","family":"Vu","sequence":"additional","affiliation":[{"name":"Department of Medical Epidemiology and Biostatistics , Karolinska Institutet, Stockholm 17177, Sweden"}],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"286","published-online":{"date-parts":[[2019,8,10]]},"reference":[{"key":"2023013110023362400_btz640-B1","doi-asserted-by":"crossref","first-page":"525.","DOI":"10.1038\/nbt.3519","article-title":"Near-optimal probabilistic RNA-seq quantification","volume":"34","author":"Bray","year":"2016","journal-title":"Nat. Biotechnol"},{"key":"2023013110023362400_btz640-B2","doi-asserted-by":"crossref","first-page":"230.","DOI":"10.1038\/nature06734","article-title":"The m2 splice isoform of pyruvate kinase is important for cancer metabolism and tumour growth","volume":"452","author":"Christofk","year":"2008","journal-title":"Nature"},{"key":"2023013110023362400_btz640-B3","doi-asserted-by":"crossref","first-page":"15","DOI":"10.1093\/bioinformatics\/bts635","article-title":"Star: ultrafast universal RNA-seq aligner","volume":"29","author":"Dobin","year":"2013","journal-title":"Bioinformatics"},{"key":"2023013110023362400_btz640-B4","doi-asserted-by":"crossref","first-page":"2778","DOI":"10.1093\/bioinformatics\/btv272","article-title":"Polyester: simulating RNA-seq datasets with differential transcript expression","volume":"31","author":"Frazee","year":"2015","journal-title":"Bioinformatics"},{"key":"2023013110023362400_btz640-B5","doi-asserted-by":"crossref","first-page":"563","DOI":"10.1093\/bib\/bbu033","article-title":"Rediscovery rate estimation for assessing the validation of significant findings in high-throughput studies","volume":"16","author":"Ganna","year":"2015","journal-title":"Brief. Bioinf"},{"key":"2023013110023362400_btz640-B6","doi-asserted-by":"crossref","first-page":"1026","DOI":"10.1093\/bioinformatics\/btp113","article-title":"Statistical inferences for isoform expression in RNA-seq","volume":"25","author":"Jiang","year":"2009","journal-title":"Bioinformatics"},{"key":"2023013110023362400_btz640-B7","doi-asserted-by":"crossref","first-page":"357.","DOI":"10.1038\/nmeth.3317","article-title":"Hisat: a fast spliced aligner with low memory requirements","volume":"12","author":"Kim","year":"2015","journal-title":"Nat. Methods"},{"key":"2023013110023362400_btz640-B8","doi-asserted-by":"crossref","first-page":"580.","DOI":"10.1038\/ng.2653","article-title":"The genotype-tissue expression (GTEx) project","volume":"45","author":"Lonsdale","year":"2013","journal-title":"Nat. Genet"},{"key":"2023013110023362400_btz640-B9","doi-asserted-by":"crossref","first-page":"621","DOI":"10.1038\/nmeth.1226","article-title":"Mapping and quantifying mammalian transcriptomes by RNA-seq","volume":"5","author":"Mortazavi","year":"2008","journal-title":"Nat. Methods"},{"key":"2023013110023362400_btz640-B10","doi-asserted-by":"crossref","first-page":"35.","DOI":"10.1186\/1471-2105-11-35","article-title":"Hybridization thermodynamics of nimblegen microarrays","volume":"11","author":"Mueckstein","year":"2010","journal-title":"BMC Bioinformatics"},{"key":"2023013110023362400_btz640-B11","doi-asserted-by":"crossref","first-page":"2292","DOI":"10.1093\/bioinformatics\/btt381","article-title":"Tigar: transcript isoform abundance estimation method with gapped alignment of RNA-seq data by variational Bayesian inference","volume":"29","author":"Nariai","year":"2013","journal-title":"Bioinformatics"},{"key":"2023013110023362400_btz640-B12","doi-asserted-by":"crossref","first-page":"462.","DOI":"10.1038\/nbt.2862","article-title":"Sailfish enables alignment-free isoform quantification from RNA-seq reads using lightweight algorithms","volume":"32","author":"Patro","year":"2014","journal-title":"Nat. Biotechnol"},{"key":"2023013110023362400_btz640-B13","doi-asserted-by":"crossref","first-page":"417.","DOI":"10.1038\/nmeth.4197","article-title":"Salmon provides fast and bias-aware quantification of transcript expression","volume":"14","author":"Patro","year":"2017","journal-title":"Nat. Methods"},{"key":"2023013110023362400_btz640-B14","doi-asserted-by":"crossref","first-page":"R22.","DOI":"10.1186\/gb-2011-12-3-r22","article-title":"Improving RNA-seq expression estimates by correcting for fragment bias","volume":"12","author":"Roberts","year":"2011","journal-title":"Genome Biol"},{"key":"2023013110023362400_btz640-B15","doi-asserted-by":"crossref","first-page":"i192","DOI":"10.1093\/bioinformatics\/btw277","article-title":"Rapmap: a rapid, sensitive and accurate tool for mapping RNA-seq reads to transcriptomes","volume":"32","author":"Srivastava","year":"2016","journal-title":"Bioinformatics"},{"key":"2023013110023362400_btz640-B16","doi-asserted-by":"crossref","first-page":"1341","DOI":"10.1152\/physrev.00034.2007","article-title":"Structural basis of protein kinase c isoform function","volume":"88","author":"Steinberg","year":"2008","journal-title":"Physiol. Rev"},{"key":"2023013110023362400_btz640-B17","doi-asserted-by":"crossref","first-page":"903","DOI":"10.1038\/nbt.2957","article-title":"A comprehensive assessment of RNA-seq accuracy, reproducibility and information content by the sequencing quality control consortium","volume":"32","author":"Su","year":"2014","journal-title":"Nat. Biotechnol"},{"key":"2023013110023362400_btz640-B18","doi-asserted-by":"crossref","first-page":"506","DOI":"10.1093\/bioinformatics\/btt704","article-title":"Joint estimation of isoform expression and isoform-specific read distribution using multisample RNA-seq data","volume":"30","author":"Suo","year":"2014","journal-title":"Bioinformatics"},{"key":"2023013110023362400_btz640-B19","doi-asserted-by":"crossref","first-page":"1105","DOI":"10.1093\/bioinformatics\/btp120","article-title":"Tophat: discovering splice junctions with RNA-seq","volume":"25","author":"Trapnell","year":"2009","journal-title":"Bioinformatics"},{"key":"2023013110023362400_btz640-B20","doi-asserted-by":"crossref","first-page":"511.","DOI":"10.1038\/nbt.1621","article-title":"Transcript assembly and quantification by RNA-seq reveals unannotated transcripts and isoform switching during cell differentiation","volume":"28","author":"Trapnell","year":"2010","journal-title":"Nat. Biotechnol"},{"key":"2023013110023362400_btz640-B21","doi-asserted-by":"crossref","first-page":"562","DOI":"10.1038\/nprot.2012.016","article-title":"Differential gene and transcript expression analysis of RNA-seq experiments with TopHat and cufflinks","volume":"7","author":"Trapnell","year":"2012","journal-title":"Nat. Protoc"},{"key":"2023013110023362400_btz640-B22","doi-asserted-by":"crossref","first-page":"335","DOI":"10.1111\/j.1467-9469.2007.00585.x","article-title":"Simple and globally convergent methods for accelerating the convergence of any EM algorithm","volume":"35","author":"Varadhan","year":"2008","journal-title":"Scand. J. Stat"},{"key":"2023013110023362400_btz640-B23","doi-asserted-by":"crossref","first-page":"2128","DOI":"10.1093\/bioinformatics\/btw202","article-title":"Beta-Poisson model for single-cell RNA-seq data analyses","volume":"32","author":"Vu","year":"2016","journal-title":"Bioinformatics"},{"key":"2023013110023362400_btz640-B24","doi-asserted-by":"crossref","first-page":"1113.","DOI":"10.1038\/ng.2764","article-title":"The cancer genome atlas pan-cancer analysis project","volume":"45","author":"Weinstein","year":"2013","journal-title":"Nat. Genet"},{"key":"2023013110023362400_btz640-B25","doi-asserted-by":"crossref","first-page":"41","DOI":"10.1038\/nmeth.2694","article-title":"Quantitative assessment of single-cell RNA-sequencing methods","volume":"11","author":"Wu","year":"2014","journal-title":"Nat. Methods"},{"key":"2023013110023362400_btz640-B26","doi-asserted-by":"crossref","first-page":"583.","DOI":"10.1186\/s12864-017-4002-1","article-title":"Evaluation and comparison of computational tools for RNA-seq isoform quantification","volume":"18","author":"Zhang","year":"2017","journal-title":"BMC Genomics"},{"key":"2023013110023362400_btz640-B27","doi-asserted-by":"crossref","first-page":"203","DOI":"10.1089\/10665270050081478","article-title":"A greedy algorithm for aligning DNA sequences","volume":"7","author":"Zhang","year":"2000","journal-title":"J. Comput. Biol"}],"container-title":["Bioinformatics"],"original-title":[],"language":"en","link":[{"URL":"http:\/\/academic.oup.com\/bioinformatics\/advance-article-pdf\/doi\/10.1093\/bioinformatics\/btz640\/29603520\/btz640.pdf","content-type":"application\/pdf","content-version":"am","intended-application":"syndication"},{"URL":"https:\/\/academic.oup.com\/bioinformatics\/article-pdf\/36\/3\/805\/48982186\/bioinformatics_36_3_805.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"syndication"},{"URL":"https:\/\/academic.oup.com\/bioinformatics\/article-pdf\/36\/3\/805\/48982186\/bioinformatics_36_3_805.pdf","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2023,1,31]],"date-time":"2023-01-31T18:52:40Z","timestamp":1675191160000},"score":1,"resource":{"primary":{"URL":"https:\/\/academic.oup.com\/bioinformatics\/article\/36\/3\/805\/5545974"}},"subtitle":[],"editor":[{"given":"Bonnie","family":"Berger","sequence":"additional","affiliation":[],"role":[{"role":"editor","vocabulary":"crossref"}]}],"short-title":[],"issued":{"date-parts":[[2019,8,10]]},"references-count":27,"journal-issue":{"issue":"3","published-print":{"date-parts":[[2020,2,1]]}},"URL":"https:\/\/doi.org\/10.1093\/bioinformatics\/btz640","relation":{},"ISSN":["1367-4803","1367-4811"],"issn-type":[{"type":"print","value":"1367-4803"},{"type":"electronic","value":"1367-4811"}],"subject":[],"published-other":{"date-parts":[[2020,2,1]]},"published":{"date-parts":[[2019,8,10]]}}}