{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,7,21]],"date-time":"2026-07-21T12:22:00Z","timestamp":1784636520282,"version":"3.55.0"},"reference-count":62,"publisher":"Springer Science and Business Media LLC","issue":"1","license":[{"start":{"date-parts":[[2019,11,12]],"date-time":"2019-11-12T00:00:00Z","timestamp":1573516800000},"content-version":"tdm","delay-in-days":0,"URL":"http:\/\/creativecommons.org\/licenses\/by\/4.0\/"},{"start":{"date-parts":[[2019,11,12]],"date-time":"2019-11-12T00:00:00Z","timestamp":1573516800000},"content-version":"vor","delay-in-days":0,"URL":"http:\/\/creativecommons.org\/licenses\/by\/4.0\/"}],"funder":[{"DOI":"10.13039\/501100000266","name":"Engineering and Physical Sciences Research Council","doi-asserted-by":"publisher","award":["EP\/K030469\/1"],"award-info":[{"award-number":["EP\/K030469\/1"]}],"id":[{"id":"10.13039\/501100000266","id-type":"DOI","asserted-by":"publisher"}]},{"DOI":"10.13039\/501100007601","name":"Horizon 2020","doi-asserted-by":"publisher","award":["654241"],"award-info":[{"award-number":["654241"]}],"id":[{"id":"10.13039\/501100007601","id-type":"DOI","asserted-by":"publisher"}]}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["J Cheminform"],"published-print":{"date-parts":[[2019,12]]},"abstract":"<jats:title>Abstract<\/jats:title><jats:p>The goal of quantitative structure activity relationship (QSAR) learning is to learn a function that, given the structure of a small molecule (a potential drug), outputs the predicted activity of the compound. We employed multi-task learning (MTL) to exploit commonalities in drug targets and assays. We used datasets containing curated records about the activity of specific compounds on drug targets provided by ChEMBL. Totally, 1091 assays have been analysed. As a baseline, a single task learning approach that trains random forest to predict drug activity for each drug target individually was considered. We then carried out feature-based and instance-based MTL to predict drug activities. We introduced a natural metric of evolutionary distance between drug targets as a measure of tasks relatedness. Instance-based MTL significantly outperformed both, feature-based MTL and the base learner, on 741 drug targets out of 1091. Feature-based MTL won on 179 occasions and the base learner performed best on 171 drug targets. We conclude that MTL QSAR is improved by incorporating the evolutionary distance between targets. These results indicate that QSAR learning can be performed effectively, even if little data is available for specific drug targets, by leveraging what is known about similar drug targets.<\/jats:p>","DOI":"10.1186\/s13321-019-0392-1","type":"journal-article","created":{"date-parts":[[2019,11,12]],"date-time":"2019-11-12T18:03:07Z","timestamp":1573581787000},"update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":25,"title":["Multi-task learning with a natural metric for quantitative structure activity relationship learning"],"prefix":"10.1186","volume":"11","author":[{"given":"Noureddin","family":"Sadawi","sequence":"first","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Ivan","family":"Olier","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Joaquin","family":"Vanschoren","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Jan N.","family":"van Rijn","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Jeremy","family":"Besnard","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Richard","family":"Bickerton","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Crina","family":"Grosan","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"ORCID":"https:\/\/orcid.org\/0000-0001-6489-3029","authenticated-orcid":false,"given":"Larisa","family":"Soldatova","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Ross D.","family":"King","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]}],"member":"297","published-online":{"date-parts":[[2019,11,12]]},"reference":[{"issue":"1","key":"392_CR1","doi-asserted-by":"publisher","first-page":"41","DOI":"10.1023\/A:1007379606734","volume":"28","author":"R Caruana","year":"1997","unstructured":"Caruana R (1997) Multitask learning. Mach Learn 28(1):41\u201375. https:\/\/doi.org\/10.1023\/A:1007379606734","journal-title":"Mach Learn"},{"issue":"2","key":"392_CR2","doi-asserted-by":"publisher","first-page":"895","DOI":"10.1016\/j.neuroimage.2011.09.069","volume":"59","author":"D Zhang","year":"2012","unstructured":"Zhang D, Shen D (2012) Multi-modal multi-task learning for joint prediction of multiple regression and classification variables in Alzheimer\u2019s disease. NeuroImage 59(2):895\u2013907. https:\/\/doi.org\/10.1016\/j.neuroimage.2011.09.069","journal-title":"NeuroImage"},{"key":"392_CR3","first-page":"615","volume":"6","author":"T Evgeniou","year":"2005","unstructured":"Evgeniou T, Micchelli CA, Pontil M (2005) Learning multiple tasks with kernel methods. J Mach Learn Res 6:615\u2013637","journal-title":"J Mach Learn Res"},{"key":"392_CR4","first-page":"1817","volume":"6","author":"RK Ando","year":"2005","unstructured":"Ando RK, Zhang T (2005) A framework for learning predictive structures from multiple tasks and unlabeled data. J Mach Learn Res 6:1817\u20131853","journal-title":"J Mach Learn Res"},{"key":"392_CR5","doi-asserted-by":"publisher","DOI":"10.1093\/nsr\/nwx105","author":"Y Zhang","year":"2017","unstructured":"Zhang Y, Yang Q (2017) An overview of multi-task learning. Natl Sci Rev. https:\/\/doi.org\/10.1093\/nsr\/nwx105","journal-title":"Natl Sci Rev"},{"issue":"10","key":"392_CR6","doi-asserted-by":"publisher","first-page":"1345","DOI":"10.1109\/TKDE.2009.191","volume":"22","author":"SJ Pan","year":"2010","unstructured":"Pan SJ, Yang Q (2010) A survey on transfer learning. IEEE Trans Knowl Data Eng 22(10):1345\u20131359. https:\/\/doi.org\/10.1109\/TKDE.2009.191","journal-title":"IEEE Trans Knowl Data Eng"},{"key":"392_CR7","doi-asserted-by":"publisher","unstructured":"Dai W, Yang Q, Xue G-R, Yu Y (2007) Boosting for transfer learning. In: Proceedings of the 24th international conference on machine learning. ICML \u201907. ACM, New York, pp 193\u2013200. https:\/\/doi.org\/10.1145\/1273496.1273521","DOI":"10.1145\/1273496.1273521"},{"key":"392_CR8","doi-asserted-by":"publisher","first-page":"1","DOI":"10.1016\/B978-0-12-801505-6.00001-6","volume-title":"Understanding the basics of QSAR for applications in pharmaceutical sciences and risk assessment","author":"K Roy","year":"2015","unstructured":"Roy K, Kar S, Das RN (2015) Chapter 1\u2013Background of qsar and historical developments. In: Roy K, Kar S, Das RN (eds) Understanding the basics of QSAR for applications in pharmaceutical sciences and risk assessment. Academic Press, Boston, pp 1\u201346. https:\/\/doi.org\/10.1016\/B978-0-12-801505-6.00001-6"},{"key":"392_CR9","doi-asserted-by":"publisher","DOI":"10.1038\/194178b0","author":"C Hansch","year":"1962","unstructured":"Hansch C, Maloney P, Fujita T, Muir R (1962) Correlation of biological activity of phenoxyacetic acids with Hammett substituent constants and partition coefficients. Nature. https:\/\/doi.org\/10.1038\/194178b0","journal-title":"Nature"},{"issue":"12","key":"392_CR10","doi-asserted-by":"publisher","first-page":"4977","DOI":"10.1021\/jm4004285","volume":"57","author":"A Cherkasov","year":"2014","unstructured":"Cherkasov A, Muratov EN, Fourches D, Varnek A, Baskin II, Cronin M, Dearden J, Gramatica P, Martin YC, Todeschini R, Consonni V, Kuz\u2019min VE, Cramer R, Benigni R, Yang C, Rathman J, Terfloth L, Gasteiger J, Richard A, Tropsha A (2014) Qsar modeling: where have you been? where are you going to? J Med Chem 57(12):4977\u20135010. https:\/\/doi.org\/10.1021\/jm4004285","journal-title":"J Med Chem"},{"key":"392_CR11","doi-asserted-by":"publisher","unstructured":"Chen J, Tang L, Liu J, Ye J (2009) A convex formulation for learning shared structures from multiple tasks. In: Proceedings of the 26th annual international conference on machine learning. ICML \u201909. ACM, New York, pp 137\u2013144. https:\/\/doi.org\/10.1145\/1553374.1553392","DOI":"10.1145\/1553374.1553392"},{"key":"392_CR12","doi-asserted-by":"publisher","unstructured":"Bickel S, Bogojeska J, Lengauer T, Scheffer T (2008) Multi-task learning for hiv therapy screening. In: Proceedings of the 25th international conference on machine learning. ICML \u201908. ACM, New York, pp 56\u201363. https:\/\/doi.org\/10.1145\/1390156.1390164","DOI":"10.1145\/1390156.1390164"},{"key":"392_CR13","unstructured":"Kim S, Xing EP (2010) Tree-guided group lasso for multi-task regression with structured sparsity. In: Proceedings of the 27th international conference on machine learning (ICML-10). Omnipress, Madison, pp 543\u2013550. http:\/\/www.icml2010.org\/papers\/352.pdf"},{"key":"392_CR14","unstructured":"Long M, Wang J (2015) Learning multiple tasks with deep relationship networks. CoRR arXiv:1506.02117"},{"key":"392_CR15","doi-asserted-by":"crossref","unstructured":"Sogaard A, Goldberg Y (2016) Deep multi-task learning with low level tasks supervised at lower layers. In: Proceedings of the 54th annual meeting of the association for computational linguistics, pp 231\u2013235","DOI":"10.18653\/v1\/P16-2038"},{"key":"392_CR16","first-page":"35","volume":"8","author":"Y Xue","year":"2007","unstructured":"Xue Y, Liao X, Carin L, Krishnapuram B (2007) Multi-task learning for classification with dirichlet process priors. J Mach Learn Res 8:35\u201363","journal-title":"J Mach Learn Res"},{"issue":"3","key":"392_CR17","doi-asserted-by":"publisher","first-page":"12","DOI":"10.1145\/2538028","volume":"8","author":"Y Zhang","year":"2014","unstructured":"Zhang Y, Yeung D-Y (2014) A regularization approach to learning task relationships in multitask learning. ACM Trans Knowl Discov Data 8(3):12\u201311231. https:\/\/doi.org\/10.1145\/2538028","journal-title":"ACM Trans Knowl Discov Data"},{"key":"392_CR18","doi-asserted-by":"publisher","first-page":"83","DOI":"10.1162\/153244304322765658","volume":"4","author":"B Bakker","year":"2003","unstructured":"Bakker B, Heskes T (2003) Task clustering and gating for bayesian multitask learning. J Mach Learn Res 4:83\u201399. https:\/\/doi.org\/10.1162\/153244304322765658","journal-title":"J Mach Learn Res"},{"key":"392_CR19","unstructured":"Jacob L, Vert J-P, Bach FR (2009) Clustered multi-task learning: a convex formulation. In: Koller D, Schuurmans D, Bengio Y, Bottou L (eds) Advances in neural information processing systems, vol 21. Curran Associates, Inc., Red Hook, pp 745\u2013752. http:\/\/papers.nips.cc\/paper\/3499-clustered-multi-task-learning-a-convex-formulation.pdf. Accessed 11 Mar 2018"},{"issue":"3","key":"392_CR20","doi-asserted-by":"publisher","first-page":"243","DOI":"10.1007\/s10994-007-5040-8","volume":"73","author":"A Argyriou","year":"2008","unstructured":"Argyriou A, Evgeniou T, Pontil M (2008) Convex multi-task feature learning. Mach Learn 73(3):243\u2013272. https:\/\/doi.org\/10.1007\/s10994-007-5040-8","journal-title":"Mach Learn"},{"key":"392_CR21","unstructured":"Kang Z, Grauman K, Sha F (2011) Learning with whom to share in multi-task feature learning. In: Getoor L, Scheffer T (eds) Proceedings of the 28th international conference on machine learning (ICML-11). ACM, New York, pp 521\u2013528. http:\/\/www.icml-2011.org\/papers\/344_icmlpaper.pdf. Accessed 26 Mar 2019"},{"key":"392_CR22","doi-asserted-by":"crossref","unstructured":"Xu L, Huang A, Chen J, Chen E (2015) Exploiting task-feature co-clusters in multi-task learning","DOI":"10.1609\/aaai.v29i1.9483"},{"key":"392_CR23","unstructured":"Zhong W, Kwok JT (2012) Convex multitask learning with flexible task clusters. CoRR arXiv:1206.4601"},{"key":"392_CR24","doi-asserted-by":"crossref","unstructured":"Yousefi N, Georgiopoulos M, Anagnostopoulos GC (2015) Multi-task learning with group-specific feature space sharing. CoRR arXiv:1508.03329","DOI":"10.1007\/978-3-319-23525-7_8"},{"issue":"5","key":"392_CR25","doi-asserted-by":"publisher","first-page":"485","DOI":"10.1504\/IJDMB.2011.043030","volume":"5","author":"Q Xu","year":"2011","unstructured":"Xu Q, Xue H, Yang Q (2011) Multi-platform gene-expression mining and marker gene analysis. Int J Data Min Bioinform 5(5):485\u2013503. https:\/\/doi.org\/10.1504\/IJDMB.2011.043030","journal-title":"Int J Data Min Bioinform"},{"key":"392_CR26","doi-asserted-by":"publisher","unstructured":"Zhou J, Yuan L, Liu J, Ye J (2011) A multi-task learning formulation for predicting disease progression. In: Proceedings of the 17th ACM SIGKDD international conference on knowledge discovery and data mining. KDD \u201911. ACM, New York, pp 814\u2013822. https:\/\/doi.org\/10.1145\/2020408.2020549","DOI":"10.1145\/2020408.2020549"},{"key":"392_CR27","first-page":"522","volume-title":"Leveraging sequence classification by taxonomy-based multitask learning. Research in computational molecular biology","author":"C Widmer","year":"2010","unstructured":"Widmer C, Leiva J, Altun Y, R\u00e4tsch G (2010) Leveraging sequence classification by taxonomy-based multitask learning. Research in computational molecular biology, vol 6044. LNCS, Springer, Berlin, pp 522\u2013534"},{"key":"392_CR28","unstructured":"Widmer C, R\u00e4tsch G (2012) Multitask learning in computational biology. In: Guyon I, Dror G, Lemaire V, Taylor GW, Silver DL (eds) ICML unsupervised and transfer learning. JMLR proceedings, vol 27. JMLR.org, pp 207\u2013216"},{"issue":"1","key":"392_CR29","doi-asserted-by":"publisher","first-page":"181","DOI":"10.1186\/1471-2105-11-181","volume":"11","author":"Q Liu","year":"2010","unstructured":"Liu Q, Xu Q, Zheng VW, Xue H, Cao Z, Yang Q (2010) Multi-task learning for cross-platform sirna efficacy prediction: an in-silico study. BMC Bioinform 11(1):181. https:\/\/doi.org\/10.1186\/1471-2105-11-181","journal-title":"BMC Bioinform"},{"issue":"8","key":"392_CR30","doi-asserted-by":"publisher","first-page":"1974","DOI":"10.1021\/ci900176y","volume":"49","author":"RP Sheridan","year":"2009","unstructured":"Sheridan RP, Nam K, Maiorov VN, McMasters DR, Cornell WD (2009) Qsar models for predicting the similarity in binding profiles for pairs of protein kinases and the variation of models between experimental data sets. J Chem Inf Model 49(8):1974\u20131985. https:\/\/doi.org\/10.1021\/ci900176y","journal-title":"J Chem Inf Model"},{"key":"392_CR31","unstructured":"Dahl GE, Jaitly N, Salakhutdinov R (2014) Multi-task Neural Networks for QSAR Predictions. ArXiv e-prints . 1406.1231"},{"key":"392_CR32","doi-asserted-by":"crossref","unstructured":"Evgeniou T, Pontil M (2004) Regularized multi-task learning. In: Proceedings of the tenth ACM SIGKDD international conference on knowledge discovery and data mining. ACM, New York, pp 109\u2013117","DOI":"10.1145\/1014052.1014067"},{"key":"392_CR33","doi-asserted-by":"publisher","first-page":"33","DOI":"10.1186\/1758-2946-5-33","volume":"5","author":"L Rosenbaum","year":"2013","unstructured":"Rosenbaum L, D\u00f6rr A, Bauer MR, Boeckler FM, Zell A (2013) Inferring multi-target QSAR models with taxonomy-based multi-task learning. J Cheminform 5:33. https:\/\/doi.org\/10.1186\/1758-2946-5-33","journal-title":"J Cheminform"},{"issue":"5600","key":"392_CR34","doi-asserted-by":"publisher","first-page":"1912","DOI":"10.1126\/science.1075762","volume":"298","author":"G Manning","year":"2002","unstructured":"Manning G, Whyte DB, Martinez R, Hunter T, Sudarsanam S (2002) The protein kinase complement of the human genome. Science 298(5600):1912\u20131934. https:\/\/doi.org\/10.1126\/science.1075762","journal-title":"Science"},{"issue":"11","key":"392_CR35","doi-asserted-by":"publisher","first-page":"2444","DOI":"10.1021\/ci900182q","volume":"49","author":"X Ning","year":"2009","unstructured":"Ning X, Rangwala H, Karypis G (2009) Multi-assay-based structure\u2013activity relationship models: improving structure\u2013activity relationship models by incorporating activity information from related targets. J Chem Inf Model 49(11):2444\u20132456","journal-title":"J Chem Inf Model"},{"issue":"1","key":"392_CR36","doi-asserted-by":"publisher","first-page":"133","DOI":"10.1021\/ci8002914","volume":"49","author":"A Varnek","year":"2009","unstructured":"Varnek A, Gaudin C, Marcou G, Baskin I, Pandey AK, Tetko IV (2009) Inductive transfer of knowledge: application of multi-task learning and feature net approaches to model tissue-air partition coefficients. J Chem Inf Model 49(1):133\u2013144. https:\/\/doi.org\/10.1021\/ci8002914","journal-title":"J Chem Inf Model"},{"key":"392_CR37","doi-asserted-by":"publisher","first-page":"855","DOI":"10.1002\/minf.201000099","volume":"29","author":"F Ruggiu","year":"2010","unstructured":"Ruggiu F, Marcou G, Varnek A, Horvath D (2010) Isida property-labelled fragment descriptors. Mol Inform 29:855\u201368","journal-title":"Mol Inform"},{"key":"392_CR38","unstructured":"Ramsundar B, Kearnes SM, Riley P, Webster D, Konerding DE, Pande VS (2015) Massively multitask networks for drug discovery. CoRR arXiv:1502.02072"},{"issue":"10","key":"392_CR39","doi-asserted-by":"publisher","first-page":"2490","DOI":"10.1021\/acs.jcim.7b00087","volume":"57","author":"Y Xu","year":"2017","unstructured":"Xu Y, Ma J, Liaw A, Sheridan RP, Svetnik V (2017) Demystifying multitask deep neural networks for quantitative structure\u2013activity relationships. J Chem Inf Model 57(10):2490\u20132504. https:\/\/doi.org\/10.1021\/acs.jcim.7b00087","journal-title":"J Chem Inf Model"},{"key":"392_CR40","doi-asserted-by":"publisher","first-page":"74","DOI":"10.3389\/fphar.2018.00074","volume":"9","author":"RS Sim\u00f5es","year":"2018","unstructured":"Sim\u00f5es RS, Maltarollo VG, Oliveira PR, Honorio KM (2018) Transfer and multi-task learning in qsar modeling: advances and challenges. Front Pharmacol 9:74. https:\/\/doi.org\/10.3389\/fphar.2018.00074","journal-title":"Front Pharmacol"},{"key":"392_CR41","doi-asserted-by":"publisher","DOI":"10.1007\/s10994-017-5685-x","author":"I Olier","year":"2017","unstructured":"Olier I, Sadawi N, Bickerton GR, Vanschoren J, Grosan C, Soldatova L, King RD (2017) Meta-qsar: a large-scale application of meta-learning to drug design and discovery. Mach Learn. https:\/\/doi.org\/10.1007\/s10994-017-5685-x","journal-title":"Mach Learn"},{"issue":"10","key":"392_CR42","doi-asserted-by":"publisher","first-page":"821","DOI":"10.1038\/nrd2132","volume":"5","author":"P Imming","year":"2006","unstructured":"Imming P, Sinning C, Meyer A (2006) Drugs, their targets and the nature and number of drug targets. Nat Rev Drug Discov 5(10):821\u2013834. https:\/\/doi.org\/10.1038\/nrd2132","journal-title":"Nat Rev Drug Discov"},{"issue":"D1","key":"392_CR43","doi-asserted-by":"publisher","first-page":"777","DOI":"10.1093\/nar\/gkr777","volume":"40","author":"A Gaulton","year":"2011","unstructured":"Gaulton A, Bellis LJ, Bento AP, Chambers J, Davies M, Hersey A, Light Y, McGlinchey S, Michalovich D, Al-Lazikani B, Overington JP (2011) ChEMBL: a large-scale bioactivity database for drug discovery. Nucleic Acids Res 40(D1):777\u20131107. https:\/\/doi.org\/10.1093\/nar\/gkr777","journal-title":"Nucleic Acids Res"},{"key":"392_CR44","unstructured":"AEROPATH Team: AEROPATH target database. http:\/\/aeropath.lifesci.dundee.ac.uk\/. Accessed 26 Mar 2019"},{"key":"392_CR45","unstructured":"Mount DW (2004) Bioinformatics: sequence and genome analysis. Cold Spring Harbor Laboratory Press, Cold Spring Harbor. https:\/\/books.google.co.uk\/books?id=M8pqAAAAMAAJ. Accessed 7 Feb 2019"},{"issue":"3","key":"392_CR46","doi-asserted-by":"publisher","first-page":"443","DOI":"10.1016\/0022-2836(70)90057-4","volume":"48","author":"SB Needleman","year":"1970","unstructured":"Needleman SB, Wunsch CD (1970) A general method applicable to the search for similarities in the amino acid sequence of two proteins. J Mol Biol 48(3):443\u2013453. https:\/\/doi.org\/10.1016\/0022-2836(70)90057-4","journal-title":"J Mol Biol"},{"issue":"1","key":"392_CR47","doi-asserted-by":"publisher","first-page":"195","DOI":"10.1016\/0022-2836(81)90087-5","volume":"147","author":"TF Smith","year":"1981","unstructured":"Smith TF, Waterman MS (1981) Identification of common molecular subsequences. J Mol Biol 147(1):195\u2013197","journal-title":"J Mol Biol"},{"issue":"1","key":"392_CR48","doi-asserted-by":"publisher","first-page":"415","DOI":"10.1186\/1471-2105-7-415","volume":"7","author":"GP Raghava","year":"2006","unstructured":"Raghava GP, Barton GJ (2006) Quantification of the variation in percentage identity for protein sequence alignments. BMC Bioinform 7(1):415","journal-title":"BMC Bioinform"},{"key":"392_CR49","unstructured":"Pages H, Aboyoun P, Gentleman R, DebRoy S. Biostrings: string objects representing biological sequences, and matching algorithms. Online"},{"issue":"1","key":"392_CR50","doi-asserted-by":"publisher","first-page":"5","DOI":"10.1023\/A:1010933404324","volume":"45","author":"L Breiman","year":"2001","unstructured":"Breiman L (2001) Random forests. Mach Learn 45(1):5\u201332. https:\/\/doi.org\/10.1023\/A:1010933404324","journal-title":"Mach Learn"},{"key":"392_CR51","volume-title":"Data mining: practical machine learning tools and techniques (Morgan Kaufmann series in data management systems)","author":"IH Witten","year":"2005","unstructured":"Witten IH, Frank E (2005) Data mining: practical machine learning tools and techniques (Morgan Kaufmann series in data management systems), 2nd edn. Morgan Kaufmann Publishers Inc., San Francisco","edition":"2"},{"key":"392_CR52","unstructured":"Todeschini R, Consonni V, Mannhold R, Kubinyi H, Timmerman H (2008) Handbook of molecular descriptors. Methods and principles in medicinal chemistry. Wiley, Hoboken. https:\/\/books.google.co.uk\/books?id=TCuHqbvgMbEC. Accessed 13 Apr 2018"},{"issue":"1","key":"392_CR53","doi-asserted-by":"publisher","first-page":"10","DOI":"10.1145\/1656274.1656278","volume":"11","author":"M Hall","year":"2009","unstructured":"Hall M, Frank E, Holmes G, Pfahringer B, Reutemann P, Witten IH (2009) The weka data mining software: an update. SIGKDD Explor Newsl 11(1):10\u201318. https:\/\/doi.org\/10.1145\/1656274.1656278","journal-title":"SIGKDD Explor Newsl"},{"key":"392_CR54","unstructured":"Foreman EK (1991) Survey sampling principles. Statistics: a series of textbooks and monographs. Taylor & Francis, New York. https:\/\/books.google.co.uk\/books?id=NaB38L1pcpwC. Accessed 22 Jan 2019"},{"issue":"3-4","key":"392_CR55","doi-asserted-by":"publisher","first-page":"591","DOI":"10.1093\/biomet\/52.3-4.591","volume":"52","author":"S. S. SHAPIRO","year":"1965","unstructured":"Shapiro SS, Wilk MB (1965) An analysis of variance test for normality (complete samples). Biometrika 52(3\u20134):591\u2013611. https:\/\/doi.org\/10.1093\/biomet\/52.3-4.591. http:\/\/biomet.oxfordjournals.org\/content\/52\/3-4\/591.full.pdf+html","journal-title":"Biometrika"},{"issue":"3","key":"392_CR56","doi-asserted-by":"publisher","first-page":"705","DOI":"10.1021\/ci400737s","volume":"54","author":"AV Zakharov","year":"2014","unstructured":"Zakharov AV, Peach ML, Sitzmann M, Nicklaus MC (2014) Qsar modeling of imbalanced high-throughput screening data in pubchem. J Chem Inf Model 54(3):705\u2013712. https:\/\/doi.org\/10.1021\/ci400737s","journal-title":"J Chem Inf Model"},{"issue":"7","key":"392_CR57","doi-asserted-by":"publisher","first-page":"1316","DOI":"10.1021\/acs.jcim.5b00206","volume":"55","author":"DLJ Alexander","year":"2015","unstructured":"Alexander DLJ, Tropsha A, Winkler DA (2015) Beware of r2: simple, unambiguous assessment of the prediction accuracy of qsar and qspr models. J Chem Inf Model 55(7):1316\u20131322. https:\/\/doi.org\/10.1021\/acs.jcim.5b00206","journal-title":"J Chem Inf Model"},{"issue":"6","key":"392_CR58","doi-asserted-by":"publisher","first-page":"2345","DOI":"10.1021\/ci700157b","volume":"47","author":"C R\u00fccker","year":"2007","unstructured":"R\u00fccker C, R\u00fccker G, Meringer M (2007) y-randomization and its variants in qspr\/qsar. J Chem Inf Model 47(6):2345\u20132357. https:\/\/doi.org\/10.1021\/ci700157b","journal-title":"J Chem Inf Model"},{"issue":"2","key":"392_CR59","doi-asserted-by":"publisher","first-page":"49","DOI":"10.1145\/2641190.2641198","volume":"15","author":"J Vanschoren","year":"2013","unstructured":"Vanschoren J, van Rijn JN, Bischl B, Torgo L (2013) OpenML: networked science in machine learning. SIGKDD Explor 15(2):49\u201360. https:\/\/doi.org\/10.1145\/2641190.2641198","journal-title":"SIGKDD Explor"},{"key":"392_CR60","unstructured":"MLS Team (2019) W3C MLSchema. Online. https:\/\/www.w3.org\/community\/ml-schema. Accessed 25 Mar 2019"},{"key":"392_CR61","unstructured":"MTL-QSAR Team (2019) MTL-QSAR on OpenML. Online. https:\/\/www.openml.org\/s\/3. Accessed 25 Mar 2019"},{"key":"392_CR62","unstructured":"MTL-QSAR Team (2019) MTL-QSAR on Github. Online. https:\/\/github.com\/nsadawi\/MTL-QSAR. Accessed 25 Mar 2019"}],"container-title":["Journal of Cheminformatics"],"original-title":[],"language":"en","link":[{"URL":"http:\/\/link.springer.com\/content\/pdf\/10.1186\/s13321-019-0392-1.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"http:\/\/link.springer.com\/article\/10.1186\/s13321-019-0392-1\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"http:\/\/link.springer.com\/content\/pdf\/10.1186\/s13321-019-0392-1.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2022,10,4]],"date-time":"2022-10-04T13:17:45Z","timestamp":1664889465000},"score":1,"resource":{"primary":{"URL":"https:\/\/jcheminf.biomedcentral.com\/articles\/10.1186\/s13321-019-0392-1"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2019,11,12]]},"references-count":62,"journal-issue":{"issue":"1","published-print":{"date-parts":[[2019,12]]}},"alternative-id":["392"],"URL":"https:\/\/doi.org\/10.1186\/s13321-019-0392-1","relation":{},"ISSN":["1758-2946"],"issn-type":[{"value":"1758-2946","type":"electronic"}],"subject":[],"published":{"date-parts":[[2019,11,12]]},"assertion":[{"value":"5 August 2019","order":1,"name":"received","label":"Received","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"4 November 2019","order":2,"name":"accepted","label":"Accepted","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"12 November 2019","order":3,"name":"first_online","label":"First Online","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"The research reported in this manuscript has been approved by respective organisations.","order":1,"name":"Ethics","group":{"name":"EthicsHeading","label":"Ethics approval and consent to participate"}},{"value":"The authors declare that they have no competing interests.","order":2,"name":"Ethics","group":{"name":"EthicsHeading","label":"Competing interests"}}],"article-number":"68"}}