{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,6,3]],"date-time":"2026-06-03T13:33:44Z","timestamp":1780493624852,"version":"3.54.1"},"reference-count":55,"publisher":"Springer Science and Business Media LLC","issue":"1","license":[{"start":{"date-parts":[[2020,4,19]],"date-time":"2020-04-19T00:00:00Z","timestamp":1587254400000},"content-version":"tdm","delay-in-days":0,"URL":"http:\/\/creativecommons.org\/licenses\/by\/4.0\/"},{"start":{"date-parts":[[2020,4,19]],"date-time":"2020-04-19T00:00:00Z","timestamp":1587254400000},"content-version":"vor","delay-in-days":0,"URL":"http:\/\/creativecommons.org\/licenses\/by\/4.0\/"}],"funder":[{"DOI":"10.13039\/100010661","name":"Horizon 2020 Framework Programme","doi-asserted-by":"publisher","award":["671555"],"award-info":[{"award-number":["671555"]}],"id":[{"id":"10.13039\/100010661","id-type":"DOI","asserted-by":"publisher"}]},{"name":"Large Infrastructures for Research, Experimental Development and Innovation","award":["IT4Innovation National Supercomputing Center \u2013 LM2015070"],"award-info":[{"award-number":["IT4Innovation National Supercomputing Center \u2013 LM2015070"]}]}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["J Cheminform"],"published-print":{"date-parts":[[2020,12]]},"abstract":"<jats:title>Abstract<\/jats:title><jats:p>Artificial intelligence (AI) is undergoing a revolution thanks to the breakthroughs of machine learning algorithms in computer vision, speech recognition, natural language processing and generative modelling. Recent works on publicly available pharmaceutical data showed that AI methods are highly promising for Drug Target prediction. However, the quality of public data might be different than that of industry data due to different labs reporting measurements, different measurement techniques, fewer samples and less diverse and specialized assays. As part of a European funded project (ExCAPE), that brought together expertise from pharmaceutical industry, machine learning, and high-performance computing, we investigated how well machine learning models obtained from public data can be transferred to internal pharmaceutical industry data. Our results show that machine learning models trained on public data can indeed maintain their predictive power to a large degree when applied to industry data. Moreover, we observed that deep learning derived machine learning models outperformed comparable models, which were trained by other machine learning algorithms, when applied to internal pharmaceutical company datasets. To our knowledge, this is the first large-scale study evaluating the potential of machine learning and especially deep learning directly at the level of industry-scale settings and moreover investigating the transferability of publicly learned target prediction models towards industrial bioactivity prediction pipelines.<\/jats:p>","DOI":"10.1186\/s13321-020-00428-5","type":"journal-article","created":{"date-parts":[[2020,4,19]],"date-time":"2020-04-19T14:02:33Z","timestamp":1587304953000},"update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":43,"title":["Industry-scale application and evaluation of deep learning for drug target prediction"],"prefix":"10.1186","volume":"12","author":[{"given":"No\u00e9","family":"Sturm","sequence":"first","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Andreas","family":"Mayr","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Thanh","family":"Le Van","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Vladimir","family":"Chupakhin","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Hugo","family":"Ceulemans","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Joerg","family":"Wegner","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Jose-Felipe","family":"Golib-Dzib","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Nina","family":"Jeliazkova","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Yves","family":"Vandriessche","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Stanislav","family":"B\u00f6hm","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Vojtech","family":"Cima","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Jan","family":"Martinovic","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Nigel","family":"Greene","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Tom","family":"Vander Aa","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Thomas J.","family":"Ashby","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Sepp","family":"Hochreiter","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Ola","family":"Engkvist","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"G\u00fcnter","family":"Klambauer","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Hongming","family":"Chen","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]}],"member":"297","published-online":{"date-parts":[[2020,4,19]]},"reference":[{"issue":"5","key":"428_CR1","doi-asserted-by":"publisher","first-page":"435","DOI":"10.1038\/s41563-019-0338-z","volume":"18","author":"S Ekins","year":"2019","unstructured":"Ekins S, Puhl AC, Zorn KM et al (2019) Exploiting machine learning for end-to-end drug discovery and development. Nat Mater 18(5):435\u2013441. https:\/\/doi.org\/10.1038\/s41563-019-0338-z","journal-title":"Nat Mater"},{"issue":"6","key":"428_CR2","doi-asserted-by":"publisher","first-page":"463","DOI":"10.1038\/s41573-019-0024-5","volume":"18","author":"J Vamathevan","year":"2019","unstructured":"Vamathevan J, Clark D, Czodrowski P et al (2019) Applications of machine learning in drug discovery and development. Nat Rev Drug Discovery 18(6):463\u2013477. https:\/\/doi.org\/10.1038\/s41573-019-0024-5","journal-title":"Nat Rev Drug Discovery"},{"key":"428_CR3","doi-asserted-by":"publisher","first-page":"103850","DOI":"10.1016\/j.chemolab.2019.103850","volume":"194","author":"L Wang","year":"2019","unstructured":"Wang L, Ding J, Pan L et al (2019) Artificial intelligence facilitates drug design in the big data era. Chemometrics Intell Lab Syst 194:103850. https:\/\/doi.org\/10.1016\/j.chemolab.2019.103850","journal-title":"Chemometrics Intell Lab Syst"},{"issue":"D1","key":"428_CR4","doi-asserted-by":"publisher","first-page":"D945","DOI":"10.1093\/nar\/gkw1074","volume":"45","author":"A Gaulton","year":"2017","unstructured":"Gaulton A, Hersey A, Nowotka M et al (2017) The ChEMBL database in 2017. Nucleic Acids Res 45(D1):D945\u2013D954. https:\/\/doi.org\/10.1093\/nar\/gkw1074","journal-title":"Nucleic Acids Res"},{"issue":"D1","key":"428_CR5","doi-asserted-by":"publisher","first-page":"D1102","DOI":"10.1093\/nar\/gky1033","volume":"47","author":"S Kim","year":"2019","unstructured":"Kim S, Chen J, Cheng T et al (2019) PubChem 2019 update: improved access to chemical data. Nucleic Acids Res 47(D1):D1102\u2013D1109. https:\/\/doi.org\/10.1093\/nar\/gky1033","journal-title":"Nucleic Acids Res"},{"issue":"3","key":"428_CR6","doi-asserted-by":"publisher","first-page":"318","DOI":"10.1016\/j.drudis.2014.10.012","volume":"20","author":"A Lavecchia","year":"2015","unstructured":"Lavecchia A (2015) Machine-learning approaches in drug discovery: methods and applications. Drug Discov Today 20(3):318\u2013331. https:\/\/doi.org\/10.1016\/j.drudis.2014.10.012","journal-title":"Drug Discov Today"},{"issue":"22","key":"428_CR7","doi-asserted-by":"publisher","first-page":"3204","DOI":"10.1039\/B409813G","volume":"2","author":"A Bender","year":"2004","unstructured":"Bender A, Glen RC (2004) Molecular similarity: a key technique in molecular informatics. Org Biomol Chem 2(22):3204\u20133218. https:\/\/doi.org\/10.1039\/B409813G","journal-title":"Org Biomol Chem"},{"issue":"10","key":"428_CR8","doi-asserted-by":"publisher","first-page":"e1003253","DOI":"10.1371\/journal.pcbi.1003253","volume":"9","author":"F Mart\u00ednez-Jim\u00e9nez","year":"2013","unstructured":"Mart\u00ednez-Jim\u00e9nez F, Papadatos G, Yang L et al (2013) Target prediction for an open access set of compounds active against Mycobacterium tuberculosis. PLoS Comput Biol 9(10):e1003253. https:\/\/doi.org\/10.1371\/journal.pcbi.1003253","journal-title":"PLoS Comput Biol"},{"issue":"12","key":"428_CR9","doi-asserted-by":"publisher","first-page":"2554","DOI":"10.1016\/j.jprot.2011.05.011","volume":"74","author":"Alexios Koutsoukas","year":"2011","unstructured":"Koutsoukas Alexios, Simms Benjamin, Kirchmair Johannes et al (2011) From in silico target prediction to multi-target drug design: current databases, methods and applications. J Proteomics 74(12):2554\u20132574. https:\/\/doi.org\/10.1016\/j.jprot.2011.05.011","journal-title":"J Proteomics"},{"issue":"1","key":"428_CR10","doi-asserted-by":"publisher","first-page":"4","DOI":"10.1186\/s13321-018-0325-4","volume":"11","author":"N Bosc","year":"2019","unstructured":"Bosc N, Atkinson F, Felix E et al (2019) Large scale comparison of QSAR and conformal prediction methods and their applications in drug discovery. J Cheminform 11(1):4","journal-title":"J Cheminform"},{"issue":"1","key":"428_CR11","doi-asserted-by":"publisher","first-page":"5","DOI":"10.1023\/A:1010933404324","volume":"45","author":"L Breiman","year":"2001","unstructured":"Breiman L (2001) Random Forests. Mach Learn 45(1):5\u201332. https:\/\/doi.org\/10.1023\/A:1010933404324","journal-title":"Mach Learn"},{"issue":"3","key":"428_CR12","doi-asserted-by":"publisher","first-page":"273","DOI":"10.1007\/BF00994018","volume":"20","author":"C Cortes","year":"1995","unstructured":"Cortes C, Vapnik V (1995) Support-vector networks. Mach Learn 20(3):273\u2013297. https:\/\/doi.org\/10.1007\/BF00994018","journal-title":"Mach Learn"},{"issue":"5","key":"428_CR13","doi-asserted-by":"publisher","first-page":"1728","DOI":"10.1021\/acs.jcim.8b00832","volume":"59","author":"D Sydow","year":"2019","unstructured":"Sydow D, Burggraaff L, Szengel A et al (2019) Advances and challenges in computational target prediction. J Chem Inf Model 59(5):1728\u20131742. https:\/\/doi.org\/10.1021\/acs.jcim.8b00832","journal-title":"J Chem Inf Model"},{"key":"428_CR14","doi-asserted-by":"publisher","first-page":"1","DOI":"10.1007\/978-0-387-85820-3","volume-title":"Recommender systems handbook","author":"F Ricci","year":"2011","unstructured":"Ricci F, Rokach L, Shapira B (2011) Introduction to recommender systems handbook. In: Ricci F (ed) Recommender systems handbook, vol 23. Springer, New York, pp 1\u201335"},{"key":"428_CR15","doi-asserted-by":"publisher","first-page":"8599","DOI":"10.1109\/ICASSP.2013.6639344","volume-title":"IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2013: 26-31 May 2013, Vancouver Convention Center, Vancouver, British Columbia","author":"L Deng","year":"2013","unstructured":"Deng L, Hinton G, Kingsbury B (2013) New types of deep neural network learning for speech recognition and related applications: an overview. IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2013: 26-31 May 2013, Vancouver Convention Center, Vancouver, British Columbia. Canada; proceedings. IEEE, Piscataway, NJ, pp 8599\u20138603"},{"key":"428_CR16","first-page":"1097","volume-title":"Advances in neural information processing systems 25","author":"A Krizhevsky","year":"2012","unstructured":"Krizhevsky A, Sutskever I, Hinton GE (2012) ImageNet classification with deep convolutional neural networks. In: Pereira F, Burges CJC, Bottou L et al (eds) Advances in neural information processing systems 25. Curran Associates Inc, New york, pp 1097\u20131105"},{"key":"428_CR17","unstructured":"Simonyan K, Zisserman A (2014) Very deep convolutional networks for large-scale image recognition. International Conference on Learning Representations (ICLR) 2015. arXiv:1409.1556"},{"key":"428_CR18","doi-asserted-by":"crossref","unstructured":"He K, Zhang X, Ren S et al. (2016) Deep residual learning for image recognition. In: The IEEE Conference on computer vision and pattern recognition (CVPR)","DOI":"10.1109\/CVPR.2016.90"},{"key":"428_CR19","doi-asserted-by":"publisher","first-page":"e0177544","DOI":"10.3389\/fgene.2019.00080","volume":"10","author":"J Xie","year":"2019","unstructured":"Xie J, Liu R, Luttrell J et al (2019) Deep learning based analysis of histopathological images of breast cancer. Front Gene 10:e0177544. https:\/\/doi.org\/10.3389\/fgene.2019.00080","journal-title":"Front Gene"},{"key":"428_CR20","doi-asserted-by":"crossref","unstructured":"Collobert R, Weston J (2008) A unified architecture for natural language processing. In: McCallum AK, Roweis S (eds) Proceedings, Twenty-fifth International Conference on machine learning: [Helsinki, Finland, 5\u20139 July, 2008]. University of Helsinki, Helsinki, Finland, pp 160\u2013167","DOI":"10.1145\/1390156.1390177"},{"key":"428_CR21","unstructured":"Goodfellow I, Pouget-Abadie J, Mirza M et al. (2014) Generative adversarial nets. In: Ghahramani Z, Welling M, Cortes C, et al. (eds) Advances in neural information processing systems 27. Curran Associates, Inc, New York, pp 2672\u20132680"},{"issue":"6","key":"428_CR22","doi-asserted-by":"publisher","first-page":"1241","DOI":"10.1016\/j.drudis.2018.01.039","volume":"23","author":"H Chen","year":"2018","unstructured":"Chen H, Engkvist O, Wang Y et al (2018) The rise of deep learning in drug discovery. Drug Discov Today 23(6):1241\u20131250. https:\/\/doi.org\/10.1016\/j.drudis.2018.01.039","journal-title":"Drug Discov Today"},{"issue":"3","key":"428_CR23","doi-asserted-by":"publisher","first-page":"1253","DOI":"10.1021\/acs.jcim.8b00785","volume":"59","author":"J Wenzel","year":"2019","unstructured":"Wenzel J, Matter H, Schmidt F (2019) Predictive multitask deep neural network models for ADME-Tox properties: learning from large data sets. J Chem Inf Model 59(3):1253\u20131268. https:\/\/doi.org\/10.1021\/acs.jcim.8b00785","journal-title":"J Chem Inf Model"},{"issue":"2","key":"428_CR24","doi-asserted-by":"publisher","first-page":"263","DOI":"10.1021\/ci500747n","volume":"55","author":"J Ma","year":"2015","unstructured":"Ma J, Sheridan RP, Liaw A et al (2015) Deep neural nets as a method for quantitative structure-activity relationships. J Chem Inf Model 55(2):263\u2013274. https:\/\/doi.org\/10.1021\/ci500747n","journal-title":"J Chem Inf Model"},{"issue":"8","key":"428_CR25","doi-asserted-by":"publisher","first-page":"2068","DOI":"10.1021\/acs.jcim.7b00146","volume":"57","author":"B Ramsundar","year":"2017","unstructured":"Ramsundar B, Liu B, Wu Z et al (2017) Is multitask deep learning practical for pharma? J Chem Inf Model 57(8):2068\u20132076. https:\/\/doi.org\/10.1021\/acs.jcim.7b00146","journal-title":"J Chem Inf Model"},{"issue":"10","key":"428_CR26","doi-asserted-by":"publisher","first-page":"2490","DOI":"10.1021\/acs.jcim.7b00087","volume":"57","author":"Y Xu","year":"2017","unstructured":"Xu Y, Ma J, Liaw A et al (2017) Demystifying multitask deep neural networks for quantitative structure-activity relationships. J Chem Inf Model 57(10):2490\u20132504. https:\/\/doi.org\/10.1021\/acs.jcim.7b00087","journal-title":"J Chem Inf Model"},{"key":"428_CR27","unstructured":"Dahl GE, Jaitly N, Salakhutdinov R (2014) Multi-task Neural Networks for QSAR Predictions. arXiv:1406.1231"},{"key":"428_CR28","doi-asserted-by":"publisher","first-page":"24","DOI":"10.3389\/fenvs.2015.00080","volume":"3","author":"A Mayr","year":"2016","unstructured":"Mayr A, Klambauer G, Unterthiner T et al (2016) DeepTox: toxicity prediction using deep learning. Front Environ Sci. 3:24. https:\/\/doi.org\/10.3389\/fenvs.2015.00080","journal-title":"Front Environ Sci."},{"issue":"24","key":"428_CR29","doi-asserted-by":"publisher","first-page":"5441","DOI":"10.1039\/c8sc00148k","volume":"9","author":"A Mayr","year":"2018","unstructured":"Mayr A, Klambauer G, Unterthiner T et al (2018) Large-scale comparison of machine learning methods for drug target prediction on ChEMBL. Chem Sci 9(24):5441\u20135451. https:\/\/doi.org\/10.1039\/c8sc00148k","journal-title":"Chem Sci"},{"key":"428_CR30","doi-asserted-by":"publisher","DOI":"10.1186\/s13321-017-0203-5","author":"J Sun","year":"2017","unstructured":"Sun J, Jeliazkova N, Chupakhin V et al (2017) ExCAPE-DB: an integrated large scale dataset facilitating Big Data analysis in chemogenomics. J Cheminform. https:\/\/doi.org\/10.1186\/s13321-017-0203-5","journal-title":"J Cheminform"},{"issue":"8","key":"428_CR31","doi-asserted-by":"publisher","first-page":"1957","DOI":"10.1021\/ci300435j","volume":"53","author":"A Koutsoukas","year":"2013","unstructured":"Koutsoukas A, Lowe R, Kalantarmotamedi Y et al (2013) In silico target predictions: defining a benchmarking data set and comparison of performance of the multiclass Na\u00efve Bayes and Parzen-Rosenblatt window. J Chem Inf Model 53(8):1957\u20131966. https:\/\/doi.org\/10.1021\/ci300435j","journal-title":"J Chem Inf Model"},{"key":"428_CR32","doi-asserted-by":"publisher","DOI":"10.1186\/s13321-015-0098-y","author":"LH Mervin","year":"2015","unstructured":"Mervin LH, Afzal AM, Drakakis G et al (2015) Target prediction utilising negative bioactivity data covering large chemical space. J Cheminform. https:\/\/doi.org\/10.1186\/s13321-015-0098-y","journal-title":"J Cheminform"},{"issue":"4","key":"428_CR33","doi-asserted-by":"publisher","first-page":"e61007","DOI":"10.1371\/journal.pone.0061007","volume":"8","author":"T Kalliokoski","year":"2013","unstructured":"Kalliokoski T, Kramer C, Vulpetti A et al (2013) Comparability of mixed IC50 data\u2014a statistical analysis. PLoS ONE 8(4):e61007. https:\/\/doi.org\/10.1371\/journal.pone.0061007","journal-title":"PLoS ONE"},{"key":"428_CR34","series-title":"Wiley","doi-asserted-by":"publisher","first-page":"267","DOI":"10.1002\/9781118742785.ch12","volume-title":"Chemoinform Drug Discov","author":"C Hasselgren","year":"2013","unstructured":"Hasselgren C, Muthas D, Ahlberg E et al (2013) Chemoinformatics and beyond: moving from simple models to complex relationships in pharmaceutical computational toxicology. In: Bajorath J (ed) Chemoinform Drug Discov, vol 3. Wiley. Hoboken, NJ, pp 267\u2013290"},{"issue":"3","key":"428_CR35","doi-asserted-by":"publisher","first-page":"267","DOI":"10.1007\/s10822-016-9998-9","volume":"31","author":"H van Vlijmen","year":"2017","unstructured":"van Vlijmen H, Desjarlais RL, Mirzadegan T (2017) Computational chemistry at Janssen. J Comput Aided Mol Des 31(3):267\u2013273. https:\/\/doi.org\/10.1007\/s10822-016-9998-9","journal-title":"J Comput Aided Mol Des"},{"issue":"1","key":"428_CR36","doi-asserted-by":"publisher","first-page":"1","DOI":"10.1111\/j.1432-1033.1994.tb18960.x","volume":"223","author":"Tipton KF (1994) Nomenclature Committee of the International Union of Biochemistry and Molecular Biology (NC-IUBMB). Enzyme nomenclature. Recommendations","year":"1992","unstructured":"Tipton KF (1994) Nomenclature Committee of the International Union of Biochemistry and Molecular Biology (NC-IUBMB). Enzyme nomenclature. Recommendations (1992) Supplement: corrections and additions. Eur J Biochem 223(1):1\u20135. https:\/\/doi.org\/10.1111\/j.1432-1033.1994.tb18960.x","journal-title":"Eur J Biochem"},{"key":"428_CR37","doi-asserted-by":"publisher","first-page":"115","DOI":"10.1093\/nar\/gkh131","volume":"32","author":"R Apweiler","year":"2004","unstructured":"Apweiler R, Bairoch A, Wu CH et al (2004) UniProt: the Universal Protein knowledgebase. Nucleic Acids Res 32:115\u2013119. https:\/\/doi.org\/10.1093\/nar\/gkh131","journal-title":"Nucleic Acids Res"},{"issue":"5","key":"428_CR38","doi-asserted-by":"publisher","first-page":"742","DOI":"10.1021\/ci100050t","volume":"50","author":"D Rogers","year":"2010","unstructured":"Rogers D, Hahn M (2010) Extended-connectivity fingerprints. J Chem Inf Model 50(5):742\u2013754. https:\/\/doi.org\/10.1021\/ci100050t","journal-title":"J Chem Inf Model"},{"issue":"5\u20136","key":"428_CR39","doi-asserted-by":"publisher","first-page":"481","DOI":"10.1002\/minf.201200133","volume":"32","author":"NT Kochev","year":"2013","unstructured":"Kochev NT, Paskaleva VH, Jeliazkova N (2013) Ambit-tautomer: an open source tool for tautomer generation. Mol Inform 32(5\u20136):481\u2013504. https:\/\/doi.org\/10.1002\/minf.201200133","journal-title":"Mol Inform"},{"issue":"1","key":"428_CR40","doi-asserted-by":"publisher","first-page":"33","DOI":"10.1186\/s13321-017-0220-4","volume":"9","author":"EL Willighagen","year":"2017","unstructured":"Willighagen EL, Mayfield JW, Alvarsson J et al (2017) The Chemistry Development Kit (CDK) v2.0: atom typing, depiction, molecular formulas, and substructure searching. J Cheminform 9(1):33. https:\/\/doi.org\/10.1186\/s13321-017-0220-4","journal-title":"J Cheminform"},{"issue":"11","key":"428_CR41","doi-asserted-by":"publisher","first-page":"2594","DOI":"10.1007\/s11095-016-2029-7","volume":"33","author":"S Ekins","year":"2016","unstructured":"Ekins S (2016) The next era: deep learning in pharmaceutical research. Pharm Res 33(11):2594\u20132603. https:\/\/doi.org\/10.1007\/s11095-016-2029-7","journal-title":"Pharm Res"},{"issue":"3","key":"428_CR42","doi-asserted-by":"publisher","first-page":"1005","DOI":"10.1021\/acs.jcim.8b00671","volume":"59","author":"Y Zhou","year":"2019","unstructured":"Zhou Y, Cahya S, Combs SA et al (2019) Exploring tunable hyperparameters for deep neural networks with industrial ADME data sets. J Chem Inf Model 59(3):1005\u20131016. https:\/\/doi.org\/10.1021\/acs.jcim.8b00671","journal-title":"J Chem Inf Model"},{"issue":"1","key":"428_CR43","doi-asserted-by":"publisher","first-page":"47","DOI":"10.1186\/s13321-014-0047-1","volume":"6","author":"D Baumann","year":"2014","unstructured":"Baumann D, Baumann K (2014) Reliable estimation of prediction errors for QSAR models under model uncertainty using double cross-validation. J Cheminform 6(1):47. https:\/\/doi.org\/10.1186\/s13321-014-0047-1","journal-title":"J Cheminform"},{"issue":"1","key":"428_CR44","doi-asserted-by":"publisher","first-page":"37","DOI":"10.1177\/001316446002000104","volume":"20","author":"J Cohen","year":"1960","unstructured":"Cohen J (1960) A coefficient of agreement for nominal scales. Educ Psychol Measur 20(1):37\u201346. https:\/\/doi.org\/10.1177\/001316446002000104","journal-title":"Educ Psychol Measur"},{"issue":"4","key":"428_CR45","doi-asserted-by":"publisher","first-page":"555","DOI":"10.1162\/coli.07-034-R2","volume":"34","author":"R Artstein","year":"2008","unstructured":"Artstein R, Poesio M (2008) Inter-coder agreement for computational linguistics. Comput Linguist 34(4):555\u2013596. https:\/\/doi.org\/10.1162\/coli.07-034-R2","journal-title":"Comput Linguist"},{"key":"428_CR46","doi-asserted-by":"publisher","first-page":"2229","DOI":"10.9735\/2229-3981","volume":"2","author":"DM Powers","year":"2011","unstructured":"Powers DM (2011) Evaluation: from precision, recall and F-measure to ROC, informedness, markedness & correlation. J Mach Learn Technol 2:2229\u20133981. https:\/\/doi.org\/10.9735\/2229-3981","journal-title":"J Mach Learn Technol"},{"issue":"4","key":"428_CR47","doi-asserted-by":"publisher","first-page":"747","DOI":"10.1021\/ci9803381","volume":"39","author":"D Butina","year":"1999","unstructured":"Butina D (1999) Unsupervised data base clustering based on daylight\u2019s fingerprint and tanimoto similarity: a fast and automated way to cluster small and large data sets. J Chem Inf Comput Sci 39(4):747\u2013750. https:\/\/doi.org\/10.1021\/ci9803381","journal-title":"J Chem Inf Comput Sci"},{"key":"428_CR48","unstructured":"Nair V, Hinton GE (2010) Rectified linear units improve restricted boltzmann machines. In: Proceedings of the 27th International Conference on machine learning. Omnipress, Aliso Viejo, pp 807\u2013814"},{"key":"428_CR49","unstructured":"Xavier Glorot, Antoine Bordes, Yoshua Bengio (2011) Deep Sparse Rectifier Neural Networks Intelligence and Statistics, AISTATS 2011, Fort Lauderdale, USA, April 11-13, 2011. In: Geoffrey J. Gordon, David B. Dunson, Miroslav Dud\u0131k (eds) Proceedings of the Fourteenth International Conference on artificial intelligence and statistics, AISTATS 2011, Fort Lauderdale, April 11\u201313, 2011. JMLR.org, pp 315\u2013323"},{"key":"428_CR50","first-page":"971","volume-title":"Advances in neural information processing systems 30","author":"G Klambauer","year":"2017","unstructured":"Klambauer G, Unterthiner T, Mayr A et al (2017) Self-normalizing neural networks. In: Guyon I, Luxburg UV, Bengio S et al (eds) Advances in neural information processing systems 30. Curran Associates Inc, NewYork, pp 971\u2013980"},{"key":"428_CR51","doi-asserted-by":"crossref","unstructured":"Simm J, Arany A, Zakeri P et al. (2017) Macau: Scalable Bayesian factorization with high-dimensional side information using MCMC. In: 2017 IEEE 27th International Workshop on machine learning for signal processing (MLSP). IEEE, New York, pp 1\u20136","DOI":"10.1109\/MLSP.2017.8168143"},{"key":"428_CR52","doi-asserted-by":"crossref","unstructured":"Vander Aa T, Chakroun I, Ashby TJ et al. (2019) SMURFF: a high-performance framework for matrix factorization. arXiv:1904.02514","DOI":"10.1109\/AICAS.2019.8771607"},{"key":"428_CR53","doi-asserted-by":"crossref","unstructured":"Chen T, Guestrin C (2016) XGBoost: A scalable tree boosting system. In: Proceedings of the 22nd ACM SIGKDD International Conference on knowledge discovery and data mining. ACM, New York, pp 785\u2013794","DOI":"10.1145\/2939672.2939785"},{"key":"#cr-split#-428_CR54.1","doi-asserted-by":"crossref","unstructured":"Cima V, B\u00f6hm S, Martinovi\u010d J et al. (2018) HyperLoom. In: PARMA-DITAM 2018 proceedings: 9th Workshop on Parallel programming and run-time management techniques for Many-core Architectures","DOI":"10.1145\/3183767.3183768"},{"key":"#cr-split#-428_CR54.2","unstructured":"7th Workshop on design tools and architectures for multicore embedded computing platforms. January 23, 2018, Manchester, United Kingdom. The Association for Computing Machinery, New York, pp 1-6"}],"container-title":["Journal of Cheminformatics"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1186\/s13321-020-00428-5.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/article\/10.1186\/s13321-020-00428-5\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1186\/s13321-020-00428-5.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2021,4,18]],"date-time":"2021-04-18T23:29:16Z","timestamp":1618788556000},"score":1,"resource":{"primary":{"URL":"https:\/\/jcheminf.biomedcentral.com\/articles\/10.1186\/s13321-020-00428-5"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2020,4,19]]},"references-count":55,"journal-issue":{"issue":"1","published-print":{"date-parts":[[2020,12]]}},"alternative-id":["428"],"URL":"https:\/\/doi.org\/10.1186\/s13321-020-00428-5","relation":{},"ISSN":["1758-2946"],"issn-type":[{"value":"1758-2946","type":"electronic"}],"subject":[],"published":{"date-parts":[[2020,4,19]]},"assertion":[{"value":"29 October 2019","order":1,"name":"received","label":"Received","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"30 March 2020","order":2,"name":"accepted","label":"Accepted","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"19 April 2020","order":3,"name":"first_online","label":"First Online","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"The authors declare no competing interests.","order":1,"name":"Ethics","group":{"name":"EthicsHeading","label":"Competing interests"}}],"article-number":"26"}}