{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,4,28]],"date-time":"2026-04-28T08:39:26Z","timestamp":1777365566147,"version":"3.51.4"},"reference-count":39,"publisher":"Springer Science and Business Media LLC","issue":"6","license":[{"start":{"date-parts":[[2024,5,6]],"date-time":"2024-05-06T00:00:00Z","timestamp":1714953600000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"},{"start":{"date-parts":[[2024,5,6]],"date-time":"2024-05-06T00:00:00Z","timestamp":1714953600000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"}],"funder":[{"name":"Key-Area Research and Development Program of Guangdong Province","award":["No. 2021B0101420004"],"award-info":[{"award-number":["No. 2021B0101420004"]}]}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["Scientometrics"],"published-print":{"date-parts":[[2024,6]]},"DOI":"10.1007\/s11192-024-05024-0","type":"journal-article","created":{"date-parts":[[2024,5,6]],"date-time":"2024-05-06T09:01:54Z","timestamp":1714986114000},"page":"3067-3087","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":6,"title":["Research on cross-lingual multi-label patent classification based on pre-trained model"],"prefix":"10.1007","volume":"129","author":[{"given":"Yonghe","family":"Lu","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Lehua","family":"Chen","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Xinyu","family":"Tong","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Yongxin","family":"Peng","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0002-6843-9795","authenticated-orcid":false,"given":"Hou","family":"Zhu","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"297","published-online":{"date-parts":[[2024,5,6]]},"reference":[{"key":"5024_CR1","doi-asserted-by":"publisher","first-page":"597","DOI":"10.1162\/tacl_a_00288","volume":"7","author":"M Artetxe","year":"2019","unstructured":"Artetxe, M., & Schwenk, H. (2019). Massively multilingual sentence embeddings for zero-shot cross-lingual transfer and beyond. Transactions of the Association for Computational Linguistics, 7, 597\u2013610.","journal-title":"Transactions of the Association for Computational Linguistics"},{"key":"5024_CR2","doi-asserted-by":"crossref","unstructured":"Bel, N., Koster, C. H., & Villegas, M. (2003). Cross-lingual text categorization. In International conference on theory and practice of digital libraries, 2003 (pp. 126\u2013139). Springer.","DOI":"10.1007\/978-3-540-45175-4_13"},{"issue":"Feb","key":"5024_CR3","first-page":"1137","volume":"3","author":"Y Bengio","year":"2003","unstructured":"Bengio, Y., Ducharme, R., Vincent, P., & Jauvin, C. (2003). A neural probabilistic language model. Journal of Machine Learning Research, 3(Feb), 1137\u20131155.","journal-title":"Journal of Machine Learning Research"},{"key":"5024_CR4","doi-asserted-by":"publisher","first-page":"135","DOI":"10.1162\/tacl_a_00051","volume":"5","author":"P Bojanowski","year":"2017","unstructured":"Bojanowski, P., Grave, E., Joulin, A., & Mikolov, T. (2017). Enriching word vectors with subword information. Transactions of the Association for Computational Linguistics, 5, 135\u2013146.","journal-title":"Transactions of the Association for Computational Linguistics"},{"key":"5024_CR5","doi-asserted-by":"crossref","unstructured":"Conneau, A., Khandelwal, K., Goyal, N., Chaudhary, V., Wenzek, G., Guzm\u00e1n, F., Grave, E., Ott, M., Zettlemoyer, L., & Stoyanov, V. (2019). Unsupervised cross-lingual representation learning at scale. arXiv preprint arXiv:1911.02116","DOI":"10.18653\/v1\/2020.acl-main.747"},{"key":"5024_CR6","unstructured":"Devlin, J., Chang, M.-W., Lee, K., & Toutanova, K. (2018). BERT: Pre-training of deep bidirectional transformers for language understanding. arXiv preprint arXiv:1810.04805"},{"key":"5024_CR7","doi-asserted-by":"crossref","unstructured":"Fall, C. J., T\u00f6rcsv\u00e1ri, A., Benzineb, K., & Karetka, G. (2003). Automated categorization in the International Patent Classification. In ACM SIGIR Forum, 2003 (Vol. 37, pp. 10\u201325). ACM.","DOI":"10.1145\/945546.945547"},{"key":"5024_CR8","unstructured":"Hermann, K. M., & Blunsom, P. (2013). Multilingual distributed representations without word alignment. arXiv preprint arXiv:1312.6173"},{"key":"5024_CR9","doi-asserted-by":"crossref","unstructured":"Hermann, K. M., & Blunsom, P. (2014). Multilingual models for compositional distributed semantics. arXiv preprint arXiv:1404.4641","DOI":"10.3115\/v1\/P14-1006"},{"issue":"1","key":"5024_CR10","doi-asserted-by":"publisher","first-page":"219","DOI":"10.3390\/su10010219","volume":"10","author":"J Hu","year":"2018","unstructured":"Hu, J., Li, S., Hu, J., & Yang, G. (2018). A hierarchical feature extraction model for multi-label mechanical patent classification. Sustainability, 10(1), 219.","journal-title":"Sustainability"},{"key":"5024_CR11","doi-asserted-by":"crossref","unstructured":"Kim, Y. (2014). Convolutional neural networks for sentence classification. In Proceedings of the 2014 conference on empirical methods in natural language processing (EMNLP), Doha, Qatar, October 2014 (pp. 1746\u20131751). Association for Computational Linguistics.","DOI":"10.3115\/v1\/D14-1181"},{"key":"5024_CR12","doi-asserted-by":"crossref","unstructured":"Kudo, T. (2018). Subword regularization: Improving neural network translation models with multiple subword candidates. arXiv preprint arXiv:1804.10959","DOI":"10.18653\/v1\/P18-1007"},{"key":"5024_CR13","unstructured":"Lample, G., & Conneau, A. (2019). Cross-lingual language model pretraining. arXiv preprint arXiv:1901.07291"},{"key":"5024_CR14","unstructured":"Lauly, S., Larochelle, H., Khapra, M. M., Ravindran, B., Raykar, V., Saha, A. (2014). An autoencoder approach to learning bilingual word representations. arXiv preprint arXiv:1402.1454"},{"issue":"2","key":"5024_CR15","doi-asserted-by":"publisher","first-page":"721","DOI":"10.1007\/s11192-018-2905-5","volume":"117","author":"S Li","year":"2018","unstructured":"Li, S., Hu, J., Cui, Y., & Hu, J. (2018). DeepPatent: Patent classification with convolutional neural networks and word embedding. Scientometrics, 117(2), 721\u2013744.","journal-title":"Scientometrics"},{"issue":"8","key":"5024_CR16","first-page":"103","volume":"39","author":"J Miao","year":"2016","unstructured":"Miao, J., Jia, G., & Zhang, Y. (2016). The rapid automatic categorization of patent based on abstract text. Information Studies: Theory and Application, 39(8), 103\u2013105.","journal-title":"Information Studies: Theory and Application"},{"key":"5024_CR17","unstructured":"Mikolov, T., Le, Q. V., & Sutskever, I. (2013). Exploiting similarities among languages for machine translation. arXiv preprint arXiv:1309.4168"},{"key":"5024_CR18","doi-asserted-by":"crossref","unstructured":"Pennington, J., Socher, R., & Manning, C. D. (2014). GloVe: Global vectors for word representation. In Proceedings of the 2014 conference on empirical methods in natural language processing (EMNLP), 2015 (pp. 1532\u20131543).","DOI":"10.3115\/v1\/D14-1162"},{"key":"5024_CR19","doi-asserted-by":"crossref","unstructured":"Peters, M. E., Neumann, M., Iyyer, M., Gardner, M., Clark, C., Lee, K., & Zettlemoyer, L. (2018). Deep contextualized word representations. In Proceedings of the 2018 conference of the North American Chapter of the Association for Computational Linguistics: human language technologies: Long papers, New Orleans, Louisiana, June 2018 (Vol. 1, pp. 2227\u20132237). Association for Computational Linguistics.","DOI":"10.18653\/v1\/N18-1202"},{"key":"5024_CR20","doi-asserted-by":"crossref","unstructured":"Pires, T., Schlinger, E., & Garrette, D. (2019). How multilingual is multilingual BERT? arXiv preprint arXiv:1906.01502","DOI":"10.18653\/v1\/P19-1493"},{"key":"5024_CR21","unstructured":"Radford, A., Narasimhan, K., Salimans, T., & Sutskever, I. (2018). Improving language understanding by generative pre-training. Preprint."},{"key":"5024_CR22","doi-asserted-by":"crossref","unstructured":"Roudsari, A. H., Afshar, J., Lee, C. C., & Lee, W. (2020). Multi-label patent classification using attention-aware deep learning model. In 2020 IEEE international conference on big data and smart computing (BigComp), 2020 (pp. 558\u2013559). IEEE.","DOI":"10.1109\/BigComp48618.2020.000-2"},{"key":"5024_CR23","doi-asserted-by":"publisher","first-page":"569","DOI":"10.1613\/jair.1.11640","volume":"65","author":"S Ruder","year":"2019","unstructured":"Ruder, S., Vuli\u0107, I., & S\u00f8gaard, A. (2019). A survey of cross-lingual word embedding models. Journal of Artificial Intelligence Research, 65, 569\u2013631.","journal-title":"Journal of Artificial Intelligence Research"},{"key":"5024_CR24","doi-asserted-by":"crossref","unstructured":"Ryzhova, A., & Sochenkov, I. (2021). Extrinsic evaluation of cross-lingual embeddings on the patent classification task. In Data analytics and management in data intensive domains: 22nd International conference, DAMDID\/RCDL 2020: Selected proceedings 22, Voronezh, Russia, October 13\u201316, 2020 (pp. 178\u2013190). Springer.","DOI":"10.1007\/978-3-030-81200-3_13"},{"key":"5024_CR25","unstructured":"Sanh, V., Debut, L., Chaumond, J., & Wolf, T. (2019). DistilBERT, a distilled version of BERT: Smaller, faster, cheaper and lighter. arXiv preprint arXiv:1910.01108"},{"key":"5024_CR26","doi-asserted-by":"crossref","unstructured":"Sennrich, R., Haddow, B., & Birch, A. (2015). Neural machine translation of rare words with subword units. arXiv preprint arXiv:1508.07909","DOI":"10.18653\/v1\/P16-1162"},{"key":"5024_CR27","doi-asserted-by":"crossref","unstructured":"Shalaby, M., Stutzki, J., Schubert, M., & G\u00fcnnemann, S. (2018). An LSTM approach to patent classification based on fixed hierarchy vectors. In Proceedings of the 2018 SIAM international conference on data mining, 2018 (pp. 495\u2013503). SIAM.","DOI":"10.1137\/1.9781611975321.56"},{"key":"5024_CR28","unstructured":"T. Five IP Offices. (2021). IP5 statistics report 2019 edition. Retrieved December 28, 2021, from https:\/\/www.fiveipoffices.org\/statistics\/statisticsreports\/2019edition"},{"issue":"1","key":"5024_CR29","first-page":"75","volume":"313","author":"L Tian","year":"2022","unstructured":"Tian, L., Li, B., & Zhang, C. (2022). Classification of cross-lingual research methods based on full-text content of academic articles. Library Development, 313(1), 75.","journal-title":"Library Development"},{"key":"5024_CR30","unstructured":"Tong, X., Zhao, R., & Lu, Y. (2022). Research on multi-label patent classification based on pre-training mode. Data Analysis and Knowledge Discovery, 6(z1), 129\u2013137."},{"key":"5024_CR31","doi-asserted-by":"crossref","unstructured":"Tran, T., & Kavuluru, R. (2017). Supervised approaches to assign Cooperative Patent Classification (CPC) codes to patents. In International conference on mining intelligence and knowledge exploration, 2017 (pp. 22\u201334). Springer.","DOI":"10.1007\/978-3-319-71928-3_3"},{"key":"5024_CR39","doi-asserted-by":"crossref","unstructured":"van der Heijden, N., Yannakoudakis, H., Mishra, P., & Shutova, E. (2021). Multilingual and cross-lingual document classification: A meta-learning approach. arXiv preprint arXiv:2101.11302","DOI":"10.18653\/v1\/2021.eacl-main.168"},{"key":"5024_CR32","unstructured":"Vaswani, A., Shazeer, N., Parmar, N., Uszkoreit, J., Jones, L., Gomez, A. N., Kaiser, \u0141., & Polosukhin, I. (2017). Attention is all you need. In Advances in neural information processing systems, 2017 (pp. 5998\u20136008)."},{"key":"5024_CR33","doi-asserted-by":"publisher","first-page":"953","DOI":"10.1613\/jair.4986","volume":"55","author":"I Vuli\u0107","year":"2016","unstructured":"Vuli\u0107, I., & Moens, M.-F. (2016). Bilingual distributed word representations from document-aligned comparable data. Journal of Artificial Intelligence Research, 55, 953\u2013994.","journal-title":"Journal of Artificial Intelligence Research"},{"key":"5024_CR34","unstructured":"World Intellectual Property Organization. (2021). Intellectual property statistics. WIPO. Retrieved December 28, 2021, from https:\/\/www.wipo.int\/ipstats\/en\/index.html"},{"key":"5024_CR35","doi-asserted-by":"crossref","unstructured":"Xiao, M., & Guo, Y. (2014). Distributed word representation learning for cross-lingual dependency parsing. In Proceedings of the eighteenth conference on computational natural language learning, 2014 (pp. 119\u2013129).","DOI":"10.3115\/v1\/W14-1613"},{"key":"5024_CR36","doi-asserted-by":"crossref","unstructured":"Xing, C., Wang, D., Liu, C., & Lin, Y. (2015). Normalized word embedding and orthogonal transform for bilingual word translation. In Proceedings of the 2015 conference of the North American Chapter of the Association for Computational Linguistics: Human language technologies, 2015 (pp. 1006\u20131011).","DOI":"10.3115\/v1\/N15-1104"},{"key":"5024_CR37","doi-asserted-by":"crossref","unstructured":"Yu, K., Li, H., & Oguz, B. (2018). Multilingual Seq2Seq training with similarity loss for cross-lingual document classification. In Proceedings of the third workshop on representation learning for NLP, 2018 (pp. 175\u2013179).","DOI":"10.18653\/v1\/W18-3023"},{"issue":"7","key":"5024_CR38","doi-asserted-by":"publisher","first-page":"2038","DOI":"10.1016\/j.patcog.2006.12.019","volume":"40","author":"M-L Zhang","year":"2007","unstructured":"Zhang, M.-L., & Zhou, Z.-H. (2007). ML-KNN: A lazy learning approach to multi-label learning. Pattern Recognition, 40(7), 2038\u20132048.","journal-title":"Pattern Recognition"}],"container-title":["Scientometrics"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s11192-024-05024-0.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/article\/10.1007\/s11192-024-05024-0\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s11192-024-05024-0.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2024,7,3]],"date-time":"2024-07-03T02:05:24Z","timestamp":1719972324000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/s11192-024-05024-0"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2024,5,6]]},"references-count":39,"journal-issue":{"issue":"6","published-print":{"date-parts":[[2024,6]]}},"alternative-id":["5024"],"URL":"https:\/\/doi.org\/10.1007\/s11192-024-05024-0","relation":{},"ISSN":["0138-9130","1588-2861"],"issn-type":[{"value":"0138-9130","type":"print"},{"value":"1588-2861","type":"electronic"}],"subject":[],"published":{"date-parts":[[2024,5,6]]},"assertion":[{"value":"21 July 2022","order":1,"name":"received","label":"Received","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"8 April 2024","order":2,"name":"accepted","label":"Accepted","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"6 May 2024","order":3,"name":"first_online","label":"First Online","group":{"name":"ArticleHistory","label":"Article History"}},{"order":1,"name":"Ethics","group":{"name":"EthicsHeading","label":"Declarations"}},{"value":"The author has no conflict of interest to declare.","order":2,"name":"Ethics","group":{"name":"EthicsHeading","label":"Conflict of interest"}}]}}