{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,5,30]],"date-time":"2026-05-30T01:54:18Z","timestamp":1780106058935,"version":"3.54.0"},"publisher-location":"Singapore","reference-count":28,"publisher":"Springer Nature Singapore","isbn-type":[{"value":"9789819530571","type":"print"},{"value":"9789819530588","type":"electronic"}],"license":[{"start":{"date-parts":[[2025,11,18]],"date-time":"2025-11-18T00:00:00Z","timestamp":1763424000000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"},{"start":{"date-parts":[[2025,11,18]],"date-time":"2025-11-18T00:00:00Z","timestamp":1763424000000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2026]]},"DOI":"10.1007\/978-981-95-3058-8_4","type":"book-chapter","created":{"date-parts":[[2025,11,18]],"date-time":"2025-11-18T15:00:01Z","timestamp":1763478001000},"page":"40-51","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":0,"title":["MatSciES: Automated Knowledge Extraction and\u00a0Summarization from\u00a0Materials Science Literature with\u00a0Large Language Models"],"prefix":"10.1007","author":[{"ORCID":"https:\/\/orcid.org\/0009-0005-7149-4292","authenticated-orcid":false,"given":"Jialin","family":"Xu","sequence":"first","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"ORCID":"https:\/\/orcid.org\/0000-0002-9118-3775","authenticated-orcid":false,"given":"Jinguo","family":"You","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"ORCID":"https:\/\/orcid.org\/0009-0007-7372-245X","authenticated-orcid":false,"given":"Chuhan","family":"Zhang","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"ORCID":"https:\/\/orcid.org\/0009-0009-4654-0794","authenticated-orcid":false,"given":"Huaze","family":"Huang","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Jingmei","family":"Tao","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Jianhong","family":"Yi","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]}],"member":"297","published-online":{"date-parts":[[2025,11,18]]},"reference":[{"issue":"1","key":"4_CR1","doi-asserted-by":"publisher","first-page":"1418","DOI":"10.1038\/s41467-024-45563-x","volume":"15","author":"J Dagdelen","year":"2024","unstructured":"Dagdelen, J., et al.: Structured information extraction from scientific text with large language models. Nat. Commun. 15(1), 1418 (2024)","journal-title":"Nat. Commun."},{"key":"4_CR2","unstructured":"Dua, D., Wang, Y., Dasigi, P., Stanovsky, G., Singh, S., Gardner, M.: Drop: a reading comprehension benchmark requiring discrete reasoning over paragraphs. arXiv preprint arXiv:1903.00161 (2019)"},{"key":"4_CR3","doi-asserted-by":"crossref","unstructured":"Gupta, T., Zaki, M., Krishnan, N.A., Mausam: Matscibert: a materials domain language model for text mining and information extraction. NPJ Comput. Mater. 8(1), 102 (2022)","DOI":"10.1038\/s41524-022-00784-w"},{"issue":"18","key":"4_CR4","doi-asserted-by":"publisher","first-page":"7861","DOI":"10.1021\/acs.chemmater.0c02553","volume":"32","author":"T He","year":"2020","unstructured":"He, T., et al.: Similarity of precursors in solid-state synthesis as text-mined from scientific literature. Chem. Mater. 32(18), 7861\u20137873 (2020)","journal-title":"Chem. Mater."},{"key":"4_CR5","unstructured":"Hendrycks, D., et al.: Aligning AI with shared human values. arXiv preprint arXiv:2008.02275 (2020)"},{"issue":"1","key":"4_CR6","doi-asserted-by":"publisher","first-page":"80","DOI":"10.1038\/s41597-023-02897-3","volume":"11","author":"D Huang","year":"2024","unstructured":"Huang, D., Cole, J.M.: A database of thermally activated delayed fluorescent molecules auto-generated from scientific literature with chemdataextractor. Sci. Data 11(1), 80 (2024)","journal-title":"Sci. Data"},{"issue":"1","key":"4_CR7","doi-asserted-by":"publisher","first-page":"260","DOI":"10.1038\/s41597-020-00602-2","volume":"7","author":"S Huang","year":"2020","unstructured":"Huang, S., Cole, J.M.: A database of battery materials auto-generated using ChemDataExtractor. Sci. Data 7(1), 260 (2020)","journal-title":"Sci. Data"},{"issue":"24","key":"4_CR8","doi-asserted-by":"publisher","first-page":"6365","DOI":"10.1021\/acs.jcim.2c00035","volume":"62","author":"S Huang","year":"2022","unstructured":"Huang, S., Cole, J.M.: Batterybert: a pretrained language model for battery database enhancement. J. Chem. Inf. Model. 62(24), 6365\u20136377 (2022)","journal-title":"J. Chem. Inf. Model."},{"key":"4_CR9","unstructured":"Jin, H., Zhang, Y., Meng, D., Wang, J., Tan, J.: A comprehensive survey on process-oriented automatic text summarization with exploration of LLM-based methods. arXiv preprint arXiv:2403.02901 (2024)"},{"key":"4_CR10","doi-asserted-by":"crossref","unstructured":"Kocmi, T., et\u00a0al.: Findings of the 2023 conference on machine translation (WMT23): LLMs are here but not quite there yet. In: WMT23-Eighth Conference on Machine Translation, pp. 198\u2013216 (2023)","DOI":"10.18653\/v1\/2023.wmt-1.1"},{"key":"4_CR11","doi-asserted-by":"crossref","unstructured":"Kononova, O., He, T., Huo, H., Trewartha, A., Olivetti, E.A., Ceder, G.: Opportunities and challenges of text mining in materials research. Iscience 24(3) (2021)","DOI":"10.1016\/j.isci.2021.102155"},{"key":"4_CR12","doi-asserted-by":"publisher","first-page":"1","DOI":"10.1186\/s13321-018-0280-0","volume":"10","author":"I Korvigo","year":"2018","unstructured":"Korvigo, I., Holmatov, M., Zaikovskii, A., Skoblov, M.: Putting hands to rest: efficient deep CNN-RNN architecture for chemical named entity recognition with no hand-crafted rules. J. Cheminform. 10, 1\u201310 (2018)","journal-title":"J. Cheminform."},{"issue":"7","key":"4_CR13","doi-asserted-by":"publisher","first-page":"1257","DOI":"10.1039\/D4DD00074A","volume":"3","author":"G Lei","year":"2024","unstructured":"Lei, G., Docherty, R., Cooper, S.J.: Materials science in the era of large language models: a perspective. Digit. Discov. 3(7), 1257\u20131272 (2024)","journal-title":"Digit. Discov."},{"key":"4_CR14","doi-asserted-by":"crossref","unstructured":"Mavracic, J., Court, C.J., Isazawa, T., Elliott, S.R., Cole, J.M.: Chemdataextractor 2.0: autopopulated ontologies for materials science. J. Chem. Inf. Model. 61(9), 4280\u20134289 (2021)","DOI":"10.1021\/acs.jcim.1c00446"},{"issue":"1","key":"4_CR15","doi-asserted-by":"publisher","first-page":"1569","DOI":"10.1038\/s41467-024-45914-8","volume":"15","author":"MP Polak","year":"2024","unstructured":"Polak, M.P., Morgan, D.: Extracting accurate materials data from research papers with conversational language models and prompt engineering. Nat. Commun. 15(1), 1569 (2024)","journal-title":"Nat. Commun."},{"issue":"9","key":"4_CR16","doi-asserted-by":"publisher","first-page":"99","DOI":"10.1145\/3474381","volume":"64","author":"K Sakaguchi","year":"2021","unstructured":"Sakaguchi, K., Bras, R.L., Bhagavatula, C., Choi, Y.: Winogrande: an adversarial winograd schema challenge at scale. Commun. ACM 64(9), 99\u2013106 (2021)","journal-title":"Commun. ACM"},{"issue":"10","key":"4_CR17","doi-asserted-by":"publisher","first-page":"1894","DOI":"10.1021\/acs.jcim.6b00207","volume":"56","author":"MC Swain","year":"2016","unstructured":"Swain, M.C., Cole, J.M.: Chemdataextractor: a toolkit for automated extraction of chemical information from the scientific literature. J. Chem. Inf. Model. 56(10), 1894\u20131904 (2016)","journal-title":"J. Chem. Inf. Model."},{"key":"4_CR18","doi-asserted-by":"crossref","unstructured":"Trewartha, A., et al.: Quantifying the advantage of domain-specific pre-training on named entity recognition tasks in materials science. Patterns 3(4) (2022)","DOI":"10.1016\/j.patter.2022.100488"},{"issue":"1","key":"4_CR19","doi-asserted-by":"publisher","first-page":"217","DOI":"10.1038\/s41597-024-03039-z","volume":"11","author":"V Venugopal","year":"2024","unstructured":"Venugopal, V., Olivetti, E.: Matkg: an autonomously generated knowledge graph in material science. Sci. Data 11(1), 217 (2024)","journal-title":"Sci. Data"},{"key":"4_CR20","unstructured":"Wang, S., et al.: GPT-NER: named entity recognition via large language models. arXiv preprint arXiv:2304.10428 (2023)"},{"issue":"9","key":"4_CR21","doi-asserted-by":"publisher","first-page":"3692","DOI":"10.1021\/acs.jcim.9b00470","volume":"59","author":"L Weston","year":"2019","unstructured":"Weston, L., et al.: Named entity recognition and normalization applied to large-scale information extraction from the materials science literature. J. Chem. Inf. Model. 59(9), 3692\u20133702 (2019)","journal-title":"J. Chem. Inf. Model."},{"key":"4_CR22","doi-asserted-by":"crossref","unstructured":"Wilary, D.M., Cole, J.M.: Reactiondataextractor 2.0: a deep learning approach for data extraction from chemical reaction schemes. J. Chem. Inf. Model. 63(19), 6053\u20136067 (2023)","DOI":"10.1021\/acs.jcim.3c00422"},{"key":"4_CR23","unstructured":"Ye, J., et al.: LLM-DA: data augmentation via large language models for few-shot named entity recognition. arXiv preprint arXiv:2402.14568 (2024)"},{"issue":"2","key":"4_CR24","doi-asserted-by":"publisher","first-page":"313","DOI":"10.1039\/D3DD00188A","volume":"3","author":"M Zaki","year":"2024","unstructured":"Zaki, M., Krishnan, N.A., et al.: Mascqa: investigating materials science knowledge of large language models. Digit. Discov. 3(2), 313\u2013327 (2024)","journal-title":"Digit. Discov."},{"issue":"27","key":"4_CR25","doi-asserted-by":"publisher","first-page":"10600","DOI":"10.1039\/D4SC00924J","volume":"15","author":"W Zhang","year":"2024","unstructured":"Zhang, W., et al.: Fine-tuning large language models for chemical text mining. Chem. Sci. 15(27), 10600\u201310611 (2024)","journal-title":"Chem. Sci."},{"issue":"1","key":"4_CR26","doi-asserted-by":"publisher","first-page":"192","DOI":"10.1038\/s41597-022-01295-5","volume":"9","author":"J Zhao","year":"2022","unstructured":"Zhao, J., Cole, J.M.: A database of refractive indices and dielectric constants auto-generated using ChemDataExtractor. Sci. Data 9(1), 192 (2022)","journal-title":"Sci. Data"},{"issue":"7","key":"4_CR27","doi-asserted-by":"publisher","first-page":"1961","DOI":"10.1021\/acs.jcim.2c01259","volume":"63","author":"J Zhao","year":"2023","unstructured":"Zhao, J., Huang, S., Cole, J.M.: Opticalbert and opticaltable-sqa: text-and table-based language models for the optical-materials domain. J. Chem. Inf. Model. 63(7), 1961\u20131981 (2023)","journal-title":"J. Chem. Inf. Model."},{"issue":"32","key":"4_CR28","doi-asserted-by":"publisher","first-page":"18048","DOI":"10.1021\/jacs.3c05819","volume":"145","author":"Z Zheng","year":"2023","unstructured":"Zheng, Z., Zhang, O., Borgs, C., Chayes, J.T., Yaghi, O.M.: Chatgpt chemistry assistant for text mining and the prediction of MOF synthesis. J. Am. Chem. Soc. 145(32), 18048\u201318062 (2023)","journal-title":"J. Am. Chem. Soc."}],"container-title":["Lecture Notes in Computer Science","Knowledge Science, Engineering and Management"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/978-981-95-3058-8_4","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2025,11,18]],"date-time":"2025-11-18T15:00:05Z","timestamp":1763478005000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/978-981-95-3058-8_4"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2025,11,18]]},"ISBN":["9789819530571","9789819530588"],"references-count":28,"URL":"https:\/\/doi.org\/10.1007\/978-981-95-3058-8_4","relation":{},"ISSN":["0302-9743","1611-3349"],"issn-type":[{"value":"0302-9743","type":"print"},{"value":"1611-3349","type":"electronic"}],"subject":[],"published":{"date-parts":[[2025,11,18]]},"assertion":[{"value":"18 November 2025","order":1,"name":"first_online","label":"First Online","group":{"name":"ChapterHistory","label":"Chapter History"}},{"value":"KSEM","order":1,"name":"conference_acronym","label":"Conference Acronym","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"International Conference on Knowledge Science, Engineering and Management","order":2,"name":"conference_name","label":"Conference Name","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"Macao","order":3,"name":"conference_city","label":"Conference City","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"China","order":4,"name":"conference_country","label":"Conference Country","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"2025","order":5,"name":"conference_year","label":"Conference Year","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"4 August 2025","order":7,"name":"conference_start_date","label":"Conference Start Date","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"7 August 2025","order":8,"name":"conference_end_date","label":"Conference End Date","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"18","order":9,"name":"conference_number","label":"Conference Number","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"ksem2025","order":10,"name":"conference_id","label":"Conference ID","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"https:\/\/ksem2025.scimeeting.cn\/en\/web\/index\/27434","order":11,"name":"conference_url","label":"Conference URL","group":{"name":"ConferenceInfo","label":"Conference Information"}}]}}