{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,2,13]],"date-time":"2026-02-13T08:20:16Z","timestamp":1770970816064,"version":"3.50.1"},"publisher-location":"New York, NY, USA","reference-count":44,"publisher":"ACM","license":[{"start":{"date-parts":[[2022,10,10]],"date-time":"2022-10-10T00:00:00Z","timestamp":1665360000000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.acm.org\/publications\/policies\/copyright_policy#Background"}],"funder":[{"name":"Strategic Priority Research Program of Chinese Academy of Sciences","award":["No.XDC02040400"],"award-info":[{"award-number":["No.XDC02040400"]}]},{"DOI":"10.13039\/501100012166","name":"National Key Research and Development Program of China","doi-asserted-by":"publisher","award":["No.2021YFB3100600"],"award-info":[{"award-number":["No.2021YFB3100600"]}],"id":[{"id":"10.13039\/501100012166","id-type":"DOI","asserted-by":"publisher"}]},{"name":"Youth Innovation Promotion Association of Chinese Academy of Sciences","award":["No.2021153"],"award-info":[{"award-number":["No.2021153"]}]}],"content-domain":{"domain":["dl.acm.org"],"crossmark-restriction":true},"short-container-title":[],"published-print":{"date-parts":[[2022,10,10]]},"DOI":"10.1145\/3503161.3548765","type":"proceedings-article","created":{"date-parts":[[2022,10,10]],"date-time":"2022-10-10T15:42:35Z","timestamp":1665416555000},"page":"7252-7260","update-policy":"https:\/\/doi.org\/10.1145\/crossmark-policy","source":"Crossref","is-referenced-by-count":4,"title":["Layout-Aware Information Extraction for Document-Grounded Dialogue"],"prefix":"10.1145","author":[{"given":"Zhenyu","family":"Zhang","sequence":"first","affiliation":[{"name":"Institute of Information Engineering, Chinese Academy of Sciences, Beijing, China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Bowen","family":"Yu","sequence":"additional","affiliation":[{"name":"DAMO Academy, Alibaba Group &amp; Institute of Information Engineering, Chinese Academy of Sciences, Beijing, China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Haiyang","family":"Yu","sequence":"additional","affiliation":[{"name":"DAMO Academy, Alibaba Group, Beijing, China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Tingwen","family":"Liu","sequence":"additional","affiliation":[{"name":"Institute of Information Engineering, Chinese Academy of Sciences &amp; School of Cyber Security, University of Chinese Academy of Sciences, Beijing, China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Cheng","family":"Fu","sequence":"additional","affiliation":[{"name":"DAMO Academy, Alibaba Group, Beijing, China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Jingyang","family":"Li","sequence":"additional","affiliation":[{"name":"DAMO Academy, Alibaba Group, Beijing, China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Chengguang","family":"Tang","sequence":"additional","affiliation":[{"name":"DAMO Academy, Alibaba Group, Beijing, China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Jian","family":"Sun","sequence":"additional","affiliation":[{"name":"DAMO Academy, Alibaba Group, Beijing, China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Yongbin","family":"Li","sequence":"additional","affiliation":[{"name":"DAMO Academy, Alibaba Group, Beijing, China"}],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"320","published-online":{"date-parts":[[2022,10,10]]},"reference":[{"key":"e_1_3_2_2_1_1","volume-title":"ICCV","author":"Appalaraju Srikar","year":"2021","unstructured":"Srikar Appalaraju , Bhavan Jasani , Bhargava Urala Kota , Yusheng Xie , and R Man- matha. Docformer : End-to-end transformer for document understanding . In ICCV , 2021 . Srikar Appalaraju, Bhavan Jasani, Bhargava Urala Kota, Yusheng Xie, and R Man- matha. Docformer: End-to-end transformer for document understanding. In ICCV, 2021."},{"key":"e_1_3_2_2_2_1","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/2020.acl-main.652"},{"key":"e_1_3_2_2_3_1","doi-asserted-by":"publisher","DOI":"10.1609\/aaai.v35i14.17494"},{"key":"e_1_3_2_2_4_1","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/2021.dialdoc-1.14"},{"key":"e_1_3_2_2_5_1","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/2020.emnlp-main.275"},{"key":"e_1_3_2_2_6_1","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/D18-1241"},{"key":"e_1_3_2_2_7_1","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/2020.acl-main.57"},{"key":"e_1_3_2_2_8_1","volume-title":"NAACL","author":"Devlin Jacob","year":"2019","unstructured":"Jacob Devlin , Ming-Wei Chang , Kenton Lee , and Kristina Toutanova . Bert : Pre- training of deep bidirectional transformers for language understanding . In NAACL , 2019 . Jacob Devlin, Ming-Wei Chang, Kenton Lee, and Kristina Toutanova. Bert: Pre- training of deep bidirectional transformers for language understanding. In NAACL, 2019."},{"key":"e_1_3_2_2_9_1","volume-title":"AAAI","author":"Fadnis Kshitij","year":"2021","unstructured":"Kshitij Fadnis , Pankaj Dhoolia , Li Zhu , Q Vera Liao , Steven Ross , Nathaniel Mills , Sachindra Joshi , and Luis Lastras . Doc2bot : Document grounded bot framework . In AAAI , 2021 . Kshitij Fadnis, Pankaj Dhoolia, Li Zhu, Q Vera Liao, Steven Ross, Nathaniel Mills, Sachindra Joshi, and Luis Lastras. Doc2bot: Document grounded bot framework. In AAAI, 2021."},{"key":"e_1_3_2_2_10_1","doi-asserted-by":"publisher","DOI":"10.1609\/aaai.v34i09.7089"},{"key":"e_1_3_2_2_11_1","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/2020.emnlp-main.652"},{"key":"e_1_3_2_2_12_1","doi-asserted-by":"publisher","DOI":"10.1145\/3477495.3532069"},{"key":"e_1_3_2_2_13_1","doi-asserted-by":"publisher","DOI":"10.1609\/aaai.v36i10.21320"},{"key":"e_1_3_2_2_14_1","volume-title":"SemEval","author":"Hendrickx Iris","year":"2010","unstructured":"Iris Hendrickx , Su Nam Kim , Zornitsa Kozareva , Preslav Nakov , Diarmuid \u00d3 S\u00e9aghdha , Sebastian Pad\u00f3 , Marco Pennacchiotti , Lorenza Romano , and Stan Szpakowicz . Semeval-2010 task 8 : Multi-way classification of semantic relations between pairs of nominals . In SemEval , 2010 . Iris Hendrickx, Su Nam Kim, Zornitsa Kozareva, Preslav Nakov, Diarmuid \u00d3 S\u00e9aghdha, Sebastian Pad\u00f3, Marco Pennacchiotti, Lorenza Romano, and Stan Szpakowicz. Semeval-2010 task 8: Multi-way classification of semantic relations between pairs of nominals. In SemEval, 2010."},{"key":"e_1_3_2_2_15_1","doi-asserted-by":"publisher","DOI":"10.1109\/ICDAR.2019.00244"},{"key":"e_1_3_2_2_16_1","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/2020.acl-main.670"},{"key":"e_1_3_2_2_17_1","doi-asserted-by":"publisher","DOI":"10.1109\/ICDARW.2019.10029"},{"key":"e_1_3_2_2_18_1","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/2021.dialdoc-1.13"},{"key":"e_1_3_2_2_19_1","volume-title":"ACL","author":"Li Chenliang","year":"2021","unstructured":"Chenliang Li , Bin Bi , Ming Yan , Wei Wang , Songfang Huang , Fei Huang , and Luo Si. Structurallm : Structural pre-training for form understanding . In ACL , 2021 . Chenliang Li, Bin Bi, Ming Yan, Wei Wang, Songfang Huang, Fei Huang, and Luo Si. Structurallm: Structural pre-training for form understanding. In ACL, 2021."},{"key":"e_1_3_2_2_20_1","volume-title":"NeurIPS","author":"Li Jinpeng","year":"2021","unstructured":"Jinpeng Li , Yingce Xia , Rui Yan , Hongda Sun , Dongyan Zhao , and Tie-Yan Liu . Stylized dialogue generation with multi-pass dual learning . In NeurIPS , 2021 . Jinpeng Li, Yingce Xia, Rui Yan, Hongda Sun, Dongyan Zhao, and Tie-Yan Liu. Stylized dialogue generation with multi-pass dual learning. In NeurIPS, 2021."},{"key":"e_1_3_2_2_21_1","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-030-32236-6_72"},{"key":"e_1_3_2_2_22_1","doi-asserted-by":"publisher","DOI":"10.1145\/3474085.3475345"},{"key":"e_1_3_2_2_23_1","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/2021.emnlp-main.185"},{"key":"e_1_3_2_2_24_1","volume-title":"NeurIPS: Workshop","author":"Park Seunghyun","year":"2019","unstructured":"Seunghyun Park , Seung Shin , Bado Lee , Junyeop Lee , Jaeheung Surh , Minjoon Seo , and Hwalsuk Lee . Cord : A consolidated receipt dataset for post-ocr parsing . In NeurIPS: Workshop , 2019 . Seunghyun Park, Seung Shin, Bado Lee, Junyeop Lee, Jaeheung Surh, Minjoon Seo, and Hwalsuk Lee. Cord: A consolidated receipt dataset for post-ocr parsing. In NeurIPS: Workshop, 2019."},{"issue":"7","key":"e_1_3_2_2_25_1","first-page":"46","article-title":"The gestalt approach","volume":"13","author":"Ratcliff John W","year":"1988","unstructured":"John W Ratcliff and David E Metzener . Pattern matching : The gestalt approach . Dr Dobbs Journal , 13 ( 7 ): 46 , 1988 . John W Ratcliff and David E Metzener. Pattern matching: The gestalt approach. Dr Dobbs Journal, 13(7):46, 1988.","journal-title":"Dr Dobbs Journal"},{"key":"e_1_3_2_2_26_1","volume-title":"WSDM","author":"Sun Mingming","year":"2018","unstructured":"Mingming Sun , Xu Li , Xin Wang , Miao Fan , Yue Feng , and Ping Li. Logician : A unified end-to-end neural approach for open-domain information extraction . In WSDM , 2018 . Mingming Sun, Xu Li, Xin Wang, Miao Fan, Yue Feng, and Ping Li. Logician: A unified end-to-end neural approach for open-domain information extraction. In WSDM, 2018."},{"key":"e_1_3_2_2_27_1","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/2021.naacl-main.367"},{"key":"e_1_3_2_2_28_1","doi-asserted-by":"publisher","DOI":"10.1609\/aaai.v35i4.16378"},{"key":"e_1_3_2_2_29_1","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/2020.coling-main.138"},{"key":"e_1_3_2_2_30_1","doi-asserted-by":"publisher","DOI":"10.1145\/3397271.3401442"},{"key":"e_1_3_2_2_31_1","volume-title":"ACL","author":"Wei Zhongyu","year":"2018","unstructured":"Zhongyu Wei , Qianlong Liu , Baolin Peng , Huaixiao Tou , Ting Chen , Xuan-Jing Huang , Kam-Fai Wong , and Xiang Dai . Task-oriented dialogue system for auto- matic diagnosis . In ACL , 2018 . Zhongyu Wei, Qianlong Liu, Baolin Peng, Huaixiao Tou, Ting Chen, Xuan-Jing Huang, Kam-Fai Wong, and Xiang Dai. Task-oriented dialogue system for auto- matic diagnosis. In ACL, 2018."},{"key":"e_1_3_2_2_32_1","volume-title":"EMNLP: Demo","author":"Wolf Thomas","year":"2020","unstructured":"Thomas Wolf , Julien Chaumond , Lysandre Debut , Victor Sanh , Clement Delangue , Anthony Moi , Pierric Cistac , Morgan Funtowicz , Joe Davison , Sam Shleifer , : State-of-the-art natural language processing . In EMNLP: Demo , 2020 . Thomas Wolf, Julien Chaumond, Lysandre Debut, Victor Sanh, Clement Delangue, Anthony Moi, Pierric Cistac, Morgan Funtowicz, Joe Davison, Sam Shleifer, et al. Transformers: State-of-the-art natural language processing. In EMNLP: Demo, 2020."},{"key":"e_1_3_2_2_33_1","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2017.634"},{"key":"e_1_3_2_2_34_1","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/2021.acl-long.201"},{"key":"e_1_3_2_2_35_1","doi-asserted-by":"publisher","DOI":"10.1145\/3394486.3403172"},{"key":"e_1_3_2_2_36_1","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/P19-1074"},{"key":"e_1_3_2_2_37_1","volume-title":"ECAI","author":"Yu Bowen","year":"2020","unstructured":"Bowen Yu , Zhenyu Zhang , Xiaobo Shu , Tingwen Liu , Yubin Wang , Bin Wang , and Sujian Li . Joint extraction of entities and relations based on a novel decomposition strategy . In ECAI , 2020 . Bowen Yu, Zhenyu Zhang, Xiaobo Shu, Tingwen Liu, Yubin Wang, Bin Wang, and Sujian Li. Joint extraction of entities and relations based on a novel decomposition strategy. In ECAI, 2020."},{"key":"e_1_3_2_2_38_1","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/2020.acl-main.444"},{"key":"e_1_3_2_2_39_1","volume-title":"NeurIPS","author":"Zaheer Manzil","year":"2020","unstructured":"Manzil Zaheer , Guru Guruganesh , Kumar Avinava Dubey , Joshua Ainslie , Chris Alberti , Santiago Ontanon , Philip Pham , Anirudh Ravula , Qifan Wang , Li Yang , and Amr Ahmed . Big bird : Transformers for longer sequences . In NeurIPS , 2020 . Manzil Zaheer, Guru Guruganesh, Kumar Avinava Dubey, Joshua Ainslie, Chris Alberti, Santiago Ontanon, Philip Pham, Anirudh Ravula, Qifan Wang, Li Yang, and Amr Ahmed. Big bird: Transformers for longer sequences. In NeurIPS, 2020."},{"key":"e_1_3_2_2_40_1","doi-asserted-by":"publisher","DOI":"10.1145\/3394171.3413900"},{"key":"e_1_3_2_2_41_1","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/2020.coling-main.143"},{"key":"e_1_3_2_2_42_1","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-030-86523-8_35"},{"key":"e_1_3_2_2_43_1","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/P17-1113"},{"key":"e_1_3_2_2_44_1","doi-asserted-by":"publisher","DOI":"10.24963\/ijcai.2022\/793"}],"event":{"name":"MM '22: The 30th ACM International Conference on Multimedia","location":"Lisboa Portugal","acronym":"MM '22","sponsor":["SIGMM ACM Special Interest Group on Multimedia"]},"container-title":["Proceedings of the 30th ACM International Conference on Multimedia"],"original-title":[],"link":[{"URL":"https:\/\/dl.acm.org\/doi\/10.1145\/3503161.3548765","content-type":"unspecified","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/dl.acm.org\/doi\/pdf\/10.1145\/3503161.3548765","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2025,6,17]],"date-time":"2025-06-17T17:49:17Z","timestamp":1750182557000},"score":1,"resource":{"primary":{"URL":"https:\/\/dl.acm.org\/doi\/10.1145\/3503161.3548765"}},"subtitle":["Dataset, Method and Demonstration"],"short-title":[],"issued":{"date-parts":[[2022,10,10]]},"references-count":44,"alternative-id":["10.1145\/3503161.3548765","10.1145\/3503161"],"URL":"https:\/\/doi.org\/10.1145\/3503161.3548765","relation":{},"subject":[],"published":{"date-parts":[[2022,10,10]]},"assertion":[{"value":"2022-10-10","order":2,"name":"published","label":"Published","group":{"name":"publication_history","label":"Publication History"}}]}}