{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,11,25]],"date-time":"2025-11-25T15:33:35Z","timestamp":1764084815824,"version":"3.41.0"},"publisher-location":"New York, NY, USA","reference-count":53,"publisher":"ACM","license":[{"start":{"date-parts":[[2021,4,19]],"date-time":"2021-04-19T00:00:00Z","timestamp":1618790400000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/creativecommons.org\/licenses\/by\/4.0\/"}],"content-domain":{"domain":["dl.acm.org"],"crossmark-restriction":true},"short-container-title":[],"published-print":{"date-parts":[[2021,4,19]]},"DOI":"10.1145\/3442381.3449993","type":"proceedings-article","created":{"date-parts":[[2021,6,3]],"date-time":"2021-06-03T19:00:27Z","timestamp":1622746827000},"page":"2601-2612","update-policy":"https:\/\/doi.org\/10.1145\/crossmark-policy","source":"Crossref","is-referenced-by-count":5,"title":["ComQA: Compositional Question Answering via Hierarchical Graph Neural Networks"],"prefix":"10.1145","author":[{"given":"Bingning","family":"Wang","sequence":"first","affiliation":[{"name":"Sogou Inc., China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Ting","family":"Yao","sequence":"additional","affiliation":[{"name":"Sogou Inc., China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Weipeng","family":"Chen","sequence":"additional","affiliation":[{"name":"Sogou Inc., China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Jingfang","family":"Xu","sequence":"additional","affiliation":[{"name":"Sogou Inc., China"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Xiaochuan","family":"Wang","sequence":"additional","affiliation":[{"name":"Sogou Inc. and Tsinghua University, China"}],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"320","published-online":{"date-parts":[[2021,6,3]]},"reference":[{"key":"e_1_3_2_1_1_1","unstructured":"Jimmy Ba Jamie\u00a0Ryan Kiros and Geoffrey\u00a0E. Hinton. 2016. Layer Normalization. ArXiv abs\/1607.06450(2016).  Jimmy Ba Jamie\u00a0Ryan Kiros and Geoffrey\u00a0E. Hinton. 2016. Layer Normalization. ArXiv abs\/1607.06450(2016)."},{"key":"e_1_3_2_1_2_1","unstructured":"Razieh Baradaran Razieh Ghiasi and Hossein Amirkhani. 2020. A survey on machine reading comprehension systems. arXiv preprint arXiv:2001.01582(2020).  Razieh Baradaran Razieh Ghiasi and Hossein Amirkhani. 2020. A survey on machine reading comprehension systems. arXiv preprint arXiv:2001.01582(2020)."},{"key":"e_1_3_2_1_3_1","unstructured":"Peter\u00a0W Battaglia Jessica\u00a0B Hamrick Victor Bapst Alvaro Sanchez-Gonzalez Vinicius Zambaldi Mateusz Malinowski Andrea Tacchetti David Raposo Adam Santoro Ryan Faulkner 2018. Relational inductive biases deep learning and graph networks. arXiv preprint arXiv:1806.01261(2018).  Peter\u00a0W Battaglia Jessica\u00a0B Hamrick Victor Bapst Alvaro Sanchez-Gonzalez Vinicius Zambaldi Mateusz Malinowski Andrea Tacchetti David Raposo Adam Santoro Ryan Faulkner 2018. Relational inductive biases deep learning and graph networks. arXiv preprint arXiv:1806.01261(2018)."},{"key":"e_1_3_2_1_4_1","doi-asserted-by":"publisher","DOI":"10.1162\/tacl_a_00104"},{"key":"e_1_3_2_1_5_1","doi-asserted-by":"publisher","DOI":"10.1145\/1076034.1076103"},{"key":"e_1_3_2_1_6_1","volume-title":"Bert: Pre-training of deep bidirectional transformers for language understanding. arXiv preprint arXiv:1810.04805(2018).","author":"Devlin Jacob","year":"2018","unstructured":"Jacob Devlin , Ming-Wei Chang , Kenton Lee , and Kristina Toutanova . 2018 . Bert: Pre-training of deep bidirectional transformers for language understanding. arXiv preprint arXiv:1810.04805(2018). Jacob Devlin, Ming-Wei Chang, Kenton Lee, and Kristina Toutanova. 2018. Bert: Pre-training of deep bidirectional transformers for language understanding. arXiv preprint arXiv:1810.04805(2018)."},{"key":"e_1_3_2_1_7_1","volume-title":"Quasar: Datasets for Question Answering by Search and Reading. CoRR abs\/1707.03904(2017).","author":"Dhingra Bhuwan","year":"2017","unstructured":"Bhuwan Dhingra , Kathryn Mazaitis , and William\u00a0 W. Cohen . 2017 . Quasar: Datasets for Question Answering by Search and Reading. CoRR abs\/1707.03904(2017). Bhuwan Dhingra, Kathryn Mazaitis, and William\u00a0W. Cohen. 2017. Quasar: Datasets for Question Answering by Search and Reading. CoRR abs\/1707.03904(2017)."},{"key":"e_1_3_2_1_8_1","volume-title":"Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies","volume":"1","author":"Dua Dheeru","year":"2019","unstructured":"Dheeru Dua , Yizhong Wang , Pradeep Dasigi , Gabriel Stanovsky , Sameer Singh , and Matt Gardner . 2019 . DROP: A Reading Comprehension Benchmark Requiring Discrete Reasoning Over Paragraphs . In Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies , Volume 1 (Long and Short Papers). 2368\u20132378. Dheeru Dua, Yizhong Wang, Pradeep Dasigi, Gabriel Stanovsky, Sameer Singh, and Matt Gardner. 2019. DROP: A Reading Comprehension Benchmark Requiring Discrete Reasoning Over Paragraphs. In Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, Volume 1 (Long and Short Papers). 2368\u20132378."},{"key":"e_1_3_2_1_9_1","volume-title":"Searchqa: A new q&a dataset augmented with context from a search engine. arXiv preprint arXiv:1704.05179(2017).","author":"Dunn Matthew","year":"2017","unstructured":"Matthew Dunn , Levent Sagun , Mike Higgins , Ugur Guney , Volkan Cirik , and Kyunghyun Cho . 2017 . Searchqa: A new q&a dataset augmented with context from a search engine. arXiv preprint arXiv:1704.05179(2017). Matthew Dunn, Levent Sagun, Mike Higgins, Ugur Guney, Volkan Cirik, and Kyunghyun Cho. 2017. Searchqa: A new q&a dataset augmented with context from a search engine. arXiv preprint arXiv:1704.05179(2017)."},{"key":"e_1_3_2_1_10_1","doi-asserted-by":"publisher","DOI":"10.1145\/1460690.1460714"},{"key":"e_1_3_2_1_12_1","unstructured":"William\u00a0L Hamilton Rex Ying and Jure Leskovec. 2017. Representation learning on graphs: Methods and applications. arXiv preprint arXiv:1709.05584(2017).  William\u00a0L Hamilton Rex Ying and Jure Leskovec. 2017. Representation learning on graphs: Methods and applications. arXiv preprint arXiv:1709.05584(2017)."},{"key":"e_1_3_2_1_13_1","doi-asserted-by":"publisher","DOI":"10.1017\/S1351324903003176"},{"volume-title":"The elements of statistical learning: data mining, inference, and prediction","author":"Hastie Trevor","key":"e_1_3_2_1_14_1","unstructured":"Trevor Hastie , Robert Tibshirani , and Jerome Friedman . 2009. The elements of statistical learning: data mining, inference, and prediction . Springer Science & Business Media . Trevor Hastie, Robert Tibshirani, and Jerome Friedman. 2009. The elements of statistical learning: data mining, inference, and prediction. Springer Science & Business Media."},{"key":"e_1_3_2_1_15_1","unstructured":"Dan Hendrycks and Kevin Gimpel. 2016. Gaussian error linear units (gelus). arXiv preprint arXiv:1606.08415(2016).  Dan Hendrycks and Kevin Gimpel. 2016. Gaussian error linear units (gelus). arXiv preprint arXiv:1606.08415(2016)."},{"key":"e_1_3_2_1_16_1","unstructured":"Karl\u00a0Moritz Hermann Tomas Kocisky Edward Grefenstette Lasse Espeholt Will Kay Mustafa Suleyman and Phil Blunsom. 2015. Teaching machines to read and comprehend. In NIPS. 1684\u20131692.  Karl\u00a0Moritz Hermann Tomas Kocisky Edward Grefenstette Lasse Espeholt Will Kay Mustafa Suleyman and Phil Blunsom. 2015. Teaching machines to read and comprehend. In NIPS. 1684\u20131692."},{"key":"e_1_3_2_1_17_1","volume-title":"Long short-term memory. Neural computation 9, 8","author":"Hochreiter Sepp","year":"1997","unstructured":"Sepp Hochreiter and J\u00fcrgen Schmidhuber . 1997. Long short-term memory. Neural computation 9, 8 ( 1997 ), 1735\u20131780. Sepp Hochreiter and J\u00fcrgen Schmidhuber. 1997. Long short-term memory. Neural computation 9, 8 (1997), 1735\u20131780."},{"key":"e_1_3_2_1_18_1","volume-title":"International Conference on Learning Representations.","author":"Huang Hsin-Yuan","year":"2018","unstructured":"Hsin-Yuan Huang , Chenguang Zhu , Yelong Shen , and Weizhu Chen . 2018 . FusionNet: Fusing via Fully-aware Attention with Application to Machine Comprehension . In International Conference on Learning Representations. Hsin-Yuan Huang, Chenguang Zhu, Yelong Shen, and Weizhu Chen. 2018. FusionNet: Fusing via Fully-aware Attention with Application to Machine Comprehension. In International Conference on Learning Representations."},{"key":"e_1_3_2_1_19_1","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/P19-1237"},{"key":"e_1_3_2_1_20_1","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/N18-1023"},{"key":"e_1_3_2_1_21_1","volume-title":"Kingma and Jimmy Ba","author":"P.","year":"2014","unstructured":"Diederik\u00a0 P. Kingma and Jimmy Ba . 2014 . Adam : A Method for Stochastic Optimization. ICLR ( 2014). Diederik\u00a0P. Kingma and Jimmy Ba. 2014. Adam: A Method for Stochastic Optimization. ICLR (2014)."},{"key":"e_1_3_2_1_22_1","unstructured":"Thomas\u00a0N Kipf and Max Welling. 2016. Semi-supervised classification with graph convolutional networks. arXiv preprint arXiv:1609.02907(2016).  Thomas\u00a0N Kipf and Max Welling. 2016. Semi-supervised classification with graph convolutional networks. arXiv preprint arXiv:1609.02907(2016)."},{"key":"e_1_3_2_1_23_1","doi-asserted-by":"crossref","unstructured":"Taku Kudo and John Richardson. 2018. SentencePiece: A simple and language independent subword tokenizer and detokenizer for Neural Text Processing. arXiv preprint arXiv:1808.06226(2018).  Taku Kudo and John Richardson. 2018. SentencePiece: A simple and language independent subword tokenizer and detokenizer for Neural Text Processing. arXiv preprint arXiv:1808.06226(2018).","DOI":"10.18653\/v1\/D18-2012"},{"key":"e_1_3_2_1_24_1","doi-asserted-by":"publisher","DOI":"10.1162\/tacl_a_00276"},{"key":"e_1_3_2_1_25_1","volume-title":"Roberta: A robustly optimized bert pretraining approach. arXiv preprint arXiv:1907.11692(2019).","author":"Liu Yinhan","year":"2019","unstructured":"Yinhan Liu , Myle Ott , Naman Goyal , Jingfei Du , Mandar Joshi , Danqi Chen , Omer Levy , Mike Lewis , Luke Zettlemoyer , and Veselin Stoyanov . 2019 . Roberta: A robustly optimized bert pretraining approach. arXiv preprint arXiv:1907.11692(2019). Yinhan Liu, Myle Ott, Naman Goyal, Jingfei Du, Mandar Joshi, Danqi Chen, Omer Levy, Mike Lewis, Luke Zettlemoyer, and Veselin Stoyanov. 2019. Roberta: A robustly optimized bert pretraining approach. arXiv preprint arXiv:1907.11692(2019)."},{"key":"e_1_3_2_1_26_1","volume-title":"Decoupled Weight Decay Regularization. In International Conference on Learning Representations.","author":"Loshchilov Ilya","year":"2018","unstructured":"Ilya Loshchilov and Frank Hutter . 2018 . Decoupled Weight Decay Regularization. In International Conference on Learning Representations. Ilya Loshchilov and Frank Hutter. 2018. Decoupled Weight Decay Regularization. In International Conference on Learning Representations."},{"key":"e_1_3_2_1_27_1","volume-title":"MS MARCO: A Human Generated MAchine Reading COmprehension Dataset. arXiv preprint arXiv:1611.09268(2016).","author":"Nguyen Tri","year":"2016","unstructured":"Tri Nguyen , Mir Rosenberg , Xia Song , Jianfeng Gao , Saurabh Tiwary , Rangan Majumder , and Li Deng . 2016 . MS MARCO: A Human Generated MAchine Reading COmprehension Dataset. arXiv preprint arXiv:1611.09268(2016). Tri Nguyen, Mir Rosenberg, Xia Song, Jianfeng Gao, Saurabh Tiwary, Rangan Majumder, and Li Deng. 2016. MS MARCO: A Human Generated MAchine Reading COmprehension Dataset. arXiv preprint arXiv:1611.09268(2016)."},{"key":"e_1_3_2_1_28_1","unstructured":"Adam Paszke Sam Gross Francisco Massa Adam Lerer James Bradbury Gregory Chanan Trevor Killeen Zeming Lin Natalia Gimelshein Luca Antiga 2019. PyTorch: An imperative style high-performance deep learning library. In Advances in Neural Information Processing Systems. 8024\u20138035.  Adam Paszke Sam Gross Francisco Massa Adam Lerer James Bradbury Gregory Chanan Trevor Killeen Zeming Lin Natalia Gimelshein Luca Antiga 2019. PyTorch: An imperative style high-performance deep learning library. In Advances in Neural Information Processing Systems. 8024\u20138035."},{"key":"e_1_3_2_1_29_1","unstructured":"Anthony\u00a0Valiant Phillips. 1960. Artificial Intelligence Project-RLE and MIT Computation Center Memo 16-A Question-Answering Routine\u2019. (1960).  Anthony\u00a0Valiant Phillips. 1960. Artificial Intelligence Project-RLE and MIT Computation Center Memo 16-A Question-Answering Routine\u2019. (1960)."},{"key":"e_1_3_2_1_30_1","first-page":"9","article-title":"Language models are unsupervised multitask learners","volume":"1","author":"Radford Alec","year":"2019","unstructured":"Alec Radford , Jeffrey Wu , Rewon Child , David Luan , Dario Amodei , and Ilya Sutskever . 2019 . Language models are unsupervised multitask learners . OpenAI Blog 1 , 8 (2019), 9 . Alec Radford, Jeffrey Wu, Rewon Child, David Luan, Dario Amodei, and Ilya Sutskever. 2019. Language models are unsupervised multitask learners. OpenAI Blog 1, 8 (2019), 9.","journal-title":"OpenAI Blog"},{"key":"e_1_3_2_1_31_1","doi-asserted-by":"crossref","unstructured":"Pranav Rajpurkar Jian Zhang Konstantin Lopyrev and Percy Liang. 2016. SQuAD: 100 000+ Questions for Machine Comprehension of Text. In EMNLP.  Pranav Rajpurkar Jian Zhang Konstantin Lopyrev and Percy Liang. 2016. SQuAD: 100 000+ Questions for Machine Comprehension of Text. In EMNLP.","DOI":"10.18653\/v1\/D16-1264"},{"key":"e_1_3_2_1_32_1","unstructured":"Matthew Richardson Christopher\u00a0JC Burges and Erin Renshaw. 2013. MCTest: A Challenge Dataset for the Open-Domain Machine Comprehension of Text.. In EMNLP Vol.\u00a01. 2.  Matthew Richardson Christopher\u00a0JC Burges and Erin Renshaw. 2013. MCTest: A Challenge Dataset for the Open-Domain Machine Comprehension of Text.. In EMNLP Vol.\u00a01. 2."},{"key":"e_1_3_2_1_33_1","doi-asserted-by":"crossref","unstructured":"Adam Roberts Colin Raffel and Noam Shazeer. 2020. How Much Knowledge Can You Pack Into the Parameters of a Language Model?arXiv preprint arXiv:2002.08910(2020).  Adam Roberts Colin Raffel and Noam Shazeer. 2020. How Much Knowledge Can You Pack Into the Parameters of a Language Model?arXiv preprint arXiv:2002.08910(2020).","DOI":"10.18653\/v1\/2020.emnlp-main.437"},{"key":"e_1_3_2_1_34_1","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/P16-1162"},{"key":"e_1_3_2_1_35_1","unstructured":"Min\u00a0Joon Seo Aniruddha Kembhavi Ali Farhadi and Hannaneh Hajishirzi. 2016. Bidirectional Attention Flow for Machine Comprehension. CoRR abs\/1611.01603(2016).  Min\u00a0Joon Seo Aniruddha Kembhavi Ali Farhadi and Hannaneh Hajishirzi. 2016. Bidirectional Attention Flow for Machine Comprehension. CoRR abs\/1611.01603(2016)."},{"key":"e_1_3_2_1_36_1","volume-title":"Dropout: a simple way to prevent neural networks from overfitting. The journal of machine learning research 15, 1","author":"Srivastava Nitish","year":"2014","unstructured":"Nitish Srivastava , Geoffrey Hinton , Alex Krizhevsky , Ilya Sutskever , and Ruslan Salakhutdinov . 2014. Dropout: a simple way to prevent neural networks from overfitting. The journal of machine learning research 15, 1 ( 2014 ), 1929\u20131958. Nitish Srivastava, Geoffrey Hinton, Alex Krizhevsky, Ilya Sutskever, and Ruslan Salakhutdinov. 2014. Dropout: a simple way to prevent neural networks from overfitting. The journal of machine learning research 15, 1 (2014), 1929\u20131958."},{"key":"e_1_3_2_1_37_1","volume-title":"Dataset Cartography: Mapping and Diagnosing Datasets with Training Dynamics. arXiv preprint arXiv:2009.10795(2020).","author":"Swayamdipta Swabha","year":"2020","unstructured":"Swabha Swayamdipta , Roy Schwartz , Nicholas Lourie , Yizhong Wang , Hannaneh Hajishirzi , Noah\u00a0 A Smith , and Yejin Choi . 2020 . Dataset Cartography: Mapping and Diagnosing Datasets with Training Dynamics. arXiv preprint arXiv:2009.10795(2020). Swabha Swayamdipta, Roy Schwartz, Nicholas Lourie, Yizhong Wang, Hannaneh Hajishirzi, Noah\u00a0A Smith, and Yejin Choi. 2020. Dataset Cartography: Mapping and Diagnosing Datasets with Training Dynamics. arXiv preprint arXiv:2009.10795(2020)."},{"key":"e_1_3_2_1_38_1","doi-asserted-by":"crossref","unstructured":"Zhixing Tian Yuanzhe Zhang Xinwei Feng Wenbin Jiang Yajuan Lyu Kang Liu and Jun Zhao. 2020. Capturing Sentence Relations for Answer Sentence Selection with Multi-Perspective Graph Encoding.. In AAAI. 9032\u20139039.  Zhixing Tian Yuanzhe Zhang Xinwei Feng Wenbin Jiang Yajuan Lyu Kang Liu and Jun Zhao. 2020. Capturing Sentence Relations for Answer Sentence Selection with Multi-Perspective Graph Encoding.. In AAAI. 9032\u20139039.","DOI":"10.1609\/aaai.v34i05.6436"},{"key":"e_1_3_2_1_39_1","doi-asserted-by":"crossref","unstructured":"Adam Trischler Tong Wang Xingdi Yuan Justin Harris Alessandro Sordoni Philip Bachman and Kaheer Suleman. 2016. NewsQA: A Machine Comprehension Dataset. arXiv preprint arXiv:1611.09830(2016).  Adam Trischler Tong Wang Xingdi Yuan Justin Harris Alessandro Sordoni Philip Bachman and Kaheer Suleman. 2016. NewsQA: A Machine Comprehension Dataset. arXiv preprint arXiv:1611.09830(2016).","DOI":"10.18653\/v1\/W17-2623"},{"key":"e_1_3_2_1_40_1","unstructured":"Ashish Vaswani Noam Shazeer Niki Parmar Jakob Uszkoreit Llion Jones Aidan\u00a0N Gomez \u0141ukasz Kaiser and Illia Polosukhin. 2017. Attention is all you need. In Advances in neural information processing systems. 5998\u20136008.  Ashish Vaswani Noam Shazeer Niki Parmar Jakob Uszkoreit Llion Jones Aidan\u00a0N Gomez \u0141ukasz Kaiser and Illia Polosukhin. 2017. Attention is all you need. In Advances in neural information processing systems. 5998\u20136008."},{"key":"e_1_3_2_1_41_1","volume-title":"Graph Attention Networks. In International Conference on Learning Representations.","author":"Veli\u010dkovi\u0107 Petar","year":"2018","unstructured":"Petar Veli\u010dkovi\u0107 , Guillem Cucurull , Arantxa Casanova , Adriana Romero , Pietro Li\u00f2 , and Yoshua Bengio . 2018 . Graph Attention Networks. In International Conference on Learning Representations. Petar Veli\u010dkovi\u0107, Guillem Cucurull, Arantxa Casanova, Adriana Romero, Pietro Li\u00f2, and Yoshua Bengio. 2018. Graph Attention Networks. In International Conference on Learning Representations."},{"key":"e_1_3_2_1_42_1","unstructured":"Suzan Verberne H\u00a0van Halteren Stephan Raaijmakers DL Theijssen and LWJ Boves. 2009. Learning to Rank QA Data: Evaluating Machine Learning Techniques for Ranking Answers to Why-Questions. (2009).  Suzan Verberne H\u00a0van Halteren Stephan Raaijmakers DL Theijssen and LWJ Boves. 2009. Learning to Rank QA Data: Evaluating Machine Learning Techniques for Ranking Answers to Why-Questions. (2009)."},{"key":"e_1_3_2_1_43_1","doi-asserted-by":"publisher","DOI":"10.1080\/01621459.1963.10500845"},{"key":"e_1_3_2_1_44_1","doi-asserted-by":"publisher","DOI":"10.1162\/tacl_a_00021"},{"key":"e_1_3_2_1_45_1","unstructured":"Junjie Yang Zhuosheng Zhang and Hai Zhao. 2020. Multi-span Style Extraction for Generative Reading Comprehension. arXiv preprint arXiv:2009.07382(2020).  Junjie Yang Zhuosheng Zhang and Hai Zhao. 2020. Multi-span Style Extraction for Generative Reading Comprehension. arXiv preprint arXiv:2009.07382(2020)."},{"key":"e_1_3_2_1_46_1","volume-title":"Xlnet: Generalized autoregressive pretraining for language understanding. In Advances in neural information processing systems. 5754\u20135764.","author":"Yang Zhilin","year":"2019","unstructured":"Zhilin Yang , Zihang Dai , Yiming Yang , Jaime Carbonell , Russ\u00a0 R Salakhutdinov , and Quoc\u00a0 V Le . 2019 . Xlnet: Generalized autoregressive pretraining for language understanding. In Advances in neural information processing systems. 5754\u20135764. Zhilin Yang, Zihang Dai, Yiming Yang, Jaime Carbonell, Russ\u00a0R Salakhutdinov, and Quoc\u00a0V Le. 2019. Xlnet: Generalized autoregressive pretraining for language understanding. In Advances in neural information processing systems. 5754\u20135764."},{"key":"e_1_3_2_1_47_1","doi-asserted-by":"crossref","unstructured":"Zhilin Yang Peng Qi Saizheng Zhang Yoshua Bengio William\u00a0W Cohen Ruslan Salakhutdinov and Christopher\u00a0D Manning. 2018. HotpotQA: A Dataset for Diverse Explainable Multi-hop Question Answering. In EMNLP.  Zhilin Yang Peng Qi Saizheng Zhang Yoshua Bengio William\u00a0W Cohen Ruslan Salakhutdinov and Christopher\u00a0D Manning. 2018. HotpotQA: A Dataset for Diverse Explainable Multi-hop Question Answering. In EMNLP.","DOI":"10.18653\/v1\/D18-1259"},{"key":"e_1_3_2_1_48_1","doi-asserted-by":"publisher","DOI":"10.1609\/aaai.v33i01.33017370"},{"key":"e_1_3_2_1_49_1","doi-asserted-by":"publisher","DOI":"10.1109\/ICEECCOT.2017.8284526"},{"key":"e_1_3_2_1_50_1","volume-title":"QANet: Combining Local Convolution with Global Self-Attention for Reading Comprehension. In International Conference on Learning Representations.","author":"Yu Adams\u00a0Wei","year":"2018","unstructured":"Adams\u00a0Wei Yu , David Dohan , Minh-Thang Luong , Rui Zhao , Kai Chen , Mohammad Norouzi , and Quoc\u00a0 V Le . 2018 . QANet: Combining Local Convolution with Global Self-Attention for Reading Comprehension. In International Conference on Learning Representations. Adams\u00a0Wei Yu, David Dohan, Minh-Thang Luong, Rui Zhao, Kai Chen, Mohammad Norouzi, and Quoc\u00a0V Le. 2018. QANet: Combining Local Convolution with Global Self-Attention for Reading Comprehension. In International Conference on Learning Representations."},{"key":"e_1_3_2_1_51_1","unstructured":"Manzil Zaheer Guru Guruganesh Avinava Dubey Joshua Ainslie Chris Alberti Santiago Ontanon Philip Pham Anirudh Ravula Qifan Wang Li Yang 2020. Big bird: Transformers for longer sequences. arXiv preprint arXiv:2007.14062(2020).  Manzil Zaheer Guru Guruganesh Avinava Dubey Joshua Ainslie Chris Alberti Santiago Ontanon Philip Pham Anirudh Ravula Qifan Wang Li Yang 2020. Big bird: Transformers for longer sequences. arXiv preprint arXiv:2007.14062(2020)."},{"key":"e_1_3_2_1_52_1","unstructured":"Chengchang Zeng Shaobo Li Qin Li Jie Hu and Jianjun Hu. 2020. A survey on machine reading comprehension: Tasks evaluation metrics and benchmark datasets. arXiv preprint arXiv:2006.11880(2020).  Chengchang Zeng Shaobo Li Qin Li Jie Hu and Jianjun Hu. 2020. A survey on machine reading comprehension: Tasks evaluation metrics and benchmark datasets. arXiv preprint arXiv:2006.11880(2020)."},{"key":"e_1_3_2_1_53_1","doi-asserted-by":"publisher","DOI":"10.18653\/v1\/D18-1244"},{"key":"e_1_3_2_1_54_1","unstructured":"Zhuosheng Zhang Yiqing Zhang Hai Zhao Xi Zhou and Xiang Zhou. 2020. Composing Answer from Multi-spans for Reading Comprehension. arXiv preprint arXiv:2009.06141(2020).  Zhuosheng Zhang Yiqing Zhang Hai Zhao Xi Zhou and Xiang Zhou. 2020. Composing Answer from Multi-spans for Reading Comprehension. arXiv preprint arXiv:2009.06141(2020)."}],"event":{"name":"WWW '21: The Web Conference 2021","sponsor":["SIGWEB ACM Special Interest Group on Hypertext, Hypermedia, and Web"],"location":"Ljubljana Slovenia","acronym":"WWW '21"},"container-title":["Proceedings of the Web Conference 2021"],"original-title":[],"link":[{"URL":"https:\/\/dl.acm.org\/doi\/10.1145\/3442381.3449993","content-type":"unspecified","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/dl.acm.org\/doi\/pdf\/10.1145\/3442381.3449993","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2025,6,17]],"date-time":"2025-06-17T21:24:45Z","timestamp":1750195485000},"score":1,"resource":{"primary":{"URL":"https:\/\/dl.acm.org\/doi\/10.1145\/3442381.3449993"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2021,4,19]]},"references-count":53,"alternative-id":["10.1145\/3442381.3449993","10.1145\/3442381"],"URL":"https:\/\/doi.org\/10.1145\/3442381.3449993","relation":{},"subject":[],"published":{"date-parts":[[2021,4,19]]},"assertion":[{"value":"2021-06-03","order":2,"name":"published","label":"Published","group":{"name":"publication_history","label":"Publication History"}}]}}