{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,3,28]],"date-time":"2025-03-28T05:50:09Z","timestamp":1743141009462,"version":"3.40.3"},"publisher-location":"Cham","reference-count":83,"publisher":"Springer International Publishing","isbn-type":[{"type":"print","value":"9783319990033"},{"type":"electronic","value":"9783319990040"}],"license":[{"start":{"date-parts":[[2019,1,1]],"date-time":"2019-01-01T00:00:00Z","timestamp":1546300800000},"content-version":"tdm","delay-in-days":0,"URL":"http:\/\/www.springer.com\/tdm"}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2019]]},"DOI":"10.1007\/978-3-319-99004-0_4","type":"book-chapter","created":{"date-parts":[[2019,2,6]],"date-time":"2019-02-06T12:11:22Z","timestamp":1549455082000},"page":"89-139","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":2,"title":["Extracting Data from Comparable Corpora"],"prefix":"10.1007","author":[{"given":"M\u0101rcis","family":"Pinnis","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Nikola","family":"Ljube\u0161i\u0107","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Dan","family":"\u015etef\u0103nescu","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Inguna","family":"Skadi\u0146a","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Marko","family":"Tadi\u0107","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Tatjana","family":"Gornostaja","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"\u0160pela","family":"Vintar","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Darja","family":"Fi\u0161er","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"297","published-online":{"date-parts":[[2019,2,7]]},"reference":[{"issue":"2","key":"4_CR1","first-page":"193","volume":"37","author":"M Apidianaki","year":"2013","unstructured":"Apidianaki, M., Ljube\u0161i\u0107, N., & Fi\u0161er, D. (2013). Vector disambiguation for translation extraction from comparable corpora resources used comparable corpus. Informatica (Slovenia), 37(2), 193\u2013201.","journal-title":"Informatica (Slovenia)"},{"issue":"3","key":"4_CR2","doi-asserted-by":"publisher","first-page":"209","DOI":"10.1007\/s10579-009-9081-4","volume":"43","author":"M Baroni","year":"2009","unstructured":"Baroni, M., Bernardini, S., Ferraresi, A., & Zanchetta, E. (2009). The WaCky Wide Web: a collection of very large linguistically processed web-crawled corpora. Language Resources and Evaluation, 43(3), 209\u2013226.","journal-title":"Language Resources and Evaluation"},{"key":"4_CR3","doi-asserted-by":"crossref","unstructured":"Bourigault, D. (1992). Surface grammatical analysis for the extraction of terminological noun phrases. Proceedings of the 14th Conference on Computational Linguistics (Vol. 3, pp. 977\u2013981). Association for Computational Linguistics.","DOI":"10.3115\/992383.992415"},{"issue":"4","key":"4_CR4","doi-asserted-by":"publisher","first-page":"359","DOI":"10.1006\/csla.1999.0128","volume":"13","author":"SF Chen","year":"1999","unstructured":"Chen, S. F., & Goodman, J. (1999). An empirical study of smoothing techniques for language modeling. Computer Speech and Language, 13(4), 359\u2013393.","journal-title":"Computer Speech and Language"},{"key":"4_CR5","doi-asserted-by":"crossref","unstructured":"Chiao, Y.-C., & Zweigenbaum, P. (2002). Looking for candidate translational equivalents in specialized, comparable corpora. Proceedings of the 19th International Conference on Computational Linguistics (Vol. 2). Association for Computational Linguistics.","DOI":"10.3115\/1071884.1071904"},{"key":"4_CR6","unstructured":"Chinchor, N. (1997). MUC-7 named entity task definition. Proceedings of the 7th Conference on Message Understanding."},{"issue":"4","key":"4_CR7","doi-asserted-by":"publisher","first-page":"213","DOI":"10.1037\/h0026256","volume":"70","author":"J Cohen","year":"1968","unstructured":"Cohen, J. (1968). Weighted Kappa: Nominal scale agreement provision for scaled disagreement or partial credit. Psychological Bulletin, 70(4), 213\u2013220.","journal-title":"Psychological Bulletin"},{"key":"4_CR8","doi-asserted-by":"crossref","unstructured":"Dagan, I., & Church, K. (1994). Termight: Identifying and translating technical terminology. Proceedings of the Fourth Conference on Applied Natural Language Processing (pp. 34\u201340). Association for Computational Linguistics.","DOI":"10.3115\/974358.974367"},{"key":"4_CR9","unstructured":"Daille, B. (1994). Study and implementation of combined techniques for automatic extraction of terminology. Proceedings of the Workshop The Balancing Act: Combining Symbolic and Statistical Approaches to Language (Language, Speech, and Communication) (pp. 29\u201336). Association for Computational Linguistics, Las Cruces, NM."},{"key":"4_CR10","unstructured":"Daille, B., & Morin, E. (2008). Effective compositional model for lexical alignment. Proceedings, IJCNLP 2008: Third International Joint Conference on Natural Language Processing (Vol. 1, pp. 95\u2013102)."},{"issue":"4","key":"4_CR11","doi-asserted-by":"publisher","first-page":"433","DOI":"10.1016\/0306-4573(93)90039-G","volume":"29","author":"FJ Damerau","year":"1993","unstructured":"Damerau, F. J. (1993). Generating and evaluating domain-oriented multi-word terms from texts. Information Processing and Management, 29(4), 433\u2013447.","journal-title":"Information Processing and Management"},{"issue":"2","key":"4_CR12","doi-asserted-by":"publisher","first-page":"111","DOI":"10.1016\/j.artmed.2004.07.015","volume":"33","author":"H D\u00e9jean","year":"2005","unstructured":"D\u00e9jean, H., Gaussier, E., Renders, J.-M., & Sadat, F. (2005). Automatic processing of multilingual medical terminology: Applications to thesaurus enrichment and cross-language information retrieval. Artificial Intelligence in Medicine, 33(2), 111\u2013124.","journal-title":"Artificial Intelligence in Medicine"},{"key":"4_CR13","doi-asserted-by":"crossref","unstructured":"Dela\u010d, D., Krle\u017ea, Z., \u0160najder, J., Ba\u0161i\u0107, B. D., & \u0160ari\u0107, F. (2009). TermeX: A tool for collocation extraction. In Computational Linguistics and Intelligent Text Processing (pp. 149\u2013157). Springer.","DOI":"10.1007\/978-3-642-00382-0_12"},{"key":"4_CR14","doi-asserted-by":"crossref","unstructured":"Finkel, J. R., Grenager, T., & Manning, C. (2005). Incorporating non-local information into information extraction systems by Gibbs sampling. Proceedings of the 43rd Annual Meeting on Association for Computational Linguistics (pp. 363\u2013370). Association for Computational Linguistics.","DOI":"10.3115\/1219840.1219885"},{"key":"4_CR15","unstructured":"Fi\u0161er, D., & Ljube\u0161ic, N. (2011). Bilingual lexicon extraction from comparable corpora for closely related languages. Proceedings of the International Conference on Recent Advances in Natural Language Processing (RANLP\u201911) (pp. 125\u2013131)."},{"key":"4_CR16","unstructured":"Fi\u0161er, D., Vintar, \u0160., Ljube\u0161i\u0107, N., & Pollak, S. (2011). Building and using comparable corpora for domain-specific bilingual lexicon extraction. Proceedings of the 4th Workshop on Building and Using Comparable Corpora: Comparable Corpora and the Web (pp. 19\u201326). Association for Computational Linguistics."},{"key":"4_CR17","unstructured":"Fi\u0161er, D., Ljube\u0161i\u0107, N., & Kubelka, O. (2012). Addressing polysemy in bilingual lexicon extraction from comparable corpora. Proceedings of the 8th International Conference on Language Resources and Evaluation, LREC\u201912 (pp. 3031\u20133035)."},{"issue":"2","key":"4_CR18","doi-asserted-by":"publisher","first-page":"115","DOI":"10.1007\/s007999900023","volume":"3","author":"K Frantzi","year":"2000","unstructured":"Frantzi, K., Ananiadou, S., & Mima, H. (2000). Automatic recognition of multi-word terms: The C-value\/NC-Value Method. International Journal on Digital Libraries, 3(2), 115\u2013130.","journal-title":"International Journal on Digital Libraries"},{"key":"4_CR19","doi-asserted-by":"crossref","unstructured":"Fung, P. (1998). A statistical view on bilingual lexicon extraction: From parallel corpora to non-parallel corpora. In Machine translation and the information soup (pp. 1\u201317). Springer.","DOI":"10.1007\/3-540-49478-2_1"},{"issue":"1\u20132","key":"4_CR20","doi-asserted-by":"publisher","first-page":"53","DOI":"10.1023\/A:1007974605290","volume":"12","author":"P Fung","year":"1997","unstructured":"Fung, P., & McKeown, K. (1997). A technical word- and term-translation aid using noisy parallel corpora across language groups. Machine Translation, 12(1\u20132), 53\u201387.","journal-title":"Machine Translation"},{"key":"4_CR21","unstructured":"Georgantopoulos, B., & Piperidis, S. (2000). A hybrid technique for automatic term extraction. Proceedings of the ACIDCA 2000 Conference."},{"key":"4_CR22","doi-asserted-by":"publisher","DOI":"10.1007\/978-1-4615-2710-7","volume-title":"Explorations in automatic thesaurus discovery","author":"G Grefenstette","year":"1994","unstructured":"Grefenstette, G. (1994). Explorations in automatic thesaurus discovery. Heidelberg: Springer."},{"key":"4_CR23","unstructured":"Grefenstette, G. (1999). The World Wide Web as a resource for example-based machine translation tasks. Proceedings of the ASLIB Conference on Translating and the Computer (Vol. 21)."},{"key":"4_CR24","unstructured":"Grigonyte, G., Rimkute, E., Utka, A., & Boizou, L. (2011). Experiments on lithuanian term extraction. Proceedings of the NODALIDA 2011 Conference (pp. 82\u201389)."},{"key":"4_CR25","unstructured":"Ion, R. (2007). Word sense disambiguation methods applied to English and Romanian. PhD Thesis, Romanian Academy, Bucharest."},{"issue":"01","key":"4_CR26","doi-asserted-by":"publisher","first-page":"9","DOI":"10.1017\/S1351324900000048","volume":"1","author":"JS Justeson","year":"1995","unstructured":"Justeson, J. S., & Katz, S. M. (1995). Technical terminology: Some linguistic properties and an algorithm for identification in text. Natural Language Engineering, 1(01), 9\u201327.","journal-title":"Natural Language Engineering"},{"issue":"2","key":"4_CR27","doi-asserted-by":"publisher","first-page":"259","DOI":"10.1075\/term.3.2.03kag","volume":"3","author":"K Kageura","year":"1996","unstructured":"Kageura, K., & Umino, B. (1996). Methods of automatic term recognition: A review. Terminology, 3(2), 259\u2013289.","journal-title":"Terminology"},{"issue":"1","key":"4_CR28","doi-asserted-by":"publisher","first-page":"97","DOI":"10.1075\/ijcl.6.1.05kil","volume":"6","author":"A Kilgarriff","year":"2001","unstructured":"Kilgarriff, A. (2001). Comparing Corpora. International Journal of Corpus Linguistics, 6(1), 97\u2013133.","journal-title":"International Journal of Corpus Linguistics"},{"key":"4_CR29","unstructured":"Kochanski, G. (2006). Lecture 4-good-turing probability estimation. Oxford."},{"key":"4_CR30","doi-asserted-by":"crossref","unstructured":"Koehn, P., & Knight, K. (2002). Learning a translation lexicon from monolingual corpora. Proceedings of the ACL-02 Workshop on Unsupervised Lexical Acquisition (Vol. 9, pp. 9\u201316). Association for Computational Linguistics.","DOI":"10.3115\/1118627.1118629"},{"key":"4_CR31","doi-asserted-by":"crossref","unstructured":"Kondrak, G., & Dorr, B. (2004). Identification of confusable drug names: A new approach and evaluation methodology. Proceedings of the 20th International Conference on Computational Linguistics. Association for Computational Linguistics.","DOI":"10.3115\/1220355.1220492"},{"key":"4_CR32","unstructured":"Kravalov\u00e1, J., & \u017dabokrtsk\u00fd, Z. (2009). Czech named entity corpus and SVM-based recognizer. Proceedings of the 2009 Named Entities Workshop: Shared Task on Transliteration (pp. 194\u2013201). Association for Computational Linguistics."},{"key":"4_CR33","unstructured":"Krug\u013cevskis, V. (2010). Semi-automatic term extraction from Latvian texts and related language technologies. Magyar Terminologia (Journal of Hungarian Terminology)."},{"key":"4_CR34","unstructured":"Kruglevskis, V., & Vancane, I. (2005). Term extraction from legal texts in Latvian. Proceedings of the Second Baltic Conference on Human Language Technologies (pp. 155\u2013161)."},{"key":"4_CR35","unstructured":"Lee, L., Aw, A., Zhang, M., & Li, H. (2010). EM-based hybrid model for bilingual terminology extraction from comparable corpora. Proceedings of the 23rd International Conference on Computational Linguistics: Posters (pp. 639\u2013646). Association for Computational Linguistics."},{"key":"4_CR36","doi-asserted-by":"crossref","unstructured":"Liao, W., & Veeramachaneni, S. (2009). A simple semi-supervised algorithm for named entity recognition. Proceedings of the NAACL HLT 2009 Workshop on Semi-Supervised Learning for Natural Language Processing (pp. 58\u201365). Association for Computational Linguistics.","DOI":"10.3115\/1621829.1621837"},{"key":"4_CR37","doi-asserted-by":"crossref","unstructured":"Ljube\u0161i\u0107, N., & Erjavec, T. (2011). hrWaC and slWac: Compiling web corpora for Croatian and Slovene. Text, Speech and Dialogue 2011 Conference Proceedings (pp. 395\u2013402). Springer.","DOI":"10.1007\/978-3-642-23538-2_50"},{"key":"4_CR38","doi-asserted-by":"publisher","first-page":"91","DOI":"10.1007\/978-3-642-23538-2_12","volume-title":"Text, Speech and Dialogue","author":"Nikola Ljube\u0161i\u0107","year":"2011","unstructured":"Ljube\u0161i\u0107, N., & Fi\u0161er, D. (2011). Bootstrapping bilingual lexicons from comparable corpora for closely related languages. Text, Speech and Dialogue (pp. 91\u201398)."},{"key":"4_CR39","unstructured":"Ljube\u0161i\u0107, N., Fi\u0161er, D., Vintar, \u0160., & Pollak, S. (2011). Bilingual lexicon extraction from comparable corpora: A comparative study. First International Workshop on Lexical Resources."},{"key":"4_CR40","unstructured":"Ljube\u0161i\u0107, N., Vintar, \u0160., & Fi\u0161er, D. (2012). Multi-word term extraction from comparable corpora by combining contextual and constituent clues. Proceedings of the 5th Workshop on Building and Using Comparable Corpora (BUCC 2012) (pp. 143\u2013147). ELRA, Istanbul."},{"key":"4_CR41","volume-title":"Foundations of statistical natural language processing","author":"CD Manning","year":"1999","unstructured":"Manning, C. D., & Sch\u00fctze, H. (1999). Foundations of statistical natural language processing. Cambridge, MA: MIT Press."},{"key":"4_CR42","unstructured":"Marsi, E., & Krahmer, E. (2010). Automatic analysis of semantic similarity in comparable text through syntactic tree matching. Proceedings of the 23rd International Conference on Computational Linguistics (pp. 752\u2013760). Association for Computational Linguistics."},{"issue":"2","key":"4_CR43","doi-asserted-by":"publisher","first-page":"175","DOI":"10.1075\/term.6.2.04mim","volume":"6","author":"H Mima","year":"2000","unstructured":"Mima, H., & Ananiadou, S. (2000). An application and evaluation of the C\/NC-value approach for the automatic term recognition of multi-word units in Japanese. Terminology, 6(2), 175\u2013194.","journal-title":"Terminology"},{"key":"4_CR44","unstructured":"Morin, E., & Prochasson, E. (2011). Bilingual lexicon extraction from comparable corpora enhanced with parallel corpora. Proceedings of the 4th Workshop on Building and Using Comparable Corpora: Comparable Corpora and the Web (pp. 27\u201334)."},{"key":"4_CR45","unstructured":"Morin, E., Daille, B., Takeuchi, K., Kageura, K. (2007). Bilingual terminology mining \u2013 Using brain, not brawn comparable corpora. Proceedings of the 45th Annual Meeting of the Association for Computational Linguistics (pp. 664\u2013671). Association for Computational Linguistics."},{"issue":"1","key":"4_CR46","doi-asserted-by":"publisher","first-page":"3","DOI":"10.1075\/li.30.1.03nad","volume":"30","author":"D Nadeau","year":"2007","unstructured":"Nadeau, D., & Sekine, S. (2007). A survey of named entity recognition and classification. Lingvisticae Investigationes, 30(1), 3\u201326.","journal-title":"Lingvisticae Investigationes"},{"key":"4_CR47","doi-asserted-by":"crossref","unstructured":"Och, F. J., & Ney, H. (2000). Improved statistical alignment models. Proceedings of the 38th Annual Meeting on Association for Computational Linguistics (pp. 440\u2013447). Association for Computational Linguistics.","DOI":"10.3115\/1075218.1075274"},{"issue":"1","key":"4_CR48","doi-asserted-by":"publisher","first-page":"19","DOI":"10.1162\/089120103321337421","volume":"29","author":"FJ Och","year":"2003","unstructured":"Och, F. J., & Ney, H. (2003). A systematic comparison of various statistical alignment models. Computational Linguistics, 29(1), 19\u201351.","journal-title":"Computational Linguistics"},{"key":"4_CR49","unstructured":"Otero, P. G. (2007). Learning bilingual lexicons from comparable English and Spanish corpora. Proceedings of MT Summit XI (pp. 191\u2013198)."},{"key":"4_CR50","doi-asserted-by":"publisher","first-page":"36","DOI":"10.1007\/3-540-45153-6_4","volume-title":"Advances in Artificial Intelligence","author":"Patrick Pantel","year":"2001","unstructured":"Pantel, P., & Lin, D. (2001). A statistical corpus-based term extractor. Proceedings of the 14th Biennial Conference of the Canadian Society for Computational Studies of Intelligence \u2013 Advances in Artificial Intelligence (AI 2001) (pp. 36\u201346). Ottawa, Canada. Berlin: Springer."},{"key":"4_CR51","unstructured":"Paukkeri, M.-S., Nieminen, I. T., P\u00f6ll\u00e4, M., & Honkela, T. (2008). A language-independent approach to keyphrase extraction and evaluation. Proceedings of COLING 2008 (pp. 83\u201386)."},{"key":"4_CR52","unstructured":"Pinnis, M. (2012). Latvian and lithuanian named entity recognition with TildeNER. Proceedings of the Eight International Conference on Language Resources and Evaluation (LREC\u201912) (pp. 1258\u20131265). European Language Resources Association (ELRA), Istanbul, Turkey."},{"key":"4_CR53","doi-asserted-by":"publisher","first-page":"14","DOI":"10.1007\/978-3-642-23138-4_2","volume-title":"Proceedings of the 2nd International Workshop on Systems and Frameworks for Computational Morphology","author":"M Pinnis","year":"2011","unstructured":"Pinnis, M., & Goba, K. (2011). Maximum entropy model for disambiguation of rich morphological tags. In C. Mahlow & M. Piotrowski (Eds.), Proceedings of the 2nd International Workshop on Systems and Frameworks for Computational Morphology (pp. 14\u201322). Zurich: Springer."},{"key":"4_CR54","unstructured":"Pinnis, M., & Skadi\u0146\u0161, R. (2012). MT adaptation for under-resourced domains \u2013 What works and what not. Human Language Technologies \u2013 The Baltic Perspective \u2013 Proceedings of the Fifth International Conference Baltic HLT 2012 (Vol. 247, pp. 176\u2013184). Tartu, Estonia: IOS Press."},{"key":"4_CR55","unstructured":"Pinnis, M., Ljube\u0161i\u0107, N., \u015etef\u0103nescu, D., Skadi\u0146a, I., Tadi\u0107, M., & Gornostay, T. (2012). Term extraction, tagging, and mapping tools for under-resourced languages. Proceedings of the 10th Conference on Terminology and Knowledge Engineering (TKE 2012) (pp. 193\u2013208), Madrid."},{"key":"4_CR56","doi-asserted-by":"crossref","unstructured":"Rapp, R. (1995). Identifying word translations in non-parallel texts. Proceedings of the 33rd Annual Meeting on Association for Computational Linguistics (pp. 320\u2013322). Computation and Language, Association for Computational Linguistics.","DOI":"10.3115\/981658.981709"},{"key":"4_CR57","doi-asserted-by":"crossref","unstructured":"Rapp, R. (1999). Automatic identification of word translations from unrelated English and German corpora. Proceedings of the 37th Annual Meeting of the Association for Computational Linguistics on Computational Linguistics (pp. 519\u2013526). Association for Computational Linguistics, Stroudsburg, PA.","DOI":"10.3115\/1034678.1034756"},{"key":"4_CR58","unstructured":"Saralegi, X., San Vicente, I., & Gurrutxaga, A. (2008). Automatic extraction of bilingual terms from comparable corpora in a popular science domain. Proceedings of Building and Using Comparable Corpora Workshop (pp. 27\u201332)."},{"key":"4_CR59","unstructured":"Schmid, H. (1994). Probabilistic part-of-speech tagging using decision trees. Proceedings of International Conference on New Methods in Language Processing (Vol. 12, pp. 44\u201349)."},{"key":"4_CR60","unstructured":"Sch\u00fctze, H. (1998). The hypertext concordance: A better back-of-the-book index. Proceedings of First Workshop on Computational Terminology."},{"key":"4_CR61","doi-asserted-by":"crossref","unstructured":"Shao, L., & Ng, H. T. (2004). Mining new word translations from comparable corpora. Proceedings of the 20th International Conference on Computational Linguistics. Association for Computational Linguistics, Stroudsburg, PA.","DOI":"10.3115\/1220355.1220444"},{"key":"4_CR62","unstructured":"Shezaf, D., & Rappoport, A. (2010). Bilingual lexicon generation using non-aligned signatures. Proceedings of the 48th Annual Meeting of the Association for Computational Linguistics (pp. 98\u2013107). Association for Computational Linguistics."},{"key":"4_CR63","unstructured":"Skadi\u0146a, I. (2009). Jaunas iesp\u0113jas att\u0113lu mekl\u0113\u0161an\u0101: \u0123eotelpiskaj\u0101 inform\u0101cij\u0101 un valodu tehnolo\u0123ij\u0101s balst\u012bta att\u0113lu mekl\u0113\u0161anas platforma TRIPOD. Latvijas Nacion\u0101l\u0101s bibliot\u0113kas zin\u0101tniskie raksti (pp. 182\u2013192). National Library of Latvia."},{"issue":"1","key":"4_CR64","first-page":"143","volume":"19","author":"F Smadja","year":"1993","unstructured":"Smadja, F. (1993). Retrieving collocations from text: Xtract. Computational Linguistics, 19(1), 143\u2013177.","journal-title":"Computational Linguistics"},{"key":"4_CR65","doi-asserted-by":"publisher","first-page":"11","DOI":"10.1108\/eb026526","volume":"28","author":"K Sp\u00e4rck Jones","year":"1972","unstructured":"Sp\u00e4rck Jones, K. (1972). A statistical interpretation of term specificity and its application in retrieval. Journal of Documentation, 28, 11\u201321.","journal-title":"Journal of Documentation"},{"key":"4_CR66","unstructured":"\u015etef\u0103nescu, D. (2010). Intelligent information mining from multilingual corpora. PhD Thesis, Romanian Academy, Bucharest."},{"key":"4_CR67","unstructured":"\u015etef\u0103nescu, D. (2012). Mining for term translations in comparable corpora. The 5th Workshop on Building and Using Comparable Corpora (pp. 98\u2013103). Turkey, Istanbul."},{"key":"4_CR68","unstructured":"\u015etef\u0103nescu, D., Tufi\u015f, D., & Irimia, E. (2006). Automatic identification and extraction of collocations from texts. Proceedings of the 2nd Romanian Workshop for Linguistic Tools and Resources (Vol. 3). Bucharest, Romania."},{"key":"4_CR69","unstructured":"\u015etef\u0103nescu, D., Ion, R., & Boro\u015f, T. (2011). TiradeAI: An ensemble of spellcheckers. Proceedings of the Spelling Alteration for Web Search Workshop (pp. 20\u201323)."},{"key":"4_CR70","doi-asserted-by":"publisher","first-page":"415","DOI":"10.1007\/3-540-45715-1_44","volume-title":"Computational Linguistics and Intelligent Text Processing","author":"Ralf Steinberger","year":"2002","unstructured":"Steinberger, R., Pouliquen, B., & Hagman, J. (2002). Cross-lingual document similarity calculation using the multilingual thesaurus EuroVoc. Computational Linguistics and Intelligent Text Processing (pp. 115\u2013424)."},{"key":"4_CR71","unstructured":"Steinberger, R., Pouliquen, B., Widiger, A., Ignat, C., Erjavec, T., Tufi, D., Varga, D. (2006). The JRC-Acquis: A multilingual aligned parallel corpus with 20+ languages. Proceedings of the 5th International Conference on Language Resources and Evaluation (LREC\u20192006) (Vol. 4, pp. 2142\u20132147)."},{"key":"4_CR72","unstructured":"Tadi\u0107, M., & \u0160ojat, K. (2003). Finding multiword term candidates in Croatian. In Proceedings of Information Extraction for Slavic Languages 2003 Workshop (pp. 102\u2013107)."},{"issue":"03","key":"4_CR73","doi-asserted-by":"publisher","first-page":"279","DOI":"10.1017\/S1351324905003864","volume":"11","author":"J Tiedemann","year":"2005","unstructured":"Tiedemann, J. (2005). Optimization of word alignment clues. Natural Language Engineering, 11(03), 279\u2013293.","journal-title":"Natural Language Engineering"},{"key":"4_CR74","unstructured":"Tjong, E. F., & Sang, K. (2002). Introduction to the CoNLL-2002 shared task: Language-independent named entity recognition. Proceedings of the 6th Conference on Natural Language Learning (Vol. 20, pp. 142\u2013147). Association for Computational Linguistics, Taipei, Taiwan."},{"key":"4_CR75","doi-asserted-by":"crossref","unstructured":"Todirascu, A., Gledhill, C., & Stefanescu, D. (2009). Extracting collocations in contexts. Human Language Technology. Challenges of the Information Society (pp. 336\u2013349). Springer.","DOI":"10.1007\/978-3-642-04235-5_29"},{"key":"4_CR76","unstructured":"Tufi, D., & Irimia, E. (2006). RoCo-news: A hand validated journalistic corpus of Romanian. Proceedings of the 5th LREC Conference (pp. 869\u2013872). Genoa, Italy."},{"key":"4_CR77","unstructured":"Tufi, D., Ion, R., Ceau\u015fu, A., & \u015etef\u0103nescu, D. (2008). RACAI\u2019s linguistic web services. Proceedings of the 6th Language Resources and Evaluation Conference-LREC (pp. 327\u2013333)."},{"issue":"2","key":"4_CR78","doi-asserted-by":"publisher","first-page":"141","DOI":"10.1075\/term.16.2.01vin","volume":"16","author":"\u0160 Vintar","year":"2010","unstructured":"Vintar, \u0160. (2010). Bilingual term recognition revisited: The bag-of-equivalents term alignment approach and its evaluation. Terminology, 16(2), 141\u2013158.","journal-title":"Terminology"},{"key":"4_CR79","doi-asserted-by":"crossref","unstructured":"Voorhees, E. M. (2001). Overview of the TREC-9 question answering track. Proceedings of the Ninth Text REtrieval Conference (TREC-9).","DOI":"10.6028\/NIST.SP.500-249"},{"key":"4_CR80","unstructured":"Weller, M., Gojun, A., Heid, U., Daille, B., & Harastani, R. (2011). Simple methods for dealing with term variation and term alignment. Proceedings of the 9th International Conference on Terminology and Artificial Intelligence (TIA 2011) (pp. 86\u201392)."},{"issue":"1","key":"4_CR81","doi-asserted-by":"publisher","first-page":"103","DOI":"10.1093\/applin\/ami045","volume":"27","author":"R Xiao","year":"2006","unstructured":"Xiao, R., & McEnery, T. (2006). Collocation, semantic prosody, and near synonymy: A cross-linguistic perspective. Applied Linguistics, 27(1), 103\u2013129.","journal-title":"Applied Linguistics"},{"key":"4_CR82","unstructured":"Yu, K., & Tsujii, J. (2009). Bilingual dictionary extraction from Wikipedia. Proceedings of Machine Translation Summit XII (pp. 379\u2013386)."},{"key":"4_CR83","unstructured":"Zeller, I. (2005). Automatinis terminu atpazinimas ir apdorojimas. VDU Lietuviu Kalbos Institutas."}],"container-title":["Theory and Applications of Natural Language Processing","Using Comparable Corpora for Under-Resourced Areas of Machine Translation"],"original-title":[],"language":"en","link":[{"URL":"http:\/\/link.springer.com\/content\/pdf\/10.1007\/978-3-319-99004-0_4","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2019,5,21]],"date-time":"2019-05-21T04:26:00Z","timestamp":1558412760000},"score":1,"resource":{"primary":{"URL":"http:\/\/link.springer.com\/10.1007\/978-3-319-99004-0_4"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2019]]},"ISBN":["9783319990033","9783319990040"],"references-count":83,"URL":"https:\/\/doi.org\/10.1007\/978-3-319-99004-0_4","relation":{},"ISSN":["2192-032X","2192-0338"],"issn-type":[{"type":"print","value":"2192-032X"},{"type":"electronic","value":"2192-0338"}],"subject":[],"published":{"date-parts":[[2019]]},"assertion":[{"value":"7 February 2019","order":1,"name":"first_online","label":"First Online","group":{"name":"ChapterHistory","label":"Chapter History"}}]}}