{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,4,30]],"date-time":"2026-04-30T03:42:02Z","timestamp":1777520522239,"version":"3.51.4"},"publisher-location":"New York, NY, USA","reference-count":53,"publisher":"ACM","license":[{"start":{"date-parts":[[2022,9,14]],"date-time":"2022-09-14T00:00:00Z","timestamp":1663113600000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/creativecommons.org\/licenses\/by\/4.0\/"}],"funder":[{"DOI":"10.13039\/501100001602","name":"Science Foundation Ireland","doi-asserted-by":"publisher","award":["SFI\/12\/RC\/2289,SFI\/12\/RC\/2289-P2, SFI\/13\/RC\/2106,18\/CRT\/6223,18\/CRT\/6224"],"award-info":[{"award-number":["SFI\/12\/RC\/2289,SFI\/12\/RC\/2289-P2, SFI\/13\/RC\/2106,18\/CRT\/6223,18\/CRT\/6224"]}],"id":[{"id":"10.13039\/501100001602","id-type":"DOI","asserted-by":"publisher"}]}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2022,9,14]]},"DOI":"10.1145\/3549555.3549593","type":"proceedings-article","created":{"date-parts":[[2022,10,7]],"date-time":"2022-10-07T16:14:01Z","timestamp":1665159241000},"page":"15-22","source":"Crossref","is-referenced-by-count":5,"title":["An Exploration into the Benefits of the CLIP model for Lifelog Retrieval"],"prefix":"10.1145","author":[{"given":"Ly-Duyen","family":"Tran","sequence":"first","affiliation":[{"name":"School of Computing, Dublin City University, Ireland"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Naushad","family":"Alam","sequence":"additional","affiliation":[{"name":"School of Computing, Dublin City University, Ireland"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Yvette","family":"Graham","sequence":"additional","affiliation":[{"name":"Trinity College, Ireland"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Linh Khanh","family":"Vo","sequence":"additional","affiliation":[{"name":"University of Science; Vietnam National University, Vietnam and AISIA Research Lab, Vietnam"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Nghiem Tuong","family":"Diep","sequence":"additional","affiliation":[{"name":"University of Science; Vietnam National University, Vietnam and AISIA Research Lab, Vietnam"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Binh","family":"Nguyen","sequence":"additional","affiliation":[{"name":"University of Science; Vietnam National University, Vietnam and AISIA Research Lab, Vietnam"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Liting","family":"Zhou","sequence":"additional","affiliation":[{"name":"School of Computing, Dublin City University, Ireland"}],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Cathal","family":"Gurrin","sequence":"additional","affiliation":[{"name":"School of Computing, Dublin City University, Ireland"}],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"320","published-online":{"date-parts":[[2022,10,7]]},"reference":[{"key":"e_1_3_2_1_1_1","doi-asserted-by":"publisher","DOI":"10.1145\/3463948.3469069"},{"key":"e_1_3_2_1_2_1","doi-asserted-by":"publisher","DOI":"10.1145\/3463948.3469070"},{"key":"e_1_3_2_1_3_1","unstructured":"Artashes Arutiunian Dev Vidhani Goutham Venkatesh Mayank Bhaskar Ritobrata Ghosh and Sujit Pal. 2021. Fine tuning CLIP with Remote Sensing (Satellite) images and captions. https:\/\/huggingface.co\/blog\/fine-tune-clip-rsicd.  Artashes Arutiunian Dev Vidhani Goutham Venkatesh Mayank Bhaskar Ritobrata Ghosh and Sujit Pal. 2021. Fine tuning CLIP with Remote Sensing (Satellite) images and captions. https:\/\/huggingface.co\/blog\/fine-tune-clip-rsicd."},{"key":"e_1_3_2_1_4_1","unstructured":"Vannevar Bush. 1945. As We May Think. https:\/\/www.theatlantic.com\/magazine\/archive\/1945\/07\/as-we-may-think\/303881\/ Section: Technology.  Vannevar Bush. 1945. As We May Think. https:\/\/www.theatlantic.com\/magazine\/archive\/1945\/07\/as-we-may-think\/303881\/ Section: Technology."},{"key":"e_1_3_2_1_5_1","volume-title":"Proc. IEEE 105, 10 (Oct. 2017), 1865\u20131883. https:\/\/doi.org\/10.1109\/JPROC.2017.2675998 Conference Name: Proceedings of the IEEE.","author":"Cheng Gong","year":"2017","unstructured":"Gong Cheng , Junwei Han , and Xiaoqiang Lu . 2017 . Remote Sensing Image Scene Classification: Benchmark and State of the Art . Proc. IEEE 105, 10 (Oct. 2017), 1865\u20131883. https:\/\/doi.org\/10.1109\/JPROC.2017.2675998 Conference Name: Proceedings of the IEEE. Gong Cheng, Junwei Han, and Xiaoqiang Lu. 2017. Remote Sensing Image Scene Classification: Benchmark and State of the Art. Proc. IEEE 105, 10 (Oct. 2017), 1865\u20131883. https:\/\/doi.org\/10.1109\/JPROC.2017.2675998 Conference Name: Proceedings of the IEEE."},{"key":"e_1_3_2_1_6_1","volume-title":"CLIP-Art: Contrastive Pre-training for Fine-Grained Art Classification. In 2021 IEEE\/CVF Conference on Computer Vision and Pattern Recognition Workshops (CVPRW). IEEE","author":"V.","year":"2021","unstructured":"Marcos\u00a0 V. Conde and Kerem Turgutlu. 2021 . CLIP-Art: Contrastive Pre-training for Fine-Grained Art Classification. In 2021 IEEE\/CVF Conference on Computer Vision and Pattern Recognition Workshops (CVPRW). IEEE , Nashville, TN, USA, 3951\u20133955. https:\/\/doi.org\/10.1109\/CVPRW53098. 2021 .00444 Marcos\u00a0V. Conde and Kerem Turgutlu. 2021. CLIP-Art: Contrastive Pre-training for Fine-Grained Art Classification. In 2021 IEEE\/CVF Conference on Computer Vision and Pattern Recognition Workshops (CVPRW). IEEE, Nashville, TN, USA, 3951\u20133955. https:\/\/doi.org\/10.1109\/CVPRW53098.2021.00444"},{"key":"e_1_3_2_1_7_1","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2009.5206848"},{"key":"e_1_3_2_1_8_1","first-page":"19","volume-title":"Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies","volume":"1","author":"Devlin Jacob","year":"2019","unstructured":"Jacob Devlin , Ming-Wei Chang , Kenton Lee , and Kristina Toutanova . 2019 . BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding . In Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies , Volume 1 (Long and Short Papers). Association for Computational Linguistics, Minneapolis, Minnesota, 4171\u20134186. https:\/\/doi.org\/10. 18653\/v1\/N 19 - 1423 Jacob Devlin, Ming-Wei Chang, Kenton Lee, and Kristina Toutanova. 2019. BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. In Proceedings of the 2019 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, Volume 1 (Long and Short Papers). Association for Computational Linguistics, Minneapolis, Minnesota, 4171\u20134186. https:\/\/doi.org\/10.18653\/v1\/N19-1423"},{"key":"e_1_3_2_1_9_1","doi-asserted-by":"publisher","DOI":"10.1109\/TMC.2018.2840153"},{"key":"e_1_3_2_1_10_1","doi-asserted-by":"publisher","DOI":"10.1145\/3463948.3469067"},{"key":"e_1_3_2_1_11_1","volume-title":"CLIP-Adapter: Better Vision-Language Models with Feature Adapters. arXiv:2110.04544 [cs] (Oct","author":"Gao Peng","year":"2021","unstructured":"Peng Gao , Shijie Geng , Renrui Zhang , Teli Ma , Rongyao Fang , Yongfeng Zhang , Hongsheng Li , and Yu Qiao . 2021. CLIP-Adapter: Better Vision-Language Models with Feature Adapters. arXiv:2110.04544 [cs] (Oct . 2021 ). http:\/\/arxiv.org\/abs\/2110.04544 arXiv:2110.04544. Peng Gao, Shijie Geng, Renrui Zhang, Teli Ma, Rongyao Fang, Yongfeng Zhang, Hongsheng Li, and Yu Qiao. 2021. CLIP-Adapter: Better Vision-Language Models with Feature Adapters. arXiv:2110.04544 [cs] (Oct. 2021). http:\/\/arxiv.org\/abs\/2110.04544 arXiv:2110.04544."},{"key":"e_1_3_2_1_12_1","doi-asserted-by":"publisher","DOI":"10.1177\/0278364913491297"},{"key":"e_1_3_2_1_13_1","volume-title":"MyLifeBits: A personal database for everything. Commun. ACM 49 (01","author":"Gemmell Jim","year":"2006","unstructured":"Jim Gemmell , Chester Bell , and Roger Lueder . 2006. MyLifeBits: A personal database for everything. Commun. ACM 49 (01 2006 ), 89\u201395. Jim Gemmell, Chester Bell, and Roger Lueder. 2006. MyLifeBits: A personal database for everything. Commun. ACM 49 (01 2006), 89\u201395."},{"key":"e_1_3_2_1_14_1","unstructured":"Cathal Gurrin Hideo Joho Frank Hopfgartner Liting Zhou Rashmi Gupta Rami Albatal and Duc-Tien Dang-Nguyen. 2017. Overview of NTCIR-13 Lifelog-2 Task. (2017) 6.  Cathal Gurrin Hideo Joho Frank Hopfgartner Liting Zhou Rashmi Gupta Rami Albatal and Duc-Tien Dang-Nguyen. 2017. Overview of NTCIR-13 Lifelog-2 Task. (2017) 6."},{"key":"e_1_3_2_1_15_1","doi-asserted-by":"publisher","DOI":"10.1145\/3460426.3470945"},{"key":"e_1_3_2_1_16_1","doi-asserted-by":"publisher","DOI":"10.1145\/3372278.3388043"},{"key":"e_1_3_2_1_17_1","volume-title":"Lifelogging: Personal big data. Foundations and trends in information retrieval 8, 1","author":"Gurrin Cathal","year":"2014","unstructured":"Cathal Gurrin , Alan\u00a0 F Smeaton , and Aiden\u00a0 R Doherty . 2014 . Lifelogging: Personal big data. Foundations and trends in information retrieval 8, 1 (2014), 1\u2013125. Cathal Gurrin, Alan\u00a0F Smeaton, and Aiden\u00a0R Doherty. 2014. Lifelogging: Personal big data. Foundations and trends in information retrieval 8, 1 (2014), 1\u2013125."},{"key":"e_1_3_2_1_18_1","doi-asserted-by":"publisher","DOI":"10.1145\/3512527.3531439"},{"key":"e_1_3_2_1_19_1","doi-asserted-by":"publisher","DOI":"10.1016\/j.pmcj.2015.12.002"},{"key":"e_1_3_2_1_20_1","volume-title":"Deep Residual Learning for Image Recognition. In 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). IEEE","author":"He Kaiming","year":"2016","unstructured":"Kaiming He , Xiangyu Zhang , Shaoqing Ren , and Jian Sun . 2016 . Deep Residual Learning for Image Recognition. In 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). IEEE , Las Vegas, NV, USA, 770\u2013778. https:\/\/doi.org\/10.1109\/CVPR. 2016.90 Kaiming He, Xiangyu Zhang, Shaoqing Ren, and Jian Sun. 2016. Deep Residual Learning for Image Recognition. In 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). IEEE, Las Vegas, NV, USA, 770\u2013778. https:\/\/doi.org\/10.1109\/CVPR.2016.90"},{"key":"e_1_3_2_1_21_1","volume-title":"EuroSAT: A Novel Dataset and Deep Learning Benchmark for Land Use and Land Cover Classification. arXiv:1709.00029 [cs] (Feb","author":"Helber Patrick","year":"2019","unstructured":"Patrick Helber , Benjamin Bischke , Andreas Dengel , and Damian Borth . 2019. EuroSAT: A Novel Dataset and Deep Learning Benchmark for Land Use and Land Cover Classification. arXiv:1709.00029 [cs] (Feb . 2019 ). http:\/\/arxiv.org\/abs\/1709.00029 arXiv:1709.00029 version: 2. Patrick Helber, Benjamin Bischke, Andreas Dengel, and Damian Borth. 2019. EuroSAT: A Novel Dataset and Deep Learning Benchmark for Land Use and Land Cover Classification. arXiv:1709.00029 [cs] (Feb. 2019). http:\/\/arxiv.org\/abs\/1709.00029 arXiv:1709.00029 version: 2."},{"key":"e_1_3_2_1_22_1","doi-asserted-by":"publisher","DOI":"10.1007\/s13735-021-00225-2"},{"key":"e_1_3_2_1_23_1","doi-asserted-by":"publisher","DOI":"10.1145\/3512729.3533003"},{"key":"e_1_3_2_1_24_1","volume-title":"Scaling Up Visual and Vision-Language Representation Learning With Noisy Text Supervision. arXiv:2102.05918 [cs] (June","author":"Jia Chao","year":"2021","unstructured":"Chao Jia , Yinfei Yang , Ye Xia , Yi-Ting Chen , Zarana Parekh , Hieu Pham , Quoc\u00a0 V. Le , Yunhsuan Sung , Zhen Li , and Tom Duerig . 2021. Scaling Up Visual and Vision-Language Representation Learning With Noisy Text Supervision. arXiv:2102.05918 [cs] (June 2021 ). http:\/\/arxiv.org\/abs\/2102.05918 arXiv:2102.05918. Chao Jia, Yinfei Yang, Ye Xia, Yi-Ting Chen, Zarana Parekh, Hieu Pham, Quoc\u00a0V. Le, Yunhsuan Sung, Zhen Li, and Tom Duerig. 2021. Scaling Up Visual and Vision-Language Representation Learning With Noisy Text Supervision. arXiv:2102.05918 [cs] (June 2021). http:\/\/arxiv.org\/abs\/2102.05918 arXiv:2102.05918."},{"key":"e_1_3_2_1_25_1","volume-title":"Li Fei-Fei, C.\u00a0Lawrence Zitnick, and Ross Girshick.","author":"Johnson Justin","year":"2016","unstructured":"Justin Johnson , Bharath Hariharan , Laurens van\u00a0der Maaten , Li Fei-Fei, C.\u00a0Lawrence Zitnick, and Ross Girshick. 2016 . CLEVR : A Diagnostic Dataset for Compositional Language and Elementary Visual Reasoning . arXiv:1612.06890 [cs] (Dec. 2016). http:\/\/arxiv.org\/abs\/1612.06890 arXiv:1612.06890. Justin Johnson, Bharath Hariharan, Laurens van\u00a0der Maaten, Li Fei-Fei, C.\u00a0Lawrence Zitnick, and Ross Girshick. 2016. CLEVR: A Diagnostic Dataset for Compositional Language and Elementary Visual Reasoning. arXiv:1612.06890 [cs] (Dec. 2016). http:\/\/arxiv.org\/abs\/1612.06890 arXiv:1612.06890."},{"key":"e_1_3_2_1_26_1","doi-asserted-by":"publisher","DOI":"10.24963\/ijcai.2021\/710"},{"key":"e_1_3_2_1_27_1","doi-asserted-by":"publisher","DOI":"10.1145\/3463948.3469255"},{"key":"e_1_3_2_1_28_1","volume-title":"Adam: A Method for Stochastic Optimization. In ICLR (Poster).","author":"Kingma P","year":"2015","unstructured":"Diederik\u00a0 P Kingma and Jimmy Ba . 2015 . Adam: A Method for Stochastic Optimization. In ICLR (Poster). Diederik\u00a0P Kingma and Jimmy Ba. 2015. Adam: A Method for Stochastic Optimization. In ICLR (Poster)."},{"key":"e_1_3_2_1_29_1","doi-asserted-by":"publisher","DOI":"10.1145\/3379172.3391725"},{"key":"e_1_3_2_1_30_1","doi-asserted-by":"publisher","DOI":"10.1145\/3379172.3391720"},{"key":"e_1_3_2_1_31_1","volume-title":"RoBERTa: A Robustly Optimized BERT Pretraining Approach. arXiv:1907.11692 [cs] (July","author":"Liu Yinhan","year":"2019","unstructured":"Yinhan Liu , Myle Ott , Naman Goyal , Jingfei Du , Mandar Joshi , Danqi Chen , Omer Levy , Mike Lewis , Luke Zettlemoyer , and Veselin Stoyanov . 2019. RoBERTa: A Robustly Optimized BERT Pretraining Approach. arXiv:1907.11692 [cs] (July 2019 ). http:\/\/arxiv.org\/abs\/1907.11692 arXiv:1907.11692. Yinhan Liu, Myle Ott, Naman Goyal, Jingfei Du, Mandar Joshi, Danqi Chen, Omer Levy, Mike Lewis, Luke Zettlemoyer, and Veselin Stoyanov. 2019. RoBERTa: A Robustly Optimized BERT Pretraining Approach. arXiv:1907.11692 [cs] (July 2019). http:\/\/arxiv.org\/abs\/1907.11692 arXiv:1907.11692."},{"key":"e_1_3_2_1_32_1","doi-asserted-by":"publisher","DOI":"10.1145\/3463948.3469074"},{"key":"e_1_3_2_1_33_1","volume-title":"Sgdr: Stochastic gradient descent with warm restarts. arXiv preprint arXiv:1608.03983(2016).","author":"Loshchilov Ilya","year":"2016","unstructured":"Ilya Loshchilov and Frank Hutter . 2016 . Sgdr: Stochastic gradient descent with warm restarts. arXiv preprint arXiv:1608.03983(2016). Ilya Loshchilov and Frank Hutter. 2016. Sgdr: Stochastic gradient descent with warm restarts. arXiv preprint arXiv:1608.03983(2016)."},{"key":"e_1_3_2_1_34_1","volume-title":"Decoupled Weight Decay Regularization. In International Conference on Learning Representations.","author":"Loshchilov Ilya","year":"2018","unstructured":"Ilya Loshchilov and Frank Hutter . 2018 . Decoupled Weight Decay Regularization. In International Conference on Learning Representations. Ilya Loshchilov and Frank Hutter. 2018. Decoupled Weight Decay Regularization. In International Conference on Learning Representations."},{"key":"e_1_3_2_1_35_1","first-page":"4","article-title":"Exploring Models and Data for Remote Sensing Image Caption Generation","volume":"56","author":"Lu Xiaoqiang","year":"2018","unstructured":"Xiaoqiang Lu , Binqiang Wang , Xiangtao Zheng , and Xuelong Li . 2018 . Exploring Models and Data for Remote Sensing Image Caption Generation . IEEE Transactions on Geoscience and Remote Sensing 56 , 4 (April 2018), 2183\u20132195. https:\/\/doi.org\/10.1109\/TGRS.2017.2776321 arXiv:1712.07835 version: 1. Xiaoqiang Lu, Binqiang Wang, Xiangtao Zheng, and Xuelong Li. 2018. Exploring Models and Data for Remote Sensing Image Caption Generation. IEEE Transactions on Geoscience and Remote Sensing 56, 4 (April 2018), 2183\u20132195. https:\/\/doi.org\/10.1109\/TGRS.2017.2776321 arXiv:1712.07835 version: 1.","journal-title":"IEEE Transactions on Geoscience and Remote Sensing"},{"key":"e_1_3_2_1_36_1","volume-title":"Learning Transferable Visual Models From Natural Language Supervision. arXiv:2103.00020 [cs] (Feb","author":"Radford Alec","year":"2021","unstructured":"Alec Radford , Jong\u00a0Wook Kim , Chris Hallacy , Aditya Ramesh , Gabriel Goh , Sandhini Agarwal , Girish Sastry , Amanda Askell , Pamela Mishkin , Jack Clark , Gretchen Krueger , and Ilya Sutskever . 2021. Learning Transferable Visual Models From Natural Language Supervision. arXiv:2103.00020 [cs] (Feb . 2021 ). http:\/\/arxiv.org\/abs\/2103.00020 arXiv:2103.00020. Alec Radford, Jong\u00a0Wook Kim, Chris Hallacy, Aditya Ramesh, Gabriel Goh, Sandhini Agarwal, Girish Sastry, Amanda Askell, Pamela Mishkin, Jack Clark, Gretchen Krueger, and Ilya Sutskever. 2021. Learning Transferable Visual Models From Natural Language Supervision. arXiv:2103.00020 [cs] (Feb. 2021). http:\/\/arxiv.org\/abs\/2103.00020 arXiv:2103.00020."},{"key":"e_1_3_2_1_37_1","volume-title":"MEMORIA: A Memory Enhancement and MOment RetrIeval Application for LSC 2022. In Proceedings of the 5th Annual on Lifelog Search Challenge","author":"Ribiero Ricardo","unstructured":"Ricardo Ribiero , Alina Trifan , and Antonio J . \u00a0R. Neves. 2022 . MEMORIA: A Memory Enhancement and MOment RetrIeval Application for LSC 2022. In Proceedings of the 5th Annual on Lifelog Search Challenge ( Newark, NJ, USA) (LSC \u201922). Association for Computing Machinery, New York, NY, USA, 8\u201313. https:\/\/doi.org\/10.1145\/3512729.3533011 Ricardo Ribiero, Alina Trifan, and Antonio J.\u00a0R. Neves. 2022. MEMORIA: A Memory Enhancement and MOment RetrIeval Application for LSC 2022. In Proceedings of the 5th Annual on Lifelog Search Challenge (Newark, NJ, USA) (LSC \u201922). Association for Computing Machinery, New York, NY, USA, 8\u201313. https:\/\/doi.org\/10.1145\/3512729.3533011"},{"key":"e_1_3_2_1_38_1","volume-title":"a distilled version of BERT: smaller, faster, cheaper and lighter. arXiv:1910.01108 [cs] (Feb","author":"Sanh Victor","year":"2020","unstructured":"Victor Sanh , Lysandre Debut , Julien Chaumond , and Thomas Wolf . 2020. DistilBERT , a distilled version of BERT: smaller, faster, cheaper and lighter. arXiv:1910.01108 [cs] (Feb . 2020 ). http:\/\/arxiv.org\/abs\/1910.01108 arXiv:1910.01108. Victor Sanh, Lysandre Debut, Julien Chaumond, and Thomas Wolf. 2020. DistilBERT, a distilled version of BERT: smaller, faster, cheaper and lighter. arXiv:1910.01108 [cs] (Feb. 2020). http:\/\/arxiv.org\/abs\/1910.01108 arXiv:1910.01108."},{"key":"e_1_3_2_1_39_1","volume-title":"2012 IEEE International Conference on Emerging Signal Processing Applications. 99\u2013102","author":"Shah Mohit","year":"2012","unstructured":"Mohit Shah , Brian Mears , Chaitali Chakrabarti , and Andreas Spanias . 2012 . Lifelogging: Archival and retrieval of continuously recorded audio using wearable devices . In 2012 IEEE International Conference on Emerging Signal Processing Applications. 99\u2013102 . Mohit Shah, Brian Mears, Chaitali Chakrabarti, and Andreas Spanias. 2012. Lifelogging: Archival and retrieval of continuously recorded audio using wearable devices. In 2012 IEEE International Conference on Emerging Signal Processing Applications. 99\u2013102."},{"key":"e_1_3_2_1_40_1","doi-asserted-by":"publisher","DOI":"10.1145\/3512729.3533008"},{"key":"e_1_3_2_1_41_1","doi-asserted-by":"crossref","unstructured":"J. Stallkamp M. Schlipsing J. Salmen and C. Igel. 2012. Man vs. computer: Benchmarking machine learning algorithms for traffic sign recognition. Neural Networks0(2012) \u2013. https:\/\/doi.org\/10.1016\/j.neunet.2012.02.016  J. Stallkamp M. Schlipsing J. Salmen and C. Igel. 2012. Man vs. computer: Benchmarking machine learning algorithms for traffic sign recognition. Neural Networks0(2012) \u2013. https:\/\/doi.org\/10.1016\/j.neunet.2012.02.016","DOI":"10.1016\/j.neunet.2012.02.016"},{"key":"e_1_3_2_1_42_1","volume-title":"MultiMedia Modeling","author":"Tran Ly-Duyen","unstructured":"Ly-Duyen Tran , Thanh\u00a0Cong Ho , Lan\u00a0Anh Pham , Binh Nguyen , Cathal Gurrin , and Liting Zhou . 2022. LLQA - Lifelog Question Answering Dataset . In MultiMedia Modeling . Springer International Publishing , Cham , 217\u2013228. Ly-Duyen Tran, Thanh\u00a0Cong Ho, Lan\u00a0Anh Pham, Binh Nguyen, Cathal Gurrin, and Liting Zhou. 2022. LLQA - Lifelog Question Answering Dataset. In MultiMedia Modeling. Springer International Publishing, Cham, 217\u2013228."},{"key":"e_1_3_2_1_43_1","doi-asserted-by":"publisher","DOI":"10.1145\/3512729.3533012"},{"key":"e_1_3_2_1_44_1","doi-asserted-by":"publisher","DOI":"10.1145\/3463948.3469064"},{"key":"e_1_3_2_1_45_1","volume-title":"Advances in Neural Information Processing Systems, Vol.\u00a030. Curran Associates","author":"Vaswani Ashish","unstructured":"Ashish Vaswani , Noam Shazeer , Niki Parmar , Jakob Uszkoreit , Llion Jones , Aidan\u00a0 N Gomez , \u0141ukasz Kaiser , and Illia Polosukhin . 2017. Attention is All you Need . In Advances in Neural Information Processing Systems, Vol.\u00a030. Curran Associates , Inc . Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan\u00a0N Gomez, \u0141ukasz Kaiser, and Illia Polosukhin. 2017. Attention is All you Need. In Advances in Neural Information Processing Systems, Vol.\u00a030. Curran Associates, Inc."},{"key":"e_1_3_2_1_46_1","volume-title":"Rotation Equivariant CNNs for Digital Pathology. arXiv:1806.03962 [cs, stat] (June","author":"Veeling S.","year":"2018","unstructured":"Bastiaan\u00a0 S. Veeling , Jasper Linmans , Jim Winkens , Taco Cohen , and Max Welling . 2018. Rotation Equivariant CNNs for Digital Pathology. arXiv:1806.03962 [cs, stat] (June 2018 ). http:\/\/arxiv.org\/abs\/1806.03962 arXiv:1806.03962. Bastiaan\u00a0S. Veeling, Jasper Linmans, Jim Winkens, Taco Cohen, and Max Welling. 2018. Rotation Equivariant CNNs for Digital Pathology. arXiv:1806.03962 [cs, stat] (June 2018). http:\/\/arxiv.org\/abs\/1806.03962 arXiv:1806.03962."},{"key":"e_1_3_2_1_47_1","volume-title":"ActionCLIP: A New Paradigm for Video Action Recognition. arXiv:2109.08472 [cs] (Sept","author":"Wang Mengmeng","year":"2021","unstructured":"Mengmeng Wang , Jiazheng Xing , and Yong Liu . 2021. ActionCLIP: A New Paradigm for Video Action Recognition. arXiv:2109.08472 [cs] (Sept . 2021 ). http:\/\/arxiv.org\/abs\/2109.08472 arXiv:2109.08472. Mengmeng Wang, Jiazheng Xing, and Yong Liu. 2021. ActionCLIP: A New Paradigm for Video Action Recognition. arXiv:2109.08472 [cs] (Sept. 2021). http:\/\/arxiv.org\/abs\/2109.08472 arXiv:2109.08472."},{"key":"e_1_3_2_1_48_1","unstructured":"Mitchell Wortsman Gabriel Ilharco Mike Li Jong\u00a0Wook Kim Hannaneh Hajishirzi Ali Farhadi Hongseok Namkoong and Ludwig Schmidt. 2021. Robust fine-tuning of zero-shot models. CoRR abs\/2109.01903(2021). arXiv:2109.01903https:\/\/arxiv.org\/abs\/2109.01903  Mitchell Wortsman Gabriel Ilharco Mike Li Jong\u00a0Wook Kim Hannaneh Hajishirzi Ali Farhadi Hongseok Namkoong and Ludwig Schmidt. 2021. Robust fine-tuning of zero-shot models. CoRR abs\/2109.01903(2021). arXiv:2109.01903https:\/\/arxiv.org\/abs\/2109.01903"},{"key":"e_1_3_2_1_49_1","doi-asserted-by":"crossref","unstructured":"Yang Yang Hyowon Lee and Cathal Gurrin. 2013. Visualizing lifelog data for different interaction platforms. In CHI\u201913 Extended Abstracts on Human Factors in Computing Systems. 1785\u20131790.  Yang Yang Hyowon Lee and Cathal Gurrin. 2013. Visualizing lifelog data for different interaction platforms. In CHI\u201913 Extended Abstracts on Human Factors in Computing Systems. 1785\u20131790.","DOI":"10.1145\/2468356.2468676"},{"key":"e_1_3_2_1_50_1","volume-title":"Visual Object Detection from Lifelogs using Visual Non-lifelog Data. Ph.\u00a0D. Dissertation","author":"TengQi Ye.","unstructured":"TengQi Ye. 2018. Visual Object Detection from Lifelogs using Visual Non-lifelog Data. Ph.\u00a0D. Dissertation . Dublin City University . TengQi Ye. 2018. Visual Object Detection from Lifelogs using Visual Non-lifelog Data. Ph.\u00a0D. Dissertation. Dublin City University."},{"key":"e_1_3_2_1_51_1","volume-title":"Tip-Adapter: Training-free CLIP-Adapter for Better Vision-Language Modeling. arXiv:2111.03930 [cs] (Nov","author":"Zhang Renrui","year":"2021","unstructured":"Renrui Zhang , Rongyao Fang , Wei Zhang , Peng Gao , Kunchang Li , Jifeng Dai , Yu Qiao , and Hongsheng Li. 2021. Tip-Adapter: Training-free CLIP-Adapter for Better Vision-Language Modeling. arXiv:2111.03930 [cs] (Nov . 2021 ). http:\/\/arxiv.org\/abs\/2111.03930 arXiv:2111.03930. Renrui Zhang, Rongyao Fang, Wei Zhang, Peng Gao, Kunchang Li, Jifeng Dai, Yu Qiao, and Hongsheng Li. 2021. Tip-Adapter: Training-free CLIP-Adapter for Better Vision-Language Modeling. arXiv:2111.03930 [cs] (Nov. 2021). http:\/\/arxiv.org\/abs\/2111.03930 arXiv:2111.03930."},{"key":"e_1_3_2_1_52_1","volume-title":"PointCLIP: Point Cloud Understanding by CLIP. arXiv:2112.02413 [cs] (Dec","author":"Zhang Renrui","year":"2021","unstructured":"Renrui Zhang , Ziyu Guo , Wei Zhang , Kunchang Li , Xupeng Miao , Bin Cui , Yu Qiao , Peng Gao , and Hongsheng Li. 2021. PointCLIP: Point Cloud Understanding by CLIP. arXiv:2112.02413 [cs] (Dec . 2021 ). http:\/\/arxiv.org\/abs\/2112.02413 arXiv:2112.02413. Renrui Zhang, Ziyu Guo, Wei Zhang, Kunchang Li, Xupeng Miao, Bin Cui, Yu Qiao, Peng Gao, and Hongsheng Li. 2021. PointCLIP: Point Cloud Understanding by CLIP. arXiv:2112.02413 [cs] (Dec. 2021). http:\/\/arxiv.org\/abs\/2112.02413 arXiv:2112.02413."},{"key":"e_1_3_2_1_53_1","volume-title":"Multimodal Embedding for Lifelog Retrieval. In International Conference on Multimedia Modeling. Springer, 416\u2013427","author":"Zhou Liting","year":"2022","unstructured":"Liting Zhou and Cathal Gurrin . 2022 . Multimodal Embedding for Lifelog Retrieval. In International Conference on Multimedia Modeling. Springer, 416\u2013427 . Liting Zhou and Cathal Gurrin. 2022. Multimodal Embedding for Lifelog Retrieval. In International Conference on Multimedia Modeling. Springer, 416\u2013427."}],"event":{"name":"CBMI 2022: International Conference on Content-based Multimedia Indexing","location":"Graz Austria","acronym":"CBMI 2022"},"container-title":["International Conference on Content-based Multimedia Indexing"],"original-title":[],"link":[{"URL":"https:\/\/dl.acm.org\/doi\/10.1145\/3549555.3549593","content-type":"unspecified","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/dl.acm.org\/doi\/pdf\/10.1145\/3549555.3549593","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2025,6,17]],"date-time":"2025-06-17T19:00:12Z","timestamp":1750186812000},"score":1,"resource":{"primary":{"URL":"https:\/\/dl.acm.org\/doi\/10.1145\/3549555.3549593"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2022,9,14]]},"references-count":53,"alternative-id":["10.1145\/3549555.3549593","10.1145\/3549555"],"URL":"https:\/\/doi.org\/10.1145\/3549555.3549593","relation":{},"subject":[],"published":{"date-parts":[[2022,9,14]]}}}