{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,7,8]],"date-time":"2025-07-08T04:17:14Z","timestamp":1751948234102,"version":"3.41.2"},"publisher-location":"Cham","reference-count":29,"publisher":"Springer International Publishing","isbn-type":[{"type":"print","value":"9783030007669"},{"type":"electronic","value":"9783030007676"}],"license":[{"start":{"date-parts":[[2018,1,1]],"date-time":"2018-01-01T00:00:00Z","timestamp":1514764800000},"content-version":"unspecified","delay-in-days":0,"URL":"http:\/\/www.springer.com\/tdm"}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2018]]},"DOI":"10.1007\/978-3-030-00767-6_27","type":"book-chapter","created":{"date-parts":[[2018,9,18]],"date-time":"2018-09-18T07:54:58Z","timestamp":1537257298000},"page":"285-295","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":7,"title":["Gaze Aware Deep Learning Model for\u00a0Video Summarization"],"prefix":"10.1007","author":[{"given":"Jiaxin","family":"Wu","sequence":"first","affiliation":[]},{"given":"Sheng-hua","family":"Zhong","sequence":"additional","affiliation":[]},{"given":"Zheng","family":"Ma","sequence":"additional","affiliation":[]},{"given":"Stephen J.","family":"Heinen","sequence":"additional","affiliation":[]},{"given":"Jianmin","family":"Jiang","sequence":"additional","affiliation":[]}],"member":"297","published-online":{"date-parts":[[2018,9,19]]},"reference":[{"key":"27_CR1","doi-asserted-by":"crossref","unstructured":"Chakraborty, P.R., Tjondronegoro, D., Zhang, L., Chandran, V.: Automatic identification of sports video highlights using viewer interest features. In: ICMR, pp. 55\u201362 (2016)","DOI":"10.1145\/2911996.2912011"},{"issue":"3","key":"27_CR2","doi-asserted-by":"publisher","first-page":"1","DOI":"10.1145\/1961189.1961199","volume":"2","author":"CC Chang","year":"2011","unstructured":"Chang, C.C., Lin, C.J.: Libsvm: a library for support vector machines. ACM TIST 2(3), 1\u201327 (2011)","journal-title":"ACM TIST"},{"key":"27_CR3","unstructured":"Chuk, T., Chan, A., Hsiao, J.: Hidden markov model analysis reveals better eye movement strategies in face recognition. In: CogSci (2015)"},{"key":"27_CR4","doi-asserted-by":"crossref","unstructured":"Deng, J., et al.: Imagenet: a large-scale hierarchical image database. In: CVPR, pp. 248\u2013255 (2009)","DOI":"10.1109\/CVPR.2009.5206848"},{"key":"27_CR5","unstructured":"Drucker, H., Burges, C.J.C., Kaufman, L., Smola, A.J., Vapnik, V.: Support vector regression machines. In: NIPS, pp. 155\u2013161 (1997)"},{"key":"27_CR6","series-title":"Lecture Notes in Computer Science","doi-asserted-by":"publisher","first-page":"505","DOI":"10.1007\/978-3-319-10584-0_33","volume-title":"Computer Vision \u2013 ECCV 2014","author":"M Gygli","year":"2014","unstructured":"Gygli, M., Grabner, H., Riemenschneider, H., Van Gool, L.: Creating summaries from user videos. In: Fleet, D., Pajdla, T., Schiele, B., Tuytelaars, T. (eds.) ECCV 2014. LNCS, vol. 8695, pp. 505\u2013520. Springer, Cham (2014). https:\/\/doi.org\/10.1007\/978-3-319-10584-0_33"},{"key":"27_CR7","doi-asserted-by":"crossref","unstructured":"Gygli, M., Grabner, H., Van Gool, L.: Video summarization by learning submodular mixtures of objectives. In: CVPR (2015)","DOI":"10.1109\/CVPR.2015.7298928"},{"issue":"2","key":"27_CR8","doi-asserted-by":"crossref","first-page":"1","DOI":"10.16910\/jemr.8.2.2","volume":"8","author":"N Holmberg","year":"2015","unstructured":"Holmberg, N., Holmqvist, K., Sandberg, H.: Children\u2019s attention to online adverts is related to low-level saliency factors and individual level of gaze control. JEMR 8(2), 1\u201310 (2015)","journal-title":"JEMR"},{"key":"27_CR9","doi-asserted-by":"crossref","unstructured":"Jia, Y., et al.: Caffe: convolutional architecture for fast feature embedding. CoRR abs\/1408.5093 (2014)","DOI":"10.1145\/2647868.2654889"},{"key":"27_CR10","doi-asserted-by":"crossref","unstructured":"Jiang, W., Cotton, C., Loui, A.C.: Automatic consumer video summarization by audio and visual analysis. In: ICMR, pp. 1\u20136 (2011)","DOI":"10.1109\/ICME.2011.6011841"},{"key":"27_CR11","doi-asserted-by":"crossref","unstructured":"Li, Y., Fathi, A., Rehg, J.M.: Learning to predict gaze in egocentric video. In: ICCV, pp. 3216\u20133223 (2013)","DOI":"10.1109\/ICCV.2013.399"},{"key":"27_CR12","doi-asserted-by":"crossref","unstructured":"Liu, Y., Zhong, S.H., Li, W.: Query-oriented multi-document summarization via unsupervised deep learning. In: AAAI, pp. 1699\u20131705 (2012)","DOI":"10.1609\/aaai.v26i1.8352"},{"key":"27_CR13","doi-asserted-by":"crossref","unstructured":"Mahasseni, B., Lam, M., Todorovic, S.: Unsupervised video summarization with adversarial LSTM networks. In: CVPR (2017)","DOI":"10.1109\/CVPR.2017.318"},{"issue":"4","key":"27_CR14","doi-asserted-by":"publisher","first-page":"639","DOI":"10.1109\/TPAMI.2011.171","volume":"34","author":"AK Mishra","year":"2012","unstructured":"Mishra, A.K., Aloimonos, Y., Cheong, L.F., Kassim, A.: Active visual segmentation. TPAMI 34(4), 639\u2013653 (2012)","journal-title":"TPAMI"},{"key":"27_CR15","doi-asserted-by":"crossref","unstructured":"Papoutsaki, A., Sangkloy, P., Laskey, J., Daskalova, N., Huang, J., Hays, J.: Webgazer: Scalable webcam eye tracking using user interactions. In: IJCAI, pp. 3839\u20133845 (2016)","DOI":"10.1145\/2702613.2702627"},{"key":"27_CR16","doi-asserted-by":"crossref","unstructured":"Salehin, M.M., Paul, M.: A novel framework for video summarization based on smooth pursuit information from eye tracker data. In: ICMR, pp. 692\u2013697 (2017)","DOI":"10.1109\/ICMEW.2017.8026294"},{"key":"27_CR17","unstructured":"Simonyan, K., Zisserman, A.: Two-stream convolutional networks for action recognition in videos. In: NIPS, pp. 568\u2013576 (2014)"},{"key":"27_CR18","unstructured":"Simonyan, K., Zisserman, A.: Very deep convolutional networks for large-scale image recognition. CoRR abs\/1409.1556 (2014)"},{"key":"27_CR19","doi-asserted-by":"crossref","unstructured":"Song, Y., Vallmitjana, J., Stent, A., Jaimes, A.: Tvsum: summarizing web videos using titles. In: CVPR, pp. 5179\u20135187 (2015)","DOI":"10.1109\/CVPR.2015.7299154"},{"issue":"1","key":"27_CR20","doi-asserted-by":"publisher","first-page":"1","DOI":"10.1145\/1198302.1198303","volume":"3","author":"BT Truong","year":"2007","unstructured":"Truong, B.T., Venkatesh, S.: Video abstraction: a systematic review and classification. ACM TOMM 3(1), 1\u201337 (2007)","journal-title":"ACM TOMM"},{"issue":"7","key":"27_CR21","first-page":"9625","volume":"76","author":"J Wu","year":"2017","unstructured":"Wu, J., Zhong, S.H., Jiang, J., Yang, Y.: A novel clustering method for static video summarization. MTAP 76(7), 9625\u20139641 (2017)","journal-title":"MTAP"},{"key":"27_CR22","doi-asserted-by":"crossref","unstructured":"Wu, J., Zhong, S.H., Ma, Z., Heinen, S.J., Jiang, J.: Foveated convolutional neural networks for video summarization. MTAP (2018)","DOI":"10.1007\/s11042-018-5953-1"},{"key":"27_CR23","doi-asserted-by":"crossref","unstructured":"Xu, J., Mukherjee, L., Li, Y., Warner, J., Rehg, J.M., Singh, V.: Gaze-enabled egocentric video summarization via constrained submodular maximization. In: CVPR, pp. 2235\u20132244 (2015)","DOI":"10.1109\/CVPR.2015.7298836"},{"key":"27_CR24","doi-asserted-by":"crossref","unstructured":"Yao, T., Mei, T., Rui, Y.: Highlight detection with pairwise deep ranking for first-person video summarization. In: CVPR, pp. 982\u2013990 (2016)","DOI":"10.1109\/CVPR.2016.112"},{"key":"27_CR25","doi-asserted-by":"crossref","unstructured":"Zhang, B., Wang, L., Wang, Z., Qiao, Y., Wang, H.: Real-time action recognition with enhanced motion vector CNNs. In: CVPR, pp. 2718\u20132726 (2016)","DOI":"10.1109\/CVPR.2016.297"},{"key":"27_CR26","doi-asserted-by":"crossref","unstructured":"Zhang, K., Chao, Wei, L., Sha, F., Grauman, K.: Summary transfer: exemplar-based subset selection for video summarization. In: CVPR (2016)","DOI":"10.1109\/CVPR.2016.120"},{"key":"27_CR27","series-title":"Lecture Notes in Computer Science","doi-asserted-by":"publisher","first-page":"766","DOI":"10.1007\/978-3-319-46478-7_47","volume-title":"Computer Vision \u2013 ECCV 2016","author":"K Zhang","year":"2016","unstructured":"Zhang, K., Chao, W.-L., Sha, F., Grauman, K.: Video summarization with long short-term memory. In: Leibe, B., Matas, J., Sebe, N., Welling, M. (eds.) ECCV 2016. LNCS, vol. 9911, pp. 766\u2013782. Springer, Cham (2016). https:\/\/doi.org\/10.1007\/978-3-319-46478-7_47"},{"issue":"21","key":"27_CR28","first-page":"8146","volume":"42","author":"SH Zhong","year":"2015","unstructured":"Zhong, S.H., Liu, Y., Li, B., Long, J.: Query-oriented unsupervised multi-document summarization via deep learning model. ESWA 42(21), 8146\u20138155 (2015)","journal-title":"ESWA"},{"key":"27_CR29","doi-asserted-by":"crossref","unstructured":"Zhong, S.H., Liu, Y., Liu, Y.: Bilinear deep learning for image classification. In: ACM MM, pp. 343\u2013352 (2011)","DOI":"10.1145\/2072298.2072505"}],"container-title":["Lecture Notes in Computer Science","Advances in Multimedia Information Processing \u2013 PCM 2018"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/978-3-030-00767-6_27","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2025,7,7]],"date-time":"2025-07-07T18:23:33Z","timestamp":1751912613000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/978-3-030-00767-6_27"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2018]]},"ISBN":["9783030007669","9783030007676"],"references-count":29,"URL":"https:\/\/doi.org\/10.1007\/978-3-030-00767-6_27","relation":{},"ISSN":["0302-9743","1611-3349"],"issn-type":[{"type":"print","value":"0302-9743"},{"type":"electronic","value":"1611-3349"}],"subject":[],"published":{"date-parts":[[2018]]},"assertion":[{"value":"19 September 2018","order":1,"name":"first_online","label":"First Online","group":{"name":"ChapterHistory","label":"Chapter History"}},{"value":"PCM","order":1,"name":"conference_acronym","label":"Conference Acronym","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"Pacific Rim Conference on Multimedia","order":2,"name":"conference_name","label":"Conference Name","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"Hefei","order":3,"name":"conference_city","label":"Conference City","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"China","order":4,"name":"conference_country","label":"Conference Country","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"2018","order":5,"name":"conference_year","label":"Conference Year","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"21 September 2018","order":7,"name":"conference_start_date","label":"Conference Start Date","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"22 September 2018","order":8,"name":"conference_end_date","label":"Conference End Date","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"19","order":9,"name":"conference_number","label":"Conference Number","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"pcm2018","order":10,"name":"conference_id","label":"Conference ID","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"http:\/\/pcm2018.org\/","order":11,"name":"conference_url","label":"Conference URL","group":{"name":"ConferenceInfo","label":"Conference Information"}}]}}