{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,4,18]],"date-time":"2026-04-18T05:59:38Z","timestamp":1776491978665,"version":"3.51.2"},"reference-count":51,"publisher":"Springer Science and Business Media LLC","issue":"6","license":[{"start":{"date-parts":[[2023,8,21]],"date-time":"2023-08-21T00:00:00Z","timestamp":1692576000000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"},{"start":{"date-parts":[[2023,8,21]],"date-time":"2023-08-21T00:00:00Z","timestamp":1692576000000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["Multimedia Systems"],"published-print":{"date-parts":[[2023,12]]},"DOI":"10.1007\/s00530-023-01154-2","type":"journal-article","created":{"date-parts":[[2023,8,21]],"date-time":"2023-08-21T05:02:03Z","timestamp":1692594123000},"page":"3685-3701","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":8,"title":["A two-stage attention augmented fully convolutional network-based dynamic video summarization"],"prefix":"10.1007","volume":"29","author":[{"given":"Deeksha","family":"Gupta","sequence":"first","affiliation":[]},{"given":"Akashdeep","family":"Sharma","sequence":"additional","affiliation":[]}],"member":"297","published-online":{"date-parts":[[2023,8,21]]},"reference":[{"key":"1154_CR1","doi-asserted-by":"publisher","first-page":"812","DOI":"10.1016\/j.procs.2016.06.065","volume":"89","author":"M Srinivas","year":"2016","unstructured":"Srinivas, M., Pai, M.M.M., Pai, R.M.: An improved algorithm for video summarization: a rank based approach. Proced. Comput. Sci. 89, 812\u2013819 (2016). https:\/\/doi.org\/10.1016\/j.procs.2016.06.065","journal-title":"Proced. Comput. Sci."},{"issue":"1","key":"1154_CR2","doi-asserted-by":"publisher","first-page":"56","DOI":"10.1016\/j.patrec.2010.08.004","volume":"32","author":"SEF De Avila","year":"2011","unstructured":"De Avila, S.E.F., Lopes, A.P.B., Da Luz, A., De Albuquerque Ara\u00fajo, A.: VSUMM: a mechanism designed to produce static video summaries and a novel evaluation method. Pattern Recognit. Lett. 32(1), 56\u201368 (2011). https:\/\/doi.org\/10.1016\/j.patrec.2010.08.004","journal-title":"Pattern Recognit. Lett."},{"issue":"1","key":"1154_CR3","doi-asserted-by":"publisher","first-page":"47","DOI":"10.1007\/s11042-009-0307-7","volume":"46","author":"M Furini","year":"2010","unstructured":"Furini, M., Geraci, F., Montangero, M., Pellegrini, M.: STIMO: STIll and MOving video storyboard for the web scenario. Multimed. Tools Appl. 46(1), 47\u201369 (2010). https:\/\/doi.org\/10.1007\/s11042-009-0307-7","journal-title":"Multimed. Tools Appl."},{"key":"1154_CR4","first-page":"2069","volume":"3","author":"B Gong","year":"2014","unstructured":"Gong, B., Chao, W.L., Grauman, K., Sha, F.: Diverse sequential subset selection for supervised video summarization. Adv. Neural. Inf. Process. Syst. 3, 2069\u20132077 (2014)","journal-title":"Adv. Neural. Inf. Process. Syst."},{"key":"1154_CR5","doi-asserted-by":"publisher","DOI":"10.1109\/ISM.2015.124","author":"R Viguier","year":"2015","unstructured":"Viguier, R., et al.: Automatic video content summarization using geospatial mosaics of aerial imagery. Proc. IEEE Int. Symp. Multimed. (2015). https:\/\/doi.org\/10.1109\/ISM.2015.124","journal-title":"Proc. IEEE Int. Symp. Multimed."},{"key":"1154_CR6","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2013.350","author":"Z Lu","year":"2013","unstructured":"Lu, Z., Grauman, K.: Story-driven summarization for egocentric video. Proc. IEEE Comput. Soc. Conf. Comput. Vis. Pattern Recognit. (2013). https:\/\/doi.org\/10.1109\/CVPR.2013.350","journal-title":"Proc. IEEE Comput. Soc. Conf. Comput. Vis. Pattern Recognit."},{"key":"1154_CR7","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-319-46478-7_47","volume-title":"Lecture Notes in Computer Science (Including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), vol 9911","author":"K Zhang","year":"2016","unstructured":"Zhang, K., Chao, W.L., Sha, F., Grauman, K.: Video summarization with long short-term memory. In: Lecture Notes in Computer Science (Including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), vol 9911. Springer (2016). https:\/\/doi.org\/10.1007\/978-3-319-46478-7_47"},{"key":"1154_CR8","doi-asserted-by":"publisher","DOI":"10.1145\/3321408.3322622","author":"Y Zhang","year":"2019","unstructured":"Zhang, Y., Zhao, X., Kampffmeyer, M., Tan, M.: DTR-GAN: dilated temporal relational adversarial network for video summarization. ACM Int. Conf. Proc. Ser. (2019). https:\/\/doi.org\/10.1145\/3321408.3322622","journal-title":"ACM Int. Conf. Proc. Ser."},{"issue":"1","key":"1154_CR9","first-page":"216","volume":"32","author":"H Wei","year":"2018","unstructured":"Wei, H., Ni, B., Yan, Y., Yu, H., Yang, X.: Video summarization via semantic attended networks. Proc. AAAI Conf. Artif. Intell. 32(1), 216\u2013223 (2018)","journal-title":"Proc. AAAI Conf. Artif. Intell."},{"key":"1154_CR10","doi-asserted-by":"publisher","first-page":"505","DOI":"10.1007\/978-3-319-10584-0_33","volume-title":"Lecture Notes in Computer Science (Including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), vol 8695","author":"M Gygli","year":"2014","unstructured":"Gygli, M., Grabner, H., Riemenschneider, H., Van Gool, L.: Creating summaries from user videos. In: Lecture Notes in Computer Science (Including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), vol 8695, pp. 505\u2013520. Springer (2014). https:\/\/doi.org\/10.1007\/978-3-319-10584-0_33"},{"key":"1154_CR11","doi-asserted-by":"publisher","DOI":"10.1145\/3123266.3123328","author":"B Zhao","year":"2017","unstructured":"Zhao, B., Li, X., Lu, X.: Hierarchical recurrent neural network for video summarization. Proc. ACM Multimed. Conf. (2017). https:\/\/doi.org\/10.1145\/3123266.3123328","journal-title":"Proc. ACM Multimed. Conf."},{"key":"1154_CR12","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2018.00773","author":"B Zhao","year":"2018","unstructured":"Zhao, B., Li, X., Lu, X.: HSA-RNN: hierarchical structure-adaptive RNN for video summarization. Proc. IEEE Comput. Soc. Conf. Comput. Vis. Pattern Recognit. (2018). https:\/\/doi.org\/10.1109\/CVPR.2018.00773","journal-title":"Proc. IEEE Comput. Soc. Conf. Comput. Vis. Pattern Recognit."},{"issue":"6","key":"1154_CR13","doi-asserted-by":"publisher","first-page":"1709","DOI":"10.1109\/TCSVT.2019.2904996","volume":"30","author":"Z Ji","year":"2020","unstructured":"Ji, Z., Xiong, K., Pang, Y., Li, X.: Video summarization with attention-based encoder-decoder networks. IEEE Trans. Circuits Syst. Video Technol. 30(6), 1709\u20131717 (2020). https:\/\/doi.org\/10.1109\/TCSVT.2019.2904996","journal-title":"IEEE Trans. Circuits Syst. Video Technol."},{"key":"1154_CR14","doi-asserted-by":"publisher","first-page":"202","DOI":"10.1109\/CVPR.2017.318","volume":"2017","author":"B Mahasseni","year":"2017","unstructured":"Mahasseni, B., Lam, M., Todorovic, S.: Unsupervised Video Summarization with Adversarial LSTM Networks. Proc. IEEE Conf. Comput. Vis. Pattern Recognit. 2017, 202\u2013211 (2017). https:\/\/doi.org\/10.1109\/CVPR.2017.318","journal-title":"Proc. IEEE Conf. Comput. Vis. Pattern Recognit."},{"key":"1154_CR15","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-030-01258-8_22","author":"M Rochan","year":"2018","unstructured":"Rochan, M., Ye, L., Wang, Y.: Video summarization using fully convolutional sequence networks. Proc. Eur. Conf. Comput. Vis. (ECCV) (2018). https:\/\/doi.org\/10.1007\/978-3-030-01258-8_22","journal-title":"Proc. Eur. Conf. Comput. Vis. (ECCV)"},{"key":"1154_CR16","unstructured":"Liang, G., Lv, Y., Li, S., Zhang, S., Zhang, Y.: Unsupervised video summarization with a convolutional attentive adversarial network. arXiv preprint, pp. 1\u201326. http:\/\/arxiv.org\/abs\/2105.11131 (2021)"},{"issue":"1","key":"1154_CR17","doi-asserted-by":"publisher","first-page":"34","DOI":"10.1016\/j.image.2012.10.002","volume":"28","author":"N Ejaz","year":"2013","unstructured":"Ejaz, N., Mehmood, I., Baik, S.W.: Efficient visual attention based framework for extracting key frames from videos. Signal Process. 28(1), 34\u201344 (2013). https:\/\/doi.org\/10.1016\/j.image.2012.10.002","journal-title":"Signal Process."},{"key":"1154_CR18","doi-asserted-by":"publisher","first-page":"5179","DOI":"10.1109\/CVPR.2015.7299154","volume":"07","author":"Y Song","year":"2015","unstructured":"Song, Y., Vallmitjana, J., Stent, A., Jaimes, A.: TVSum: summarizing web videos using titles. Proc. IEEE Comput. Soc. Conf. Comput. Vis. Pattern Recognit. 07, 5179\u20135187 (2015). https:\/\/doi.org\/10.1109\/CVPR.2015.7299154","journal-title":"Proc. IEEE Comput. Soc. Conf. Comput. Vis. Pattern Recognit."},{"key":"1154_CR19","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2012.6247820","author":"YJ Lee","year":"2012","unstructured":"Lee, Y.J., Ghosh, J., Grauman, K.: Discovering important people and objects for egocentric video summarization. Proc. IEEE Comput. Soc. Conf. Comput. Vis. Pattern Recognit. (2012). https:\/\/doi.org\/10.1109\/CVPR.2012.6247820","journal-title":"Proc. IEEE Comput. Soc. Conf. Comput. Vis. Pattern Recognit."},{"issue":"6","key":"1154_CR20","doi-asserted-by":"publisher","first-page":"7947","DOI":"10.1007\/s11042-016-3433-z","volume":"76","author":"P Etezadifar","year":"2017","unstructured":"Etezadifar, P., Farsi, H.: Scalable video summarization via sparse dictionary learning and selection simultaneously. Multimed. Tools Appl. 76(6), 7947\u20137971 (2017). https:\/\/doi.org\/10.1007\/s11042-016-3433-z","journal-title":"Multimed. Tools Appl."},{"key":"1154_CR21","first-page":"184","volume-title":"Proceedings of the European Conference on Computer Vision (ECCV)","author":"S Cai","year":"2018","unstructured":"Cai, S., Zuo, W., Davis, L.S., Zhang, L.: Weakly-supervised video summarization using variational encoder-decoder and web prior. In: Proceedings of the European Conference on Computer Vision (ECCV), pp. 184\u2013200. Springer (2018)"},{"key":"1154_CR22","doi-asserted-by":"crossref","unstructured":"Zhou, K., Qiao, Y., Xiang, T.: Deep reinforcement learning for unsupervised video summarization with diversity-representativeness reward. In: 32nd AAAI Conference on Artificial Intelligence, AAAI, pp. 7582\u20137589 (2018)","DOI":"10.1609\/aaai.v32i1.12255"},{"key":"1154_CR23","doi-asserted-by":"publisher","DOI":"10.1145\/3347449.3357482","author":"E Apostolidis","year":"2019","unstructured":"Apostolidis, E., Metsai, A.I., Adamantidou, E., Mezaris, V., Patras, I.: A stepwise, label-based approach for improving the adversarial training in unsupervised video summarization. Proc. First Int. Worksh. AI Smart TV Content Prod. Access Deliv (2019). https:\/\/doi.org\/10.1145\/3347449.3357482","journal-title":"Proc. First Int. Worksh. AI Smart TV Content Prod. Access Deliv"},{"key":"1154_CR24","doi-asserted-by":"publisher","DOI":"10.1145\/3338533.3366583","author":"Y Chen","year":"2019","unstructured":"Chen, Y., Tao, L., Wang, X., Yamasaki, T.: Weakly supervised video summarization by hierarchical reinforcement learning. First ACM Int. Conf. Multimed. Asia (2019). https:\/\/doi.org\/10.1145\/3338533.3366583","journal-title":"First ACM Int. Conf. Multimed. Asia"},{"key":"1154_CR25","doi-asserted-by":"publisher","DOI":"10.1109\/WACV.2019.00173","author":"TJ Fu","year":"2019","unstructured":"Fu, T.J., Tai, S.H., Chen, H.T.: Attentive and adversarial learning for video summarization. Proc. IEEE Winter Conf. Appl. Comput. Vis. WACV (2019). https:\/\/doi.org\/10.1109\/WACV.2019.00173","journal-title":"Proc. IEEE Winter Conf. Appl. Comput. Vis. WACV"},{"key":"1154_CR26","doi-asserted-by":"publisher","first-page":"391","DOI":"10.1007\/978-3-030-01237-3_24","volume-title":"Lecture Notes in Computer Science (Including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), vol 11212","author":"K Zhang","year":"2018","unstructured":"Zhang, K., Grauman, K., Sha, F.: Retrospective encoders for video summarization. In: Lecture Notes in Computer Science (Including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), vol 11212, pp. 391\u2013408. Springer (2018). https:\/\/doi.org\/10.1007\/978-3-030-01237-3_24"},{"key":"1154_CR27","doi-asserted-by":"publisher","first-page":"39","DOI":"10.1007\/978-3-030-21074-8_4","volume-title":"Lecture Notes in Computer Science (Including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics)","author":"J Fajtl","year":"2019","unstructured":"Fajtl, J., Sokeh, H.S., Argyriou, V., Monekosso, D., Remagnino, P.: Summarizing videos with attention. In: Ch, M. (ed.) Lecture Notes in Computer Science (Including Subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics), pp. 39\u201354. Springer (2019). https:\/\/doi.org\/10.1007\/978-3-030-21074-8_4"},{"key":"1154_CR28","doi-asserted-by":"publisher","first-page":"224","DOI":"10.1016\/j.neucom.2018.12.040","volume":"332","author":"SH Zhong","year":"2019","unstructured":"Zhong, S.H., Wu, J., Jiang, J.: Video summarization via spatio-temporal deep architecture. Neurocomputing 332, 224\u2013235 (2019). https:\/\/doi.org\/10.1016\/j.neucom.2018.12.040","journal-title":"Neurocomputing"},{"issue":"4","key":"1154_CR29","doi-asserted-by":"publisher","first-page":"1765","DOI":"10.1109\/TNNLS.2020.2991083","volume":"32","author":"Z Ji","year":"2021","unstructured":"Ji, Z., Zhao, Y., Pang, Y., Li, X., Han, J.: Deep attentive video summarization with distribution consistency learning. IEEE Trans. Neural Netw. Learn. Syst. 32(4), 1765\u20131775 (2021). https:\/\/doi.org\/10.1109\/TNNLS.2020.2991083","journal-title":"IEEE Trans. Neural Netw. Learn. Syst."},{"issue":"10","key":"1154_CR30","doi-asserted-by":"publisher","first-page":"3989","DOI":"10.1109\/TNNLS.2019.2951680","volume":"31","author":"B Zhao","year":"2020","unstructured":"Zhao, B., Li, X., Lu, X.: Property-constrained dual learning for video summarization. IEEE Trans. Neural Netw. Learn. Syst. 31(10), 3989\u20134000 (2020). https:\/\/doi.org\/10.1109\/TNNLS.2019.2951680","journal-title":"IEEE Trans. Neural Netw. Learn. Syst."},{"key":"1154_CR31","first-page":"1","volume":"8828","author":"B Zhao","year":"2021","unstructured":"Zhao, B., Li, H., Lu, X., Li, X.: Reconstructive sequence-graph network for video summarization. IEEE Trans. Pattern Anal. Mach. Intell. 8828, 1\u201310 (2021)","journal-title":"IEEE Trans. Pattern Anal. Mach. Intell."},{"key":"1154_CR32","doi-asserted-by":"publisher","first-page":"5998","DOI":"10.1109\/2943.974352","volume-title":"Advances in Neural Information Processing Systems","author":"A Vaswani","year":"2017","unstructured":"Vaswani, A., et al.: Attention is all you need. In: Advances in Neural Information Processing Systems, pp. 5998\u20136008. Springer (2017). https:\/\/doi.org\/10.1109\/2943.974352"},{"key":"1154_CR33","first-page":"12744","volume":"2019","author":"H Zhang","year":"2019","unstructured":"Zhang, H., Goodfellow, I., Metaxas, D., Odena, A.: Self-attention generative adversarial networks. Int. Conf. Mach. Learn. 2019, 12744\u201312753 (2019)","journal-title":"Int. Conf. Mach. Learn."},{"key":"1154_CR34","doi-asserted-by":"publisher","DOI":"10.1109\/ICCV.2019.00830","author":"S Li","year":"2019","unstructured":"Li, S., Chen, Z., Lu, J., Li, X., Zhou, J.: Neighborhood preserving hashing for scalable video retrieval. Proc. IEEE Int. Conf. Comput. Vis. (2019). https:\/\/doi.org\/10.1109\/ICCV.2019.00830","journal-title":"Proc. IEEE Int. Conf. Comput. Vis."},{"key":"1154_CR35","unstructured":"Zhang, Y., Li, K., Li, K., Zhong, B., Fu, Y.: Residual non-local attention networks for image restoration. In: 7th International Conference on Learning Representations, ICLR, pp. 1\u201318 (2019)"},{"key":"1154_CR36","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2015.7298594","author":"C Szegedy","year":"2015","unstructured":"Szegedy, C., et al.: Going deeper with convolutions. Proc. IEEE Comput. Soc. Conf. Comput. Vis. Pattern Recognit. (2015). https:\/\/doi.org\/10.1109\/CVPR.2015.7298594","journal-title":"Proc. IEEE Comput. Soc. Conf. Comput. Vis. Pattern Recognit."},{"key":"1154_CR37","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2018.00712","author":"Y Zhang","year":"2018","unstructured":"Zhang, Y., Qiu, Z., Yao, T., Liu, D., Mei, T.: Fully convolutional adaptation networks for semantic segmentation. Proc. IEEE Comput. Soc. Conf. Comput. Vis. Pattern Recognit. (2018). https:\/\/doi.org\/10.1109\/CVPR.2018.00712","journal-title":"Proc. IEEE Comput. Soc. Conf. Comput. Vis. Pattern Recognit."},{"key":"1154_CR38","first-page":"540","volume-title":"European Conference on Computer Vision","author":"D Potapov","year":"2014","unstructured":"Potapov, D., et al.: Category-specific video summarization. In: European Conference on Computer Vision, pp. 540\u2013555. Springer, Cham (2014)"},{"key":"1154_CR39","unstructured":"Friedman, J., Hastie, T., Tibshirani, R.: A note on the group lasso and a sparse group lasso. arXiv\u202f, pp. 1\u20138. https:\/\/arxiv.org\/pdf\/1001.0736.pdf (2010)"},{"key":"1154_CR40","doi-asserted-by":"publisher","first-page":"8537","DOI":"10.1609\/aaai.v33i01.33018537","volume-title":"33rd AAAI Conference on Artificial Intelligence, AAAI 2019, 31st Innovative Applications of Artificial Intelligence Conference, IAAI 2019 and the 9th AAAI Symposium on Educational Advances in Artificial Intelligence, EAAI 2019","author":"Y Jung","year":"2019","unstructured":"Jung, Y., Cho, D., Kim, D., Woo, S., Kweon, I.S.: Discriminative feature learning for unsupervised video summarization. In: 33rd AAAI Conference on Artificial Intelligence, AAAI 2019, 31st Innovative Applications of Artificial Intelligence Conference, IAAI 2019 and the 9th AAAI Symposium on Educational Advances in Artificial Intelligence, EAAI 2019, pp. 8537\u20138544. Springer (2019). https:\/\/doi.org\/10.1609\/aaai.v33i01.33018537"},{"key":"1154_CR41","doi-asserted-by":"publisher","first-page":"107000","DOI":"10.1016\/j.compeleceng.2021.107000","volume":"90","author":"X Zhang","year":"2021","unstructured":"Zhang, X., Lu, W., Pan, Y., Wu, H., Wang, R., Yu, R.: Empirical study on tangent loss function for classification with deep neural networks. Comput. Electr. Eng. 90, 107000 (2021). https:\/\/doi.org\/10.1016\/j.compeleceng.2021.107000","journal-title":"Comput. Electr. Eng."},{"key":"1154_CR42","volume-title":"Advances in Neural Information Processing Systems, vol 32","author":"A Paszke","year":"2019","unstructured":"Paszke, A., et al.: \u201cPyTorch: An imperative style, high-performance deep learning library. In: Advances in Neural Information Processing Systems, vol 32. NeurIPS (2019)"},{"issue":"2","key":"1154_CR43","doi-asserted-by":"publisher","first-page":"21","DOI":"10.1145\/3477538","volume":"18","author":"S Zhong","year":"2022","unstructured":"Zhong, S., Lin, J., Lu, J., Science, C.: Deep semantic and attentive network for unsupervised video summarization. ACM Trans. Multimed. Comput. Commun. Appl. 18(2), 21 (2022)","journal-title":"ACM Trans. Multimed. Comput. Commun. Appl."},{"key":"1154_CR44","doi-asserted-by":"publisher","first-page":"107618","DOI":"10.1016\/j.compeleceng.2021.107618","volume":"97","author":"J Lin","year":"2022","unstructured":"Lin, J., Zhong, S., Fares, A.: Deep hierarchical LSTM networks with attention for video. Comput. Electr. Eng. 97, 107618 (2022). https:\/\/doi.org\/10.1016\/j.compeleceng.2021.107618","journal-title":"Comput. Electr. Eng."},{"key":"1154_CR45","doi-asserted-by":"publisher","first-page":"1573","DOI":"10.1109\/TIP.2022.3143699","volume":"31","author":"T Liu","year":"2022","unstructured":"Liu, T., Meng, Q., Huang, J.J., Vlontzos, A., Rueckert, D., Kainz, B.: Video summarization through reinforcement learning with a 3D spatio-temporal U-Net. IEEE Trans. Image Process. 31, 1573\u20131586 (2022). https:\/\/doi.org\/10.1109\/TIP.2022.3143699","journal-title":"IEEE Trans. Image Process."},{"key":"1154_CR46","doi-asserted-by":"publisher","first-page":"1789","DOI":"10.1109\/TIP.2022.3146012","volume":"31","author":"M Ma","year":"2022","unstructured":"Ma, M., Mei, S., Wan, S., Wang, Z., Hua, X.S., Feng, D.D.: Graph convolutional dictionary selection with L2, p Norm for video summarization. IEEE Trans. Image Process. 31, 1789\u20131804 (2022). https:\/\/doi.org\/10.1109\/TIP.2022.3146012","journal-title":"IEEE Trans. Image Process."},{"key":"1154_CR47","doi-asserted-by":"crossref","unstructured":"Feng, S., Xie, Y., Wei, Y., Yan, J., Wang, Q.: Transformer-based video summarization with spatial-temporal representation. In: BigDIA, pp. 428\u2013433 (2022)","DOI":"10.1109\/BigDIA56350.2022.9874248"},{"key":"1154_CR48","doi-asserted-by":"publisher","DOI":"10.1109\/WACV56688.2023.00554","author":"H Li","year":"2023","unstructured":"Li, H., Ke, Q., Gong, M., Drummond, T.: Progressive video summarization via multimodal self-supervised learning. Proc. IEEE Winter Conf. Appl. Comput. Vis. (2023). https:\/\/doi.org\/10.1109\/WACV56688.2023.00554","journal-title":"Proc. IEEE Winter Conf. Appl. Comput. Vis."},{"key":"1154_CR49","unstructured":"Chu, X., Tian, Z., Zhang, B., Wang, X., Shen, C.: Conditional positional encodings for vision transformers, pp. 1\u201319. http:\/\/arxiv.org\/abs\/2102.10882 (2021)"},{"key":"1154_CR50","doi-asserted-by":"publisher","DOI":"10.1109\/CVPR.2019.00778","author":"M Otani","year":"2019","unstructured":"Otani, M., Nakashima, Y., Rahtu, E., Heikkila, J.: Rethinking the evaluation of video summaries. Proc. IEEE Comput. Soc. Conf. Comput. Vis. Pattern Recognit. (2019). https:\/\/doi.org\/10.1109\/CVPR.2019.00778","journal-title":"Proc. IEEE Comput. Soc. Conf. Comput. Vis. Pattern Recognit."},{"key":"1154_CR51","doi-asserted-by":"publisher","first-page":"239","DOI":"10.1093\/biomet\/33.3.239","volume":"33","author":"MG Kendall","year":"1945","unstructured":"Kendall, M.G.: The treatment of ties in ranking problems. Biometrika 33, 239\u2013251 (1945). https:\/\/doi.org\/10.1093\/biomet\/33.3.239","journal-title":"Biometrika"}],"container-title":["Multimedia Systems"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s00530-023-01154-2.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/article\/10.1007\/s00530-023-01154-2\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s00530-023-01154-2.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2023,11,16]],"date-time":"2023-11-16T11:09:15Z","timestamp":1700132955000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/s00530-023-01154-2"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2023,8,21]]},"references-count":51,"journal-issue":{"issue":"6","published-print":{"date-parts":[[2023,12]]}},"alternative-id":["1154"],"URL":"https:\/\/doi.org\/10.1007\/s00530-023-01154-2","relation":{},"ISSN":["0942-4962","1432-1882"],"issn-type":[{"value":"0942-4962","type":"print"},{"value":"1432-1882","type":"electronic"}],"subject":[],"published":{"date-parts":[[2023,8,21]]},"assertion":[{"value":"27 February 2023","order":1,"name":"received","label":"Received","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"31 July 2023","order":2,"name":"accepted","label":"Accepted","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"21 August 2023","order":3,"name":"first_online","label":"First Online","group":{"name":"ArticleHistory","label":"Article History"}},{"order":1,"name":"Ethics","group":{"name":"EthicsHeading","label":"Declarations"}},{"value":"The authors have no competing interests to declare that are relevant to the content of this article.","order":2,"name":"Ethics","group":{"name":"EthicsHeading","label":"Conflict of interest"}}]}}