{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,2,21]],"date-time":"2025-02-21T07:26:56Z","timestamp":1740122816817,"version":"3.37.3"},"reference-count":52,"publisher":"Springer Science and Business Media LLC","issue":"27","license":[{"start":{"date-parts":[[2023,4,24]],"date-time":"2023-04-24T00:00:00Z","timestamp":1682294400000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"},{"start":{"date-parts":[[2023,4,24]],"date-time":"2023-04-24T00:00:00Z","timestamp":1682294400000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"}],"funder":[{"name":"Institute of Information & communications Technology Planning & Evaluation(IITP) grant funded by the Korea governmen","award":["IITP-2021-0-02067","IITP-2022-RS-2022-00156345"],"award-info":[{"award-number":["IITP-2021-0-02067","IITP-2022-RS-2022-00156345"]}]},{"name":"National Research Foundation of Korea(NRF) grant funded by the Korean governmen","award":["NRF-2021R1F1A1060816"],"award-info":[{"award-number":["NRF-2021R1F1A1060816"]}]}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["Multimed Tools Appl"],"published-print":{"date-parts":[[2023,11]]},"DOI":"10.1007\/s11042-023-15409-7","type":"journal-article","created":{"date-parts":[[2023,4,24]],"date-time":"2023-04-24T05:02:23Z","timestamp":1682312543000},"page":"42803-42816","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":3,"title":["Efficient feature coding based on performance analysis of Versatile Video Coding (VVC) in Video Coding for Machines (VCM)"],"prefix":"10.1007","volume":"82","author":[{"given":"Jin Young","family":"Lee","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Yongho","family":"Choi","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"The","family":"Van Le","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"ORCID":"https:\/\/orcid.org\/0000-0002-2869-0440","authenticated-orcid":false,"given":"Kiho","family":"Choi","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"297","published-online":{"date-parts":[[2023,4,24]]},"reference":[{"key":"15409_CR1","doi-asserted-by":"crossref","unstructured":"Aafaq N, Akhtar N, Liu W, Gilani SZ, Mian A (2019) \u201cSpatio-temporal dynamics and semantic attribute enriched visual encoding for video captioning,\u201d in IEEE\/CVF Conference on Computer Vision and Pattern Recognition (CVPR)","DOI":"10.1109\/CVPR.2019.01277"},{"key":"15409_CR2","doi-asserted-by":"crossref","unstructured":"Alshin A and Alshina E (2016) \u201cBi-directional optical flow for future video codec,\u201d in Proc. Data Compress. Conf. (DCC)","DOI":"10.1109\/DCC.2016.125"},{"key":"15409_CR3","unstructured":"\u00a0Baroncini V and Wien M (2020) \u201cVVC Verification Test Report for UHD SDR Video Content, document\u201d, JVET-T2020, ITU-T\/ISO\/IEC Joint Video Experts Team (JVET)"},{"key":"15409_CR4","unstructured":"Bossen F, Boyce J, Suehring K, Li X, Seregin V (2019) \u201cJVET common test conditions and software reference configurations for SDR video,\u201d ITU-T\/ISO\/IEC Joint Video Experts Team (JVET) JVET-N1010"},{"key":"15409_CR5","unstructured":"Bj\u00f8ntegaard G (2008) \u201cImprovement of BD-PSNR Model\u201d, ITU-T SG16\/Q6 VCEG-AI11"},{"key":"15409_CR6","unstructured":"Bross B, Keydel P, Schwarz H, Marpe D, Wiegand T, Zhao L, Zhao X, Li X, Liu S, Chang Y-J, Jiang H-Y, Lin P-H, Kuo C-C, Lin C-C, Lin C-L (2018) \u201cCE3: Multiple reference line intra prediction (Test 1.1.1, 1.1.2, 1.1.3 and 1.1.4)\u201d, JVET-L0283, ITU-T\/ISO\/IEC Joint Video Experts Team (JVET)"},{"key":"15409_CR7","unstructured":"Chen DL, Dolan WB (2011) \u201cCollecting highly parallel data for paraphrase evaluation,\u201d Association for Computational Linguistics, pp. 190\u2013200"},{"key":"15409_CR8","unstructured":"Chen H, Yang H, Chen J (2018) \u201cSymmetrical Mode for Biprediction,\u201d JVET-J0063, ITU-T\/ISO\/IEC Joint Video Experts Team (JVET)"},{"key":"15409_CR9","unstructured":"Chen H, Yang H, Chen J (2018) \u201cCE4: Separate List for Sub-Block Merge Candidates (Test 4.2.8)\u201d, JVET-L0369, ITU-T\/ISO\/IEC Joint Video Experts Team (JVET)"},{"key":"15409_CR10","unstructured":"Chen J, Chien W-J, Hu N, Seregin V, Karczewicz M, Li X (2016) \u201cEnhanced Motion Vector Difference Coding,\u201d JVET-D0123, ITU-T\/ISO\/IEC Joint Video Exploration Team (JVET)"},{"key":"15409_CR11","unstructured":"Chen W, Chen Y, Chernyak R, Choi K, Hashimoto R, Huang Y, Jang H, Liao R, Liu S (2020) \u201cJVET AHG report: Tool reporting procedure (AHG13),\u201d ITU-T\/ISO\/IEC Joint Video Experts Team (JVET) JVET-T0013"},{"key":"15409_CR12","unstructured":"Chiang M-S, Hsu C-W, Huang Y-W, Lei S-M (2018) \u201cCE10.1.1: Multi-hypothesis Prediction for Improving AMVP Mode, Skip or Merge Mode, and Intra Mode,\u201d JVET-L0100, ITUT\/ISO\/IEC Joint Video Experts Team (JVET)"},{"issue":"3","key":"15409_CR13","doi-asserted-by":"publisher","first-page":"160","DOI":"10.1109\/MSP.2020.2971765","volume":"37","author":"K Choi","year":"2020","unstructured":"Choi K, Chen J, Rusanovskyy D, Choi K-P, Jang ES (2020) An Overview of the MPEG-5 Essential Video Coding Standard. IEEE Signal Process Mag 37(3):160\u2013167","journal-title":"IEEE Signal Process Mag"},{"key":"15409_CR14","unstructured":"Choi K, Piao Y, Kim C (2018) \u201cCE6: AMT with reduced transform types (Test1.5),\u201d JVET-K0171, ITUT\/ISO\/IEC Joint Video Experts Team (JVET)"},{"key":"15409_CR15","doi-asserted-by":"crossref","unstructured":"De-Lux\u00e1n-Hern\u00e1ndez S, De-Lux\u00e1n-Hern\u00e1ndez S, George V, Ma J, Nguyen T, Schwarz H, Marpe D, Wiegand T (2019) \u201cAn intra subpartition coding mode for VVC,\u201d in Proceedings of IEEE Int. Conf. Image Process. (ICIP), pp. 1203\u20131207","DOI":"10.1109\/ICIP.2019.8803777"},{"key":"15409_CR16","doi-asserted-by":"crossref","unstructured":"Denkowski M, Lavie A (2014) \u201cMeteor Universal: Language Specific Translation Evaluation for Any Target Language,\u201d Association for Computational Linguistics, pp. 376\u2013380","DOI":"10.3115\/v1\/W14-3348"},{"issue":"9","key":"15409_CR17","doi-asserted-by":"publisher","first-page":"3603","DOI":"10.1109\/TCSVT.2020.3040291","volume":"31","author":"H Gao","year":"2021","unstructured":"Gao H, Esenlik S, Alshina E, Steinbach E (2021) Geometric Partitioning Mode in Versatile Video Coding: Algorithm Review and Analysis. IEEE Trans Circuits Syst Video Technol 31(9):3603\u20133617","journal-title":"IEEE Trans Circuits Syst Video Technol"},{"key":"15409_CR18","doi-asserted-by":"crossref","unstructured":"He Y and Luo J (2019) \u201cCE4\u20132.1: Prediction Refinement With Optical Flow for Affine Mode,\u201d JVET-O0070, ITUT\/ISO\/IEC Joint Video Experts Team (JVET)","DOI":"10.1109\/VCIP47243.2019.8965942"},{"key":"15409_CR19","doi-asserted-by":"crossref","unstructured":"Helle P, Pfaff J, Sch\u00e4fer J, Rischke R, Schwarz H, Marpe D, and Wiegand T (2019), \u201cIntra Picture Prediction for Video Coding with Neural Networks,\u201d In Proc. Data Compression Conference 2019","DOI":"10.1109\/DCC.2019.00053"},{"key":"15409_CR20","unstructured":"High Efficient Video Coding (HEVC) (2013) ITU-T Recommendation H.265 and ISO\/IEC 23008\u20132"},{"issue":"8","key":"15409_CR21","doi-asserted-by":"publisher","first-page":"1735","DOI":"10.1162\/neco.1997.9.8.1735","volume":"9","author":"S Hochreiter","year":"1998","unstructured":"Hochreiter S, Schmidhuber J (1998) Long short-term memory. Neural Comput 9(8):1735\u20131780","journal-title":"Neural Comput"},{"issue":"10","key":"15409_CR22","doi-asserted-by":"publisher","first-page":"3818","DOI":"10.1109\/TCSVT.2021.3088134","volume":"31","author":"Y-W Huang","year":"2021","unstructured":"Huang Y-W, An J, Huang H, Li X, Hsiang S-T, Zhang K, Gao H, Ma J, Chubach O (2021) Block partitioning structure in the VVC standard. IEEE Trans Circuits Syst Video Technol 31(10):3818\u20133833","journal-title":"IEEE Trans Circuits Syst Video Technol"},{"key":"15409_CR23","unstructured":"ISO\/IEC JTC1\/SC 29\/WG2, N0190 (2022) Use Cases and Requirements for Video Coding for Machines"},{"key":"15409_CR24","unstructured":"ISO\/IEC JTC1\/SC 29\/WG2, N0193 ( 2022) Evaluation Framework for Video Coding for Machines"},{"key":"15409_CR25","unstructured":"Jeong S, Park MW, Piao Y, Park M, Choi K (2018) \u201cCE4: Ultimate Motion Vector Expression (Test 4.5.4),\u201d JVET-L0054, ITU-T\/ISO\/IEC Joint Video Experts Team (JVET)"},{"issue":"10","key":"15409_CR26","doi-asserted-by":"publisher","first-page":"3907","DOI":"10.1109\/TCSVT.2021.3072297","volume":"31","author":"M Karczewicz","year":"2021","unstructured":"Karczewicz M, Hu N, Taquet J, Chen C, Misra K, Andersson K, Yin P, Lu T, Fran\u00e7ois E, Chen J (2021) VVC In-Loop Filters. IEEE Trans Circuits Syst Video Technol 31(10):3907\u20133925","journal-title":"IEEE Trans Circuits Syst Video Technol"},{"key":"15409_CR27","unstructured":"Krizhevsky A, Sutskever I, Hinton GE (2012) \u201cImagenet classification with deep convolutional neural networks,\u201d Neural Information Processing Systems, pp. 1106\u20131114"},{"key":"15409_CR28","doi-asserted-by":"crossref","unstructured":"Koo M, Salehifar M, Lim J, Kim S-H (2019) \u201cLow frequency nonseparable transform (LFNST),\u201d in Proc. Picture Coding Symp. (PCS)","DOI":"10.1109\/PCS48520.2019.8954507"},{"issue":"22","key":"15409_CR29","doi-asserted-by":"publisher","first-page":"31793","DOI":"10.1007\/s11042-019-08011-3","volume":"78","author":"JY Lee","year":"2019","unstructured":"Lee JY (2019) Deep multimodal embedding for video captioning. Multimed Tools Appl 78(22):31793\u201331805","journal-title":"Multimed Tools Appl"},{"issue":"2","key":"15409_CR30","doi-asserted-by":"publisher","first-page":"55","DOI":"10.3390\/fi13020055","volume":"13","author":"Z Lei","year":"2021","unstructured":"Lei Z, Huang Y (2021) Video captioning based on channel soft attention and semantic reconstructor. Future internet 13(2):55","journal-title":"Future internet"},{"key":"15409_CR31","doi-asserted-by":"crossref","unstructured":"Li J, Wang M, Zhang L, Zhang K, Wang S, Wang S, Ma S, Gao W (2020) \u201cSub-Sampled Cross-Component Prediction for Chroma Component Coding,\u201d In Proc. Data Compression Conference","DOI":"10.1109\/DCC47342.2020.00028"},{"issue":"8","key":"15409_CR32","doi-asserted-by":"publisher","first-page":"1934","DOI":"10.1109\/TCSVT.2017.2699919","volume":"28","author":"L Li","year":"2018","unstructured":"Li L, Li H, Liu D, Li Z, Yang H, Lin S, Chen H, Wu F (2018) \u201cAn efficient four-parameter affine motion model for video coding. IEEE Trans Circuits Syst Video Technol 28(8):1934\u20131948","journal-title":"IEEE Trans Circuits Syst Video Technol"},{"key":"15409_CR33","unstructured":"Lin C-Y (2004) \u201cROUGE: A Package for Automatic Evaluation of Summaries,\u201d Association for Computational Linguistics, pp, 74\u201381"},{"issue":"6","key":"15409_CR34","doi-asserted-by":"publisher","DOI":"10.1016\/j.ipm.2020.102302","volume":"57","author":"M Nabati","year":"2020","unstructured":"Nabati M, Behrad A (2020) Multi-sentence video captioning using content-oriented beam searching and multi-stage refining algorithm. Inf Process Manag 57(6):102302","journal-title":"Inf Process Manag"},{"key":"15409_CR35","doi-asserted-by":"crossref","unstructured":"Pan Y, Yao T, Li H, Mei T (2017) \u201cVideo captioning with transferred semantic attributes,\u201d in IEEE Conference on Computer Vision and Pattern Recognition (CVPR)","DOI":"10.1109\/CVPR.2017.111"},{"key":"15409_CR36","doi-asserted-by":"crossref","unstructured":"Papineni K, Roukos S, Ward T, Zhu W-J (2002) \u201cBLEU: a method for automatic evaluation of machine translation,\u201d Association for Computational Linguistics, pp. 311\u2013318","DOI":"10.3115\/1073083.1073135"},{"key":"15409_CR37","unstructured":"Schwarz H, Nguyen T, Marpe D, Wiegand T (2018) \u201cCE7: Transform Coefficient Coding and Dependent Quantization (Tests 7.1.2, 7.2.1),\u201d JVET-K0071, ITUT\/ISO\/IEC Joint Video Experts Team (JVET)"},{"key":"15409_CR38","unstructured":"Sethuraman S (2019) \u201cCE9: Results of DMVR Related Tests CE9.2.1 and CE9.2.2,\u201d JVET-M0147, ITUT\/ISO\/IEC Joint Video Experts Team (JVET),"},{"key":"15409_CR39","unstructured":"Su Y-C, Chen C-Y, Huang Y-W, Lei S-M, He Y, Luo J, Xiu X, Ye Y (2018) \u201cCE4-related: Generalized Bi-prediction Improvements Combined from JVET-L0197 and JVET-L0296,\u201d JVET-L0646, ITU-T\/ISO\/IEC Joint Video Experts Team (JVET)"},{"key":"15409_CR40","doi-asserted-by":"crossref","unstructured":"Szegedy C, Ioffe S, Vanhoucke V, and Alemi A (2016) \u201cInception-v4, Inception-ResNet and the impact of residual connections on learning,\u201d arXiv [cs.CV]","DOI":"10.1609\/aaai.v31i1.11231"},{"key":"15409_CR41","unstructured":"Van der Auwera G, Heo J, Filippov A (2018) \u201cCE3: Summary Report on Intra Prediction and Mode Coding,\u201d JVET-J0023, ITU-T\/ISO\/IEC Joint Video Experts Team (JVET)"},{"key":"15409_CR42","doi-asserted-by":"crossref","unstructured":"Venugopalan S, Rohrbach M, Donahue J, Mooney R, Darrell T, Saenko en K (2015) \u201cSequence to sequence-video to text\u201d, in Proceedings of the IEEE international conference on computer vision","DOI":"10.1109\/ICCV.2015.515"},{"key":"15409_CR43","unstructured":"Versatile Video Coding (VVC) (2020) ITU-T Recommendation H.266 and ISO\/IEC 23090\u20133"},{"key":"15409_CR44","doi-asserted-by":"crossref","unstructured":"Vedantam R, Zitnick CL, Parikh D (2015) \u201cCIDEr: Consensus-based Image Description Evaluation,\u201d IEEE Conference on Computer Vision and Pattern Recognition, pp. 4566\u20134575","DOI":"10.1109\/CVPR.2015.7299087"},{"key":"15409_CR45","unstructured":"VVC Reference Software. https:\/\/vcgit.hhi.fraunhofer.de\/jvet\/VVCSoftware_VTM\/-\/tags\/."},{"key":"15409_CR46","doi-asserted-by":"crossref","unstructured":"Xu X, Li X, Liu S (2019) \u201cIntra block copy in Versatile Video Coding with Reference Sample Memory Reuse,\u201d in Proc. Picture Coding Symp. (PCS)","DOI":"10.1109\/PCS48520.2019.8954512"},{"issue":"1","key":"15409_CR47","doi-asserted-by":"publisher","first-page":"229","DOI":"10.1109\/TMM.2019.2924576","volume":"22","author":"C Yan","year":"2020","unstructured":"Yan C et al (2020) STAT: Spatial-temporal attention mechanism for video captioning. IEEE Trans Multimedia 22(1):229\u2013241","journal-title":"IEEE Trans Multimedia"},{"key":"15409_CR48","doi-asserted-by":"crossref","unstructured":"Zhang Y, Agrafiotis D, Bull DR (2013) \u201cHigh Dynamic Range image & video compression a review,\u201d In Proc. International Conference on Digital Signal Processing (DSP)","DOI":"10.1109\/ICDSP.2013.6622714"},{"issue":"5","key":"15409_CR49","doi-asserted-by":"publisher","first-page":"950","DOI":"10.1109\/TCSVT.2015.2426552","volume":"26","author":"Y Zhang","year":"2016","unstructured":"Zhang Y, Naccari M, Agrafiotis D, Mrak M, Bull DR (2016) High Dynamic Range Video Compression Exploiting Luminance Masking. IEEE Trans Circuits Syst Video Technol 26(5):950\u2013964","journal-title":"IEEE Trans Circuits Syst Video Technol"},{"key":"15409_CR50","doi-asserted-by":"crossref","unstructured":"Zhang Y, Naccari M, Agrafiotis D, Mrak M, Bull DR (2013) \u201cHigh dynamic range video compression by intensity dependent spatial quantization in HEVC,\u201d In Proc. Picture Coding Symposium (PCS)","DOI":"10.1109\/PCS.2013.6737756"},{"key":"15409_CR51","unstructured":"Zhang L, Zhang K, Liu H, Wang Y, Zhao P, Hong D (2018) \u201cCE4: History-based Motion Vector Prediction (Test 4.4.7),\u201d JVET-L0266, ITU-T\/ISO\/IEC Joint Video Experts Team (JVET)"},{"key":"15409_CR52","unstructured":"Zhao Y, Yang H, Chen J (2018) \u201cCE6: Spatially Varying Transform (Test 6.1.12.1),\u201d JVET-K0139, ITUT\/ISO\/IEC Joint Video Experts Team (JVET)"}],"container-title":["Multimedia Tools and Applications"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s11042-023-15409-7.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/article\/10.1007\/s11042-023-15409-7\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s11042-023-15409-7.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2024,10,19]],"date-time":"2024-10-19T01:49:37Z","timestamp":1729302577000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/s11042-023-15409-7"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2023,4,24]]},"references-count":52,"journal-issue":{"issue":"27","published-print":{"date-parts":[[2023,11]]}},"alternative-id":["15409"],"URL":"https:\/\/doi.org\/10.1007\/s11042-023-15409-7","relation":{},"ISSN":["1380-7501","1573-7721"],"issn-type":[{"type":"print","value":"1380-7501"},{"type":"electronic","value":"1573-7721"}],"subject":[],"published":{"date-parts":[[2023,4,24]]},"assertion":[{"value":"6 June 2022","order":1,"name":"received","label":"Received","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"1 December 2022","order":2,"name":"revised","label":"Revised","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"18 April 2023","order":3,"name":"accepted","label":"Accepted","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"24 April 2023","order":4,"name":"first_online","label":"First Online","group":{"name":"ArticleHistory","label":"Article History"}},{"order":1,"name":"Ethics","group":{"name":"EthicsHeading","label":"Declarations"}},{"value":"The authors declare that they have no known competing financial interests or personal relationships that could have appeared to influence the work reported in this paper.","order":2,"name":"Ethics","group":{"name":"EthicsHeading","label":"Conflict of interest"}}]}}