{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,6,26]],"date-time":"2026-06-26T21:17:23Z","timestamp":1782508643151,"version":"3.54.5"},"reference-count":58,"publisher":"Springer Science and Business Media LLC","issue":"22","license":[{"start":{"date-parts":[[2022,4,9]],"date-time":"2022-04-09T00:00:00Z","timestamp":1649462400000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.springer.com\/tdm"},{"start":{"date-parts":[[2022,4,9]],"date-time":"2022-04-09T00:00:00Z","timestamp":1649462400000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.springer.com\/tdm"}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["Multimed Tools Appl"],"published-print":{"date-parts":[[2022,9]]},"DOI":"10.1007\/s11042-022-12872-6","type":"journal-article","created":{"date-parts":[[2022,4,9]],"date-time":"2022-04-09T00:03:21Z","timestamp":1649462601000},"page":"31313-31328","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":7,"title":["Lightweight identification of retail products based on improved convolutional neural network"],"prefix":"10.1007","volume":"81","author":[{"given":"Junjie","family":"Wang","sequence":"first","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Chengwei","family":"Huang","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Liye","family":"Zhao","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Zhi","family":"Li","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]}],"member":"297","published-online":{"date-parts":[[2022,4,9]]},"reference":[{"key":"12872_CR1","doi-asserted-by":"crossref","unstructured":"Baz I, Yoruk E, Cetin M (2016) Context-aware hybrid classification system for fine-grained retail product recognition. In: 2016 IEEE 12th image, video, and multidimensional signal processing workshop, Bordeaux, France, pp 1\u20135","DOI":"10.1109\/IVMSPW.2016.7528213"},{"key":"12872_CR2","unstructured":"Bochkovskiy A, Wang CY , Liao H (2020) YOLOv4: Optimal Speed and Accuracy of Object Detection. arXiv:2004.10934"},{"key":"12872_CR3","unstructured":"Chong T, Bustan I, Wee M (2016) Deep learning approach to planogram compliance in retail stores. Semantic Scholar, pp 1\u20136"},{"key":"12872_CR4","doi-asserted-by":"crossref","unstructured":"Dalal N, Triggs B (2005) Histograms of oriented gradients for human detection. In: 2005 IEEE computer society conference on computer vision and pattern recognition, San Diego, CA, pp 886\u2013893","DOI":"10.1109\/CVPR.2005.177"},{"key":"12872_CR5","doi-asserted-by":"crossref","unstructured":"Efraty B, Huang C, Shah SK, Kakadiaris IA (2011) Facial landmark detection in uncontrolled conditions. In: 2011 International joint conference on biometrics, pp 1\u20138","DOI":"10.1109\/IJCB.2011.6117477"},{"key":"12872_CR6","unstructured":"Farren D (2017) Classifying food items by image using Convolutional Neural Networks"},{"key":"12872_CR7","doi-asserted-by":"crossref","unstructured":"Geng W, Han F, Lin J et al (2018) Fine-grained grocery product recognition by one-shot learning. In: Proceedings of the 26th ACM International conference on multimedia, Republic of Seoul, Korea, pp 1706\u20131714","DOI":"10.1145\/3240508.3240522"},{"key":"12872_CR8","doi-asserted-by":"crossref","unstructured":"Girshick R et al (2014) Rich Feature Hierarchies for Accurate Object Detection and Semantic Segmentation. In: 2014 IEEE conference on computer vision and pattern recognition, Columbus, OH, USA, pp 580\u2013587","DOI":"10.1109\/CVPR.2014.81"},{"key":"12872_CR9","doi-asserted-by":"crossref","unstructured":"Girshick R (2015) Fast R-CNN. In: 2015 IEEE international conference on computer vision, Santiago, Chile, pp 1440\u20131448","DOI":"10.1109\/ICCV.2015.169"},{"issue":"9","key":"12872_CR10","doi-asserted-by":"publisher","first-page":"1904","DOI":"10.1109\/TPAMI.2015.2389824","volume":"37","author":"K He","year":"2015","unstructured":"He K et al (2015) Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition. IEEE Trans Pattern Anal Mach Intell 37(9):1904\u20131916","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"key":"12872_CR11","unstructured":"Howard AG et al (2017) MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications. arXiv:1704.04861"},{"issue":"15","key":"12872_CR12","doi-asserted-by":"publisher","first-page":"20679","DOI":"10.1007\/s11042-019-7440-8","volume":"78","author":"C Huang","year":"2019","unstructured":"Huang C, Jiang H (2019) Image indexing and content analysis in children\u2019s picture books using a large-scale database. Multimed Tools Appl 78 (15):20679\u201320695","journal-title":"Multimed Tools Appl"},{"key":"12872_CR13","doi-asserted-by":"crossref","unstructured":"Huang C, Efraty BA, Kurkure U, Papadakis M, Shah SK, Kakadiaris IA (2012) Facial landmark configuration for improved detection. In: 2012 IEEE International workshop on information forensics and security, pp 13\u201318","DOI":"10.1109\/WIFS.2012.6412618"},{"key":"12872_CR14","doi-asserted-by":"crossref","unstructured":"Huang C, Jin Y, Zhao Y, Yu Y, Zhao L (2009) Speech emotion recognition based on re-composition of two-class classifiers. In: 2009 3rd International conference on affective computing and intelligent interaction and workshops, pp 1\u20133","DOI":"10.1109\/ACII.2009.5349420"},{"key":"12872_CR15","doi-asserted-by":"crossref","unstructured":"Huang C et al (2013) Practical speech emotion recognition based on online learning: From acted data to elicited data. Mathematical Problems in Engineering","DOI":"10.1155\/2013\/265819"},{"issue":"4","key":"12872_CR16","first-page":"396","volume":"29","author":"CW Huang","year":"2010","unstructured":"Huang CW, Jin Y, Zhao Y, Yu YH, Zhao L (2010) Design and establishment of practical speech emotion database. Tech Acoust 29(4):396\u2013399","journal-title":"Tech Acoust"},{"issue":"15","key":"12872_CR17","doi-asserted-by":"publisher","first-page":"20679","DOI":"10.1007\/s11042-019-7440-8","volume":"78","author":"C Huang","year":"2019","unstructured":"Huang C, Jiang H (2019) Image indexing and content analysis in children\u2019s picture books using a large-scale database. Multimed Tools Appl 78 (15):20679\u201320695","journal-title":"Multimed Tools Appl"},{"issue":"1","key":"12872_CR18","first-page":"63","volume":"29","author":"Y Jin","year":"2010","unstructured":"Jin Y, Zhao Y, Huang C, Zhao L (2010) The design and establishment of a Chinese whispered speech emotion database. Tech Acoust 29(1):63\u201368","journal-title":"Tech Acoust"},{"key":"12872_CR19","doi-asserted-by":"crossref","unstructured":"Jin Y, Zhao Y, Huang C, Zhao L (2009) Study on the emotion recognition of whispered speech. In: 2009 WRI global congress on intelligent systems, vol 3, pp 242\u2013246","DOI":"10.1109\/GCIS.2009.175"},{"issue":"1","key":"12872_CR20","first-page":"63","volume":"29","author":"Y Jin","year":"2010","unstructured":"Jin Y, Zhao Y, Huang C, Zhao L (2010) The design and establishment of a Chinese whispered speech emotion database. Tech Acoust 29(1):63\u201368","journal-title":"Tech Acoust"},{"key":"12872_CR21","unstructured":"Jund P, Abdo N, Eitel A et al (2016) The Freiburg groceries dataset. arXiv preprint, arXiv:1611.05799"},{"key":"12872_CR22","doi-asserted-by":"crossref","unstructured":"Karlinsky L, Shtok J, Tzur Y et al (2017) Fine-grained recognition of thousands of object categories with single-example training. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pp 4113\u20134122","DOI":"10.1109\/CVPR.2017.109"},{"key":"12872_CR23","unstructured":"Krizhevsky A, Sutskever I, Hinton G (2012) ImageNet classification with deep convolutional neural networks. In: International conference on neural information processing systems, Minneapolis, MN, USA, pp 1\u20138"},{"issue":"2","key":"12872_CR24","doi-asserted-by":"publisher","first-page":"323","DOI":"10.1109\/TMM.2017.2741423","volume":"20","author":"K Kumar","year":"2018","unstructured":"Kumar K, Shrimankar D (2018) F-DES: Fast and Deep Event Summarization. IEEE Trans Multimed 20(2):323\u2013334","journal-title":"IEEE Trans Multimed"},{"key":"12872_CR25","doi-asserted-by":"publisher","first-page":"7383","DOI":"10.1007\/s11042-017-4642-9","volume":"77","author":"K Kumar","year":"2018","unstructured":"Kumar K, Shrimankar D et al (2018) Eratosthenes sieve based key-frame extraction technique for event summarization in videos. Multimed Tools Appl 77:7383\u20137404","journal-title":"Multimed Tools Appl"},{"key":"12872_CR26","doi-asserted-by":"publisher","first-page":"26635","DOI":"10.1007\/s11042-018-5882-z","volume":"77","author":"K Kumar","year":"2018","unstructured":"Kumar K, Shrimankar D (2018) Deep Event Learning boosT-up Approach: DELTA. Multimed Tools and Appl 77:26635\u201326655","journal-title":"Multimed Tools and Appl"},{"key":"12872_CR27","doi-asserted-by":"publisher","first-page":"11079","DOI":"10.1007\/s11042-020-10157-4","volume":"80","author":"K Kumar","year":"2021","unstructured":"Kumar K (2021) Text query based summarized event searching interface system using deep learning over cloud. Multimed Tools and Appl 80:11079\u201311094","journal-title":"Multimed Tools and Appl"},{"key":"12872_CR28","doi-asserted-by":"crossref","unstructured":"Kumar K, Sinha S, Manupriya P D-pnr: Deep license plate number recognition. Proceedings of 2nd International Conference on Computer Vision & Image Processing, pp 37\u201346, (2018)","DOI":"10.1007\/978-981-10-7898-9_4"},{"key":"12872_CR29","doi-asserted-by":"crossref","unstructured":"Leutenegger S, Chli M, Siegwart RY (2011) BRISK: Binary Robust invariant scalable keypoints. In: 2011 International conference on computer vision, Barcelona, Spain, pp 2548\u20132555","DOI":"10.1109\/ICCV.2011.6126542"},{"key":"12872_CR30","doi-asserted-by":"crossref","unstructured":"Lin T et al (2017) Feature Pyramid Networks for Object Detection. In: 2017 IEEE conference on computer vision and pattern recognition, Honolulu, HI, USA, pp 936\u2013944","DOI":"10.1109\/CVPR.2017.106"},{"key":"12872_CR31","doi-asserted-by":"crossref","unstructured":"Liu L, Zhou B, Zou Z et al (2018) A smart unstaffed retail shop based on artificial intelligence and IoT. 2018 IEEE 23rd International workshop on computer aided modeling and design of communication links and networks (CAMAD), pp 1\u20134","DOI":"10.1109\/CAMAD.2018.8514988"},{"issue":"2","key":"12872_CR32","doi-asserted-by":"publisher","first-page":"91","DOI":"10.1023\/B:VISI.0000029664.99615.94","volume":"60","author":"DG Lowe","year":"2004","unstructured":"Lowe DG (2004) Distinctive Image Features from Scale-Invariant Keypoints. Int J Comput Vis 60(2):91\u2013110","journal-title":"Int J Comput Vis"},{"issue":"10","key":"12872_CR33","first-page":"1423","volume":"29","author":"V Luo","year":"2013","unstructured":"Luo V, Huang C et al (2013) Emotional feature analysis and recognition from Vietnamese speech. J Signal Process 29(10):1423\u20131432","journal-title":"J Signal Process"},{"key":"12872_CR34","doi-asserted-by":"crossref","unstructured":"Milella A et al (2021) 3D Vision-Based Shelf Monitoring System for Intelligent Retail, ICPR International Workshops and Challenges, Milan, Italy, pp 447\u2013459","DOI":"10.1007\/978-3-030-68790-8_35"},{"key":"12872_CR35","doi-asserted-by":"publisher","unstructured":"Merler M, Galleguillos C, Belongie S (2007) Recognizing groceries in situ using in vitro training data. In: 2007 IEEE conference on computer vision and pattern recognition. https:\/\/doi.org\/10.1109\/CVPR.2007.383486, pp 1\u20138","DOI":"10.1109\/CVPR.2007.383486"},{"key":"12872_CR36","doi-asserted-by":"publisher","first-page":"179","DOI":"10.1016\/j.robot.2019.01.021","volume":"118","author":"M Paolanti","year":"2019","unstructured":"Paolanti M et al (2019) Robotic retail surveying by deep learning visual and textual data. Robot Auton Syst 118:179\u2013188","journal-title":"Robot Auton Syst"},{"issue":"6","key":"12872_CR37","doi-asserted-by":"publisher","first-page":"1137","DOI":"10.1109\/TPAMI.2016.2577031","volume":"39","author":"S Ren","year":"2017","unstructured":"Ren S et al (2017) Faster R-CNN: towards Real-Time Object Detection with Region Proposal Networks. IEEE Trans Pattern Anal Mach Intell 39(6):1137\u20131149","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"key":"12872_CR38","doi-asserted-by":"crossref","unstructured":"Redmon J et al (2016) You Only Look Once: Unified, Real-Time Object Detection. In: 2016 IEEE conference on computer vision and pattern recognition, Las Vegas, NV, USA, pp 779\u2013788","DOI":"10.1109\/CVPR.2016.91"},{"key":"12872_CR39","doi-asserted-by":"crossref","unstructured":"Redmon J, Farhadi A (2017) YOLO9000: better, faster, stronger. In: 2017 IEEE conference on computer vision and pattern recognition, Honolulu, HI, USA, pp 7263\u20137271","DOI":"10.1109\/CVPR.2017.690"},{"key":"12872_CR40","unstructured":"Redmon J, Farhadi A (2018) YOLOv3: An Incremental Improvement. arXiv:1804.02767"},{"key":"12872_CR41","doi-asserted-by":"publisher","first-page":"45","DOI":"10.1016\/j.imavis.2019.03.005","volume":"86","author":"B Santra","year":"2019","unstructured":"Santra B, Mukherjee DP (2019) A comprehensive survey on computer vision based approaches for automatic identification of products in retail store. Image Vis Comput 86:45\u201363","journal-title":"Image Vis Comput"},{"issue":"1","key":"12872_CR42","doi-asserted-by":"publisher","first-page":"13","DOI":"10.1016\/j.jretai.2020.10.006","volume":"97","author":"V Shankar","year":"2021","unstructured":"Shankar V et al (2021) How Technology is Changing Retail. J Retail 97(1):13\u201327","journal-title":"J Retail"},{"key":"12872_CR43","doi-asserted-by":"publisher","unstructured":"Sharma S, Kumar K, Singh N (2017) D-FES: Deep facial expression recognition system, 2017 Conference on Information and Communication Technology (CICT), pp 1\u20136. https:\/\/doi.org\/10.1109\/INFOCOMTECH.2017.8340635","DOI":"10.1109\/INFOCOMTECH.2017.8340635"},{"key":"12872_CR44","doi-asserted-by":"publisher","first-page":"26319","DOI":"10.1007\/s11042-021-10768-5","volume":"80","author":"S Sharma","year":"2021","unstructured":"Sharma S, Kumar K (2021) ASL-3DCNN: American sign language recognition technique using 3-D convolutional neural networks. Multimed Tools and Appl 80:26319\u201326331","journal-title":"Multimed Tools and Appl"},{"key":"12872_CR45","doi-asserted-by":"crossref","unstructured":"Singh N, Dhanak N et al (2017) HDML: habit detection with machine learning. ICCCT-2017: Proceedings of the 7th International Conference on Computer and Communication Technology, pp 29\u201333","DOI":"10.1145\/3154979.3154996"},{"key":"12872_CR46","doi-asserted-by":"crossref","unstructured":"Sun H, Zhang J, Akashi T (2020) TemplateFree: product detection on retail store shelves, vol 15","DOI":"10.1002\/tee.23051"},{"key":"12872_CR47","doi-asserted-by":"crossref","unstructured":"Sriram T et al (1996) Applications of barcode technology in automated storage and retrieval systems. In: Proceedings of the 22nd international conference on industrial electronics, control, and instrumentation, Taipei, Taiwan, pp 641\u2013646","DOI":"10.1109\/IECON.1996.571035"},{"key":"12872_CR48","doi-asserted-by":"crossref","unstructured":"Srivastava MM (2020) Bag of Tricks for Retail Product Image Classification. In: Image analysis and recognition, P\u00f3voa de Varzim, Porto, Portugal, pp 71\u201382","DOI":"10.1007\/978-3-030-50347-5_8"},{"key":"12872_CR49","doi-asserted-by":"crossref","unstructured":"Szegedy C et al (2015) Going deeper with convolutions. In: 2015 IEEE conference on computer vision and pattern recognition, Boston, MA, pp 1\u20139","DOI":"10.1109\/CVPR.2015.7298594"},{"key":"12872_CR50","unstructured":"Sonmez EB, Albayrak S (2017) A survey of product recognition in shelf images. 2017 International Conference on Computer Science and Engineering (UBMK), pp 145\u2013150"},{"key":"12872_CR51","doi-asserted-by":"crossref","unstructured":"Tonioni A, Di Stefano L (2019) Domain invariant hierarchical embedding for grocery products recognition. Computer Vision and Image Understanding, (182):81-92","DOI":"10.1016\/j.cviu.2019.03.005"},{"issue":"1","key":"12872_CR52","doi-asserted-by":"publisher","first-page":"25","DOI":"10.1109\/MPRV.2006.2","volume":"5","author":"R Want","year":"2006","unstructured":"Want R (2006) An introduction to, RFID technology. IEEE Pervasive Computing 5(1):25\u201333","journal-title":"IEEE Pervasive Computing"},{"issue":"18","key":"12872_CR53","doi-asserted-by":"publisher","first-page":"14613","DOI":"10.1007\/s00521-020-05148-3","volume":"32","author":"W Wang","year":"2020","unstructured":"Wang W et al (2020) A self-attention-based destruction and construction learning fine-grained image classification method for retail product recognition. Neural Comput Appl 32(18):14613\u201314622","journal-title":"Neural Comput Appl"},{"key":"12872_CR54","doi-asserted-by":"crossref","unstructured":"Wu C, Huang C, Chen H (2015) Automatic recognition of emotions and actions in bi-modal video analysis. In: International conference on internet of vehicles, pp 427\u2013438","DOI":"10.1007\/978-3-319-27293-1_37"},{"key":"12872_CR55","doi-asserted-by":"crossref","unstructured":"Wei X-S et al (2019) RPC: A large-scale retail product checkout dataset. arXiv preprint, arXiv:1901.072491901.07249. URL: https:\/\/rpc-dataset.github.io\/, accessed on May 22, 2022","DOI":"10.1007\/s11432-022-3513-y"},{"key":"12872_CR56","doi-asserted-by":"publisher","unstructured":"Yan J, Lu G, Li X, et al. (2020) FENP: a database of neonatal facial expression for pain analysis. IEEE transactions on affective computing, https:\/\/doi.org\/10.1109\/TAFFC.2020.3030296","DOI":"10.1109\/TAFFC.2020.3030296"},{"key":"12872_CR57","doi-asserted-by":"crossref","unstructured":"Yun S et al (2019) CutMix: Regularization Strategy to Train Strong Classifiers With Localizable Features. In: 2019 IEEE\/CVF international conference on computer vision, Seoul, Korea (South), pp 6022\u20136031","DOI":"10.1109\/ICCV.2019.00612"},{"key":"12872_CR58","doi-asserted-by":"crossref","unstructured":"Yan J, Lu G, Li X et al (2020) FENP: a database of neonatal facial expression for pain analysis. IEEE Transactions on Affective Computing","DOI":"10.1109\/TAFFC.2020.3030296"}],"container-title":["Multimedia Tools and Applications"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s11042-022-12872-6.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/article\/10.1007\/s11042-022-12872-6\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s11042-022-12872-6.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2022,8,22]],"date-time":"2022-08-22T05:09:40Z","timestamp":1661144980000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/s11042-022-12872-6"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2022,4,9]]},"references-count":58,"journal-issue":{"issue":"22","published-print":{"date-parts":[[2022,9]]}},"alternative-id":["12872"],"URL":"https:\/\/doi.org\/10.1007\/s11042-022-12872-6","relation":{},"ISSN":["1380-7501","1573-7721"],"issn-type":[{"value":"1380-7501","type":"print"},{"value":"1573-7721","type":"electronic"}],"subject":[],"published":{"date-parts":[[2022,4,9]]},"assertion":[{"value":"1 July 2021","order":1,"name":"received","label":"Received","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"7 February 2022","order":2,"name":"revised","label":"Revised","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"10 March 2022","order":3,"name":"accepted","label":"Accepted","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"9 April 2022","order":4,"name":"first_online","label":"First Online","group":{"name":"ArticleHistory","label":"Article History"}},{"order":1,"name":"Ethics","group":{"name":"EthicsHeading","label":"Declarations"}},{"value":"The authors have no competing interests to declare that are relevant to the content of this article.","order":2,"name":"Ethics","group":{"name":"EthicsHeading","label":"<!--Emphasis Type='Bold' removed-->Competing interests"}}]}}