{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,4,10]],"date-time":"2026-04-10T04:34:36Z","timestamp":1775795676274,"version":"3.50.1"},"reference-count":55,"publisher":"Springer Science and Business Media LLC","issue":"3","license":[{"start":{"date-parts":[[2022,7,12]],"date-time":"2022-07-12T00:00:00Z","timestamp":1657584000000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"},{"start":{"date-parts":[[2022,7,12]],"date-time":"2022-07-12T00:00:00Z","timestamp":1657584000000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["Multimed Tools Appl"],"published-print":{"date-parts":[[2023,1]]},"DOI":"10.1007\/s11042-022-13230-2","type":"journal-article","created":{"date-parts":[[2022,7,12]],"date-time":"2022-07-12T09:56:49Z","timestamp":1657619809000},"page":"3605-3625","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":15,"title":["A new modified-unet deep learning model for semantic segmentation"],"prefix":"10.1007","volume":"82","author":[{"given":"Twinkle","family":"Tiwari","sequence":"first","affiliation":[]},{"given":"Mukesh","family":"Saraswat","sequence":"additional","affiliation":[]}],"member":"297","published-online":{"date-parts":[[2022,7,12]]},"reference":[{"key":"13230_CR1","doi-asserted-by":"crossref","unstructured":"Aydogdu MF, Celik V, Demirci MF (2017) Comparison of three different cnn architectures for age classification. In: IEEE 11th international conference on semantic computing (ICSC), pp 372\u2013377. IEEE","DOI":"10.1109\/ICSC.2017.61"},{"issue":"12","key":"13230_CR2","doi-asserted-by":"publisher","first-page":"2481","DOI":"10.1109\/TPAMI.2016.2644615","volume":"39","author":"V Badrinarayanan","year":"2017","unstructured":"Badrinarayanan V, Kendall A, Cipolla R (2017) Segnet: a deep convolutional encoder-decoder architecture for image segmentation. IEEE Trans Pattern Anal Mach Intell 39(12):2481\u20132495","journal-title":"IEEE Trans Pattern Anal Mach Intell"},{"key":"13230_CR3","doi-asserted-by":"crossref","unstructured":"Buric M, Pobar M, Ivasic-Kos M (2018) \u201cBall detection using yolo and mask r-cnn\u201d. In: International conference on computational science and computational intelligence (CSCI). IEEE, pp 319\u2013323","DOI":"10.1109\/CSCI46756.2018.00068"},{"key":"13230_CR4","doi-asserted-by":"crossref","unstructured":"Byeon W, Breuel TM, Raue F, Liwicki M (2015) Scene labeling with lstm recurrent neural networks. In: Proceedings of the IEEE conference on computer vision and pattern recognition, pp 3547\u20133555","DOI":"10.1109\/CVPR.2015.7298977"},{"key":"13230_CR5","unstructured":"Chen L-C, Papandreou G, Kokkinos I, Murphy K, Yuille AL (2014) Semantic image segmentation with deep convolutional nets and fully connected crfs. arXiv:1412.7062"},{"key":"13230_CR6","unstructured":"Chen L-C, Papandreou G, Schroff F, Adam H (2017) Rethinking atrous convolution for semantic image segmentation. arXiv:1706.05587"},{"key":"13230_CR7","doi-asserted-by":"crossref","unstructured":"Chen C, Song J, Peng C, Wang G, Fang Y (2021) A novel video salient object detection method via semisupervised motion quality perception. IEEE Trans Circuits Syst Video Technol","DOI":"10.1109\/TCSVT.2021.3095843"},{"key":"13230_CR8","doi-asserted-by":"publisher","first-page":"3995","DOI":"10.1109\/TIP.2021.3068644","volume":"30","author":"C Chen","year":"2021","unstructured":"Chen C, Wang G, Peng C, Fang Y, Zhang D, Qin H (2021) Exploring rich and efficient spatial temporal interactions for real-time video salient object detection. IEEE Trans Image Process 30:3995\u20134007","journal-title":"IEEE Trans Image Process"},{"key":"13230_CR9","doi-asserted-by":"publisher","first-page":"2350","DOI":"10.1109\/TIP.2021.3052069","volume":"30","author":"C Chen","year":"2021","unstructured":"Chen C, Wei J, Peng C, Qin H (2021) Depth-quality-aware salient object detection. IEEE Trans Image Process 30:2350\u20132363","journal-title":"IEEE Trans Image Process"},{"key":"13230_CR10","doi-asserted-by":"crossref","unstructured":"Chen L-C, Zhu Y, Papandreou G, Schroff F, Adam H (2018) Encoder-decoder with atrous separable convolution for semantic image segmentation. In: Proceedings of the European conference on computer vision (ECCV), pp 801\u2013818","DOI":"10.1007\/978-3-030-01234-2_49"},{"issue":"1","key":"13230_CR11","doi-asserted-by":"publisher","first-page":"432","DOI":"10.1109\/TIP.2017.2762591","volume":"27","author":"W Chu","year":"2017","unstructured":"Chu W, Liu Y, Shen C, Cai D, Hua X-S (2017) Multi-task vehicle detection with region-of-interest voting. IEEE Trans Image Process 27 (1):432\u2013441","journal-title":"IEEE Trans Image Process"},{"key":"13230_CR12","first-page":"1","volume":"7","author":"J Dem\u0161ar","year":"2006","unstructured":"Dem\u0161ar J (2006) Statistical comparisons of classifiers over multiple data sets. J Mach Learn Res 7:1\u201330","journal-title":"J Mach Learn Res"},{"key":"13230_CR13","doi-asserted-by":"crossref","unstructured":"Deng L, Yang M, Li H, Li T, Hu B, Wang C (2019) Restricted deformable convolution-based road scene semantic segmentation using surround view cameras. IEEE Trans Intell Transp Syst","DOI":"10.1109\/TITS.2019.2939832"},{"issue":"1","key":"13230_CR14","doi-asserted-by":"publisher","first-page":"9","DOI":"10.1134\/S1054661816010065","volume":"26","author":"P Druzhkov","year":"2016","unstructured":"Druzhkov P, Kustikova V (2016) A survey of deep learning methods and software tools for image classification and object detection. Pattern Recognit Image Anal 26(1):9\u201315","journal-title":"Pattern Recognit Image Anal"},{"issue":"11","key":"13230_CR15","doi-asserted-by":"publisher","first-page":"3475","DOI":"10.1109\/TITS.2017.2775628","volume":"19","author":"H Fan","year":"2018","unstructured":"Fan H, Mei X, Prokhorov D, Ling H (2018) Multi-level contextual rnns with attention model for scene labeling. IEEE Trans Intell Transp Syst 19 (11):3475\u20133485","journal-title":"IEEE Trans Intell Transp Syst"},{"key":"13230_CR16","doi-asserted-by":"crossref","unstructured":"Girshick R (2015) Fast r-cnn. In: Proceedings of the IEEE international conference on computer vision, pp 1440\u20131448","DOI":"10.1109\/ICCV.2015.169"},{"key":"13230_CR17","doi-asserted-by":"crossref","unstructured":"Girshick R, Donahue J, Darrell T, Malik J (2014) Rich feature hierarchies for accurate object detection and semantic segmentation. In: Proceedings of the IEEE conference on computer vision and pattern recognition, pp 580\u2013587","DOI":"10.1109\/CVPR.2014.81"},{"key":"13230_CR18","doi-asserted-by":"publisher","first-page":"1","DOI":"10.1007\/s12293-021-00328-7","volume":"13","author":"YCYP Haoran Li","year":"2021","unstructured":"Haoran Li YCYP, He F (2021) Mlfs-ccde: multi-objective large-scale feature selection by cooperative coevolutionary differential evolution. Memetic Comp 13:1\u201318","journal-title":"Memetic Comp"},{"key":"13230_CR19","unstructured":"Hayou S, Doucet A, Rousseau J (2018) On the selection of initialization and activation function for deep neural networks. arXiv:1805.08266"},{"key":"13230_CR20","doi-asserted-by":"crossref","unstructured":"He K, Zhang X, Ren S, Sun J (2016) Deep residual learning for image recognition. In: Proceedings of the IEEE conference on computer vision and pattern recognition, pp 770\u2013778","DOI":"10.1109\/CVPR.2016.90"},{"key":"13230_CR21","unstructured":"Hong S, Noh H, Han B (2015) Decoupled deep neural network for semi-supervised semantic segmentation. Adv Neural Inf Process Syst:1495\u20131503"},{"key":"13230_CR22","doi-asserted-by":"crossref","unstructured":"Huang Z, Wang X, Wang J, Liu W, Wang J (2018) Weakly-supervised semantic segmentation network with deep seeded region growing. In: Proceedings of the IEEE conference on computer vision and pattern recognition, pp 7014\u20137023","DOI":"10.1109\/CVPR.2018.00733"},{"key":"13230_CR23","unstructured":"Ioffe S, Szegedy C (2015) Batch normalization: accelerating deep network training by reducing internal covariate shift. arXiv:1502.03167"},{"key":"13230_CR24","doi-asserted-by":"crossref","unstructured":"J\u00e9gou S, Drozdzal M, Vazquez D, Romero A, Bengio Y (2017) The one hundred layers tiramisu: fully convolutional densenets for semantic segmentation. In: Proceedings of the IEEE conference on computer vision and pattern recognition workshops, pp 11\u201319","DOI":"10.1109\/CVPRW.2017.156"},{"key":"13230_CR25","doi-asserted-by":"crossref","unstructured":"Khoreva A, Benenson R, Hosang J, Hein M, Schiele B (2017) Simple does it: weakly supervised instance and semantic segmentation. In: Proceedings of the IEEE conference on computer vision and pattern recognition, pp 876\u2013885","DOI":"10.1109\/CVPR.2017.181"},{"key":"13230_CR26","unstructured":"Krizhevsky A, Sutskever I, Hinton GE (2012) Imagenet classification with deep convolutional neural networks. Adv Neural Inf Process Syst:1097\u20131105"},{"key":"13230_CR27","doi-asserted-by":"publisher","first-page":"321","DOI":"10.1016\/j.neucom.2019.02.003","volume":"338","author":"F Lateef","year":"2019","unstructured":"Lateef F, Ruichek Y (2019) Survey on semantic segmentation using deep learning techniques. Neurocomputing 338:321\u2013348","journal-title":"Neurocomputing"},{"issue":"1","key":"13230_CR28","doi-asserted-by":"publisher","first-page":"1167","DOI":"10.1007\/s11071-020-06111-6","volume":"103","author":"M-W Li","year":"2021","unstructured":"Li M-W, Wang Y-T, Geng J, Hong W-C (2021) Chaos cloud quantum bat hybrid optimization algorithm. Nonlinear Dynamics 103(1):1167\u20131193","journal-title":"Nonlinear Dynamics"},{"key":"13230_CR29","doi-asserted-by":"crossref","unstructured":"Liang M, Hu X (2015) Recurrent convolutional neural network for object recognition. In: Proceedings of the IEEE conference on computer vision and pattern recognition, pp 3367\u20133375","DOI":"10.1109\/CVPR.2015.7298958"},{"key":"13230_CR30","unstructured":"Maysam Shahedi JDDMBF, Anusha Devi TT (2020) A study on u-net limitations in object localization and image segmentation. In: SIIM"},{"key":"13230_CR31","doi-asserted-by":"crossref","unstructured":"Mehta S, Rastegari M, Caspi A, Shapiro L, Hajishirzi H (2018) Espnet: efficient spatial pyramid of dilated convolutions for semantic segmentation. In: Proceedings of the european conference on computer vision (ECCV), pp 552\u2013568","DOI":"10.1007\/978-3-030-01249-6_34"},{"key":"13230_CR32","unstructured":"Meyes R, Lu M, De Puiseau CW, Meisen T (2019) Ablation studies in artificial neural networks. arXiv:1901.08644"},{"key":"13230_CR33","unstructured":"Nikolenko S, Kadurin A, Arkhangelskaya E (2018) Deep learning.SPb. Peter"},{"issue":"4","key":"13230_CR34","doi-asserted-by":"publisher","first-page":"2259","DOI":"10.1007\/s11280-020-00793-z","volume":"23","author":"Y Pan","year":"2020","unstructured":"Pan Y, He F, Yu H (2020) Learning social representations with deep autoencoder for recommender system. World Wide Web 23(4):2259\u20132279","journal-title":"World Wide Web"},{"key":"13230_CR35","unstructured":"Paszke A, Chaurasia A, Kim S, Culurciello E (2016) Enet: a deep neural network architecture for real-time semantic segmentation. arXiv:1606.02147"},{"key":"13230_CR36","doi-asserted-by":"crossref","unstructured":"Pohlen T, Hermans A, Mathias M, Leibe B (2017) Full-resolution residual networks for semantic segmentation in street scenes. In: Proceedings of the IEEE conference on computer vision and pattern recognition, pp 4151\u20134160","DOI":"10.1109\/CVPR.2017.353"},{"issue":"2","key":"13230_CR37","doi-asserted-by":"publisher","first-page":"245","DOI":"10.1007\/s00371-020-01796-7","volume":"37","author":"Q Quan","year":"2021","unstructured":"Quan Q, He F, Li H (2021) A multi-phase blending method with incremental intensity for training detection networks. Vis Comput 37(2):245\u2013259","journal-title":"Vis Comput"},{"key":"13230_CR38","unstructured":"Reddy DR (1975) Speech recognition: invited papers presented at the 1974 IEEE symposium. Elsevier"},{"key":"13230_CR39","unstructured":"Ren S, He K, Girshick R, Sun J (2015) Faster r-cnn : towards real-time object detection with region proposal networks. Adv Neural Inf Process Syst:91\u201399"},{"issue":"1","key":"13230_CR40","doi-asserted-by":"publisher","first-page":"263","DOI":"10.1109\/TITS.2017.2750080","volume":"19","author":"E Romera","year":"2017","unstructured":"Romera E, Alvarez JM, Bergasa LM, Arroyo R (2017) Erfnet: efficient residual factorized convnet for real-time semantic segmentation. IEEE Trans Intell Transp Syst 19(1):263\u2013272","journal-title":"IEEE Trans Intell Transp Syst"},{"key":"13230_CR41","doi-asserted-by":"crossref","unstructured":"Ronneberger O, Fischer P, Brox T (2015) U-net: convolutional networks for biomedical image segmentation. In: International conference on medical image computing and computer-assisted intervention. Springer, pp 234\u2013241","DOI":"10.1007\/978-3-319-24574-4_28"},{"key":"13230_CR42","unstructured":"Simonyan K, Zisserman A (2014) Very deep convolutional networks for large-scale image recognition. arXiv:1409.1556"},{"key":"13230_CR43","unstructured":"Sirignano J, Spiliopoulos K (2019) Scaling limit of neural networks with the xavier initialization and convergence to a global minimum. arXiv:1907.04108"},{"key":"13230_CR44","doi-asserted-by":"crossref","unstructured":"Szegedy C, Liu W, Jia Y, Sermanet P, Reed S, Anguelov D, Erhan D, Vanhoucke V, Rabinovich A (2015) Going deeper with convolutions. In: Proceedings of the IEEE conference on computer vision and pattern recognition (CVPR)","DOI":"10.1109\/CVPR.2015.7298594"},{"key":"13230_CR45","doi-asserted-by":"crossref","unstructured":"Valada A, Vertens J, Dhall A, Burgard W (2017) Adapnet: adaptive semantic segmentation in adverse environmental conditions. In: IEEE international conference on robotics and automation (ICRA). IEEE, pp 4644\u20134651","DOI":"10.1109\/ICRA.2017.7989540"},{"key":"13230_CR46","doi-asserted-by":"crossref","unstructured":"Wang G, Chen C, Fan D-P, Hao A, Qin H (2021) From semantic categories to fixations: a novel weakly-supervised visual-auditory saliency detection approach. In: Proceedings of the IEEE\/CVF conference on computer vision and pattern recognition, pp 15119\u201315128","DOI":"10.1109\/CVPR46437.2021.01487"},{"key":"13230_CR47","doi-asserted-by":"publisher","first-page":"108212","DOI":"10.1016\/j.patcog.2021.108212","volume":"121","author":"Z Wu","year":"2022","unstructured":"Wu Z, Li S, Chen C, Hao A, Qin H (2022) Recursive multi-model complementary deep fusion for robust salient object detection via parallel sub-networks. Pattern Recogn 121:108212","journal-title":"Pattern Recogn"},{"key":"13230_CR48","doi-asserted-by":"publisher","first-page":"119","DOI":"10.1016\/j.patcog.2019.01.006","volume":"90","author":"Z Wu","year":"2019","unstructured":"Wu Z, Shen C, Hengel AVD (2019) Wider or deeper: revisiting the resnet model for visual recognition. Pattern Recogn 90:119\u2013133","journal-title":"Pattern Recogn"},{"key":"13230_CR49","doi-asserted-by":"crossref","unstructured":"Xie S, Girshick R, Doll\u00e1r P, Tu Z, He K (2017) Aggregated residual transformations for deep neural networks. In: Proceedings of the IEEE conference on computer vision and pattern recognition, pp 1492\u20131500","DOI":"10.1109\/CVPR.2017.634"},{"key":"13230_CR50","first-page":"3203","volume":"17","author":"H-J Xue","year":"2017","unstructured":"Xue H-J, Dai X, Zhang J, Huang S, Chen J (2017) Deep matrix factorization models for recommender systems. IJCAI Melbourne Australia 17:3203\u20133209","journal-title":"IJCAI Melbourne Australia"},{"issue":"4","key":"13230_CR51","doi-asserted-by":"publisher","first-page":"1740","DOI":"10.1002\/mp.13436","volume":"46","author":"F Zabihollahy","year":"2019","unstructured":"Zabihollahy F, White JA, Ukwatta E (2019) Convolutional neural network-based approach for segmentation of left ventricle myocardial scar from 3d late gadolinium enhancement mr images. Med Phys 46(4):1740\u20131751","journal-title":"Med Phys"},{"issue":"9","key":"13230_CR52","doi-asserted-by":"publisher","first-page":"1797","DOI":"10.1007\/s00371-019-01774-8","volume":"36","author":"S Zhang","year":"2020","unstructured":"Zhang S, He F (2020) Drcdn: learning deep residual convolutional dehazing networks. Vis Comput 36(9):1797\u20131808","journal-title":"Vis Comput"},{"key":"13230_CR53","doi-asserted-by":"publisher","first-page":"107297","DOI":"10.1016\/j.knosys.2021.107297","volume":"228","author":"Z Zhang","year":"2021","unstructured":"Zhang Z, Hong W-C (2021) Application of variational mode decomposition and chaotic grey wolf optimizer with support vector regression for forecasting electric loads. Knowl-Based Syst 228:107297","journal-title":"Knowl-Based Syst"},{"key":"13230_CR54","unstructured":"Zhang M, Lucas J, Ba J, Hinton GE (2019) Lookahead optimizer: k steps forward, 1 step back. Adv Neural Inf Process Sys:9597\u20139608"},{"key":"13230_CR55","doi-asserted-by":"crossref","unstructured":"Zhao H, Qi X, Shen X, Shi J, Jia J (2018) Icnet for real-time semantic segmentation on high-resolution images. In: Proceedings of the European conference on computer vision (ECCV), pp 405\u2013420","DOI":"10.1007\/978-3-030-01219-9_25"}],"container-title":["Multimedia Tools and Applications"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s11042-022-13230-2.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/article\/10.1007\/s11042-022-13230-2\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s11042-022-13230-2.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2023,1,4]],"date-time":"2023-01-04T09:34:33Z","timestamp":1672824873000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/s11042-022-13230-2"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2022,7,12]]},"references-count":55,"journal-issue":{"issue":"3","published-print":{"date-parts":[[2023,1]]}},"alternative-id":["13230"],"URL":"https:\/\/doi.org\/10.1007\/s11042-022-13230-2","relation":{},"ISSN":["1380-7501","1573-7721"],"issn-type":[{"value":"1380-7501","type":"print"},{"value":"1573-7721","type":"electronic"}],"subject":[],"published":{"date-parts":[[2022,7,12]]},"assertion":[{"value":"25 June 2021","order":1,"name":"received","label":"Received","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"1 February 2022","order":2,"name":"revised","label":"Revised","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"11 May 2022","order":3,"name":"accepted","label":"Accepted","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"12 July 2022","order":4,"name":"first_online","label":"First Online","group":{"name":"ArticleHistory","label":"Article History"}},{"order":1,"name":"Ethics","group":{"name":"EthicsHeading","label":"Declarations"}},{"value":"The authors have stated that this paper has no potential conflict of interest.","order":2,"name":"Ethics","group":{"name":"EthicsHeading","label":"<!--Emphasis Type='Bold' removed-->Competing interests"}}]}}