{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,3,25]],"date-time":"2025-03-25T14:20:33Z","timestamp":1742912433759,"version":"3.40.3"},"publisher-location":"Cham","reference-count":20,"publisher":"Springer International Publishing","isbn-type":[{"type":"print","value":"9783030005627"},{"type":"electronic","value":"9783030005634"}],"license":[{"start":{"date-parts":[[2018,1,1]],"date-time":"2018-01-01T00:00:00Z","timestamp":1514764800000},"content-version":"tdm","delay-in-days":0,"URL":"http:\/\/www.springer.com\/tdm"}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2018]]},"DOI":"10.1007\/978-3-030-00563-4_84","type":"book-chapter","created":{"date-parts":[[2018,10,5]],"date-time":"2018-10-05T11:35:29Z","timestamp":1538739329000},"page":"856-865","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":1,"title":["An Improved Tentative Q Learning Algorithm for Robot Learning"],"prefix":"10.1007","author":[{"given":"Lixiang","family":"Zhang","sequence":"first","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Yi\u2019an","family":"Zhu","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]},{"given":"Junhua","family":"Duan","sequence":"additional","affiliation":[],"role":[{"role":"author","vocabulary":"crossref"}]}],"member":"297","published-online":{"date-parts":[[2018,10,6]]},"reference":[{"issue":"11","key":"84_CR1","doi-asserted-by":"publisher","first-page":"1238","DOI":"10.1177\/0278364913495721","volume":"32","author":"J Kober","year":"2013","unstructured":"Kober, J., Bagnell, J.A., et al.: Reinforcement learning in robotics: a survey. Int. J. Robot. Res. 32(11), 1238\u20131274 (2013)","journal-title":"Int. J. Robot. Res."},{"issue":"2","key":"84_CR2","doi-asserted-by":"publisher","first-page":"153","DOI":"10.1007\/s10846-017-0468-y","volume":"86","author":"A Polydoros","year":"2017","unstructured":"Polydoros, A., Nalpantidis, L.: Survey of model-based reinforcement learning: applications on robotics. J. Intell. Rob. Syst. 86(2), 153\u2013173 (2017)","journal-title":"J. Intell. Rob. Syst."},{"key":"84_CR3","doi-asserted-by":"crossref","first-page":"137","DOI":"10.1007\/978-1-4842-3453-2_6","volume-title":"Reinforcement Learning and Robotics, Introduction to Deep Learning Business Applications for Developers. Apress","author":"A Vieira","year":"2018","unstructured":"Vieira, A., Ribeiro, B.: Reinforcement Learning and Robotics, Introduction to Deep Learning Business Applications for Developers. Apress, pp. 137\u2013168. A Press, Berkeley (2018)"},{"issue":"3","key":"84_CR4","doi-asserted-by":"publisher","first-page":"122","DOI":"10.3390\/robotics2030122","volume":"2","author":"P Kormushev","year":"2013","unstructured":"Kormushev, P., Calinon, S., et al.: Reinforcement learning in robotics: applications and real-world challenges. Robotics 2(3), 122\u2013148 (2013)","journal-title":"Robotics"},{"issue":"2","key":"84_CR5","doi-asserted-by":"publisher","first-page":"91","DOI":"10.7763\/IJMLC.2015.V5.489","volume":"5","author":"P Wawrzynski","year":"2015","unstructured":"Wawrzynski, P.: Control policy with autocorrelated noise in reinforcement learning for robotics. Int. J. Mach. Learn. Comput. 5(2), 91 (2015)","journal-title":"Int. J. Mach. Learn. Comput."},{"key":"84_CR6","unstructured":"Sutton, R.S., Barto, A.G.: Reinforcement learning: an introduction (2011)"},{"issue":"1","key":"84_CR7","doi-asserted-by":"publisher","first-page":"1","DOI":"10.17485\/ijst\/2017\/v10i1\/109385","volume":"10","author":"R Ravishankar","year":"2017","unstructured":"Ravishankar, R., Vijayakumar, V.: Reinforcement learning algorithms: survey and classification. Indian J. Sci. Technol. 10(1), 1\u20138 (2017)","journal-title":"Indian J. Sci. Technol."},{"key":"84_CR8","unstructured":"Koga, M.L., Silva, V.F., et al.: Speeding-up reinforcement learning through abstraction and transfer learning. In: Proc. of Int. Cof. on Autonomous Agents and Multi-agent Systems. International Foundation for Autonomous Agents and Multiagent Systems, pp. 119\u2013126 (2013)"},{"key":"84_CR9","unstructured":"Azar, G., Munos, R., Ghavamzadeh, M., et al.: Speedy Q-learning: a computationally efficient reinforcement learning algorithm with a near optimal rate of convergence (2013)"},{"key":"84_CR10","unstructured":"Matignon, L., Laurent, G., et al.: Improving reinforcement learning speed for robot control. In: IEEE\/RSJ Int. Conf. on Intelligent Robots and Systems, pp. 3172\u20133177 (2008)"},{"key":"84_CR11","doi-asserted-by":"publisher","first-page":"203","DOI":"10.1007\/978-3-642-16111-7_23","volume-title":"KI 2010: Advances in Artificial Intelligence","author":"Michel Tokic","year":"2010","unstructured":"Tokic, M.: Adaptive \u03b5-greedy exploration in reinforcement learning based on value differences. In: Annual Conference on Artificial Intelligence, pp. 203\u2013210 (2010)"},{"issue":"13\u201315","key":"84_CR12","doi-asserted-by":"publisher","first-page":"2507","DOI":"10.1016\/j.neucom.2007.11.040","volume":"71","author":"Y Achbany","year":"2008","unstructured":"Achbany, Y., Fouss, F., et al.: Tuning continual exploration in reinforcement learning: An optimality property of the Boltzmann strategy. Neurocomputing 71(13\u201315), 2507\u20132520 (2008)","journal-title":"Neurocomputing"},{"key":"84_CR13","doi-asserted-by":"publisher","first-page":"467","DOI":"10.1007\/978-94-007-2598-0_49","volume-title":"IT Convergence and Services","author":"HH Viet","year":"2011","unstructured":"Viet, H.H., Kyaw, P.H., et al.: Simulation-based evaluations of reinforcement learning algorithms for autonomous mobile robot path planning. In: Park, J., Arabnia, H., Chang, H.B., Shon, T. (eds.) IT Convergence and Services, pp. 467\u2013476. Springer, Dordrecht (2011)"},{"key":"84_CR14","doi-asserted-by":"publisher","first-page":"68","DOI":"10.1016\/j.neucom.2018.01.076","volume":"287","author":"Z Wang","year":"2018","unstructured":"Wang, Z., Ren, J., et al.: A deep-learning based feature hybrid framework for spatiotemporal saliency detection inside videos. Neurocomputing 287, 68\u201383 (2018)","journal-title":"Neurocomputing"},{"issue":"5","key":"84_CR15","doi-asserted-by":"publisher","first-page":"906","DOI":"10.1109\/TMM.2009.2021782","volume":"11","author":"J Ren","year":"2009","unstructured":"Ren, J., Jiang, J.: Hierarchical modeling and adaptive clustering for real-time summarization of rush videos. IEEE Trans. Multimed. 11(5), 906\u2013917 (2009)","journal-title":"IEEE Trans. Multimed."},{"issue":"6","key":"84_CR16","doi-asserted-by":"publisher","first-page":"3325","DOI":"10.1109\/TGRS.2014.2374218","volume":"53","author":"J Han","year":"2015","unstructured":"Han, J., Zhang, D., et al.: Object detection in optical remote sensing images based on weakly supervised learning and high-level feature learning. IEEE Trans. Geosci. Remote Sens. 53(6), 3325\u20133337 (2015)","journal-title":"IEEE Trans. Geosci. Remote Sens."},{"issue":"2","key":"84_CR17","doi-asserted-by":"publisher","first-page":"219","DOI":"10.1007\/s11042-010-0518-y","volume":"54","author":"J Chen","year":"2011","unstructured":"Chen, J., Ren, J.: Modelling of content-aware indicators for effective determination of shot boundaries in compressed MPEG videos. Multimed. Tools Appl. 54(2), 219\u2013239 (2011)","journal-title":"Multimed. Tools Appl."},{"key":"84_CR18","doi-asserted-by":"crossref","unstructured":"Ren, J., Vlachos, T.: Immersive and perceptual human\u2013computer interaction using computer vision techniques. In: 2010 IEEE Computer Society Conference on Computer Vision and Pattern Recognition Workshops, pp. 66\u201372. IEEE (2010)","DOI":"10.1109\/CVPRW.2010.5543161"},{"key":"84_CR19","first-page":"1","volume":"61","author":"Y Yan","year":"2017","unstructured":"Yan, Y., Ren, J., et al.: Cognitive fusion of thermal and visible imagery for effective detection and tracking of pedestrians in videos. Cogn. Comput. 61, 1\u201311 (2017)","journal-title":"Cogn. Comput."},{"key":"84_CR20","doi-asserted-by":"publisher","first-page":"65","DOI":"10.1016\/j.patcog.2018.02.004","volume":"79","author":"Y Yan","year":"2018","unstructured":"Yan, Y., Ren, J., et al.: Unsupervised image saliency detection with Gestalt-laws guided optimization and visual attention based refinement. Pattern Recogn. 79, 65\u201378 (2018)","journal-title":"Pattern Recogn."}],"container-title":["Lecture Notes in Computer Science","Advances in Brain Inspired Cognitive Systems"],"original-title":[],"link":[{"URL":"http:\/\/link.springer.com\/content\/pdf\/10.1007\/978-3-030-00563-4_84","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2018,11,16]],"date-time":"2018-11-16T18:53:04Z","timestamp":1542394384000},"score":1,"resource":{"primary":{"URL":"http:\/\/link.springer.com\/10.1007\/978-3-030-00563-4_84"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2018]]},"ISBN":["9783030005627","9783030005634"],"references-count":20,"URL":"https:\/\/doi.org\/10.1007\/978-3-030-00563-4_84","relation":{},"ISSN":["0302-9743","1611-3349"],"issn-type":[{"type":"print","value":"0302-9743"},{"type":"electronic","value":"1611-3349"}],"subject":[],"published":{"date-parts":[[2018]]},"assertion":[{"value":"BICS","order":1,"name":"conference_acronym","label":"Conference Acronym","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"International Conference on Brain Inspired Cognitive Systems","order":2,"name":"conference_name","label":"Conference Name","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"Xi'an","order":3,"name":"conference_city","label":"Conference City","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"China","order":4,"name":"conference_country","label":"Conference Country","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"2018","order":5,"name":"conference_year","label":"Conference Year","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"7 July 2018","order":7,"name":"conference_start_date","label":"Conference Start Date","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"8 July 2018","order":8,"name":"conference_end_date","label":"Conference End Date","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"9","order":9,"name":"conference_number","label":"Conference Number","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"bics2018","order":10,"name":"conference_id","label":"Conference ID","group":{"name":"ConferenceInfo","label":"Conference Information"}},{"value":"http:\/\/bics2018.org\/","order":11,"name":"conference_url","label":"Conference URL","group":{"name":"ConferenceInfo","label":"Conference Information"}}]}}