{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,3,26]],"date-time":"2025-03-26T13:01:17Z","timestamp":1742994077873,"version":"3.40.3"},"publisher-location":"Berlin, Heidelberg","reference-count":15,"publisher":"Springer Berlin Heidelberg","isbn-type":[{"type":"print","value":"9783540688464"},{"type":"electronic","value":"9783540688471"}],"license":[{"start":{"date-parts":[[2008,1,1]],"date-time":"2008-01-01T00:00:00Z","timestamp":1199145600000},"content-version":"tdm","delay-in-days":0,"URL":"http:\/\/www.springer.com\/tdm"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2008]]},"DOI":"10.1007\/978-3-540-68847-1_42","type":"book-chapter","created":{"date-parts":[[2008,7,17]],"date-time":"2008-07-17T04:26:35Z","timestamp":1216268795000},"page":"409-416","source":"Crossref","is-referenced-by-count":4,"title":["Implementing Parametric Reinforcement Learning in Robocup Rescue Simulation"],"prefix":"10.1007","author":[{"given":"Omid","family":"Aghazadeh","sequence":"first","affiliation":[]},{"given":"Maziar Ahmad","family":"Sharbafi","sequence":"additional","affiliation":[]},{"given":"Abolfazl Toroghi","family":"Haghighat","sequence":"additional","affiliation":[]}],"member":"297","reference":[{"key":"42_CR1","unstructured":"Ahmad Sharbafi, M., Lucas, C., AmirGhiasvand, O., Aghazadeh, O., Toroghi Haghighat, A.: Using Emotional Learning in Rescue Simulation Environment, Transactions on Engineering, Computing and Technology. \u00a013, 333\u2013337 (2006)"},{"key":"42_CR2","unstructured":"Allen-Williams, M.: Coordination in multi-agent systems, PhD thesis, University of Southampton (2006)"},{"key":"42_CR3","unstructured":"Dorais, G., Bonasso, R., Kortenkamp, D., Pell, P., Schreckenghost., D.: Adjustable autonomy for human-centered autonomous systems on Mars. In: Mars Society Conference (1998)"},{"key":"42_CR4","doi-asserted-by":"publisher","first-page":"197","DOI":"10.1007\/0-387-26350-0_8","volume-title":"Multi-Agent Programming","author":"N. Schurr","year":"2005","unstructured":"Schurr, N., Marecki, J., Lewis, J.P., Tambe, M., Scerri, P.: The defacto system: Coordinating human-agent teams for the future. In: Multi-Agent Programming, pp. 197\u2013215. Springer, New York (2005)"},{"key":"42_CR5","doi-asserted-by":"crossref","unstructured":"Scerri, P., Sycara, K., Tambe, M.: Adjustable Autonomy in the Context of Coordination. In: AIAA 1st Intelligent Systems Technical Conference, Chicago, Illinois (2004)","DOI":"10.2514\/6.2004-6367"},{"issue":"2","key":"42_CR6","doi-asserted-by":"publisher","first-page":"163","DOI":"10.1177\/105971239700600201","volume":"6","author":"J.C. Santamaria","year":"1998","unstructured":"Santamaria, J.C., Sutton, R.S., Ram, A.: Experiments with reinforcement learning in problems with continuous state and action spaces. Adaptive Behavior\u00a06(2), 163\u2013218 (1998)","journal-title":"Adaptive Behavior"},{"key":"42_CR7","doi-asserted-by":"crossref","unstructured":"Sutton, R., Barto, A.: Reinforcement Learning: An Introduction. MIT Press (1998)","DOI":"10.1109\/TNN.1998.712192"},{"key":"42_CR8","first-page":"2448","volume":"4","author":"L. Baird","year":"1994","unstructured":"Baird, L.: Reinforcement learning in continuous time: Advantage updating. In Neural Networks. IEEE World Congress on Computational Intelligence\u00a04, 2448\u20132453 (1994)","journal-title":"IEEE World Congress on Computational Intelligence"},{"key":"42_CR9","unstructured":"Doya, K.: Temporal difference learning in continuous time and space. In: Advances in Neural Information Processing Systems, pp. 1073\u20131079. The MIT Press (1996)"},{"key":"42_CR10","doi-asserted-by":"crossref","unstructured":"van Kampen, E.-J.: Continuous Adaptive Critic Flight Control using Approximated Plant Dynamics, Master of Science Thesis Faculty of Aerospace Engineering, Delft University of Technology (2006)","DOI":"10.1109\/ICMLC.2006.258964"},{"key":"42_CR11","unstructured":"Martin Appl.: Model-Based Reinforcement Learning in Continuous Environments, PhD thesis Technical University of Munich (2000)"},{"key":"42_CR12","unstructured":"Precup, D., Sutton, R., Dasgupta, S.: Off-Policy Temporal-Difference Learning with Function Approximation. In: ICML 2001, pp. 417\u2013424 (2001)"},{"key":"42_CR13","series-title":"Lecture Notes in Artificial Intelligence","doi-asserted-by":"publisher","first-page":"11","DOI":"10.1007\/3-540-49097-3_2","volume-title":"Computational Learning Theory","author":"R. Sutton","year":"1999","unstructured":"Sutton, R.: Open Theoretical Questions in Reinforcement Learning. In: Fischer, P., Simon, H.U. (eds.) EuroCOLT 1999. LNCS (LNAI), vol.\u00a01572, pp. 11\u201317. Springer, Heidelberg (1999)"},{"key":"42_CR14","series-title":"Lecture Notes in Artificial Intelligence","volume-title":"RoboCup 2003: Robot Soccer World Cup VII","author":"J. Habibi","year":"2004","unstructured":"Habibi, J., Ahmadi, M., Nouri, A., Sayyadian, M., Nevisi, M.: Utilizing Different Multiagent Methods in Robocup Rescue Simulation. In: Polani, D., Browning, B., Bonarini, A., Yoshida, K. (eds.) RoboCup 2003. LNCS (LNAI), vol.\u00a03020. Springer, Heidelberg (2004)"},{"key":"42_CR15","unstructured":"Kitano, H., Tadokoro, S., Noda, I., Matsubara, H., Takahashi, T., Shinjou, A., Shimada, S.: RoboCup-Rescue: Search and Rescue in Large Scale Disasters as a Domain for Autonomous Agents Research. In: IEEE Conference on Man, Systems, and Cybernetics (1999)"}],"container-title":["Lecture Notes in Computer Science","RoboCup 2007: Robot Soccer World Cup XI"],"original-title":[],"language":"en","link":[{"URL":"http:\/\/link.springer.com\/content\/pdf\/10.1007\/978-3-540-68847-1_42","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2019,5,19]],"date-time":"2019-05-19T11:22:50Z","timestamp":1558264970000},"score":1,"resource":{"primary":{"URL":"http:\/\/link.springer.com\/10.1007\/978-3-540-68847-1_42"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2008]]},"ISBN":["9783540688464","9783540688471"],"references-count":15,"URL":"https:\/\/doi.org\/10.1007\/978-3-540-68847-1_42","relation":{},"ISSN":["0302-9743","1611-3349"],"issn-type":[{"type":"print","value":"0302-9743"},{"type":"electronic","value":"1611-3349"}],"subject":[],"published":{"date-parts":[[2008]]}}}