{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2024,9,5]],"date-time":"2024-09-05T00:18:14Z","timestamp":1725495494651},"publisher-location":"Berlin, Heidelberg","reference-count":21,"publisher":"Springer Berlin Heidelberg","isbn-type":[{"type":"print","value":"9783540427322"},{"type":"electronic","value":"9783540454939"}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2001]]},"DOI":"10.1007\/3-540-45493-4_56","type":"book-chapter","created":{"date-parts":[[2007,11,16]],"date-time":"2007-11-16T18:35:48Z","timestamp":1195238148000},"page":"554-564","source":"Crossref","is-referenced-by-count":0,"title":["Reinforcement Learning for Control of Traffic and Access Points in Intelligent Wireless ATM Networks"],"prefix":"10.1007","author":[{"given":"Jerzy","family":"Martyna","sequence":"first","affiliation":[]}],"member":"297","published-online":{"date-parts":[[2001,9,26]]},"reference":[{"key":"56_CR1","first-page":"835","volume":"13","author":"A. G. Barto","year":"1983","unstructured":"A.G. Barto, R.S. Sutton, C.W. Anderson, Neuronlike Adaptive Elements That Can Solve Difficult Learning Control Problems, IEEE Transactions on Systems, Man, and Cybernetics, Vol. 13, 1983, pp. 835\u2013846.","journal-title":"IEEE Transactions on Systems, Man, and Cybernetics"},{"key":"56_CR2","doi-asserted-by":"crossref","unstructured":"R.R. Bhat, Draft Baseline Text for Wireless ATM Capability Set 1 Specification, ATM Forum BTD-WATM-01, 10 Dec. 1998.","DOI":"10.1145\/1321387.1321396"},{"key":"56_CR3","volume-title":"Dynamic Programming","author":"R. E. Bellman","year":"1957","unstructured":"R.E. Bellman, Dynamic Programming, Princeton University Press, Princeton, NJ, 1957."},{"key":"56_CR4","doi-asserted-by":"publisher","first-page":"405","DOI":"10.1002\/(SICI)1099-1131(199909\/12)12:5\/6<405::AID-DAC419>3.0.CO;2-E","volume":"Vo. 12","author":"C.B. Ahmed","year":"1999","unstructured":"C. Ben Ahmed, N.A. Boudriga, M.S. Obaidat, A Performance Analysis Scheme for Intelligent Wireless ATM Networks, Int. Journal of Communication Systems, Vo. 12, 1999, pp. 405\u2013426.","journal-title":"Int. Journal of Communication Systems"},{"key":"56_CR5","doi-asserted-by":"crossref","unstructured":"S.K. Biswas, B. Sengupta, Call Admissibility for Multirate Traffic in Wireless ATM Networks, IEEE INFOCOM, 1997, pp. 649\u2013657.","DOI":"10.1109\/INFCOM.1997.644517"},{"key":"56_CR6","first-page":"671","volume-title":"Advances in Neural Information Processing Systems \u2014 6","author":"J. A. Boyan","year":"1994","unstructured":"J.A. Boyan, M. Littmann, Packet Routing in Dynamically Changing Networks: A Reinforcement Learning Approach, in: J.D. Cowan et al. (Eds.), Advances in Neural Information Processing Systems \u2014 6, Morgan Kauffman, San Francisco, 1994, pp. 671\u2013678."},{"key":"56_CR7","volume-title":"Wireless Intelligent Networking","author":"G. Christensen","year":"2000","unstructured":"G. Christensen, R. Duncan, Wireless Intelligent Networking, Artech House, London, 2000."},{"key":"56_CR8","doi-asserted-by":"publisher","first-page":"311","DOI":"10.1016\/0004-3702(92)90058-6","volume":"55","author":"S. Mahadevan","year":"1992","unstructured":"S. Mahadevan, J. Connel, Automatic Programming of Behaviour-Based Robots Using Reinforcement Learning, Artificial Intelligence, Vol. 55, 1992, pp. 311\u2013365.","journal-title":"Artificial Intelligence"},{"key":"56_CR9","volume-title":"Advances in NIPS \u2014 10","author":"P. Marbach","year":"1998","unstructured":"P. Marbach, O. Mihatsch, M. Schulte, J.N. Tsitsiklis, Reinforcement Learning for Call Admission Control and Routing in Integrated Service Networks, M. Jordan, M. Kearns, S. Solla (Eds.), Advances in NIPS \u2014 10, MIT Press 1998, Cambridge 1998."},{"issue":"2","key":"56_CR10","doi-asserted-by":"publisher","first-page":"197","DOI":"10.1109\/49.824797","volume":"18","author":"P. Marbach","year":"2000","unstructured":"P. Marbach, O. Mihatsch, J.N. Tsitsiklis, Call Admission Control and Routing in Integrated Services Networks Using Neuro-Dynamic Programming, IEEE Journal on Selected Areas in Comm., Vol. 18,No. 2, Feb. 2000, pp. 197\u2013208.","journal-title":"IEEE Journal on Selected Areas in Comm."},{"key":"56_CR11","unstructured":"M. Niemi, Application Requirements for WATM, ATM Forum, Document No.96-1058, 1996."},{"key":"56_CR12","doi-asserted-by":"publisher","first-page":"351","DOI":"10.1007\/BF00872474","volume":"4","author":"P. Piggott","year":"1994","unstructured":"P. Piggott, A. Sattar, Reinforcement Learning of Iterative Behaviour with Multiple Sensors, Journal of Applied Intelligence, 4, 1994, pp. 351\u2013365.","journal-title":"Journal of Applied Intelligence"},{"key":"56_CR13","unstructured":"S.P. Singh, Reinforcement Learning Algorithms for Average-Payoff Markovian Decision Processes, AAAI\u2019 94, pp. 700\u2013705."},{"key":"56_CR14","first-page":"974","volume-title":"Advances in NIPS 9","author":"S. P. Singh","year":"1997","unstructured":"S.P. Singh, D.P. Bartsekas, Reinforcements Learning for Dynamic Channel Allocation in Cellular Telephone Systems, in: M. Mozer et al. (Eds.), Advances in NIPS 9, MIT Press, Cambridge, 1997, pp. 974\u2013980."},{"key":"56_CR15","unstructured":"R.S Sutton, Temporal Credit Assignment in Reinforcement Learning, Ph.D.Thesis, Dept.of Computer and Information Science, University of Massachusetts, 1984."},{"key":"56_CR16","first-page":"9","volume":"3","author":"R. S. Sutton","year":"1988","unstructured":"R.S. Sutton, Learning to Predict by the Methods of Temporal Differences, Machine Learning,Vol. 3, 1988, pp. 9\u201344.","journal-title":"Machine Learning"},{"key":"56_CR17","volume-title":"Reinforcement Learning, An Introduction","author":"R. S. Sutton","year":"1998","unstructured":"R.S. Sutton, A.G. Barto, Reinforcement Learning, An Introduction, MIT Press, Cambridge, 1998."},{"key":"56_CR18","doi-asserted-by":"crossref","unstructured":"H. Tong, T.X. Brown, Adaptive Call Admission Control Under Quality of Service Constraints: A Reinforcement Learning Solution, IEEE Journal on Selected Areas in Comm., Vol. 18, No. 2, Feb. 2000, pp. 209\u2013221.","DOI":"10.1109\/49.824799"},{"key":"56_CR19","first-page":"279","volume":"8","author":"C. J. C. H. Watkins","year":"1992","unstructured":"C.J.C.H. Watkins, P. Dayan, Technical Note: Q-Learning, Machine Learning, Vol. 8, 1992, pp. 279\u2013292.","journal-title":"Machine Learning"},{"key":"56_CR20","volume-title":"Wireless Multimedia Communication. Networking, Video, Voice, and Data","author":"E. K. Wesel","year":"1998","unstructured":"E.K. Wesel, Wireless Multimedia Communication. Networking, Video, Voice, and Data, Addison-Wesley, Reading, 1998."},{"key":"56_CR21","doi-asserted-by":"crossref","unstructured":"S.D. Whitehead, D.H. Ballard, Learning to Perceive and Act by Trial and Error, Machine Learning, Vol. 7, No. 1, July 1991, pp. 45\u201383.","DOI":"10.1007\/BF00058926"}],"container-title":["Lecture Notes in Computer Science","Computational Intelligence. Theory and Applications"],"original-title":[],"link":[{"URL":"http:\/\/link.springer.com\/content\/pdf\/10.1007\/3-540-45493-4_56","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2019,5,4]],"date-time":"2019-05-04T15:35:57Z","timestamp":1556984157000},"score":1,"resource":{"primary":{"URL":"http:\/\/link.springer.com\/10.1007\/3-540-45493-4_56"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2001]]},"ISBN":["9783540427322","9783540454939"],"references-count":21,"URL":"https:\/\/doi.org\/10.1007\/3-540-45493-4_56","relation":{},"ISSN":["0302-9743"],"issn-type":[{"type":"print","value":"0302-9743"}],"subject":[],"published":{"date-parts":[[2001]]}}}