{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2024,10,23]],"date-time":"2024-10-23T01:41:13Z","timestamp":1729647673183,"version":"3.28.0"},"reference-count":18,"publisher":"IEEE","content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2014,12]]},"DOI":"10.1109\/glocom.2014.7417491","type":"proceedings-article","created":{"date-parts":[[2016,3,28]],"date-time":"2016-03-28T19:11:24Z","timestamp":1459192284000},"page":"1-6","source":"Crossref","is-referenced-by-count":0,"title":["Virtual Machine Placement via Q-Learning with Function Approximation"],"prefix":"10.1109","author":[{"given":"Thai","family":"Duong","sequence":"first","affiliation":[]},{"given":"Yu-Jung","family":"Chu","sequence":"additional","affiliation":[]},{"given":"Thinh","family":"Nguyen","sequence":"additional","affiliation":[]},{"given":"Jacob","family":"Chakareski","sequence":"additional","affiliation":[]}],"member":"263","reference":[{"key":"ref10","doi-asserted-by":"publisher","DOI":"10.1109\/GLOCOM.2012.6503493"},{"key":"ref11","first-page":"151","author":"coffman","year":"1999","journal-title":"Bin Packing Approximation Algorithms Combinatorial Analysis"},{"journal-title":"Dominant Resource Fairness Fair Allocation of Multiple Resource Types","year":"0","author":"ghodsi","key":"ref12"},{"key":"ref13","doi-asserted-by":"publisher","DOI":"10.1109\/INFCOM.2010.5461930"},{"journal-title":"Reinforcement Learning An Introduction","year":"1998","author":"barto","key":"ref14"},{"key":"ref15","article-title":"Policy gradient methods for reinforcement learning with function approximation","volume":"12","author":"sutton","year":"2000","journal-title":"Advances in neural information processing systems"},{"key":"ref16","doi-asserted-by":"publisher","DOI":"10.1109\/GLOCOM.2012.6503398"},{"key":"ref17","article-title":"Inverted autonomous helicopter flight via reinforcement learning","author":"ng","year":"2004","journal-title":"International Symposium on Experimental Robotics"},{"key":"ref18","doi-asserted-by":"publisher","DOI":"10.1007\/978-3-540-72927-3_23"},{"key":"ref4","doi-asserted-by":"crossref","DOI":"10.1002\/9780470316887","author":"puterman","year":"1994","journal-title":"Markov Decision Processes Discrete Stochastic Dynamic Programming"},{"key":"ref3","doi-asserted-by":"publisher","DOI":"10.1109\/TPDS.2012.169"},{"key":"ref6","doi-asserted-by":"publisher","DOI":"10.1145\/1592568.1592577"},{"key":"ref5","doi-asserted-by":"publisher","DOI":"10.1145\/1402958.1402967"},{"key":"ref8","doi-asserted-by":"publisher","DOI":"10.1109\/GLOCOM.2014.7037154"},{"key":"ref7","doi-asserted-by":"publisher","DOI":"10.1145\/1594977.1592576"},{"key":"ref2","doi-asserted-by":"publisher","DOI":"10.1016\/S0166-218X(01)00347-X"},{"key":"ref1","doi-asserted-by":"publisher","DOI":"10.1002\/0470121173"},{"key":"ref9","doi-asserted-by":"publisher","DOI":"10.1109\/GreenCom-CPSCom.2010.137"}],"event":{"name":"GLOBECOM 2015 - 2015 IEEE Global Communications Conference","start":{"date-parts":[[2015,12,6]]},"location":"San Diego, CA, USA","end":{"date-parts":[[2015,12,10]]}},"container-title":["2015 IEEE Global Communications Conference (GLOBECOM)"],"original-title":[],"deposited":{"date-parts":[[2022,6,16]],"date-time":"2022-06-16T12:15:41Z","timestamp":1655381741000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/7417491"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2014,12]]},"references-count":18,"URL":"https:\/\/doi.org\/10.1109\/glocom.2014.7417491","relation":{},"subject":[],"published":{"date-parts":[[2014,12]]}}}