{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,6,17]],"date-time":"2026-06-17T16:39:27Z","timestamp":1781714367890,"version":"3.54.5"},"reference-count":63,"publisher":"Springer Science and Business Media LLC","issue":"11","license":[{"start":{"date-parts":[[2021,4,12]],"date-time":"2021-04-12T00:00:00Z","timestamp":1618185600000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.springer.com\/tdm"},{"start":{"date-parts":[[2021,4,12]],"date-time":"2021-04-12T00:00:00Z","timestamp":1618185600000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.springer.com\/tdm"}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["J Supercomput"],"published-print":{"date-parts":[[2021,11]]},"DOI":"10.1007\/s11227-021-03784-7","type":"journal-article","created":{"date-parts":[[2021,4,12]],"date-time":"2021-04-12T07:07:38Z","timestamp":1618211258000},"page":"12711-12740","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":24,"title":["Availability-aware and energy-aware dynamic SFC placement using reinforcement learning"],"prefix":"10.1007","volume":"77","author":[{"ORCID":"https:\/\/orcid.org\/0000-0002-0257-4214","authenticated-orcid":false,"given":"Guto Leoni","family":"Santos","sequence":"first","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Theo","family":"Lynn","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Judith","family":"Kelner","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Patricia Takako","family":"Endo","sequence":"additional","affiliation":[],"role":[{"vocabulary":"crossref","role":"author"}]}],"member":"297","published-online":{"date-parts":[[2021,4,12]]},"reference":[{"key":"3784_CR1","unstructured":"Ali HMM, Lawey AQ, El-Gorashi TE, Elmirghani JM (2015) Energy efficient disaggregated servers for future data centers. In: 2015 20th European Conference on Networks and Optical Communications-(NOC), IEEE pp. 1\u20136."},{"issue":"10","key":"3784_CR2","doi-asserted-by":"publisher","first-page":"929","DOI":"10.1007\/s00607-017-0539-8","volume":"99","author":"E Andrade","year":"2017","unstructured":"Andrade E, Nogueira B, Matos R, Callou G, Maciel P (2017) Availability modeling and analysis of a disaster-recovery-as-a-service solution. Computing 99(10):929\u2013954","journal-title":"Computing"},{"issue":"1","key":"3784_CR3","doi-asserted-by":"publisher","first-page":"7","DOI":"10.1186\/s13677-018-0106-7","volume":"7","author":"J Araujo","year":"2018","unstructured":"Araujo J, Maciel P, Andrade E, Callou G, Alves V, Cunha P (2018) Decision making in cloud environments: an approach based on multiple-criteria decision analysis and stochastic models. J Cloud Comput 7(1):7","journal-title":"J Cloud Comput"},{"key":"3784_CR4","doi-asserted-by":"crossref","unstructured":"Araujo J, Maciel P, Torquato M, Callou G, Andrade E (2014) Availability evaluation of digital library cloud services. In: Dependable Systems and Networks (DSN), 2014 44th Annual IEEE\/IFIP International Conference on, IEEE pp. 666\u2013671","DOI":"10.1109\/DSN.2014.65"},{"key":"3784_CR5","doi-asserted-by":"crossref","unstructured":"Arulkumaran K, Deisenroth MP, Brundage M, Bharath AA (2017) A brief survey of deep reinforcement learning. arXiv preprint arXiv:1708.05866","DOI":"10.1109\/MSP.2017.2743240"},{"key":"3784_CR6","doi-asserted-by":"publisher","first-page":"138","DOI":"10.1016\/j.jnca.2016.09.001","volume":"75","author":"D Bhamare","year":"2016","unstructured":"Bhamare D, Jain R, Samaka M, Erbad A (2016) A survey on service function chaining. J Netw Comput Appl 75:138\u2013155","journal-title":"J Netw Comput Appl"},{"key":"3784_CR7","doi-asserted-by":"publisher","first-page":"102637","DOI":"10.1016\/j.jnca.2020.102637","volume":"163","author":"J Cai","year":"2020","unstructured":"Cai J, Huang Z, Luo J, Liu Y, Zhao H, Liao L (2020) Composing and deploying parallelized service function chains. J Netw Comput Appl 163:102637","journal-title":"J Netw Comput Appl"},{"key":"3784_CR8","doi-asserted-by":"crossref","unstructured":"Chai H, Zhang J, Wang Z, Shi J, Huang T (2019) A parallel placement approach for service function chain using deep reinforcement learning. In: 2019 IEEE 5th International Conference on Computer and Communications (ICCC), IEEE pp. 2123\u20132128","DOI":"10.1109\/ICCC47050.2019.9064448"},{"issue":"7","key":"3784_CR9","doi-asserted-by":"publisher","first-page":"2191","DOI":"10.1002\/qre.1927","volume":"32","author":"I Costa","year":"2016","unstructured":"Costa I, Araujo J, Dantas J, Campos E, Silva FA, Maciel P (2016) Availability evaluation and sensitivity analysis of a mobile backend-as-a-service platform. Qual Reliab Eng Int 32(7):2191\u20132205","journal-title":"Qual Reliab Eng Int"},{"issue":"9","key":"3784_CR10","doi-asserted-by":"publisher","first-page":"15760","DOI":"10.3390\/s140915760","volume":"14","author":"A D\u00e2maso","year":"2014","unstructured":"D\u00e2maso A, Rosa N, Maciel P (2014) Reliability of wireless sensor networks. Sensors 14(9):15760\u201315785","journal-title":"Sensors"},{"issue":"11","key":"3784_CR11","doi-asserted-by":"publisher","first-page":"2547","DOI":"10.3390\/s17112547","volume":"17","author":"A D\u00e2maso","year":"2017","unstructured":"D\u00e2maso A, Rosa N, Maciel P (2017) Integrated evaluation of reliability and power consumption of wireless sensor networks. Sensors 17(11):2547","journal-title":"Sensors"},{"key":"3784_CR12","doi-asserted-by":"crossref","unstructured":"Fan J, Guan C, Zhao Y, Qiao C (2017) Availability-aware mapping of service function chains. In: IEEE INFOCOM 2017-IEEE Conference on Computer Communications, IEEE pp. 1\u20139","DOI":"10.1109\/INFOCOM.2017.8057153"},{"issue":"8","key":"3784_CR13","doi-asserted-by":"publisher","first-page":"5520","DOI":"10.1007\/s11227-019-02804-x","volume":"75","author":"A Farshin","year":"2019","unstructured":"Farshin A, Sharifian S (2019) A modified knowledge-based ant colony algorithm for virtual machine placement and simultaneous routing of nfv in distributed cloud architecture. J Supercomput 75(8):5520\u20135550","journal-title":"J Supercomput"},{"key":"3784_CR14","volume-title":"The 3rd platform: enabling digital transformation","author":"F Gens","year":"2013","unstructured":"Gens F (2013) The 3rd platform: enabling digital transformation, vol 209. IDC, USA"},{"key":"3784_CR15","doi-asserted-by":"crossref","unstructured":"Gissler B, Shrivastava P (2015) A system for design decisions based on reliability block diagrams. In: 2015 Annual Reliability and Maintainability Symposium (RAMS), pp. 1\u20136. IEEE","DOI":"10.1109\/RAMS.2015.7105105"},{"key":"3784_CR16","doi-asserted-by":"crossref","unstructured":"Gomez-Rodriguez MA, Sosa-Sosa VJ, Carretero J, Gonzalez JL (2020) Cloudbench: an integrated evaluation of vm placement algorithms in clouds. J Supercomput :1\u201334","DOI":"10.1007\/s11227-019-03141-9"},{"key":"3784_CR17","volume-title":"Deep learning","author":"I Goodfellow","year":"2016","unstructured":"Goodfellow I, Bengio Y, Courville A, Bengio Y (2016) Deep learning, vol 1. MIT press, Cambridge"},{"key":"3784_CR18","unstructured":"ISG, NFV. Network functions virtualisation (nfv)-network operator perspectives on industry progress. ETSI GS NFV-SEC 001 V1.1.1. 2013. Available at https:\/\/www.etsi.org\/deliver\/etsi_gs\/nfv-sec\/001_099\/001\/01.01.01_60\/gs_nfv-sec001v010101p.pdf. Accessed Apr 2021"},{"issue":"7","key":"3784_CR19","doi-asserted-by":"publisher","first-page":"6010","DOI":"10.1109\/JIOT.2019.2951593","volume":"7","author":"S Guo","year":"2019","unstructured":"Guo S, Dai Y, Xu S, Qiu X, Qi F (2019) Trusted cloud-edge network resource management: Drl-driven service function chain orchestration for iot. IEEE Internet Things J 7(7):6010\u20136022","journal-title":"IEEE Internet Things J"},{"key":"3784_CR20","first-page":"2613","volume":"23","author":"HV Hasselt","year":"2010","unstructured":"Hasselt HV (2010) Double q-learning. Adv Neural Inf Process Syst 23:2613\u20132621","journal-title":"Adv Neural Inf Process Syst"},{"key":"3784_CR21","unstructured":"He W, Chen X, Qiu X, Guo S, Yu P (2019) Asco: an availability-aware service chain orchestration. In: 2019 IFIP\/IEEE Symposium on Integrated Network and Service Management (IM), IEEE  pp. 590\u2013593"},{"key":"3784_CR22","volume-title":"System reliability theory: models and statistical methods","author":"A H\u00f8yland","year":"2009","unstructured":"H\u00f8yland A, Rausand M (2009) System reliability theory: models and statistical methods, vol 420. Wiley, New Jersey"},{"key":"3784_CR23","volume-title":"The art of computer systems performance analysis","author":"R Jain","year":"1991","unstructured":"Jain R (1991) The art of computer systems performance analysis. Wiley, New Jersey"},{"key":"3784_CR24","unstructured":"Jim M (2015) Nfv applications - key considerations for profitability. https:\/\/web.dialogic.com\/making-nfv-profitable"},{"key":"3784_CR25","doi-asserted-by":"publisher","first-page":"100298","DOI":"10.1016\/j.cosrev.2020.100298","volume":"38","author":"K Kaur","year":"2020","unstructured":"Kaur K, Mangat V, Kumar K (2020) A comprehensive survey of service function chain provisioning approaches in sdn and nfv architecture. Comput Sci Rev 38:100298","journal-title":"Comput Sci Rev"},{"key":"3784_CR26","doi-asserted-by":"crossref","unstructured":"Khezri HR, Moghadam PA, Farshbafan MK, Shah-Mansouri V, Kebriaei H, Niyato D (2019) Deep reinforcement learning for dynamic reliability aware nfv-based service provisioning. In: 2019 IEEE Global Communications Conference (GLOBECOM), IEEE pp. 1\u20136","DOI":"10.1109\/GLOBECOM38437.2019.9013214"},{"key":"3784_CR27","doi-asserted-by":"crossref","unstructured":"Kouah R, Alleg A, Laraba A, Ahmed T (2018) Energy-aware placement for iot-service function chain. In: 2018 IEEE 23rd International Workshop on Computer Aided Modeling and Design of Communication Links and Networks (CAMAD), IEEE pp. 1\u20137","DOI":"10.1109\/CAMAD.2018.8515003"},{"issue":"7","key":"3784_CR28","doi-asserted-by":"publisher","first-page":"1327","DOI":"10.1002\/qre.2107","volume":"33","author":"A Kumar","year":"2017","unstructured":"Kumar A, Pant S, Ram M (2017) System reliability optimization using gray wolf optimizer algorithm. Qual Reliab Eng Int 33(7):1327\u20131335","journal-title":"Qual Reliab Eng Int"},{"issue":"2","key":"3784_CR29","doi-asserted-by":"publisher","first-page":"451","DOI":"10.1016\/j.neuron.2016.12.040","volume":"93","author":"YC Leong","year":"2017","unstructured":"Leong YC, Radulescu A, Daniel R, DeWoskin V, Niv Y (2017) Dynamic interaction between reinforcement learning and attention in multidimensional environments. Neuron 93(2):451\u2013463","journal-title":"Neuron"},{"key":"3784_CR30","doi-asserted-by":"publisher","first-page":"379","DOI":"10.1016\/j.neunet.2018.07.006","volume":"108","author":"T Lesort","year":"2018","unstructured":"Lesort T, D\u00edaz-Rodr\u00edguez N, Goudou JF, Filliat D (2018) State representation learning for control: an overview. Neural Netw 108:379\u2013392","journal-title":"Neural Netw"},{"key":"3784_CR31","doi-asserted-by":"publisher","first-page":"34976","DOI":"10.1109\/ACCESS.2018.2848266","volume":"6","author":"G Li","year":"2018","unstructured":"Li G, Zhou H, Feng B, Li G (2018) Context-aware service function chaining and its cost-effective orchestration in multi-domain networks. IEEE Access 6:34976\u201334991","journal-title":"IEEE Access"},{"key":"3784_CR32","doi-asserted-by":"crossref","unstructured":"Li G, Zhou H, Feng B, Zhang Y, Yu S (2019) Efficient provision of service function chains in overlay networks using reinforcement learning. IEEE Trans Cloud Comput","DOI":"10.1109\/TCC.2019.2961093"},{"key":"3784_CR33","doi-asserted-by":"crossref","unstructured":"Lima PA, Neto ASB, Maciel P (2020) Data centers\u2019 services restoration based on the decision-making of distributed agents. Telecommun Syst :1\u201312","DOI":"10.1007\/s11235-020-00660-2"},{"issue":"8","key":"3784_CR34","doi-asserted-by":"publisher","first-page":"1838","DOI":"10.1109\/JSAC.2019.2927068","volume":"37","author":"Z Luo","year":"2019","unstructured":"Luo Z, Wu C, Li Z, Zhou W (2019) Scaling geo-distributed network function chains: a prediction and learning framework. IEEE J Sel Areas Commun 37(8):1838\u20131850","journal-title":"IEEE J Sel Areas Commun"},{"key":"3784_CR35","unstructured":"Lynn T, Gourinovitch A, Svorobeh S, Endo PT (2018) Software defined networking and network functions virtualization - market briefing. https:\/\/recap-project.eu\/media\/market-briefings\/"},{"issue":"1","key":"3784_CR36","doi-asserted-by":"publisher","first-page":"1","DOI":"10.1145\/2797211","volume":"48","author":"Z\u00c1 Mann","year":"2015","unstructured":"Mann Z\u00c1 (2015) Allocation of virtual machines in cloud data centers-a survey of problem models and optimization algorithms. ACM Comput Surv (CSUR) 48(1):1\u201334","journal-title":"ACM Comput Surv (CSUR)"},{"issue":"1","key":"3784_CR37","doi-asserted-by":"publisher","first-page":"1","DOI":"10.1007\/s10723-016-9381-z","volume":"15","author":"R Matos","year":"2017","unstructured":"Matos R, Dantas J, Araujo J, Trivedi KS, Maciel P (2017) Redundant eucalyptus private clouds: availability modeling and sensitivity analysis. J Grid Comput 15(1):1\u201322","journal-title":"J Grid Comput"},{"issue":"4","key":"3784_CR38","doi-asserted-by":"publisher","first-page":"704","DOI":"10.1049\/cje.2018.05.008","volume":"27","author":"G Mirjalily","year":"2018","unstructured":"Mirjalily G, Zhiquan L (2018) Optimal network function virtualization and service function chaining: a survey. Chin J Electron 27(4):704\u2013717","journal-title":"Chin J Electron"},{"key":"3784_CR39","unstructured":"Mnih V, Badia AP, Mirza M, Graves A, Lillicrap T, Harley T, Silver D, Kavukcuoglu K (2016) Asynchronous methods for deep reinforcement learning. In: International Conference on Machine Learning, pp. 1928\u20131937"},{"key":"3784_CR40","doi-asserted-by":"crossref","unstructured":"Moualla G, Turletti T, Saucez D (2018) An availability-aware sfc placement algorithm for fat-tree data centers. In: 2018 IEEE 7th International Conference on Cloud Networking (CloudNet), IEEE pp. 1\u20134","DOI":"10.1109\/CloudNet.2018.8549338"},{"issue":"7","key":"3784_CR41","doi-asserted-by":"publisher","first-page":"417","DOI":"10.1049\/iet-its.2017.0153","volume":"11","author":"SS Mousavi","year":"2017","unstructured":"Mousavi SS, Schukat M, Howley E (2017) Traffic light control using deep policy-gradient and value-function-based reinforcement learning. IET Intell Transp Syst 11(7):417\u2013423","journal-title":"IET Intell Transp Syst"},{"key":"3784_CR42","unstructured":"Mundie C, de Vries P, Haynes P, Corwine M (2002) Trustworthy computing. Tech. rep, Technical report, p 10"},{"key":"3784_CR43","unstructured":"Osband I, Blundell C, Pritzel A, Van Roy B (2016) Deep exploration via bootstrapped dqn.  arXiv preprint http:\/\/arxiv.org\/abs\/1602.04621"},{"key":"3784_CR44","doi-asserted-by":"crossref","unstructured":"Palhares A, Santos M, Endo P, Vitalino J, Rodrigues M, Gon\u00e7alves G, Sadok D, Sefidcon A, Wuhib F (2014) Joint allocation of nodes and links with load balancing in network virtualization. In: 2014 IEEE 28th International Conference on Advanced Information Networking and Applications, pp. 148\u2013155. IEEE","DOI":"10.1109\/AINA.2014.24"},{"issue":"6","key":"3784_CR45","doi-asserted-by":"publisher","first-page":"2227","DOI":"10.1109\/TNNLS.2018.2806087","volume":"29","author":"J Pan","year":"2018","unstructured":"Pan J, Wang X, Cheng Y, Yu Q (2018) Multisource transfer double dqn based on actor learning. IEEE Trans Neural Netw Learn Syst 29(6):2227\u20132238","journal-title":"IEEE Trans Neural Netw Learn Syst"},{"key":"3784_CR46","doi-asserted-by":"crossref","unstructured":"Peng B, Li X, Gao J, Liu J, Chen YN, Wong KF (2018) Adversarial advantage actor-critic model for task-completion dialogue policy learning. In: 2018 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), pp. 6149\u20136153. IEEE","DOI":"10.1109\/ICASSP.2018.8461918"},{"key":"3784_CR47","doi-asserted-by":"crossref","unstructured":"Qiu Z, Zhang J, Ning P, Wen X (2017) Reliability modeling and analysis of sic mosfet power modules. In: IECON 2017-43rd Annual Conference of the IEEE Industrial Electronics Society, IEEE pp. 1459\u20131463","DOI":"10.1109\/IECON.2017.8216248"},{"key":"3784_CR48","volume-title":"Hands-on reinforcement learning with Python: master reinforcement and deep reinforcement learning using OpenAI gym and tensorFlow","author":"S Ravichandiran","year":"2018","unstructured":"Ravichandiran S (2018) Hands-on reinforcement learning with Python: master reinforcement and deep reinforcement learning using OpenAI gym and tensorFlow. Packt Publishing Ltd, England"},{"issue":"1","key":"3784_CR49","doi-asserted-by":"publisher","first-page":"16","DOI":"10.1186\/s13677-018-0118-3","volume":"7","author":"GL Santos","year":"2018","unstructured":"Santos GL, Endo PT, da Silva Lisboa MFF, da Silva LGF, Sadok D, Kelner J, Lynn T et al (2018) Analyzing the availability and performance of an e-health system integrated with edge, fog and cloud infrastructures. J Cloud Comput 7(1):16","journal-title":"J Cloud Comput"},{"issue":"4","key":"3784_CR50","doi-asserted-by":"publisher","first-page":"2126","DOI":"10.1007\/s11227-018-2709-7","volume":"75","author":"MH Sayadnavard","year":"2019","unstructured":"Sayadnavard MH, Haghighat AT, Rahmani AM (2019) A reliable energy-aware approach for dynamic virtual machine consolidation in cloud data centers. J Supercomput 75(4):2126\u20132147","journal-title":"J Supercomput"},{"key":"3784_CR51","unstructured":"Schulman J, Wolski F, Dhariwal P, Radford A, Klimov O (2017) Proximal policy optimization algorithms. arXiv preprint arXiv:1707.06347"},{"key":"3784_CR52","doi-asserted-by":"publisher","first-page":"69","DOI":"10.1016\/j.comcom.2019.04.008","volume":"142","author":"NFS de Sousa","year":"2019","unstructured":"de Sousa NFS, Perez DAL, Rosa RV, Santos MA, Rothenberg CE (2019) Network service orchestration: a survey. Comput Commun 142:69\u201394","journal-title":"Comput Commun"},{"key":"3784_CR53","doi-asserted-by":"publisher","first-page":"347","DOI":"10.1016\/j.future.2018.09.037","volume":"91","author":"G Sun","year":"2019","unstructured":"Sun G, Li Y, Yu H, Vasilakos AV, Du X, Guizani M (2019) Energy-efficient and traffic-aware service function chaining orchestration in multi-domain networks. Future -Gener Comput Syst 91:347\u2013360","journal-title":"Future Gener Comput Syst"},{"key":"3784_CR54","doi-asserted-by":"crossref","unstructured":"Sun P, Lan J, Li J, Guo Z, Hu Y (2020) Combining deep reinforcement learning with graph neural networks for optimal vnf placement. IEEE Commun Lett","DOI":"10.1109\/LCOMM.2020.3025298"},{"key":"3784_CR55","volume-title":"Reinforcement learning: an introduction","author":"RS Sutton","year":"2018","unstructured":"Sutton RS, Barto AG (2018) Reinforcement learning: an introduction. MIT press, Cambridge"},{"issue":"10","key":"3784_CR56","doi-asserted-by":"publisher","first-page":"6451","DOI":"10.1007\/s11227-019-02849-y","volume":"75","author":"S Tavakoli-Someh","year":"2019","unstructured":"Tavakoli-Someh S, Rezvani MH (2019) Multi-objective virtual network function placement using nsga-ii meta-heuristic approach. J Supercomput 75(10):6451\u20136487","journal-title":"J Supercomput"},{"key":"3784_CR57","doi-asserted-by":"crossref","unstructured":"Torquato M, Torquato L, Maciel P, Vieira M (2019) Iaas cloud availability planning using models and genetic algorithms. In: 2019 9th Latin-American Symposium on Dependable Computing (LADC), IEEE pp. 1\u201310","DOI":"10.1109\/LADC48089.2019.8995734"},{"key":"3784_CR58","doi-asserted-by":"publisher","first-page":"167944","DOI":"10.1109\/ACCESS.2019.2953498","volume":"7","author":"S Troia","year":"2019","unstructured":"Troia S, Alvizu R, Maier G (2019) Reinforcement learning for service function chain reconfiguration in nfv-sdn metro-core optical networks. IEEE Access 7:167944\u2013167957","journal-title":"IEEE Access"},{"key":"3784_CR59","doi-asserted-by":"crossref","unstructured":"Xiao Y, Zhang Q, Liu F, Wang J, Zhao M, Zhang Z, Zhang J (2019) Nfvdeep: Adaptive online service function chain deployment with deep reinforcement learning. In: Proceedings of the International Symposium on Quality of Service, pp. 1\u201310","DOI":"10.1145\/3326285.3329056"},{"key":"3784_CR60","doi-asserted-by":"crossref","unstructured":"Xu Z, Zhang X, Yu S, Zhang J (2018) Energy-efficient virtual network function placement in telecom networks. In: 2018 IEEE International Conference on Communications (ICC), IEEE pp. 1\u20137","DOI":"10.1109\/ICC.2018.8422879"},{"issue":"6","key":"3784_CR61","doi-asserted-by":"publisher","first-page":"152","DOI":"10.1109\/MNET.2018.1700467","volume":"32","author":"J Zhang","year":"2018","unstructured":"Zhang J, Wang Z, Ma N, Huang T, Liu Y (2018) Enabling efficient service function chaining by integrating nfv and sdn: architecture, challenges and opportunities. IEEE Netw 32(6):152\u2013159","journal-title":"IEEE Netw"},{"key":"3784_CR62","doi-asserted-by":"crossref","unstructured":"Zhang X, Xu Z, Fan L, Yu S, Qu Y (2019) Near-optimal energy-efficient algorithm for virtual network function placement. IEEE Trans Cloud Comput","DOI":"10.1109\/TCC.2019.2947554"},{"issue":"12","key":"3784_CR63","doi-asserted-by":"publisher","first-page":"3093","DOI":"10.1007\/s12555-019-0278-z","volume":"18","author":"Y Zheng","year":"2020","unstructured":"Zheng Y, Li X, Xu L (2020) Balance control for the first-order inverted pendulum based on the advantage actor-critic algorithm. Int J Control Autom Syst 18(12):3093\u20133100","journal-title":"Int J Control Autom Syst"}],"container-title":["The Journal of Supercomputing"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s11227-021-03784-7.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/article\/10.1007\/s11227-021-03784-7\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s11227-021-03784-7.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2021,10,25]],"date-time":"2021-10-25T09:37:45Z","timestamp":1635154665000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/s11227-021-03784-7"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2021,4,12]]},"references-count":63,"journal-issue":{"issue":"11","published-print":{"date-parts":[[2021,11]]}},"alternative-id":["3784"],"URL":"https:\/\/doi.org\/10.1007\/s11227-021-03784-7","relation":{},"ISSN":["0920-8542","1573-0484"],"issn-type":[{"value":"0920-8542","type":"print"},{"value":"1573-0484","type":"electronic"}],"subject":[],"published":{"date-parts":[[2021,4,12]]},"assertion":[{"value":"28 March 2021","order":1,"name":"accepted","label":"Accepted","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"12 April 2021","order":2,"name":"first_online","label":"First Online","group":{"name":"ArticleHistory","label":"Article History"}}]}}