{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,9,20]],"date-time":"2025-09-20T08:39:09Z","timestamp":1758357549099,"version":"3.44.0"},"reference-count":45,"publisher":"Springer Science and Business Media LLC","issue":"10","license":[{"start":{"date-parts":[[2025,5,9]],"date-time":"2025-05-09T00:00:00Z","timestamp":1746748800000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"},{"start":{"date-parts":[[2025,5,9]],"date-time":"2025-05-09T00:00:00Z","timestamp":1746748800000},"content-version":"vor","delay-in-days":0,"URL":"https:\/\/www.springernature.com\/gp\/researchers\/text-and-data-mining"}],"funder":[{"DOI":"10.13039\/501100001809","name":"National Natural Science Foundation of China","doi-asserted-by":"publisher","award":["62273002","61873113"],"award-info":[{"award-number":["62273002","61873113"]}],"id":[{"id":"10.13039\/501100001809","id-type":"DOI","asserted-by":"publisher"}]},{"name":"Major Scientific Research Project of Universities in Anhui Province","award":["2024AH040039"],"award-info":[{"award-number":["2024AH040039"]}]}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":["Appl Intell"],"published-print":{"date-parts":[[2025,7]]},"DOI":"10.1007\/s10489-025-06615-x","type":"journal-article","created":{"date-parts":[[2025,5,9]],"date-time":"2025-05-09T02:15:52Z","timestamp":1746756952000},"update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":0,"title":["An intelligent MIMO run-to-run controller for semiconductor manufacturing processes based on an enhanced twin-delayed deep deterministic policy gradient algorithm"],"prefix":"10.1007","volume":"55","author":[{"given":"Zhu","family":"Ma","sequence":"first","affiliation":[]},{"given":"Yonglin","family":"Chen","sequence":"additional","affiliation":[]},{"ORCID":"https:\/\/orcid.org\/0000-0002-0993-3937","authenticated-orcid":false,"given":"Tianhong","family":"Pan","sequence":"additional","affiliation":[]}],"member":"297","published-online":{"date-parts":[[2025,5,9]]},"reference":[{"key":"6615_CR1","doi-asserted-by":"crossref","unstructured":"Suthar K, Shah D, Wang J, He QP (2019) Next-generation virtual metrology for semiconductor manufacturing: A feature-based framework. Comput Chem Eng 127:140\u2013149","DOI":"10.1016\/j.compchemeng.2019.05.016"},{"issue":"4","key":"6615_CR2","doi-asserted-by":"publisher","first-page":"1846","DOI":"10.1109\/TASE.2020.3021949","volume":"18","author":"S-KS Fan","year":"2020","unstructured":"Fan S-KS, Jen C-H, Hsu C-Y, Liao Y-L (2020) A new double exponentially weighted moving average run-to-run control using a disturbance-accumulating strategy for mixed-product mode. IEEE Trans Autom Sci Eng 18(4):1846\u20131860","journal-title":"IEEE Trans Autom Sci Eng"},{"key":"6615_CR3","doi-asserted-by":"publisher","first-page":"107","DOI":"10.1016\/j.isatra.2018.09.005","volume":"83","author":"K Liu","year":"2018","unstructured":"Liu K, Chen Y, Zhang T, Tian S, Zhang X (2018) A survey of run-to-run control for batch processes. ISA Trans 83:107\u2013125","journal-title":"ISA Trans"},{"issue":"3","key":"6615_CR4","doi-asserted-by":"publisher","first-page":"387","DOI":"10.1109\/TSM.2021.3096787","volume":"34","author":"Z Zhong","year":"2021","unstructured":"Zhong Z, Wang A, Kim H, Paynabar K, Shi J (2021) Adaptive cautious regularized run-to-run controller for lithography process. IEEE Trans Semicond Manufac 34(3):387\u2013397","journal-title":"IEEE Trans Semicond Manufac"},{"issue":"5","key":"6615_CR5","doi-asserted-by":"publisher","first-page":"806","DOI":"10.1109\/TCPMT.2017.2691283","volume":"7","author":"Q Gong","year":"2017","unstructured":"Gong Q, Yang G, Pan C, Chen Y, Lee M (2017) Performance analysis of double EWMA controller under dynamic models with drift. IEEE Trans Components, Packag Manufac Technol 7(5):806\u2013814","journal-title":"IEEE Trans Components, Packag Manufac Technol"},{"issue":"6","key":"6615_CR6","doi-asserted-by":"publisher","first-page":"473","DOI":"10.1016\/j.omega.2004.03.003","volume":"32","author":"C-T Su","year":"2004","unstructured":"Su C-T, Hsu C-C (2004) A time-varying weights tuning method of the double ewma controller. Omega 32(6):473\u2013480","journal-title":"Omega"},{"issue":"4","key":"6615_CR7","doi-asserted-by":"publisher","first-page":"564","DOI":"10.1016\/j.jprocont.2011.01.004","volume":"21","author":"W Wu","year":"2011","unstructured":"Wu W, Maa C-Y (2011) Double EWMA controller using neural network-based tuning algorithm for MIMO non-squared systems. J Process Control 21(4):564\u2013572","journal-title":"J Process Control"},{"issue":"13","key":"6615_CR8","doi-asserted-by":"publisher","first-page":"4316","DOI":"10.1080\/00207543.2021.1973138","volume":"60","author":"M Panzer","year":"2022","unstructured":"Panzer M, Bender B (2022) Deep reinforcement learning in production systems: a systematic literature review. Int J Prod Res 60(13):4316\u20134341","journal-title":"Int J Prod Res"},{"issue":"11","key":"6615_CR9","doi-asserted-by":"publisher","first-page":"13677","DOI":"10.1007\/s10489-022-04105-y","volume":"53","author":"A Oroojlooy","year":"2023","unstructured":"Oroojlooy A, Hajinezhad D (2023) A review of cooperative multi-agent deep reinforcement learning. Appl Intell 53(11):13677\u201313722","journal-title":"Appl Intell"},{"key":"6615_CR10","doi-asserted-by":"crossref","unstructured":"Spielberg S,\u00a0Tulsyan A, Lawrence NP, Loewen PD,\u00a0Bhushan\u00a0Gopaluni R (2019) Toward self-driving processes: A deep reinforcement learning approach to control. AIChE J 65(10), e16689","DOI":"10.1002\/aic.16689"},{"issue":"1","key":"6615_CR11","doi-asserted-by":"publisher","first-page":"1","DOI":"10.1007\/s10489-023-05184-1","volume":"54","author":"D Zhang","year":"2024","unstructured":"Zhang D, Wang Y, Jiang K, Liang L (2024) Safe optimal robust control of nonlinear systems with asymmetric input constraints using reinforcement learning. Appl Intell 54(1):1\u201313","journal-title":"Appl Intell"},{"issue":"1","key":"6615_CR12","doi-asserted-by":"publisher","first-page":"95","DOI":"10.1007\/s10489-023-05197-w","volume":"54","author":"J Huang","year":"2024","unstructured":"Huang J, Tan Q, Qi R, Li H (2024) Relight: a random ensemble reinforcement learning based method for traffic light control. Appl Intell 54(1):95\u2013112","journal-title":"Appl Intell"},{"key":"6615_CR13","unstructured":"Fujimoto S,\u00a0Hoof H,\u00a0Meger D (2018) Addressing function approximation error in actor-critic methods. In: International conference on machine learning, PMLR, pp 1587\u20131596"},{"key":"6615_CR14","unstructured":"Srouji M,\u00a0Zhang J,\u00a0Salakhutdinov R (2018) Structured control nets for deep reinforcement learning. In: International conference on machine learning, PMLR, pp 4742\u20134751"},{"key":"6615_CR15","doi-asserted-by":"crossref","unstructured":"Petrazzini IG, Antonelo EA (2021) Proximal policy optimization with continuous bounded action space via the beta distribution. In: 2021 IEEE symposium series on computational intelligence (SSCI), IEEE, pp 1\u20138","DOI":"10.1109\/SSCI50451.2021.9660123"},{"key":"6615_CR16","doi-asserted-by":"crossref","unstructured":"Hirtz T,\u00a0Tian H,\u00a0Shahzad S,\u00a0Wu F,\u00a0Yang Y, Ren T-L (2024) Deep reinforcement learning framework for end-to-end semiconductor process control. Neural Comput Appl 1\u201318","DOI":"10.1007\/s00521-024-09710-1"},{"issue":"12","key":"6615_CR17","doi-asserted-by":"publisher","first-page":"1055","DOI":"10.1080\/07408170208928934","volume":"34","author":"E Del Castillo","year":"2002","unstructured":"Del Castillo E, Rajagopal R (2002) A multivariate double EWMA process adjustment scheme for drifting processes. IIE Trans 34(12):1055\u20131068","journal-title":"IIE Trans"},{"key":"6615_CR18","doi-asserted-by":"crossref","unstructured":"Rajagopal R, Castillo ED (2003) An analysis and MIMO extension of a double EWMA run-to-run controller for non-squared systems. Int J Reliab Qual Saf Eng 10(04):417\u2013428","DOI":"10.1142\/S021853930300124X"},{"issue":"4","key":"6615_CR19","doi-asserted-by":"publisher","first-page":"409","DOI":"10.1198\/004017007000000326","volume":"49","author":"S-T Tseng","year":"2007","unstructured":"Tseng S-T, Tang J, Lin C-H (2007) Sample size determination for achieving stability of double multivariate exponentially weighted moving average controller. Technometrics 49(4):409\u2013419","journal-title":"Technometrics"},{"issue":"7","key":"6615_CR20","doi-asserted-by":"publisher","first-page":"690","DOI":"10.1080\/07408170701730784","volume":"40","author":"S-P Lee","year":"2008","unstructured":"Lee S-P, Chou R-J, Tseng S-T (2008) Stability and performance of a double MEWMA controller for drifted MIMO systems. IIE Trans 40(7):690\u2013705","journal-title":"IIE Trans"},{"key":"6615_CR21","doi-asserted-by":"crossref","unstructured":"Jou B-Y, Tseng S-T (2009) An enhanced double MEWMA controller for drifted MIMO systems. Commun Stat\u2014Theory Methods 38(10):1730\u20131740","DOI":"10.1080\/03610920902790364"},{"issue":"4","key":"6615_CR22","doi-asserted-by":"publisher","first-page":"309","DOI":"10.1016\/j.jprocont.2006.11.004","volume":"17","author":"J Chen","year":"2007","unstructured":"Chen J, Wang F (2007) PLS based dEWMA run-to-run controller for MIMO non-squared semiconductor processes. J Process Control 17(4):309\u2013319","journal-title":"J Process Control"},{"issue":"6","key":"6615_CR23","doi-asserted-by":"publisher","first-page":"734","DOI":"10.1016\/j.jprocont.2010.04.002","volume":"20","author":"S-KS Fan","year":"2010","unstructured":"Fan S-KS, Chang Y-J (2010) Multiple-input multiple-output double exponentially weighted moving average controller using partial least squares. J Process Control 20(6):734\u2013742","journal-title":"J Process Control"},{"key":"6615_CR24","doi-asserted-by":"crossref","unstructured":"Gong Q,\u00a0Yang G,\u00a0Pan C (2014) A study of MEWMA controller for drifted MIMO non-squared process. In: Proceedings of the 33rd Chinese control conference, IEEE, pp 2903\u20132907","DOI":"10.1109\/ChiCC.2014.6897101"},{"issue":"4","key":"6615_CR25","first-page":"438","volume":"21","author":"M-S Lu","year":"2015","unstructured":"Lu M-S, Wang SJ (2015) Design of a self-tuning double EWMA controller for MIMO processes. Int J Indust Syst Eng 21(4):438\u2013457","journal-title":"Int J Indust Syst Eng"},{"issue":"1","key":"6615_CR26","doi-asserted-by":"publisher","first-page":"109","DOI":"10.1109\/TSM.2009.2039186","volume":"23","author":"C-T Chen","year":"2010","unstructured":"Chen C-T, Chuang Y-C (2010) An intelligent run-to-run control strategy for chemical-mechanical polishing processes. IEEE Trans Semicond Manufac 23(1):109\u2013120","journal-title":"IEEE Trans Semicond Manufac"},{"issue":"13","key":"6615_CR27","doi-asserted-by":"publisher","first-page":"3459","DOI":"10.1080\/00207540601096932","volume":"46","author":"S-K Fan","year":"2008","unstructured":"Fan S-K, Wang C-Y (2008) On-line tuning system of multivariate dEWMA control based on a neural network approach. Int J Prod Res 46(13):3459\u20133484","journal-title":"Int J Prod Res"},{"key":"6615_CR28","doi-asserted-by":"publisher","first-page":"75","DOI":"10.1016\/j.cirpj.2022.11.003","volume":"40","author":"C Li","year":"2023","unstructured":"Li C, Zheng P, Yin Y, Wang B, Wang L (2023) Deep reinforcement learning in smart manufacturing: A review and prospects. CIRP J Manufac Sci Technol 40:75\u2013101","journal-title":"CIRP J Manufac Sci Technol"},{"key":"6615_CR29","doi-asserted-by":"crossref","unstructured":"Nievas N,\u00a0Pag\u00e8s-Bernaus A,\u00a0Bonada F,\u00a0Echeverria L,\u00a0Domingo X (2024) Reinforcement learning for autonomous process control in industry 4.0: Advantages and challenges. Appl Artif Intell 38(1):2383101","DOI":"10.1080\/08839514.2024.2383101"},{"issue":"2","key":"6615_CR30","doi-asserted-by":"publisher","first-page":"283","DOI":"10.1109\/JAS.2024.124227","volume":"11","author":"O Dogru","year":"2024","unstructured":"Dogru O, Xie J, Prakash O, Chiplunkar R, Soesanto J, Chen H, Velswamy K, Ibrahim F, Huang B (2024) Reinforcement learning in process industries: Review and perspective. IEEE\/CAA J Autom Sin 11(2):283\u2013300","journal-title":"IEEE\/CAA J Autom Sin"},{"issue":"2","key":"6615_CR31","doi-asserted-by":"publisher","first-page":"182","DOI":"10.1109\/TASE.2006.879915","volume":"4","author":"R Ganesan","year":"2007","unstructured":"Ganesan R, Das TK, Ramachandran KM (2007) A multiresolution analysis-assisted reinforcement learning approach to run-by-run control. IEEE Trans Autom Sci Eng 4(2):182\u2013193","journal-title":"IEEE Trans Autom Sci Eng"},{"key":"6615_CR32","doi-asserted-by":"crossref","unstructured":"Yu J, Guo P (2020) Run-to-run control of chemical mechanical polishing process based on deep reinforcement learning. IEEE Trans Semicond Manufac 33(3):454\u2013465","DOI":"10.1109\/TSM.2020.3002896"},{"key":"6615_CR33","doi-asserted-by":"crossref","unstructured":"Ma Z,\u00a0Pan T (2023) Distributional reinforcement learning for run-to-run control in semiconductor manufacturing processes. Neural Comput Appl pp 1\u201314","DOI":"10.1007\/s00521-023-08760-1"},{"key":"6615_CR34","doi-asserted-by":"crossref","unstructured":"Li Y,\u00a0Du J,\u00a0Jiang W,\u00a0Tsung F (2024) Mfrl-bi: Design of a model-free reinforcement learning process control scheme by using bayesian inference. IISE Trans 1\u201315","DOI":"10.1080\/24725854.2024.2384965"},{"issue":"6","key":"6615_CR35","doi-asserted-by":"publisher","first-page":"585","DOI":"10.1080\/24725854.2023.2219290","volume":"56","author":"Y Li","year":"2024","unstructured":"Li Y, Du J, Jiang W (2024) Reinforcement learning for process control with application in semiconductor manufacturing. IISE Trans 56(6):585\u2013599","journal-title":"IISE Trans"},{"key":"6615_CR36","doi-asserted-by":"crossref","unstructured":"Liu B,\u00a0Zhao D,\u00a0Liu Y,\u00a0Lu X (2025) Process control in semiconductor manufacturing based on deep distributional soft actor\u2013critic reinforcement learning. IEEE Trans Semicond Manufac","DOI":"10.2139\/ssrn.4883721"},{"key":"6615_CR37","doi-asserted-by":"crossref","unstructured":"Fan S-KS, Chen T-J (2025) A new deep reinforcement learning run-to-run control algorithm for mixed-product production mode in semiconductor manufacturing. IEEE Trans Autom Sci Eng","DOI":"10.1109\/TASE.2025.3526675"},{"key":"6615_CR38","doi-asserted-by":"crossref","unstructured":"Ma Z,\u00a0Pan T (2022) Adaptive weight tuning of EWMA controller via model-free deep reinforcement learning. IEEE Trans Semicond Manufac","DOI":"10.1109\/TSM.2022.3225480"},{"key":"6615_CR39","doi-asserted-by":"crossref","unstructured":"Ma Z,\u00a0Pan T (2024) Deep reinforcement learning-assisted extended state observer for run-to-run control in the semiconductor manufacturing process. Trans Institute Measure Control 01423312241229492","DOI":"10.1177\/01423312241229492"},{"key":"6615_CR40","doi-asserted-by":"crossref","unstructured":"Pan T,\u00a0Jin B,\u00a0Ma Z,\u00a0Fang L (2025) Triple exponentially weighted moving average controller optimization using deep reinforcement learning in semiconductor manufacturing process. Asian J Control","DOI":"10.1002\/asjc.3572"},{"key":"6615_CR41","doi-asserted-by":"publisher","first-page":"419","DOI":"10.1016\/j.cherd.2023.07.049","volume":"197","author":"Z Ma","year":"2023","unstructured":"Ma Z, Pan T, Tian J (2023) Deep reinforcement learning optimized double exponentially weighted moving average controller for chemical mechanical polishing processes. Chem Eng Res Des 197:419\u2013433","journal-title":"Chem Eng Res Des"},{"key":"6615_CR42","unstructured":"Silver D,\u00a0Lever G,\u00a0Heess N,\u00a0Degris T,\u00a0Wierstra D,\u00a0Riedmiller M (2014) Deterministic policy gradient algorithms. In: International conference on machine learning, PMLR, pp 387\u2013395"},{"issue":"8","key":"6615_CR43","doi-asserted-by":"publisher","first-page":"3741","DOI":"10.1109\/TNNLS.2021.3054402","volume":"33","author":"Y Wang","year":"2021","unstructured":"Wang Y, Tang C, Wang S, Cheng L, Wang R, Tan M, Hou Z (2021) Target tracking control of a biomimetic underwater vehicle through deep reinforcement learning. IEEE Trans Neural Netw Learn Syst 33(8):3741\u20133752","journal-title":"IEEE Trans Neural Netw Learn Syst"},{"issue":"1","key":"6615_CR44","doi-asserted-by":"publisher","first-page":"104","DOI":"10.1080\/00401706.2015.1006795","volume":"58","author":"S-T Tseng","year":"2016","unstructured":"Tseng S-T, Mi H-C, Lee I-C (2016) A multivariate EWMA controller for linear dynamic processes. Technometrics 58(1):104\u2013115","journal-title":"Technometrics"},{"key":"6615_CR45","doi-asserted-by":"crossref","unstructured":"Chen L,\u00a0Chu L,\u00a0Ge C,\u00a0Zhang Y (2023) A general tool-based multi-product model for high-mixed production in semiconductor manufacturing. Int J Prod Res 1\u201318","DOI":"10.1080\/00207543.2022.2164088"}],"container-title":["Applied Intelligence"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s10489-025-06615-x.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/article\/10.1007\/s10489-025-06615-x\/fulltext.html","content-type":"text\/html","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/link.springer.com\/content\/pdf\/10.1007\/s10489-025-06615-x.pdf","content-type":"application\/pdf","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2025,9,19]],"date-time":"2025-09-19T13:57:01Z","timestamp":1758290221000},"score":1,"resource":{"primary":{"URL":"https:\/\/link.springer.com\/10.1007\/s10489-025-06615-x"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2025,5,9]]},"references-count":45,"journal-issue":{"issue":"10","published-print":{"date-parts":[[2025,7]]}},"alternative-id":["6615"],"URL":"https:\/\/doi.org\/10.1007\/s10489-025-06615-x","relation":{},"ISSN":["0924-669X","1573-7497"],"issn-type":[{"type":"print","value":"0924-669X"},{"type":"electronic","value":"1573-7497"}],"subject":[],"published":{"date-parts":[[2025,5,9]]},"assertion":[{"value":"4 May 2025","order":1,"name":"accepted","label":"Accepted","group":{"name":"ArticleHistory","label":"Article History"}},{"value":"9 May 2025","order":2,"name":"first_online","label":"First Online","group":{"name":"ArticleHistory","label":"Article History"}},{"order":1,"name":"Ethics","group":{"name":"EthicsHeading","label":"Declarations"}},{"value":"The authors declare that they have no known competing financial interests or personal relationships that could have appeared to influence the work reported in this manuscript.","order":2,"name":"Ethics","group":{"name":"EthicsHeading","label":"Competing interests"}}],"article-number":"732"}}