{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,4,14]],"date-time":"2026-04-14T18:19:59Z","timestamp":1776190799689,"version":"3.50.1"},"reference-count":35,"publisher":"Elsevier BV","license":[{"start":{"date-parts":[[2026,7,1]],"date-time":"2026-07-01T00:00:00Z","timestamp":1782864000000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.elsevier.com\/tdm\/userlicense\/1.0\/"},{"start":{"date-parts":[[2026,7,1]],"date-time":"2026-07-01T00:00:00Z","timestamp":1782864000000},"content-version":"tdm","delay-in-days":0,"URL":"https:\/\/www.elsevier.com\/legal\/tdmrep-license"},{"start":{"date-parts":[[2026,7,1]],"date-time":"2026-07-01T00:00:00Z","timestamp":1782864000000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-017"},{"start":{"date-parts":[[2026,7,1]],"date-time":"2026-07-01T00:00:00Z","timestamp":1782864000000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-037"},{"start":{"date-parts":[[2026,7,1]],"date-time":"2026-07-01T00:00:00Z","timestamp":1782864000000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-012"},{"start":{"date-parts":[[2026,7,1]],"date-time":"2026-07-01T00:00:00Z","timestamp":1782864000000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-029"},{"start":{"date-parts":[[2026,7,1]],"date-time":"2026-07-01T00:00:00Z","timestamp":1782864000000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-004"}],"funder":[{"DOI":"10.13039\/501100001809","name":"National Natural Science Foundation of China","doi-asserted-by":"publisher","award":["61972261"],"award-info":[{"award-number":["61972261"]}],"id":[{"id":"10.13039\/501100001809","id-type":"DOI","asserted-by":"publisher"}]}],"content-domain":{"domain":["elsevier.com","sciencedirect.com"],"crossmark-restriction":true},"short-container-title":["Expert Systems with Applications"],"published-print":{"date-parts":[[2026,7]]},"DOI":"10.1016\/j.eswa.2026.132043","type":"journal-article","created":{"date-parts":[[2026,3,14]],"date-time":"2026-03-14T07:49:15Z","timestamp":1773474555000},"page":"132043","update-policy":"https:\/\/doi.org\/10.1016\/elsevier_cm_policy","source":"Crossref","is-referenced-by-count":0,"special_numbering":"C","title":["Approximate approach for frequent itemsets mining on massive distributed data beyond computing capacity"],"prefix":"10.1016","volume":"318","author":[{"ORCID":"https:\/\/orcid.org\/0000-0002-5853-9354","authenticated-orcid":false,"given":"Alladoumbaye","family":"Ngueilbaye","sequence":"first","affiliation":[]},{"ORCID":"https:\/\/orcid.org\/0009-0008-6684-5598","authenticated-orcid":false,"given":"Sibagatullin","family":"Ratmir","sequence":"additional","affiliation":[]},{"ORCID":"https:\/\/orcid.org\/0000-0002-3321-879X","authenticated-orcid":false,"given":"Yongda","family":"Cai","sequence":"additional","affiliation":[]},{"ORCID":"https:\/\/orcid.org\/0000-0002-5795-787X","authenticated-orcid":false,"given":"Mohammad Sultan","family":"Mahmud","sequence":"additional","affiliation":[]},{"ORCID":"https:\/\/orcid.org\/0009-0005-2171-0081","authenticated-orcid":false,"given":"Xudong","family":"Sun","sequence":"additional","affiliation":[]},{"ORCID":"https:\/\/orcid.org\/0000-0001-7631-7440","authenticated-orcid":false,"given":"Andrey","family":"Nechesov","sequence":"additional","affiliation":[]},{"ORCID":"https:\/\/orcid.org\/0000-0001-6924-8766","authenticated-orcid":false,"given":"Sergey S.","family":"Goncharov","sequence":"additional","affiliation":[]},{"ORCID":"https:\/\/orcid.org\/0000-0002-6797-2571","authenticated-orcid":false,"given":"Joshua Zhexue","family":"Huang","sequence":"additional","affiliation":[]}],"member":"78","reference":[{"key":"10.1016\/j.eswa.2026.132043_bib0001","series-title":"2016 international conference on computing, communication and automation (ICCCA)","first-page":"13","article-title":"Implementation of an improved algorithm for frequent itemset mining using hadoop","author":"Agarwal","year":"2016"},{"key":"10.1016\/j.eswa.2026.132043_bib0002","series-title":"Proceedings of the 8th ACM european conference on computer systems","first-page":"29","article-title":"BlinkDB: Queries with bounded errors and bounded response times on very large data","author":"Agarwal","year":"2013"},{"issue":"1","key":"10.1016\/j.eswa.2026.132043_bib0003","doi-asserted-by":"crossref","DOI":"10.32604\/jbd.2022.021744","article-title":"A survey on methods and applications of intelligent market basket analysis based on association rule","volume":"4","author":"Alawadh","year":"2022","journal-title":"Journal on Big Data"},{"key":"10.1016\/j.eswa.2026.132043_bib0004","doi-asserted-by":"crossref","first-page":"53","DOI":"10.1016\/j.bdr.2017.10.004","article-title":"A parallel mapreduce algorithm to efficiently support itemset mining on high dimensional data","volume":"10","author":"Apiletti","year":"2017","journal-title":"Big Data Research"},{"issue":"4","key":"10.1016\/j.eswa.2026.132043_bib0005","doi-asserted-by":"crossref","DOI":"10.1016\/j.ipm.2024.103746","article-title":"CDFRS: A scalable sampling approach for efficient big data analysis","volume":"61","author":"Cai","year":"2024","journal-title":"Information Processing & Management"},{"key":"10.1016\/j.eswa.2026.132043_bib0006","series-title":"Proceedings of the 2004 ACM SIGMOD international conference on management of data","first-page":"287","article-title":"Effective use of block-level sampling in statistics estimation","author":"Chaudhuri","year":"2004"},{"key":"10.1016\/j.eswa.2026.132043_bib0007","doi-asserted-by":"crossref","DOI":"10.1016\/j.eswa.2024.123928","article-title":"Gminer++: Boosting GPU-based frequent itemset mining by reducing redundant computations","volume":"250","author":"Chon","year":"2024","journal-title":"Expert Systems With Applications"},{"key":"10.1016\/j.eswa.2026.132043_bib0008","series-title":"A modern introduction to probability and statistics: Understanding why and how","author":"Dekking","year":"2006"},{"key":"10.1016\/j.eswa.2026.132043_bib0009","doi-asserted-by":"crossref","first-page":"200","DOI":"10.1007\/978-3-662-58415-6_7","article-title":"Mapfim+: Memory aware parallelized frequent itemset mining in very large datasets","author":"Duong","year":"2018","journal-title":"Transactions on Large-Scale Data-and Knowledge-Centered Systems XXXIX: Special Issue on Database-and Expert-Systems Applications"},{"key":"10.1016\/j.eswa.2026.132043_bib0010","doi-asserted-by":"crossref","first-page":"105","DOI":"10.1016\/j.jss.2018.11.007","article-title":"A distributed data management system to support large-scale data analysis","volume":"148","author":"Emara","year":"2019","journal-title":"Journal of Systems and Software"},{"key":"10.1016\/j.eswa.2026.132043_bib0011","doi-asserted-by":"crossref","first-page":"178526","DOI":"10.1109\/ACCESS.2020.3027675","article-title":"Distributed data strategies to support large-scale data analysis across geo-distributed data centers","volume":"8","author":"Emara","year":"2020","journal-title":"IEEE Access"},{"issue":"2","key":"10.1016\/j.eswa.2026.132043_bib0012","doi-asserted-by":"crossref","first-page":"487","DOI":"10.1109\/TCYB.2020.2970176","article-title":"Fast utility mining on sequence data","volume":"51","author":"Gan","year":"2020","journal-title":"IEEE Transactions on Cybernetics"},{"key":"10.1016\/j.eswa.2026.132043_bib0013","series-title":"Proceedings of the twentieth international conference on architectural support for programming languages and operating systems","first-page":"383","article-title":"Approxhadoop: Bringing approximations to mapreduce frameworks","author":"Goiri","year":"2015"},{"issue":"301","key":"10.1016\/j.eswa.2026.132043_bib0014","doi-asserted-by":"crossref","first-page":"13","DOI":"10.1080\/01621459.1963.10500830","article-title":"Probability inequalities for sums of bounded random variables","volume":"58","author":"Hoeffding","year":"1963","journal-title":"Publications of the American Statistical Association"},{"issue":"2","key":"10.1016\/j.eswa.2026.132043_bib0015","doi-asserted-by":"crossref","first-page":"25","DOI":"10.1007\/s11280-025-01339-x","article-title":"Privminer: A similar-first approach to frequent itemset mining under local differential privacy","volume":"28","author":"Li","year":"2025","journal-title":"World Wide Web"},{"key":"10.1016\/j.eswa.2026.132043_bib0016","doi-asserted-by":"crossref","first-page":"122","DOI":"10.1016\/j.inffus.2021.05.011","article-title":"Efficient closed high-utility pattern fusion model in large-scale databases","volume":"76","author":"Lin","year":"2021","journal-title":"Information Fusion"},{"key":"10.1016\/j.eswa.2026.132043_bib0017","first-page":"567","article-title":"Dp-partfim: Frequent itemset mining using differential privacy and partition","author":"Liu","year":"2024","journal-title":"IEEE Transactions on Emerging Topics in Computing"},{"issue":"10","key":"10.1016\/j.eswa.2026.132043_bib0018","doi-asserted-by":"crossref","first-page":"2851","DOI":"10.1109\/TCYB.2017.2751081","article-title":"Apriori versions based on mapreduce for mining frequent patterns on big data","volume":"48","author":"Luna","year":"2017","journal-title":"IEEE transactions on cybernetics"},{"issue":"4","key":"10.1016\/j.eswa.2026.132043_bib0019","doi-asserted-by":"crossref","first-page":"1142","DOI":"10.1109\/TBDATA.2023.3255003","article-title":"Approximate clustering ensemble method for big data","volume":"9","author":"Mahmud","year":"2023","journal-title":"IEEE Transactions on Big Data"},{"key":"10.1016\/j.eswa.2026.132043_bib0020","series-title":"Applied statistics and probability for engineers, Kindle Edition, 7th","author":"Montgomery","year":"2020"},{"key":"10.1016\/j.eswa.2026.132043_bib0021","doi-asserted-by":"crossref","DOI":"10.1016\/j.knosys.2025.113161","article-title":"Approximate erasable pattern discovery and analytics on stream data","volume":"312","author":"Park","year":"2025","journal-title":"Knowledge-Based Systems"},{"issue":"6","key":"10.1016\/j.eswa.2026.132043_bib0022","doi-asserted-by":"crossref","first-page":"4463","DOI":"10.1007\/s10586-022-03673-5","article-title":"ParteClat: An improved eclat-based frequent itemset mining algorithm on spark clusters using partition technique","volume":"25","author":"Raj","year":"2022","journal-title":"Cluster Computing"},{"key":"10.1016\/j.eswa.2026.132043_bib0023","doi-asserted-by":"crossref","first-page":"3565","DOI":"10.1007\/s10115-020-01464-1","article-title":"Eafim: efficient apriori-based frequent itemset mining algorithm on spark for big transactional data","volume":"62","author":"Raj","year":"2020","journal-title":"Knowledge and Information Systems"},{"issue":"1","key":"10.1016\/j.eswa.2026.132043_bib0024","doi-asserted-by":"crossref","DOI":"10.1016\/j.ipm.2019.102078","article-title":"An extensive study on the evolution of context-aware personalized travel recommender systems","volume":"57","author":"Renjith","year":"2020","journal-title":"Information Processing & Management"},{"key":"10.1016\/j.eswa.2026.132043_bib0025","doi-asserted-by":"crossref","first-page":"39330","DOI":"10.1109\/ACCESS.2024.3376477","article-title":"Probabilistic support prediction: Fast frequent itemset mining in dense data","volume":"12","author":"Sadeequllah","year":"2024","journal-title":"IEEE Access"},{"issue":"11","key":"10.1016\/j.eswa.2026.132043_bib0026","doi-asserted-by":"crossref","first-page":"5846","DOI":"10.1109\/TII.2019.2912723","article-title":"Random sample partition: A distributed data model for big data analysis","volume":"15","author":"Salloum","year":"2019","journal-title":"IEEE Transactions on Industrial Informatics"},{"issue":"2","key":"10.1016\/j.eswa.2026.132043_bib0027","doi-asserted-by":"crossref","first-page":"154","DOI":"10.26599\/BDMA.2022.9020014","article-title":"Survey of distributed computing frameworks for supporting big data analysis","volume":"6","author":"Sun","year":"2023","journal-title":"Big Data Mining and Analytics"},{"issue":"2","key":"10.1016\/j.eswa.2026.132043_bib0028","doi-asserted-by":"crossref","DOI":"10.1016\/j.ipm.2023.103577","article-title":"A scalable and flexible basket analysis system for big transaction data in spark","volume":"61","author":"Sun","year":"2024","journal-title":"Information Processing & Management"},{"key":"10.1016\/j.eswa.2026.132043_bib0029","doi-asserted-by":"crossref","DOI":"10.1016\/j.engappai.2023.107648","article-title":"Non-mapreduce computing for intelligent big data analysis","volume":"129","author":"Sun","year":"2024","journal-title":"Engineering Applications of Artificial Intelligence"},{"key":"10.1016\/j.eswa.2026.132043_bib0030","series-title":"VLDB","first-page":"134","article-title":"Sampling large databases for association rules","volume":"vol. 96","author":"Toivonen","year":"1996"},{"key":"10.1016\/j.eswa.2026.132043_bib0031","series-title":"CLOUD","first-page":"347","article-title":"A two-stage data processing algorithm to generate random sample partitions for big data analysis","volume":"vol. 10967","author":"Wei","year":"2018"},{"issue":"1","key":"10.1016\/j.eswa.2026.132043_bib0032","doi-asserted-by":"crossref","first-page":"101","DOI":"10.1109\/TPDS.2016.2560176","article-title":"Fidoop-DP: data partitioning in frequent itemset mining on hadoop clusters","volume":"28","author":"Xun","year":"2016","journal-title":"IEEE Transactions on Parallel and Distributed Systems"},{"key":"10.1016\/j.eswa.2026.132043_bib0033","doi-asserted-by":"crossref","DOI":"10.1016\/j.parco.2020.102738","article-title":"Hbpfp-dc: A parallel frequent itemset mining using spark","volume":"101","author":"Xun","year":"2021","journal-title":"Parallel Computing"},{"issue":"4","key":"10.1016\/j.eswa.2026.132043_bib0034","doi-asserted-by":"crossref","first-page":"709","DOI":"10.1007\/s00530-020-00725-x","article-title":"PFIMD: A parallel mapreduce-based algorithm for frequent itemset mining","volume":"27","author":"Yimin","year":"2021","journal-title":"Multimedia Systems"},{"key":"10.1016\/j.eswa.2026.132043_bib0035","doi-asserted-by":"crossref","first-page":"188","DOI":"10.1016\/j.knosys.2017.03.016","article-title":"An efficient algorithm for mining high utility patterns from incremental databases with one database scan","volume":"124","author":"Yun","year":"2017","journal-title":"Knowledge-Based Systems"}],"container-title":["Expert Systems with Applications"],"original-title":[],"language":"en","link":[{"URL":"https:\/\/api.elsevier.com\/content\/article\/PII:S0957417426009565?httpAccept=text\/xml","content-type":"text\/xml","content-version":"vor","intended-application":"text-mining"},{"URL":"https:\/\/api.elsevier.com\/content\/article\/PII:S0957417426009565?httpAccept=text\/plain","content-type":"text\/plain","content-version":"vor","intended-application":"text-mining"}],"deposited":{"date-parts":[[2026,4,14]],"date-time":"2026-04-14T17:28:03Z","timestamp":1776187683000},"score":1,"resource":{"primary":{"URL":"https:\/\/linkinghub.elsevier.com\/retrieve\/pii\/S0957417426009565"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2026,7]]},"references-count":35,"alternative-id":["S0957417426009565"],"URL":"https:\/\/doi.org\/10.1016\/j.eswa.2026.132043","relation":{},"ISSN":["0957-4174"],"issn-type":[{"value":"0957-4174","type":"print"}],"subject":[],"published":{"date-parts":[[2026,7]]},"assertion":[{"value":"Elsevier","name":"publisher","label":"This article is maintained by"},{"value":"Approximate approach for frequent itemsets mining on massive distributed data beyond computing capacity","name":"articletitle","label":"Article Title"},{"value":"Expert Systems with Applications","name":"journaltitle","label":"Journal Title"},{"value":"https:\/\/doi.org\/10.1016\/j.eswa.2026.132043","name":"articlelink","label":"CrossRef DOI link to publisher maintained version"},{"value":"article","name":"content_type","label":"Content Type"},{"value":"\u00a9 2026 Elsevier Ltd. All rights are reserved, including those for text and data mining, AI training, and similar technologies.","name":"copyright","label":"Copyright"}],"article-number":"132043"}}