{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2026,6,17]],"date-time":"2026-06-17T16:46:06Z","timestamp":1781714766533,"version":"3.54.5"},"reference-count":33,"publisher":"IEEE","license":[{"start":{"date-parts":[[2022,5,28]],"date-time":"2022-05-28T00:00:00Z","timestamp":1653696000000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-029"},{"start":{"date-parts":[[2022,5,28]],"date-time":"2022-05-28T00:00:00Z","timestamp":1653696000000},"content-version":"stm-asf","delay-in-days":0,"URL":"https:\/\/doi.org\/10.15223\/policy-037"}],"funder":[{"DOI":"10.13039\/100007225","name":"Ministry of Science and Technology","doi-asserted-by":"publisher","id":[{"id":"10.13039\/100007225","id-type":"DOI","asserted-by":"publisher"}]}],"content-domain":{"domain":[],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2022,5,28]]},"DOI":"10.1109\/iscas48785.2022.9937519","type":"proceedings-article","created":{"date-parts":[[2022,11,11]],"date-time":"2022-11-11T20:38:08Z","timestamp":1668199088000},"page":"424-428","source":"Crossref","is-referenced-by-count":9,"title":["Anime Character Recognition using Intermediate Features Aggregation"],"prefix":"10.1109","author":[{"given":"Edwin Arkel","family":"Rios","sequence":"first","affiliation":[{"name":"National Yang Ming Chiao Tung University,Hsinchu,Taiwan"}],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Min-Chun","family":"Hu","sequence":"additional","affiliation":[{"name":"National Tsing Hua University,Hsinchu,Taiwan"}],"role":[{"vocabulary":"crossref","role":"author"}]},{"given":"Bo-Cheng","family":"Lai","sequence":"additional","affiliation":[{"name":"National Yang Ming Chiao Tung University,Hsinchu,Taiwan"}],"role":[{"vocabulary":"crossref","role":"author"}]}],"member":"263","reference":[{"key":"ref33","article-title":"loss-landscapes","author":"bernardi","year":"2021"},{"key":"ref32","article-title":"huggingface\/transformers","year":"2021"},{"key":"ref31","article-title":"BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding","author":"devlin","year":"2019","journal-title":"arXiv 1810 04805"},{"key":"ref30","article-title":"EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks","author":"tan","year":"2020","journal-title":"arXiv 1905 11946 [cs stat]"},{"key":"ref10","article-title":"ViLT: Vision-and-Language Transformer Without Convolution or Region Supervision","author":"kim","year":"2021","journal-title":"arXiv 2102 03334 [cs stat]"},{"key":"ref11","article-title":"Attention Is All You Need","author":"vaswani","year":"2017","journal-title":"arXiv 1706 03762"},{"key":"ref12","article-title":"Transformers in Vision: A Survey","author":"khan","year":"2021","journal-title":"arXiv 2101 01169"},{"key":"ref13","article-title":"Image Transformer","author":"parmar","year":"2018","journal-title":"arXiv 1802 05751"},{"key":"ref14","doi-asserted-by":"publisher","DOI":"10.1109\/ICCV48922.2021.00986"},{"key":"ref15","doi-asserted-by":"publisher","DOI":"10.1109\/ICCV48922.2021.00061"},{"key":"ref16","article-title":"Training data-efficient image transformers & distillation through attention","author":"touvron","year":"2021","journal-title":"arXiv 2012 12877"},{"key":"ref17","article-title":"A disciplined approach to neural network hyperparameters: Part 1 &#x2013; learning rate, batch size, momentum, and weight decay","author":"smith","year":"2018","journal-title":"arXiv 1803 09820 [cs stat]"},{"key":"ref18","doi-asserted-by":"publisher","DOI":"10.2478\/pralin-2018-0002"},{"key":"ref19","article-title":"Accurate, Large Minibatch SGD: Training ImageNet in 1 Hour","author":"goyal","year":"2018","journal-title":"arXiv 1706 02677 [cs CV]"},{"key":"ref28","article-title":"Danbooru2019: A Large-Scale Crowdsourced and Tagged Anime Illustration Dataset","author":"branwen","year":"2015"},{"key":"ref4","author":"frey","year":"2008","journal-title":"Teaching Visual Literacy Using Comic Books Graphic Novels Anime Cartoons and More to Develop Comprehension and Thinking Skills"},{"key":"ref27","article-title":"grapeot\/Danbooru2018AnimeCharacterRecognitionDataset","author":"wang","year":"2020"},{"key":"ref3","article-title":"Demon Slayer: Mugen Train Dethrones Spirited Away to Become the No. 1 Film in Japan of All Time","author":"harding","year":"0"},{"key":"ref6","article-title":"On Large-Batch Training for Deep Learning: Generalization Gap and Sharp Minima","author":"keskar","year":"2017","journal-title":"arXiv 1609 04836 [cs math]"},{"key":"ref29","article-title":"Deep Residual Learning for Image Recognition","author":"he","year":"2015","journal-title":"arXiv 1512 03385 [cs]"},{"key":"ref5","article-title":"Train faster, generalize better: Stability of stochastic gradient descent","author":"hardt","year":"2016","journal-title":"arXiv 1509 01240 [cs math stat]"},{"key":"ref8","article-title":"Visualizing the Loss Landscape of Neural Nets","author":"li","year":"2018","journal-title":"arXiv 1712 09913 [cs stat]"},{"key":"ref7","article-title":"Revisiting Small Batch Training for Deep Neural Networks","author":"masters","year":"2018","journal-title":"arXiv 1804 07612 [cs stat]"},{"key":"ref2","article-title":"Anime Industry Data |","year":"0"},{"key":"ref9","article-title":"An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale","author":"dosovitskiy","year":"2020","journal-title":"arXiv 2010 11929"},{"key":"ref1","author":"brophy","year":"2007","journal-title":"Tezuka the Marvel of Manga"},{"key":"ref20","article-title":"ImageNet-trained CNNs are biased towards texture; increasing shape bias improves accuracy and robustness","author":"geirhos","year":"2019","journal-title":"ArXiv 1811 12231 [Cs q-Bio Stat]"},{"key":"ref22","article-title":"Towards the Automatic Anime Characters Creation with Generative Adversarial Networks","author":"jin","year":"2017","journal-title":"arXiv 1708 05509"},{"key":"ref21","doi-asserted-by":"publisher","DOI":"10.3390\/jimaging4070087"},{"key":"ref24","article-title":"Diffusion Models Beat GANs on Image Synthesis","author":"dhariwal","year":"2021","journal-title":"arXiv 2105 05233 [cs stat]"},{"key":"ref23","doi-asserted-by":"publisher","DOI":"10.1109\/ACPR.2017.61"},{"key":"ref26","article-title":"Sem-GAN: Semantically-Consistent Image-to-Image Translation","author":"cherian","year":"2018","journal-title":"arXiv 1807 04409 [cs]"},{"key":"ref25","article-title":"Classification Representations Can be Reused for Downstream Generations","author":"gopalakrishnan","year":"2020","journal-title":"arXiv 2004 07543 [cs stat]"}],"event":{"name":"2022 IEEE International Symposium on Circuits and Systems (ISCAS)","location":"Austin, TX, USA","start":{"date-parts":[[2022,5,27]]},"end":{"date-parts":[[2022,6,1]]}},"container-title":["2022 IEEE International Symposium on Circuits and Systems (ISCAS)"],"original-title":[],"link":[{"URL":"http:\/\/xplorestaging.ieee.org\/ielx7\/9937201\/9937203\/09937519.pdf?arnumber=9937519","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2022,11,28]],"date-time":"2022-11-28T20:22:58Z","timestamp":1669666978000},"score":1,"resource":{"primary":{"URL":"https:\/\/ieeexplore.ieee.org\/document\/9937519\/"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2022,5,28]]},"references-count":33,"URL":"https:\/\/doi.org\/10.1109\/iscas48785.2022.9937519","relation":{},"subject":[],"published":{"date-parts":[[2022,5,28]]}}}