{"status":"ok","message-type":"work","message-version":"1.0.0","message":{"indexed":{"date-parts":[[2025,5,21]],"date-time":"2025-05-21T04:41:01Z","timestamp":1747802461773,"version":"3.41.0"},"publisher-location":"Cham","reference-count":42,"publisher":"Springer International Publishing","isbn-type":[{"type":"print","value":"9783319161778"},{"type":"electronic","value":"9783319161785"}],"license":[{"start":{"date-parts":[[2015,1,1]],"date-time":"2015-01-01T00:00:00Z","timestamp":1420070400000},"content-version":"tdm","delay-in-days":0,"URL":"http:\/\/www.springer.com\/tdm"}],"content-domain":{"domain":["link.springer.com"],"crossmark-restriction":false},"short-container-title":[],"published-print":{"date-parts":[[2015]]},"DOI":"10.1007\/978-3-319-16178-5_39","type":"book-chapter","created":{"date-parts":[[2015,3,18]],"date-time":"2015-03-18T18:28:20Z","timestamp":1426703300000},"page":"552-571","update-policy":"https:\/\/doi.org\/10.1007\/springer_crossmark_policy","source":"Crossref","is-referenced-by-count":9,"title":["Deep Dynamic Neural Networks for Gesture Segmentation and Recognition"],"prefix":"10.1007","author":[{"given":"Di","family":"Wu","sequence":"first","affiliation":[]},{"given":"Ling","family":"Shao","sequence":"additional","affiliation":[]}],"member":"297","published-online":{"date-parts":[[2015,3,19]]},"reference":[{"key":"39_CR1","doi-asserted-by":"crossref","unstructured":"Escalera, S., Bar, X., Gonzlez, J., Bautista, M., Madadi, M., Reyes, M., Ponce, V., Escalante, H., Shotton, J., Guyon, I.: Chalearn looking at people challenge 2014: dataset and results. In: European Conference on Computer Vision workshop (2014)","DOI":"10.1007\/978-3-319-16178-5_32"},{"key":"39_CR2","doi-asserted-by":"publisher","DOI":"10.1016\/j.patcog.2014.07.006","author":"L Liu","year":"2014","unstructured":"Liu, L., Shao, L., Zheng, F., Li, X.: Realistic action recognition via sparsely-constructed gaussian processes. Pattern Recognition (2014). doi: 10.1016\/j.patcog.2014.07.006","journal-title":"Pattern Recognition"},{"issue":"6","key":"39_CR3","doi-asserted-by":"publisher","first-page":"817","DOI":"10.1109\/TCYB.2013.2273174","volume":"44","author":"L Shao","year":"2014","unstructured":"Shao, L., Zhen, X., Li, X.: Spatio-temporal laplacian pyramid coding for action recognition. IEEE Transactions on Cybernetics 44(6), 817\u2013827 (2014)","journal-title":"IEEE Transactions on Cybernetics"},{"issue":"2","key":"39_CR4","doi-asserted-by":"publisher","first-page":"236","DOI":"10.1109\/TCSVT.2012.2203731","volume":"23","author":"D Wu","year":"2013","unstructured":"Wu, D., Shao, L.: Silhouette analysis-based action recognition via exploiting human poses. IEEE Transactions on Circuits and Systems for Video Technology 23(2), 236\u2013243 (2013)","journal-title":"IEEE Transactions on Circuits and Systems for Video Technology"},{"key":"39_CR5","doi-asserted-by":"crossref","unstructured":"Laptev, I.: On space-time interest points. International Journal of Computer Vision (2005)","DOI":"10.1007\/s11263-005-1838-7"},{"key":"39_CR6","unstructured":"Doll\u00e1r, P., Rabaud, V., Cottrell, G., Belongie, S.: Behavior recognition via sparse spatio-temporal features. In: Visual Surveillance and Performance Evaluation of Tracking and Surveillance. IEEE (2005)"},{"key":"39_CR7","series-title":"Lecture Notes in Computer Science","doi-asserted-by":"publisher","first-page":"650","DOI":"10.1007\/978-3-540-88688-4_48","volume-title":"Computer Vision \u2013 ECCV 2008","author":"G Willems","year":"2008","unstructured":"Willems, G., Tuytelaars, T., Van Gool, L.: An efficient dense and scale-invariant spatio-temporal interest point detector. In: Forsyth, D., Torr, P., Zisserman, A. (eds.) ECCV 2008, Part II. LNCS, vol. 5303, pp. 650\u2013663. Springer, Heidelberg (2008)"},{"key":"39_CR8","doi-asserted-by":"crossref","unstructured":"Scovanner, P., Ali, S., Shah, M.: A 3-dimensional sift descriptor and its application to action recognition. In: International Conference on Multimedia. ACM (2007)","DOI":"10.1145\/1291233.1291311"},{"key":"39_CR9","doi-asserted-by":"crossref","unstructured":"Klaser, A., Marszalek, M., Schmid, C.: A Spatio-temporal descriptor based on 3D-gradients. In: British Machine Vision Conference (2008)","DOI":"10.5244\/C.22.99"},{"key":"39_CR10","doi-asserted-by":"crossref","unstructured":"Wang, H., Kl\u00e4ser, A., Schmid, C., Liu, C.L.: Dense trajectories and motion boundary descriptors for action recognition. International Journal of Computer Vision (2013)","DOI":"10.1007\/s11263-012-0594-8"},{"issue":"1","key":"39_CR11","doi-asserted-by":"publisher","first-page":"244","DOI":"10.1109\/TIP.2012.2202678","volume":"22","author":"T Zhou","year":"2013","unstructured":"Zhou, T., Tao, D.: Double shrinking sparse dimension reduction. IEEE Transactions on Image Processing 22(1), 244\u2013257 (2013)","journal-title":"IEEE Transactions on Image Processing"},{"issue":"8","key":"39_CR12","doi-asserted-by":"publisher","first-page":"1559","DOI":"10.1109\/TPAMI.2013.2296528","volume":"36","author":"C Xu","year":"2014","unstructured":"Xu, C., Tao, D.: Large-margin multi-view information bottleneck. IEEE Trans. Pattern Anal. Mach. Intell. 36(8), 1559\u20131572 (2014)","journal-title":"IEEE Trans. Pattern Anal. Mach. Intell."},{"key":"39_CR13","doi-asserted-by":"crossref","unstructured":"Wang, H., Ullah, M.M., Klaser, A., Laptev, I., Schmid, C., et al.: Evaluation of local spatio-temporal features for action recognition. In: British Machine Vision Conference (2009)","DOI":"10.5244\/C.23.124"},{"key":"39_CR14","series-title":"Lecture Notes in Computer Science","doi-asserted-by":"publisher","first-page":"379","DOI":"10.1007\/978-3-642-15567-3_28","volume-title":"Computer Vision \u2013 ECCV 2010","author":"J Yuan","year":"2010","unstructured":"Yuan, J., Bae, E., Tai, X.-C., Boykov, Y.: A continuous max-flow approach to potts model. In: Daniilidis, K., Maragos, P., Paragios, N. (eds.) ECCV 2010, Part VI. LNCS, vol. 6316, pp. 379\u2013392. Springer, Heidelberg (2010)"},{"key":"39_CR15","doi-asserted-by":"crossref","unstructured":"Le, Q.V., Zou, W.Y., Yeung, S.Y., Ng, A.Y.: Learning hierarchical invariant spatio-temporal features for action recognition with independent subspace analysis. In: IEEE Conference on Computer Vision and Pattern Recognition (2011)","DOI":"10.1109\/CVPR.2011.5995496"},{"key":"39_CR16","doi-asserted-by":"crossref","unstructured":"Baccouche, M., Mamalet, F., Wolf, C., Garcia, C., Baskurt, A.: Spatio-temporal convolutional sparse auto-encoder for sequence classification. In: British Machine Vision Conference (2012)","DOI":"10.5244\/C.26.124"},{"key":"39_CR17","doi-asserted-by":"crossref","unstructured":"Hinton, G.E., Osindero, S., Teh, Y.W.: A fast learning algorithm for deep belief nets. Neural Computation (2006)","DOI":"10.1162\/neco.2006.18.7.1527"},{"key":"39_CR18","unstructured":"Schmidhuber, J.: Deep learning in neural networks: An overview (2014). arXiv preprint arXiv:1404.7828"},{"key":"39_CR19","unstructured":"Krizhevsky, A., Sutskever, I., Hinton, G.E.: Imagenet classification with deep convolutional neural networks. In: Neural Information Processing Systems (2012)"},{"key":"39_CR20","doi-asserted-by":"crossref","unstructured":"Ciresan, D., Meier, U., Schmidhuber, J.: Multi-column deep neural networks for image classification. In: IEEE Conference on Computer Vision and Pattern Recognition (2012)","DOI":"10.1109\/CVPR.2012.6248110"},{"key":"39_CR21","unstructured":"Shuiwang Ji, Wei Xu, M.Y., Yu, K.: 3d convolutional neural networks for human action recognition. In: International Conference on Machine Learning. IEEE (2010)"},{"key":"39_CR22","doi-asserted-by":"crossref","unstructured":"Ji, S., Xu, W., Yang, M., Yu, K.: 3d convolutional neural networks for human action recognition. IEEE Transactions on Pattern Analysis and Machine Intelligence (2013)","DOI":"10.1109\/TPAMI.2012.59"},{"key":"39_CR23","doi-asserted-by":"crossref","unstructured":"Mohamed, A., Dahl, G.E., Hinton, G.: Acoustic modeling using deep belief networks. IEEE Transactions on Speech, and Language Processing, Audio (2012)","DOI":"10.1109\/TASL.2011.2109382"},{"key":"39_CR24","doi-asserted-by":"crossref","unstructured":"Wu, D., Shao, L.: Leveraging hierarchical parametric networks for skeletal joints based action segmentation and recognition. In: IEEE Conference on Computer Vision and Pattern Recognition (2014)","DOI":"10.1109\/CVPR.2014.98"},{"key":"39_CR25","doi-asserted-by":"crossref","unstructured":"Shotton, J., Fitzgibbon, A., Cook, M., Sharp, T., Finocchio, M., Moore, R., Kipman, A., Blake, A.: Real-time human pose recognition in parts from single depth images. In: IEEE Conference on Computer Vision and Pattern Recognition (2011)","DOI":"10.1109\/CVPR.2011.5995316"},{"issue":"5","key":"39_CR26","first-page":"1317","volume":"43","author":"J Han","year":"2013","unstructured":"Han, J., Shao, L., Shotton, J.: Enhanced computer vision with microsoft kinect sensor: a review. IEEE Transactions on Cybernetics 43(5), 1317\u20131333 (2013)","journal-title":"IEEE Transactions on Cybernetics"},{"key":"39_CR27","doi-asserted-by":"crossref","unstructured":"Escalera, S., Gonzlez, J., Bar, X., Reyes, M., Lops, O., Guyon, I., Athitsos, V., Escalante, H.J.: Multi-modal gesture recognition challenge 2013: dataset and results. In: ACM ChaLearn Multi-Modal Gesture Recognition Grand Challenge and Workshop (2013)","DOI":"10.1145\/2522848.2532597"},{"key":"39_CR28","doi-asserted-by":"crossref","unstructured":"Fothergill, S., Mentis, H.M., Kohli, P., Nowozin, S.: Instructing people for training gestural interactive systems. In: ACM Computer Human Interaction (2012)","DOI":"10.1145\/2207676.2208303"},{"key":"39_CR29","doi-asserted-by":"crossref","unstructured":"Guyon, I., Athitsos, V., Jangyodsuk, P., Hamner, B., Escalante, H.J.: Chalearn gesture challenge: design and first results. In: IEEE Conference on Computer Vision and Pattern Recognition Workshops (2012)","DOI":"10.1109\/CVPRW.2012.6239178"},{"key":"39_CR30","unstructured":"Wang, J., Liu, Z., Wu, Y., Yuan, J.: Mining actionlet ensemble for action recognition with depth cameras. In: IEEE Conference on Computer Vision and Pattern Recognition (2012)"},{"key":"39_CR31","doi-asserted-by":"crossref","unstructured":"Lehrmann, A., Gehler, P., Nowozin, S.: A non-parametric bayesian network prior of human pose. In: International Conference on Computer Vision (2013)","DOI":"10.1109\/ICCV.2013.162"},{"key":"39_CR32","unstructured":"Nowozin, S., Shotton, J.: Action points: A representation for low-latency online human action recognition. Technical report (2012)"},{"key":"39_CR33","unstructured":"Bishop, C.: Pattern recognition and machine learning. Springer (2006)"},{"key":"39_CR34","doi-asserted-by":"crossref","unstructured":"Chaudhry, R., Ofli, F., Kurillo, G., Bajcsy, R., Vidal, R.: Bio-inspired dynamic 3d discriminative skeletal features for human action recognition. In: IEEE Conference on Computer Vision and Pattern Recognition Workshops (2013)","DOI":"10.1109\/CVPRW.2013.153"},{"key":"39_CR35","unstructured":"M\u00fcller, M., R\u00f6der, T.: Motion templates for automatic classification and retrieval of motion capture data. In: SIGGRAPH\/Eurographics Symposium on Computer Animation, Eurographics Association (2006)"},{"key":"39_CR36","doi-asserted-by":"crossref","unstructured":"Ofli, F., Chaudhry, R., Kurillo, G., Vidal, R., Bajcsy, R.: Sequence of the most informative joints (smij): A new representation for human skeletal action recognition. Journal of Visual Communication and Image Representation (2013)","DOI":"10.1109\/CVPRW.2012.6239231"},{"key":"39_CR37","doi-asserted-by":"crossref","unstructured":"Torralba, A., Efros, A.A.: Unbiased look at dataset bias. In: IEEE Conference on Computer Vision and Pattern Recognition (2011)","DOI":"10.1109\/CVPR.2011.5995347"},{"key":"39_CR38","unstructured":"Mnih, V., Kavukcuoglu, K., Silver, D., Graves, A., Antonoglou, I., Wierstra, D., Riedmiller, M.: Playing atari with deep reinforcement learning (2013). arXiv preprint arXiv:1312.5602"},{"key":"39_CR39","doi-asserted-by":"crossref","unstructured":"Wu, D., Zhu, F., Shao, L.: One shot learning gesture recognition from RGBD images. In: International Conference on Computer Vision and Pattern Recognition Workshops (2012)","DOI":"10.1109\/CVPRW.2012.6239179"},{"key":"39_CR40","first-page":"120","volume":"10","author":"J Lewis","year":"1995","unstructured":"Lewis, J.: Fast normalized cross-correlation. Vision Interface 10, 120\u2013123 (1995)","journal-title":"Vision Interface"},{"key":"39_CR41","unstructured":"Bradski, G. Dr. Dobb\u2019s Journal of Software Tools"},{"key":"39_CR42","doi-asserted-by":"crossref","unstructured":"Bergstra, J., Breuleux, O., Bastien, F., Lamblin, P., Pascanu, R., Desjardins, G., Turian, J., Warde-Farley, D., Bengio, Y.: Theano: a CPU and GPU math expression compiler. In: Proceedings of the Python for Scientific Computing Conference (SciPy) (2010)","DOI":"10.25080\/Majora-92bf1922-003"}],"container-title":["Lecture Notes in Computer Science","Computer Vision - ECCV 2014 Workshops"],"original-title":[],"language":"en","link":[{"URL":"http:\/\/link.springer.com\/content\/pdf\/10.1007\/978-3-319-16178-5_39","content-type":"unspecified","content-version":"vor","intended-application":"similarity-checking"}],"deposited":{"date-parts":[[2025,5,21]],"date-time":"2025-05-21T02:41:31Z","timestamp":1747795291000},"score":1,"resource":{"primary":{"URL":"http:\/\/link.springer.com\/10.1007\/978-3-319-16178-5_39"}},"subtitle":[],"short-title":[],"issued":{"date-parts":[[2015]]},"ISBN":["9783319161778","9783319161785"],"references-count":42,"URL":"https:\/\/doi.org\/10.1007\/978-3-319-16178-5_39","relation":{},"ISSN":["0302-9743","1611-3349"],"issn-type":[{"type":"print","value":"0302-9743"},{"type":"electronic","value":"1611-3349"}],"subject":[],"published":{"date-parts":[[2015]]},"assertion":[{"value":"19 March 2015","order":1,"name":"first_online","label":"First Online","group":{"name":"ChapterHistory","label":"Chapter History"}}]}}