[阅读笔记]TSNs: Towards Good Practices for Deep Action Recognition

《TSNs: Towards Good Practices for Deep Action Recognition》, 发表于2016 ECCV,主要探讨了深度行为识别领域中的最佳实践。文章指出,现有基于CNN的分类方法在长期时间结构的捕获上不如手工设计的特征,并因视频数据集量不足可能导致过拟合。作为解决方案,文章提出了一个高效模型,专注于长期时间结构的捕获,并讨论了在数据有限的情况下如何有效训练模型,包括跨模态预训练、规范化技术和数据增强,同时还介绍了第一个端到端的视频时序建模模型。