人体动作识别是计算机视觉中一个重要且具有挑战性的主题。 最近,卷积神经网络(CNN)为许多图像识别任务建立了令人印象深刻的结果。 CNN通常包含数百万个参数,这些参数在小数据集上训练时容易过拟合。 因此,CNN不会比传统的动作识别方法产生更好的性能。 在这项研究中,作者设计了一种新颖的两流全卷积网络体系结构来进行动作识别,该体系结构可以在保持性能的同时显着减少参数。 为了利用时空特征的优势,使用线性加权融合方法融合两流网络的特征图,并采用视频池化方法构建视频级特征。 同时,作者还证明了改进的密集