基于卷积Token的Vision Transformer模型的人脸表情识别 |
| |
作者姓名: | 王静 商钰 |
| |
作者单位: | 北华航天工业学院计算机学院 |
| |
基金项目: | 北华航天工业学院研究生创新资助项目(YKY-2023-31); |
| |
摘 要: | ![]() 人脸表情识别有着广泛的应用。本文使用基于卷积Token的Vision Transformer的混合模型实现表情识别。混合模型能够更好地捕捉人脸表情的局部特征以及局部特征之间的相关性。实验使用RafDB和Fer2013Plus数据集,并对比了ResNet、DenseNet、Swin Transformer和CVT模型的精度和分类混合矩阵分析在人脸表情识别中的表现。
|
关 键 词: | 卷积Token Vision Transformer 混合模型 表情识别 混合矩阵 |
|