基于卷积Token的Vision Transformer模型的人脸表情识别期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

基于卷积Token的Vision Transformer模型的人脸表情识别

作者姓名：	王静商钰

作者单位：	北华航天工业学院计算机学院

基金项目：	北华航天工业学院研究生创新资助项目（YKY-2023-31）；

摘要：	人脸表情识别有着广泛的应用。本文使用基于卷积Token的Vision Transformer的混合模型实现表情识别。混合模型能够更好地捕捉人脸表情的局部特征以及局部特征之间的相关性。实验使用RafDB和Fer2013Plus数据集，并对比了ResNet、DenseNet、Swin Transformer和CVT模型的精度和分类混合矩阵分析在人脸表情识别中的表现。
关键词：	卷积Token Vision Transformer 混合模型表情识别混合矩阵