0. 测试方法
0.1 **PLDA** :通过SDK提取不同CNNs(Caffenet、Googlenet)网络指定层输出作为特征,然后用plda对特征进行训练、分类。统计结果以**单字识别率**为指标。
0.2 **SSL**(structure Sparse Learning): 基于Alexnet训练得到的模型,基于上述模型SSL的模型,基于SSL模型finetune得到的调整模型
1. 模型选用
1.1 Caffenet(conv5_bn) + PLDA
1.2 Alexnet
1.3 Alexnet + SSL
1.4 Alexent + SSL + ft
2. PLDA特征选取层
1.1 conv5_bn
3. 数据集
3.1 train_set_1 : 共6955类(包含汉字、数字、字母)
3.2 train_set_2 : 共600类(包含部分汉字、数字、字母)用于训练PLDA模型,如果使用全部的6955类训练PLDA模型数据量过大,内存和时间消耗较大,在单机上效率很低。
3.3 test:
4. 测试结果
4.1 结果
Baseline1train_val_64_fintune_20160127_,单字识别率: 98.40%;姓名识别率:96.57%.200万次.----姓名+数字
模型 | 特征选取层 | 单字识别率 | 训练数据集 |
---|---|---|---|
caffenet | conv5_bn | 86.65% | train_set_2 |
Alexnet | fc | 95.56% | train_set_1 |
Alexnet+SSL | fc | 92.96% | train_set_1 |
Alexnet+SSL+ft | fc | 95.10% | train_set_1 |
|
|
注:
|
|
4.2 top5 accuracy and time consume
Alexnet
Alexnet+SSL
Alexnet+SSL+ft