silver lining's blog

OCR更换56947数据集测试报告

0. 测试方法

0.1 **PLDA** :通过SDK提取不同CNNs(Caffenet、Googlenet)网络指定层输出作为特征,然后用plda对特征进行训练、分类。统计结果以**单字识别率**为指标。
0.2 **SSL**(structure Sparse Learning): 基于Alexnet训练得到的模型,基于上述模型SSL的模型,基于SSL模型finetune得到的调整模型

1. 模型选用

1.1 Caffenet(conv5_bn) + PLDA
1.2 Alexnet
1.3 Alexnet + SSL
1.4 Alexent + SSL + ft

2. PLDA特征选取层

1.1 conv5_bn

3. 数据集

3.1 train_set_1 : 共6955类(包含汉字、数字、字母)

3.2 train_set_2 : 共600类(包含部分汉字、数字、字母)用于训练PLDA模型,如果使用全部的6955类训练PLDA模型数据量过大,内存和时间消耗较大,在单机上效率很低。

3.3 test: 2481张身份证上分割得到,包含了地址、姓名两个大类别(日期和身份证号没有包含在内,但是地址包含了部分数字)共有56947个测试样本

4. 测试结果

4.1 结果

Baseline

1
train_val_64_fintune_20160127_,单字识别率: 98.40%;姓名识别率:96.57%.200万次.----姓名+数字

模型 特征选取层 单字识别率 训练数据集
caffenet conv5_bn 86.65% train_set_2
Alexnet fc 95.56% train_set_1
Alexnet+SSL fc 92.96% train_set_1
Alexnet+SSL+ft fc 95.10% train_set_1
1
2
3
graph LR
Alexnet-->Alexnet+SSL
Alexnet+SSL-->Alexnet+SSL+ft

注:

1
2
3
1. 用于测试的Alexnet模型是通过简化过fc层的alexnet网络训练得到
2. Alexnet+SSL基于Alexnet加入结构稀疏得到的模型
3. Alexnet+SSL+ft是通过ALexnet+SSL模型经过finetune(微调学习率得到的测试结果)
4.2 top5 accuracy and time consume

Alexnet

image

Alexnet+SSL

image

Alexnet+SSL+ft

image