这里是效果不好的系列,但可能还是有丁点启示作用。效果好的系列:
opencv自建haartrain分类器,这是一个基于haar特征的一个玩意儿,人脸识别用的挺多的,但他们都可以直接引用一个xml文件,好气哦,做数字识别只有想办法自己建了。
首先先要从opencv的包目录下找到bin文件夹,在把里面的createsamples.exe和haartrain.exe文件拷出来,createsamples文件针对正类数据进行特征描述,而haartrain是结合createsamples的输出文件建立模型。 所以建了两个文件夹分别针对createsamples和haartrain
createsample里面先放一个刚刚的createsamples.exe自建一个sample 文件夹用来存放正确的样本,再写个pos.txt来描述sample,新建一个vec.txt,啥都不写,新建个txt改类型为bat格式,这个用来写命令行总的来说,文件夹是这样的:
pos.txt内容一览:
说明:第一列文件目录及文件名,第二列为目标文件中有多少个正样本的图,第三列与第四列分别为起始x坐标与y坐标,第五列为截取宽度。若是多个目标,再在后面添加坐标,宽高。
create.bat内容一览:
说明:-info + 描述文件,-vec + 输出文件 -w+训练样本宽,-h+高,-num+训练样本数目,算清楚就好了,不是图片数目,而是pos.txt里第二列数值总和。
之后运行create.bat文件,发现vec被填充。如果报错是缺失一系列dll文件,那么把opencv.bin下的文件全部扔到createsample的文件夹下面就好了
将vec.txt文件考入train文件夹,新建一个data文件夹,再像刚才那样建个sample文件夹啊,一个描述文件sample.txt,一个haartrain.bat文件夹。 sample.txt文件如下:
只用给出文件路径就好了
haartrain.bat文件描述:
说明:-vec+vec文件,-bg+描述文件,-npos+正例样本数,和上面计算方法一样,-nneg+负样本数,只用数图个数,-nstages+一个参数,-w+宽,-h+高,-data+新建的文件夹data
弄完就玩了,讲道理会在data目录下生成一堆东西,然而因为样本数太少了,居然什么都没有……绝望……放弃。
另附:自动图片切割代码:
for i in range(1,21): image=cv2.imread("ipadair (%d).jpg"%i) #中间下可以添加预处理的部分,以得到最好效果 #image[起始y:终止y,起始x:终止x] train = image[liney10:liney11, linex10:linex11] cv2.imwrite('1'+'%d'%i+'.jpg',train)