@dragonfive
2015-08-25T08:38:50.000000Z
字数 2152
阅读 565
python编程
最近在做船只检测的工作需要大量的正样本,之前的一些样本各种形态的船只都有,这一次训练分类器希望使用只含船只侧面的图像,这样检测船的侧面的成功率可能会提高一点。这样就需要大量的船只侧面图像,并生成描述文件。这里我们之前已经生成过全船只的描述文件,只需要挑出侧面的图像,然后根据有的图像从原描述文件中选取存在的图像的描述信息保存在新的描述文件
描述文件的内容大概是这个样子的
224871_0.jpg 1 6 50 248 82224871_10.jpg 1 16 79 269 89224871_11.jpg 1 80 53 122 40224871_12.jpg 1 53 57 219 79224871_13.jpg 1 16 94 251 72224871_14.jpg 1 20 79 197 66224871_15.jpg 1 6 69 294 98224871_16.jpg 1 91 86 155 54224871_17.jpg 1 51 70 202 72224871_18.jpg 1 6 42 294 99224871_19.jpg 1 9 36 291 98224871_1.jpg 1 37 77 243 81224871_20.jpg 1 27 27 248 83224871_21.jpg 1 40 63 250 80224871_22.jpg 1 18 65 234 78224871_23.jpg 1 12 51 272 89224871_24.jpg 1 21 83 252 73224871_25.jpg 1 32 62 230 75224871_26.jpg 1 0 61 298 99224871_27.jpg 1 8 100 271 83224871_28.jpg 1 0 60 275 92224871_29.jpg 1 72 100 151 49224871_2.jpg 1 62 46 179 60224871_30.jpg 1 137 64 149 49224871_31.jpg 1 34 119 240 80
思路很简单,就是读一行看看那个jpg文件在不在文件夹里面,如果在的话,就把这行复制进新的描述文件。
import glob,osunfound=0 (u'D:/IP_CV_WorkSpace/Img/第三批分类器/pos8/*.jpg')]with open(u'D:/IP_CV_WorkSpace/Img/第三批分类器/pos8/info.txt', 'r') as f:with open(u'D:/IP_CV_WorkSpace/Img/第三批分类器/pos8/pos8.txt', 'w') as w:for filetitle in f.readlines():if filetitle.split(u' ')[0] in [os.path.split(filename)[-1] for filename in glob.glob (u'D:/IP_CV_WorkSpace/Img/第三批分类器/pos8/*.jpg')]:w.write(filetitle)else:unfound=unfound+1print u'一共有%s个图片没找到' % unfound
这个代码挺短的,但是云讯速度却很慢原因在于第6行每次都要算一下整个集合,太慢了,所以可以优化
import glob,osunfound,filenamelist=0,[os.path.split(filename)[-1] for filename in glob.glob (u'D:/IP_CV_WorkSpace/Img/第三批分类器/pos8/*.jpg')]with open(u'D:/IP_CV_WorkSpace/Img/第三批分类器/pos8/info.txt', 'r') as f:with open(u'D:/IP_CV_WorkSpace/Img/第三批分类器/pos8/pos8.txt', 'w') as w:for filetitle in f.readlines():if filetitle.split(u' ')[0] in filenamelist:w.write(filetitle)else:unfound=unfound+1print u'一共有%s个图片没找到' % unfound
同样行数的代码速度提高了
import glob,osunfound,filenamelist=0,[os.path.split(filename)[-1] for filename in glob.glob (u'D:/IP_CV_WorkSpace/Img/第三批分类器/pos8/*.jpg')]with open(u'D:/IP_CV_WorkSpace/Img/第三批分类器/pos8/info.txt', 'r') as f:with open(u'D:/IP_CV_WorkSpace/Img/第三批分类器/pos8/pos8.txt', 'w') as w:filelist=f.readlines();found=[w.write(filetitle) for filetitle in filelist if filetitle.split(u' ')[0] in filenamelist]print u'一共有%s个图片没找到' % (len(filelist)-len(found))
使用列表生成器代码更短啦