zoukankan      html  css  js  c++  java
  • 使用KNN算法手写体识别

    1. #!/usr/bin/python  
    2. #coding:utf-8  
    3.   
    4. import numpy as np  
    5. import operator  
    6. import matplotlib  
    7. import matplotlib.pyplot as plt  
    8. import os  
    9.   
    10. ''''' 
    11. KNN算法 
    12. 1. 计算已知类别数据集中的每个点依次执行与当前点的距离。 
    13. 2. 按照距离递增排序。 
    14. 3. 选取与当前点距离最小的k个点 
    15. 4. 确定前k个点所在类别的出现频率 
    16. 5. 返回前k个点出现频率最高的类别作为当前点的预测分类 
    17. '''  
    18.   
    19. ''''' 
    20. inX为要分类的向量 
    21. dataSet为训练样本 
    22. labels为标签向量 
    23. k为最近邻的个数 
    24. '''  
    25. def classify0(inX , dataSet , labels , k):  
    26.     dataSetSize = dataSet.shape[0]#dataSetSize为训练样本的个数  
    27.     diffMat = np.tile(inX , (dataSetSize , 1)) - dataSet#将inX扩展为dataSetSize行,1列  
    28.     sqDiffMat = diffMat**2  
    29.     sqDistances = sqDiffMat.sum(axis=1)  
    30.     distances = sqDistances**0.5  
    31.     sortedDistIndicies = distances.argsort()#返回的是元素从小到大排序后,该元素原来的索引值的序列  
    32.     classCount = {}  
    33.     for i in range(k):  
    34.         voteIlabel = labels[sortedDistIndicies[i]]#voteIlabel为类别  
    35.         classCount[voteIlabel] = classCount.get(voteIlabel,0)+1#如果之前这个voteIlabel是有的,那么就返回字典里这个voteIlabel里的值,如果没有就返回0  
    36.     sortedClassCount = sorted(classCount.iteritems(),key=operator.itemgetter(1),reverse=True)#key=operator.itemgetter(1)的意思是按照字典里的第一个排序,{A:1,B:2},要按照第1个(AB是第0个),即‘1’‘2’排序。reverse=True是降序排序  
    37.     print sortedClassCount  
    38.     return sortedClassCount[0][0]  
    39.   
    40.   
    41. ''''' 
    42. 将图像转换为1*1024的向量 
    43. '''  
    44. def img2vector(filename):  
    45.     returnVect = np.zeros((1,1024))  
    46.     fr = open(filename)  
    47.     for i in range(32):  
    48.         line = fr.readline()  
    49.         for j in range(32):  
    50.             returnVect[0,i*32+j] = int(line[j] )  
    51.     return returnVect  
    52.   
    53. ''''' 
    54. 手写体识别系统测试 
    55. '''  
    56. def handwritingClassTest(trainFilePath,testFilePath):  
    57.     hwLabels = []  
    58.     trainingFileList = os.listdir(trainFilePath)  
    59.     m=len(trainingFileList)  
    60.     trainSet = np.zeros((m,1024))  
    61.     for i in range(m):  
    62.         filename = trainingFileList[i]  
    63.         classNum = filename.split('.')[0]  
    64.         classNum = int(classNum.split('_')[0])  
    65.         hwLabels.append(classNum)  
    66.         trainSet[i] = img2vector( os.path.join(trainFilePath,filename) )  
    67.     testFileList = os.listdir(testFilePath)  
    68.     errorCount = 0  
    69.     mTest = len(testFileList)  
    70.     for i in range(mTest):  
    71.         filename = trainingFileList[i]  
    72.         classNum = filename.split('.')[0]  
    73.         classNum = int(classNum.split('_')[0])  
    74.         vectorUnderTest = img2vector(os.path.join(trainFilePath, filename))  
    75.         classifyNum = classify0(vectorUnderTest,trainSet,hwLabels,10)  
    76.         print "the classifier came back with : %d , the real answer is : %d"% (classifyNum , classNum)  
    77.         if(classifyNum != classNum) : errorCount+=1  
    78.     print (" the total number of error is : %d"%errorCount)  
    79.     print (" the error rate is : %f"%(float(errorCount)/mTest))  
    80. handwritingClassTest()
  • 相关阅读:
    iOS学习——Xcode9上传项目到GitHub
    iOS 中 常用的第三方库
    ios中pch文件的创建与配置
    BlocksKit的使用
    IOS按需返回刷新数据
    16-CoreData之多表关联(存储自定义数据模型)
    分解gif图片并保存
    (转)jQuery基础之选择器
    (转)那天有个小孩教我WCF[一][1/3]
    (转)Expression 表达式树学习整理
  • 原文地址:https://www.cnblogs.com/Lambda721/p/8397453.html
Copyright © 2011-2022 走看看