zoukankan      html  css  js  c++  java
  • 简化版SMO算法标注

    '''
    随机选择随机数,不等于J
    '''
    def selectJrand(i,m):
        j=i #we want to select any J not equal to i
        while (j==i):
            j = int(random.uniform(0,m))  # 一直在挑选随机数j,直到不等于i,随机数的范围在0~m
        return j  # 返回挑选好的随机数
    
    
    '''
    门限函数
    '''
    def clipAlpha(aj,H,L):  # 最大不能超过H,最小不能低于L
        if aj > H: 
            aj = H
        if L > aj:
            aj = L
        return aj
    
    '''
    简化版的SMO函数
    '''
    def smoSimple(dataMatIn, classLabels, C, toler, maxIter):  # 输入数据,标记,常数C,容错率,最大迭代次数
        dataMatrix = mat(dataMatIn);   # 转换成矩阵
        labelMat = mat(classLabels).transpose()  # 转换成矩阵,并转置,标记成为一个列向量,每一行和数据矩阵对应
        m,n = shape(dataMatrix)  # 行,列    
    
        b = 0;  # 参数b的初始化
        alphas = mat(zeros((m,1)))  # 参数alphas是个list,初始化也是全0,大小等于样本数
        iter = 0  # 当前迭代次数,maxIter是最大迭代次数
    
        while (iter < maxIter):  # 当超过最大迭代次数,推出
            alphaPairsChanged = 0  # 标记位,记录alpha在该次循环中,有没有优化
            for i in range(m):  # 第i个样本
                fXi = float(multiply(alphas,labelMat).T*(dataMatrix*dataMatrix[i,:].T)) + b  # 第i样本的预测类别
                Ei = fXi - float(labelMat[i])#if checks if an example violates KKT conditions  # 误差
    
                #是否可以继续优化
                if ((labelMat[i]*Ei < -toler) and (alphas[i] < C)) or ((labelMat[i]*Ei > toler) and (alphas[i] > 0)):
                    j = selectJrand(i,m)  # 随机选择第j个样本
                    fXj = float(multiply(alphas,labelMat).T*(dataMatrix*dataMatrix[j,:].T)) + b  # 样本j的预测类别
                    Ej = fXj - float(labelMat[j])  # 误差
    
                    alphaIold = alphas[i].copy();  # 拷贝,分配新的内存
                    alphaJold = alphas[j].copy();
    
                    if (labelMat[i] != labelMat[j]):
                        L = max(0, alphas[j] - alphas[i])
                        H = min(C, C + alphas[j] - alphas[i])
                    else:
                        L = max(0, alphas[j] + alphas[i] - C)
                        H = min(C, alphas[j] + alphas[i])
    
                    if L==H: print "L==H"; continue
    
                    eta = 2.0 * dataMatrix[i,:]*dataMatrix[j,:].T - dataMatrix[i,:]*dataMatrix[i,:].T - dataMatrix[j,:]*dataMatrix[j,:].T
    
                    if eta >= 0: print "eta>=0"; continue
    
                    alphas[j] -= labelMat[j]*(Ei - Ej)/eta
                    alphas[j] = clipAlpha(alphas[j],H,L)  # 门限函数阻止alpha_j的修改量过大
    
                    #如果修改量很微小
                    if (abs(alphas[j] - alphaJold) < 0.00001): print "j not moving enough"; continue
    
                    # alpha_i的修改方向相反
                    alphas[i] += labelMat[j]*labelMat[i]*(alphaJold - alphas[j])#update i by the same amount as j
                                                                            #the update is in the oppostie direction
                    # 为两个alpha设置常数项b
                    b1 = b - Ei- labelMat[i]*(alphas[i]-alphaIold)*dataMatrix[i,:]*dataMatrix[i,:].T - labelMat[j]*(alphas[j]-alphaJold)*dataMatrix[i,:]*dataMatrix[j,:].T
                    b2 = b - Ej- labelMat[i]*(alphas[i]-alphaIold)*dataMatrix[i,:]*dataMatrix[j,:].T - labelMat[j]*(alphas[j]-alphaJold)*dataMatrix[j,:]*dataMatrix[j,:].T
                    if (0 < alphas[i]) and (C > alphas[i]): b = b1
                    elif (0 < alphas[j]) and (C > alphas[j]): b = b2
                    else: b = (b1 + b2)/2.0
    
                    # 说明alpha已经发生改变
                    alphaPairsChanged += 1
                    print "iter: %d i:%d, pairs changed %d" % (iter,i,alphaPairsChanged)
    
            #如果没有更新,那么继续迭代;如果有更新,那么迭代次数归0,继续优化
            if (alphaPairsChanged == 0): iter += 1
            else: iter = 0
            print "iteration number: %d" % iter
    
        # 只有当某次优化更新达到了最大迭代次数,这个时候才返回优化之后的alpha和b
        return b,alphas
    

      

  • 相关阅读:
    DHCP服务器搭建
    Nginx Web服务器
    ansible批量管理工具
    同网段存活IP公钥分发脚本
    inotify事件监控工具
    搭建云yum仓库和本地定时yum仓库
    NFS网络文件共享系统
    shell 脚本的讲解 与应用
    awk 命令精讲
    ACL权限控制 及特殊权限
  • 原文地址:https://www.cnblogs.com/shanlizi/p/6944609.html
Copyright © 2011-2022 走看看