sklearn库学习之01

import numpy as np
import urllib.request
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier

url = "http://archive.ics.uci.edu/ml/machine-learning-databases/pima-indians-diabetes/pima-indians-diabetes.data"
# 下载网络数据
raw_data = urllib.request.urlopen(url)
# 处理网络下载的数据为矩阵,方便后面的数据操作
dataset = np.loadtxt(raw_data, delimiter=",")
# 提取特征矩阵数据，dataset中的所有行，所有0-7列的数据都保存在X中
X = dataset[:,0:7]
# 提取目标变量数据，dataset中的所有行，所有8列的数据都保存在y中
y = dataset[:,8]

# 随机选择25%作为测试集，剩余作为训练集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.05, random_state=0)

# k-最近邻
def KNN(X,y,XX):#X,y 分别为训练数据集的数据和标签，XX为测试数据
    model = KNeighborsClassifier(n_neighbors=10)#默认为5
    model.fit(X,y)
    print(y_test)
    predicted = model.predict(XX)
    return predicted

a = KNN(X_train,y_train,X_test)
print(a)

# 测试训练模型的正确率
count = 0
for i in range(len(a)):
    if a[1] == y_test[i]:
        count += 1

counts = count/len(a)
print("正确率可以达到：",counts)

查看全文

相关阅读:
BZOJ4916: 神犇和蒟蒻杜教筛
 BZOJ 4816: [Sdoi2017]数字表格莫比乌斯反演
 BZOJ 4407: 于神之怒加强版莫比乌斯反演 + 线筛积性函数
 BZOJ 3963: [WF2011]MachineWorks 斜率优化 + splay动态维护凸包
 BZOJ 1492: [NOI2007]货币兑换Cash 斜率优化 + splay动态维护凸包
 BZOJ 3306: 树 LCT + set 维护子树信息
 小A与最大子段和斜率优化 + 二分 + 细节
 BZOJ 3675: [Apio2014]序列分割动态规划 + 斜率优化 + 卡精度
 BZOJ 2726: [SDOI2012]任务安排斜率优化 + 凸壳二分 + 卡精
 luoguP2365 任务安排斜率优化 + 动态规划

原文地址：https://www.cnblogs.com/lcl15/p/7977804.html