zoukankan
html css js c++ java
机器学习中文教程
介绍
sklearn (scikit-learn) 是基于 Python 语言的机器学习工具
简单高效的数据挖掘和数据分析工具
可供大家在各种环境中重复使用
建立在 NumPy ,SciPy 和 matplotlib 上
开源,可商业使用 - BSD许可证
目录
安装 scikit-learn
用户指南
1. 监督学习
1.1. 广义线性模型
1.2. 线性和二次判别分析
1.3. 内核岭回归
1.4. 支持向量机
1.5. 随机梯度下降
1.6. 最近邻
1.7. 高斯过程
1.8. 交叉分解
1.9. 朴素贝叶斯
1.10. 决策树
1.11. 集成方法
1.12. 多类和多标签算法
1.13. 特征选择
1.14. 半监督学习
1.15. 等式回归
1.16. 概率校准
1.17. 神经网络模型(有监督)
2. 无监督学习
2.1. 高斯混合模型
2.2. 流形学习
2.3. 聚类
2.4. 双聚类
2.5. 分解成分中的信号(矩阵分解问题)
2.6. 协方差估计
2.7. 新奇和异常值检测
2.8. 密度估计
2.9. 神经网络模型(无监督)
3. 模型选择和评估
3.1. 交叉验证:评估估算器的表现
3.2. 调整估计器的超参数
3.3. 模型评估: 量化预测的质量
3.4. 模型持久化
3.5. 验证曲线: 绘制分数以评估模型
4. 检验
4.1. 部分依赖图
5. 数据集转换
5.1. Pipeline(管道)和 FeatureUnion(特征联合): 合并的评估器
5.2. 特征提取
5.3 预处理数据
5.4 缺失值插补
5.5. 无监督降维
5.6. 随机投影
5.7. 内核近似
5.8. 成对的矩阵, 类别和核函数
5.9. 预测目标 (
y
) 的转换
6. 数据集加载工具
6.1. 通用数据集 API
6.2. 玩具数据集
6.3 真实世界中的数据集
6.4. 样本生成器
6.5. 加载其他数据集
7. 使用scikit-learn计算
7.1. 大规模计算的策略: 更大量的数据
7.2. 计算性能
7.3. 并行性、资源管理和配置
教程
使用 scikit-learn 介绍机器学习
关于科学数据处理的统计学习教程
机器学习: scikit-learn 中的设置以及预估对象
监督学习:从高维观察预测输出变量
模型选择:选择估计量及其参数
无监督学习: 寻求数据表示
把它们放在一起
寻求帮助
处理文本数据
选择正确的评估器(estimator.md)
外部资源,视频和谈话
API 参考
常见问题
时光轴
谁不是孤身一人,翻山越岭
查看全文
相关阅读:
Spring知识整理
业务开发(四)—— 服务器
TCP/IP协议知识整理
XSS
Java并发编程(一) —— 线程
业务开发(三)—— 前端
Effective Java——(一)创建和销毁对象
Java编程思想——异常
Git使用
网络基础(一)
原文地址:https://www.cnblogs.com/hasz/p/12977580.html
最新文章
java类加载全过程
JAVA 字节码操作利器javassist
Rhino脚本引擎技术介绍
Java 动态编译
PowerDesigner最基础的使用方法入门学习
PowerDesigner生成数据库时的列中文注释乱码问题的设置方法
使用POWERDESIGNER设计数据库的20条技巧
书籍推荐
spring 中常用的两种事务配置方式
oracle数据库数据转储最好方式(数据库表、数据结构和数据一并导出)
热门文章
浅谈SQL优化入门:2、等值连接和EXPLAIN(MySQL)
浅谈SQL优化入门:1、SQL查询语句的执行顺序
微信公众号开发 [05] 微信支付功能开发(网页JSAPI调用)
读取配置文件的正确姿势(关于配置文件的路径获取)
使用IntelliJ IDEA查看类的继承关系图形
微信公众号开发 [04] 模板消息功能的开发
微信公众号开发 [03] 结合UEditor实现图文消息群发功能
《MySQL必知必会》[03] 表数据的增删改
《Head First Java》读书笔记(3)
《MySQL必知必会》[02] 多表联合查询
Copyright © 2011-2022 走看看