原文链接:http://tecdat.cn/?p=23848
原文出处:拓端数据部落公众号
数据简介
该数据集最初来自国家糖尿病/消化/肾脏疾病研究所。数据集的目标是基于数据集中包含的某些诊断测量来诊断性的预测 患者是否患有糖尿病。从较大的数据库中选择这些实例有几个约束条件。尤其是,这里的所有患者都是印第安至少21岁的女性。数据集由多个医学预测变量和一个目标变量组成Outcome。预测变量包括患者的怀孕次数、BMI、胰岛素水平、年龄等。(查看文末了解获取方式)
数据详情
数据格式
csv
字段
怀孕次数
葡萄糖
血压 (mm Hg)
皮层厚度 (mm)
胰岛素 2小时血清胰岛素(mu U / ml
体重指数 (体重/身高)^2
糖尿病谱系功能
年龄 (岁)
类标变量 (0或1)
大小
23.3kb
样本量
768
数据浏览
以前5行数据为例,我们来预览一下:
变量探索:
数据获取
在下面公众号后台回复“糖尿病患者数据”,可获取完整数据。
点击标题查阅相关文章
左右滑动查看更多
01
02
03
04
点击标题查阅往期内容
Python决策树、随机森林、朴素贝叶斯、KNN(K-最近邻居)分类分析银行拉新活动挖掘潜在贷款客户
R语言逻辑回归(Logistic Regression)、回归决策树、随机森林信用卡违约分析信贷数据集
R语言对用电负荷时间序列数据进行K-medoids聚类建模和GAM回归
R语言贝叶斯MCMC:GLM逻辑回归、Rstan线性回归、Metropolis Hastings与Gibbs采样算法实例
R语言逻辑回归、Naive Bayes贝叶斯、决策树、随机森林算法预测心脏病
R语言用Rcpp加速Metropolis-Hastings抽样估计贝叶斯逻辑回归模型的参数
R语言逻辑回归logistic模型分析泰坦尼克titanic数据集预测生还情况
R语言用lme4多层次(混合效应)广义线性模型(GLM),逻辑回归分析教育留级调查数据
R语言随机森林RandomForest、逻辑回归Logisitc预测心脏病数据和可视化分析
R语言基于Bagging分类的逻辑回归(Logistic Regression)、决策树、森林分析心脏病患者
R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险
欲获取全文文件,请点击左下角“阅读原文”。