zoukankan
html css js c++ java
Gini 系数与熵的关系
首先来看二者的基本定义:
⎧
⎩
⎨
⎪
⎪
⎪
⎪
⎪
⎪
⎪
⎪
⎪
⎪
H
(
X
)
=
−
∑
k
=
1
K
p
k
ln
p
k
Gini
(
X
)
=
∑
k
=
1
K
p
k
(
1
−
p
k
)
将
f
(
x
)
=
−
ln
x
在
x
=
1
处进行一阶泰勒展开(忽略高阶无穷小):
f
(
x
)
=
=
=
f
(
x
0
)
+
f
′
(
x
0
)
(
x
−
x
0
)
+
o
(
⋅
)
f
(
1
)
+
f
′
(
1
)
(
x
−
1
)
+
o
(
⋅
)
1
−
x
因此,熵可近似转化为:
H
(
X
)
=
−
∑
k
=
1
K
p
k
ln
p
k
=
∑
k
=
1
K
p
k
(
−
ln
p
k
)
≃
∑
k
=
1
K
p
k
(
1
−
p
k
)
=
Gini
(
X
)
查看全文
相关阅读:
RDD弹性分布式数据集的基本操作
spark-shell的Scala的一些方法详解
浅谈架构
关于MapReduce二次排序的一点解答
mysql 和 hive 和分布式zookeeper和HBASE分布式安装教程
2018暑假总结
暑假总结07
2018暑假总结06
2018暑假总结05
2018暑假总结04
原文地址:https://www.cnblogs.com/mtcnn/p/9421901.html
最新文章
Magento开发文档(一):Magento入门
linux关机重启命令
git下载指定版本的代码
Centos 安装zlib
LINUX动态库(.SO)搜索路径(目录)设置方法
linux下安装boost
Linux编译和安装boost库
Linux中C/C++编译添加头文件和库路径方式
centos安装cmake
centos安装git
热门文章
makefile工作方式
第五次作业
软工第二次作业---数独
第一次课后作业
第三次作业
寒假学习计划
第二次作业
大一上总结
买东西打折switch
冒泡排序对N个数由小到大排序
Copyright © 2011-2022 走看看