一、解释
变异系数(coefficient of variation)又称离散系数,是一个衡量数据离散程度的、没有量纲的统计量。
其值(CV
)为标准差与平均值之比。
变异系数取值一般为:[0, +无穷)
二、实现
import numpy as np
def coefficient_of_variation(data):
mean = np.mean(data) # 平均值
std = np.std(data, ddof=0) # 标准差 自由度
cv = std / mean
return cv
data_test1 = [1,2,3,4,5,6,7]
data_test2 = [1,1,1,4,7,7,7]
print("CV of data_test1:", coefficient_of_variation(data_test1))
print("CV of data_test2:", coefficient_of_variation(data_test2))
# CV of data_test1: 0.5
# CV of data_test2: 0.6943650748294136
三、实际应用
变异系数通常用来比较两组量纲差异明显的数据的离散程度。
例如:两个粉丝数差距显著的社交媒体账号推文点赞数的离散程度。