python实现信息熵的计算代码-图灵python

400-090-8899

导航

图灵python

首页

关于我们

课程大纲

图灵AI

图灵资讯

Python全套实战项目

当前位置：首页 > 图灵资讯 > 行业资讯> python实现信息熵的计算代码

python实现信息熵的计算代码

发布时间:2024-09-04 20:05:11

1、什么是信息熵？

1948年，香农提出了信息熵（Entropy）的概念。

信息理论：

1、描述信息的完整性：

当系统的有序状态一致时，数据集中的地方熵越小，数据分散的地方熵越大。

2、描述信息的有序性：

当数据量一致时，系统越有序，熵越低；系统越混乱或分散，熵越高。

“信息熵” (information entropy)是测量样本集合纯度最常用的指标。

二、python实现信息熵的计算代码

1、导入库

importnumpyasnp
importpandasaspd

2、准备数据

data=pd.DataFrame(
{'学历':['专科','专科','专科','专科','专科','本科','本科','本科','本科','本科',
'研究生','研究生','研究生','研究生','研究生'],
'婚否':['否','否','是','是','否','否','否','是','否','否','否','否','是','是','否'],
'是否有汽车':['否','否','否','是','否','否','否','是','是','是','是','是','否','否',
'否'],
'收入水平':['中','高','高','中','中','中','高','高','很高','很高','很高','高','高',
'很高','中'],
'类别':['否','否','是','是','否','否','否','是','是','是','是','是','是','是','否']})

3、定义信息熵函数

#定义计算信息熵的函数：计算Inforr(D)
definfor(data):
a=pd.value_counts(data)/len(data)
returnsum(np.log2(a)*a*(-1))

4、数据测试

#print(infor(data["学历"]))#测试结果为1.584962007156

上一篇python中如何实现信息增益和信息增益率

下一篇 python中合并表格的两种方法

相关文章

如何让vim支持python3

如何让vim支持python3

python2.7和3.6区别有哪些

python2.7和3.6区别有哪些

python3有serial库吗

python3有serial库吗

python中w、r表示什么意思

python中w、r表示什么意思

python中如何把list变成字符串

python中如何把list变成字符串

python命名空间是什么

python命名空间是什么