一、基本信息
标题:决策树算法在学生课程成绩分析中的应用研究
时间:2019
来源:哈尔滨师范大学
关键词:决策树; 信息熵; 信息增益; 信息增益率
二、研究内容
1.信息熵和信息增益:ID3算法 信息熵 E(S)=-P/(P+N)*log2[P/(P+N)]-P/(P+N)*log2[P/(P+N)]
E(Si)=-Pi/(Pi+Ni)*log2[Pi/(Pi+Ni)]-Pi/(Pi+Ni)*log2[Pi/(Pi+Ni)]
条件熵
信息增益 Gain( A ) =E( S ) -E ( A )
C4.5算法 GainR ( A ) =Gain ( A ) /E ( A )
2.决策树技术应用
分析得到的决策树
三、结论
前面聚类分析是从学生成绩对文章进行分析,而这篇文章主要是用决策树算法对学生平时成绩(考勤、回答问题、作业完成)和学生的调查数据信息来进行分析。总结出整个的流程是:数据——构造决策树(使用ID3算法或者C4.5算法计算信息熵、条件熵、信息增益和信息增益率)——建立决策树——修剪决策树。通过前面的文献,学生成绩分析系统现在暂时可以分两模块:1.分析成绩等级(聚类分析) 2.分析影响学生成绩的主要因素(决策树)
四、参考文献
[6]胡明明. 决策树算法在学生课程成绩分析中的应用研究[D].哈尔滨师范大学,2019.