决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。由于这种决策分支画成图形很像一棵树的枝干,故称决策树。在机器学习中,决策树是一个预测模型,他代表的是对象属性与对象值之间的一种映射关系。Entropy = 系统的凌乱程度,使用算法ID3, C4.5和C5.0生成树算法使用熵。这一度量是基于信息学理论中熵的概念。
1、应用决策树爱作决策的过程,是从右向左逐步后退进行分析。根据右端的损益值和概率枝的概率,计算出期望值的大小,确定方案的期望结果,然后根据不同方案结果做出选择。
2、计算完毕后,开始对决策树进行剪枝,在每个决策结点删去除了最高期望值以外的其他所有分支,最后步步推进到第一个决策结点,这时就找到了问题的最佳方案。方案的舍弃叫做修枝,被舍弃的方案用"≠"的记号来表示,最后的决策点留下一条树枝,即为最优方案。
案例:
为了适应市场的需要,某地提出了扩大电视机生产的两个方案。一个方案是建设大工厂,第二个方案是建设小工厂。
条件:
建设大工厂需要投资600万元,可使用10年。销路好每年赢利200万元,销路不好则亏损40万元。
建设小工厂投资280万元,如销路好,3年后扩建,扩建需要投资400万元,可使用7年,每年赢利190万元。不扩建则每年赢利80万元。如销路不好则每年赢利60万元。
试用决策树法选出合理的决策方案。 经过市场调查,市场销路好的概率为0.7,销路不好的概率为0.3。
计算各点的期望值:
点②:0.7×200×10+0.3×(-40)×10-600(投资)=680(万元)
点⑤:1.0×190×7-400=930(万元)
点⑥:1.0×80×7=560(万元)
比较决策点4的情况可以看到,由于点⑤(930万元)与点⑥(560万元)相比,点⑤的期望利润值较大,因此应采用扩建的方案,而舍弃不扩建的方案。
把点⑤的930万元移到点4来,可计算出点③的期望利润值:
点③:0.7×80×3+0.7×930+0.3×60×(3+7)-280 = 719(万元)
最后比较决策点1的情况:
由于点③(719万元)与点②(680万元)相比,点③的期望利润值较大,因此取点③而舍点②。这样,相比之下,建设大工厂的方案不是最优方案,合理的策略应采用前3年建小工厂,如销路好,后7年进行扩建的方案。