吉林大学计算机科学与技术学院 长春 130012
亓常松
TP301.6
在构造决策树的过程中,属性选择将影响到决策树的分类精度.对此,讨论了基于信息熵方法和WMR方法的局限性,提出了信息系统中条件属性集的离散度的概念.利用该概念在决策树构造过程中选择划分属性,设计了基于离散度的决策树构造算法DSD.DSD 算法可以解决WMR方法在实际应用中的局限性.在UCI 数据集上的实验表明,该方法构造的决策树精度与基于信息熵的方法相近,而时间复杂度则优于基于信息熵的方法.
亓常松;孙吉贵;于海鸿.基于离散度的决策树构造方法[J].控制与决策,2008,23(1):51-55