﻿ 基于改进差别信息树的粗糙集属性约简算法
 控制与决策  2019, Vol. 34 Issue (6): 1253-1258 0

JIANG Yu. Attribute reduction with rough set based on improved discernibility information tree[J]. Control and Decision, 2019, 34(6): 1253-1258. DOI: 10.13195/j.kzyjc.2017.1523.
### 文章历史

Attribute reduction with rough set based on improved discernibility information tree
JIANG Yu
College of Software Engineering, Chengdu University of Information Technology, Chengdu 610225, China
Abstract: A discernibility matrix is a good idea for attribute reduction. Discernibility information tree can effectively eliminate redundancy elements in discernibility matrix, and it realizes the compactness storage of discernibility matrix. However, discernibility information tree neither considers the role of core attribute in eliminating redundancy elements nor considers the effect of attribute order in the compactness storage elements in the discernibility matrix. Therefore, an improved discernibility information tree is proposed, which can further compress the storage space of non-empty elements in the discernibility matrix. In order to verify the effectiveness of the improved discernibility information tree, some simulation experiments for UCI datasets are displayed.
Keywords: rough set    discernibility matrix    attribute reduction    improved discernibility information tree    attribute significance
0 引言

1 差别信息树

 图 1 基于表 1构建的差别信息树

2 改进差别信息树的设计与实现

2.1 核属性剪枝策略

get IDI-tree(decision table T)

{

1) 令CoreC(D)=∅;

2) 创建改进差别信息树根节点TN, 并令TN为null;

3) 对于决策表T中每个对象对〈xi, xj〉, 计算其差别信息DI;

if(DI∩CoreC(D)==∅){

if(|DI|==1)CoreC(D)=CoreC(D) ∪ DI且根据属性指针头表删除含有该核属性的所有路径;

while(DI≠∅){

ⅰ)令属性b是排列在DI中最左边的元素;

ⅱ) if(TN有一子节点N, 且N的属性名为b)

{

如果N是一叶子节点, 返回; 否则TN=N

}

else{

a)创建一新节点N', 节点N'作为TN一子节点, 同时初始N'的属性名为b, 并通过该节点的同名指针连接到具有与该节点有相同属性名的节点上, 从而构成一个同名属性节点链;

b)令TN=N'.

}

ⅲ) DI= DI-{b}.

}

}

}

 图 2 基于表 1和算法1构建的IDI-tree

2.2 属性重要度策略

 图 3 IDI-tree:order(DI)=〈d, e, a, b, c〉

2.3 改进差别信息树的复杂度分析

3 基于改进差别信息树的属性约简算法

1) 创建一空集R.

2) 获取改进差别信息树的头表HT, 并令CList为头表中属性至上而下的有序序列集合.

3) 集合Core'C(D)是由改进差别信息树中只含有一个节点的路径所对应的属性所构成的集合.

4) 若Core'C(D)非空, 则对所有a∈Core'C(D), 在改进差别信息树中删除包含a属性的所有路径.

5) 令R←Core'C(D)且CList←CList-Core'C(D).

6) while CList≠∅∧IDI-tree≠∅ do{

ⅰ)选取CList中最右边的一属性Ci, 令CList←CList-{Ci};

ⅱ)如果HT[Ci]≠∅并且CiR, 则根据头表HT[Ci]所对应的同名指针, 搜索同名指针构成的指针链, 在搜索过程中, 若链中节点为叶子节点, 则在改进差别信息树中删除该叶子节点;

ⅲ) 把改进差别信息树中的只有一个节点的路径所对应的属性加入集合R中, 并在改进差别信息树中删除包含这些属性的路径, 同时在CList中删除这些属性.

}

7) 输出R, 算法结束.

 图 4 基于算法2的改进差别信息树:〈a, c, d, b〉

1) 初始时R为空, 而CList为{a, c, d, b};

2) 属性b加入约简R中, 并从CList中删除属性b, 同时从改进差别信息树中删除含属性b的路径;

3) 选取CList中最右边属性d, 通过同名指针链删除包含属性d的叶子节点;

4) 选取CList中最右边属性c, 通过同名指针链删除包含属性c的叶子节点;

5) 将属性a加入约简R中, 并从CList删除属性a, 同时删除含属性a的路径;

6) 将此时差别信息树改进为只含根节点的空树, 算法结束, 输出约简R={a, b}.

4 实验结果及分析

5 结论

