一种改进的相似重复记录检测方法
DOI:
CSTR:
作者:
作者单位:

南京航空航天大学CIMS工程中心 210016

作者简介:

朱恒民

通讯作者:

中图分类号:

TP311

基金项目:


Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    针对当前相似重复记录检测方法中存在的问题,提出一种改进方法.该方法根据关系表的决定属性值划分记录集,并在每个决定属性值类中检测相似重复记录.在决定属性值聚类时,提出了动态优先队列聚类算法和合并逆序算法,尽可能使相似重复的属性值聚为同一类;在记录聚类时提出了类调整算法,以提高类的代表记录的代表性.通过大量的实验分析,验证了该方法的有效性.

    Abstract:

    参考文献
    相似文献
    引证文献
引用本文

朱恒民; 王宁生.一种改进的相似重复记录检测方法[J].控制与决策,2006,21(7):805-808

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2005-03-31
  • 最后修改日期:2005-07-21
  • 录用日期:
  • 在线发布日期: 2006-07-20
  • 出版日期:
文章二维码