西安交通大学电子与信息工程学院 710049
宋江春
TP391.11
提出一个基于Web 日志的Web 用户群体和站点URL 聚类算法.使用用户浏览行为描述和用户浏览时间离散化方法建立了Web站点的用户事务矩阵,并在此基础上对Web 用户群体和站点URL 进行聚类.由于在聚类过程中同时考虑了用户对URL 的浏览时间和访问次数,使算法的精度和效率都大大提高.同时,该算法能较好地处理类间重叠问题,使算法具有较好的实用性.最后对算法的有效性和可伸缩性进行了研究.
宋江春;沈钧毅.一种新的Web 用户群体和URL聚类算法的研究[J].控制与决策,2007,22(3):284-288