数据仓库ETL任务调度模型研究
DOI:
CSTR:
作者:
作者单位:

1. 大连交通大学 软件学院
2. 大连理工大学 CIMS中心

作者简介:

宋旭东

通讯作者:

中图分类号:

TP311

基金项目:


Study on ETL Task Scheduling Model in Data Warehouse
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    数据仓库系统包含众多的抽取-转换-加载(ETL) 任务, 这些任务具有一定的优先约束关系. 在多处理机环境下, 如何高效地调度这些ETL 任务是构建数据仓库需要研究的重要问题. 对此, 在对数据仓库ETL 任务调度规则进行归纳总结的基础上, 以数据仓库总的ETL 完成时间最短为目标, 建立了数据仓库ETL 任务调度模型. 同时结合问题的特点, 采用同层划分的思想, 提出基于同层划分遗传算法求解问题的方法. 最后, 通过应用实例验证了所建立模型和求解算法的可行性和有效性.

    Abstract:

    Data warehouse system includes many extract-transform-load(ETL) tasks which have some precedence constraint relations. In a multi-processor environment, how to efficiently schedule these ETL tasks is one of the important aspects for constructing data warehouse. On the basis of classification and summary of data warehouse ETL scheduling rules, a data warehouse ETL scheduling model is established to minimize the total ETL execution time. At the same time, based on the characteristics of the problem, adopting the same layer division strategy, a genetic algorithm based on the same layer division is proposed. Finally, the application case of the model is represented, and the case results show the feasibility and effectiveness of this model and its algorithm.

    参考文献
    相似文献
    引证文献
引用本文

宋旭东 刘晓冰.数据仓库ETL任务调度模型研究[J].控制与决策,2011,26(2):271-275

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2009-11-27
  • 最后修改日期:2010-04-17
  • 录用日期:
  • 在线发布日期: 2011-02-20
  • 出版日期:
文章二维码