摘要:现有的不平衡数据回归算法需要多次计算样本间的距离, 当样本数量较大时, 处理效率较低. 粒球模型可将样本集合迭代划分为多个粒球, 以降低样本规模. 但是, 当前的粒球模型依赖于样本类别标签, 不适合回归任务. 鉴于此, 首先, 利用粒球内样本区域的网格划分, 定义粒球的填充度, 提出一种网格自组织粒球模型(GSOGB), 能够同时处理回归任务和分类任务; 然后, 在此基础上, 给出粒球内样本在邻域内的过采样策略, 提出基于网格自组织粒球模型的不平衡回归方法(GSOGB-SMOTER). 实验结果表明: 所提出GSOGB在12个分类数据集上优于现有粒球模型; 所提出GSOGB-SMOTER在10个不平衡回归数据集连续目标值域的5个等长分区的MSE指标上略优于文献中的7种算法, 且具有鲁棒性和更高的运行效率, 能够快速处理较大规模数据的不平衡回归.