Paper Reading: Oversampling with Reliably Expanding Minority Class Regions for Imbalanced Data Learning

为了设计更有效的插值过采样算法,a56爆大奖在线娱乐提出了a56爆大奖在线娱乐新的插值过采样方法 OREM。OREM 在原始少数类样本周围找到候选少数类区域,然后利用这些候选区域识别不包含任何多数类样本的干净子区域。它们被认为是潜在的少数类区域,a56爆大奖在线娱乐通过将合成样本填充到干净子区域可以增强少数类的表达能力。OREM 方法的思路很简单,既不涉及聚类算法的使用,也不涉及邻居参数k的调整。为了提高过采样技术处理多分类不平衡数据的能力,a56爆大奖在线娱乐利用合成样本生成的迭代过程将 OREM 推广到多分类不平衡问题得到 OREM-M。OREM-M 的合成样本是迭代创建的,只有最近邻非原始样本或来自其他少数类的合成样本的合成样本才被接受,这样就缓解了对多个少数类进行过采样时类重叠的问题。为了与集成学习方法建立协同作用,a56爆大奖在线娱乐将 OREM 嵌入到 Boosting 中得到 OREMBoost 算法,OREMBoost 在训练基分类器之前对每轮的训练数据进行平衡,使得构造的基分类器对多数类的偏差更小、多样性更大。通过大量的实验证明,a56爆大奖在线娱乐提出的 OREM、OREM-M 和 OREMBoost 具有有效性。
posted @ 2023-12-08 10:30  乌漆WhiteMoon  阅读(105)  评论(0编辑  收藏  举报