서론 우리는 쉽게 데이터 불균등 문제를 마주치게 된다. 데이터 불균등 문제에는 다음과 같은 것들이 있다. Class imbalance: 클래스 간의 데이터 양이 다름 (e.g. 개나 고양이의 데이터 양이 희귀 동물의 데이터 양보다 많음) Group imbalance: 그룹 간의 데이터 양이 다름 (e.g. 인간의 손 데이터를 수집할 때 피부색에 편향이 생길 수 있음) 이러한 데이터 편향 문제를 해결하지 않는다면 classifier는 majority class에 편향된 학습을 하게 된다. 이는 상당한 성능 저하를 일으킬 뿐더러 사회적, 도덕적 문제가 될 수 있기 때문에, 많은 연구자들이 이 문제를 해결하기 위해 많은 알고리즘들을 만들어 내고 있다. 이 논문은 알고리즘에 집중하기 보다는, 데이터에 집중하여 ..