Data Augmentation 2

[ICLR 2023 Spotlight] CUDA: Curriculum of Data Augmentation for Long-tailed Recognition

이 논문은 ICLR 2023에 출판된 논문이며 Spotlight 논문 (상위 20%) 으로 선정되었다. 저자는 Sumyeong Ahn*, Jongwee Ko*, Seyoung Yun으로 구성되어 있다. Motivation 기존 연구들은 Class imbalance 문제를 해결하기 위해 주로 rewighting, resampling 기법을 사용했다. Reweighting은 training loss에서 minority class sample의 비중을 크게 하는 방식이며, resampling은 minority class를 더 많이 sampling하거나 majority class를 덜 sampling 하여 균등한 학습 데이터로 재구성하는 방식이다. 하지만 이 방식들은 여전히 한정된 minority class의 ..

논문 리뷰 2024.02.17

[ICCV 2023 workshop] SYNAuG: Exploiting Synthetic Data for Data Imbalance Problems

서론 우리는 쉽게 데이터 불균등 문제를 마주치게 된다. 데이터 불균등 문제에는 다음과 같은 것들이 있다. Class imbalance: 클래스 간의 데이터 양이 다름 (e.g. 개나 고양이의 데이터 양이 희귀 동물의 데이터 양보다 많음) Group imbalance: 그룹 간의 데이터 양이 다름 (e.g. 인간의 손 데이터를 수집할 때 피부색에 편향이 생길 수 있음) 이러한 데이터 편향 문제를 해결하지 않는다면 classifier는 majority class에 편향된 학습을 하게 된다. 이는 상당한 성능 저하를 일으킬 뿐더러 사회적, 도덕적 문제가 될 수 있기 때문에, 많은 연구자들이 이 문제를 해결하기 위해 많은 알고리즘들을 만들어 내고 있다. 이 논문은 알고리즘에 집중하기 보다는, 데이터에 집중하여 ..

논문 리뷰 2024.01.06