일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 프로그래머스
- KT 에이블스쿨
- 판다스
- 데이터 프레임
- 백준
- 알고리즘
- 케이티 에이블스쿨 기자단
- 케이티 에이블스쿨
- 에이블 기자단
- 머신러닝
- 네트워크
- kt 에이블스쿨 기자단
- 케이티 에이블스쿨 6기 후기
- 오블완
- kt 에이블스쿨 6기 빅프로젝트
- kt 에이블스쿨 6기
- 케이티 에이블스쿨 6기 ai
- 파이썬
- 앙상블
- 백준 사탕 게임
- 구현
- 케이티 에이블스쿨 6기 spring
- 티스토리챌린지
- kt aivle school
- kt 에이블스쿨 6기 ai
- kt 에이블스쿨 6기 미니 프로젝트
- KT AIVLE
- 케이티 에이블스쿨 6기 java
- 케이티 에이블스쿨 6기
- SQLD
- Today
- Total
목록SMOTE (2)
미식가의 개발 일기
클래스 불균형이란?특정 클래스의 데이터 수가 다른 클래스에 비해 훨씬 적거나 많은 현상전체 데이터 중에서 90%가 클래스 A이고 10%만이 클래스 B인 경우, 모델이 단순히 "모든 데이터가 클래스 A"라고 예측해도 정확도가 90%에 달할 수 있습니다. 그러나 이 경우 모델은 클래스 B를 거의 예측하지 못하게 되어 성능 평가 지표로는 부적절합니다.이처럼 클래스 비율이 극단적으로 다를 경우 소수 클래스의 패턴을 학습하기 어렵고, 잘못된 예측 결과를 초래할 수 있습니다. 이러한 클래스 불균형 문제를 해결하기 위해 샘플링 기법이 존재합니다. 샘플링 기법데이터의 분포를 조정하여 학습 데이터 세트의 클래스 비율을 맞추는 방법!pip install imbalanced-learn※ 라이브러리 설치 필요 언더샘플링 (..
데이터 불균형이란? -> 클래스 간의 샘플 수가 크게 차이나는 상황 "데이터 불균형을 해결하지 않으면 다수 클래스를 우선적으로 예측하기 되어 소수 클래스에 대한 성능이 저하될 수 있다." 데이터 불균형을 해결하기 위한 방법리샘플링(Resampling) 기법 언더샘플링(Under-sampling)다수 클래스의 샘플을 줄이는 방법 무작위 언더샘플링 "다수 클래스의 데이터 포인트를 무작위로 제거하는 방법"장점간단하고 쉬움, 빠름, 비용 효율 좋음단점중요 정보 손실 위험, 데이터 대표성과 다양성 저하 구현from imblearn.under_sampling import RandomUnderSamplerrus = RandomUnderSampler(random_state=42)X_resampled, y_r..