Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 데이터 프레임
- 머신러닝
- 판다스
- 케이티 에이블스쿨 6기 java
- 네트워크
- kt 에이블스쿨 6기 ai
- 에이블 기자단
- SQLD
- 케이티 에이블스쿨 6기
- kt 에이블스쿨 기자단
- 파이썬
- 프로그래머스
- 케이티 에이블스쿨 6기 ai
- kt 에이블스쿨 6기 빅프로젝트
- 티스토리챌린지
- kt aivle school
- 케이티 에이블스쿨
- 알고리즘
- 구현
- 오블완
- kt 에이블스쿨 6기
- 케이티 에이블스쿨 6기 spring
- 앙상블
- 백준 사탕 게임
- 케이티 에이블스쿨 6기 후기
- 케이티 에이블스쿨 기자단
- KT 에이블스쿨
- KT AIVLE
- kt 에이블스쿨 6기 미니 프로젝트
- 백준
Archives
- Today
- Total
목록LOF (1)
미식가의 개발 일기
[머신러닝] 이상치 처리
이상치란?"일반적인 분포에서 크게 벗어나는 데이터" 캐글 -> DataSets -> Employee Salaries Analysis csv 파일 다운로드 후 실습 진행 단변량 이상치 하나의 특징이 기준이 된다.1. Z-Score정의표준 편차를 이용해 이상치 감지데이터가 평균으로부터 얼마나 떨어져 있는지 계산 후 이상치 식별 계산식 해석Z-Score = 0데이터 = 평균값Z-Score > 0데이터 > 평균값Z-Score 데이터 -> Z-Score가 매우 높거나 낮은 값은 이상치로 판단(±2 ~ ±3 주의 필요) 장점과 단점장점: 간단, 직관적, 확장성(임계값 설정 가능), 정규 분포 데이터에 적합단점: 극단값에 민감, 이상치가 많은 경우 비효과적, 정규 분포가 아닌 형태에 대해서는 오류가 발생할 수 있음..
ML, DL
2024. 7. 23. 09:58