EDA : Exploratory Data Analysis - Part2 : 이상치
1. 이상치란? : 문자 그대로 표현하면 데이터가 통상적으로 갖고 있는 값과 큰 차이를 갖고 있는 값이야. 이상치가 단순히 통상적으로 발견할 수 있는 값과 큰 차이를 갖고 있는 것이 왜 문제일까? 그건 주어진 데이터를 통해 분석할 때 발견된 이상치로 인해 결과가 크게 뒤틀릴 수 있기 때문이야. 그럼 우리는 발견된 이상치를 어떻게 해결해야할까? 아래에 쓸 글은 이러한 이상치를 처리하는 방법에 대해서 다뤄보고자 해. 2. 이상치를 확인하면 해야할 일 이상치가 발생한 부분에서 해야하는 것은 1) 왜 이상치가 발생했는지 2) 발견된 이상치는 어떤 의미를 갖는지 이렇게 2 가지를 파악하고 어떻게 대처하는지(대체, 제거, 유지 등) 판단하는 것이 중요해. 이상치를 발견하는 기법은 여러가지가 있지만 대표적으로 아래에..
머신러닝/모형과 이론
2019. 11. 12. 23:00
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
TAG
- CA
- dimension reduce
- 서포트벡터머신
- 데이터전처리
- SVM
- 머신러닝
- 차원축소
- Partitioning Around Medoids
- 군집분석
- 주성분분석
- PCA
- Clustering Analysis
- ML
- EDA
- java
- PAM
- K-means clustering
- 이상치처리
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
글 보관함