정규화 vs 표준화, 언제 사용해야 할까?
정규화는 0-1
범위로 값을 조정하여 특정 값이 지나치게 크거나 작은 영향을 주지 않도록 하는 방법이며, 표준화는 평균을 0
, 표준편차 1
로 맞추어 데이터가 정규 분포를 따르도록 조정하는 방법입니다.
이번 수업에서는 정규화와 표준화의 차이점과 각각의 적절한 활용 사례를 배워보겠습니다.
정규화 vs 표준화, 어떻게 다를까요?
기준 | 정규화 | 표준화 |
---|---|---|
변환 방식 | 0-1 범위로 조정 (Min-Max Scaling) | 평균 0, 표준편차 1로 조정 (Z-score Scaling) |
이상치 영향 | 이상치에 민감함 | 이상치에 덜 민감함 |
사용 사례 | 이미지 처리, 딥러닝 | 통계적 분석, 회귀, PCA |
적용 대상 | 값의 범위가 중요할 때 | 데이터가 정규 분포를 따를 때 |
실무에서 정규화와 표준화를 선택하는 방법
정규화와 표준화는 각각의 장단점이 있으며, 데이터의 특성과 분석 목적에 따라 최적의 방법을 선택해야 합니다.
실무에서 정규화와 표준화를 선택하는 방법은 다음과 같습니다.
딥러닝을 한다면?
→ 정규화
가 일반적으로 유리함 (뉴런이 0-1 범위 내에서 안정적으로 학습)
통계적 분석을 한다면?
→ 표준화
가 적합 (평균을 중심으로 데이터가 분포하도록 조정)
데이터에 이상치가 많다면?
→ 표준화
가 더 적합 (극단적인 값이 영향을 덜 미침)
데이터의 범위를 유지하는 것이 중요한 경우?
→ 정규화
가 사용 (최소-최대 범위를 유지)
다음 수업에서는 범주형 데이터 인코딩
에 대해 알아보겠습니다.
Mission
0 / 1
다음 중 빈칸에 들어갈 가장 적절한 단어는 무엇인가요?
일반적으로 데이터에 이상치가 많다면 가 더 적합합니다.
정규화
표준화
이상치 제거
데이터 증강
Lecture
AI Tutor
Design
Upload
Notes
Favorites
Help