Lecture

정규화 vs 표준화, 언제 사용해야 할까?

정규화는 0-1 범위로 값을 조정하여 특정 값이 지나치게 크거나 작은 영향을 주지 않도록 하는 방법이며, 표준화는 평균을 0, 표준편차 1로 맞추어 데이터가 정규 분포를 따르도록 조정하는 방법입니다.

이번 수업에서는 정규화와 표준화의 차이점과 각각의 적절한 활용 사례를 배워보겠습니다.


정규화 vs 표준화, 어떻게 다를까요?

기준정규화표준화
변환 방식0-1 범위로 조정 (Min-Max Scaling)평균 0, 표준편차 1로 조정 (Z-score Scaling)
이상치 영향이상치에 민감함이상치에 덜 민감함
사용 사례이미지 처리, 딥러닝통계적 분석, 회귀, PCA
적용 대상값의 범위가 중요할 때데이터가 정규 분포를 따를 때

실무에서 정규화와 표준화를 선택하는 방법

정규화와 표준화는 각각의 장단점이 있으며, 데이터의 특성과 분석 목적에 따라 최적의 방법을 선택해야 합니다.

실무에서 정규화와 표준화를 선택하는 방법은 다음과 같습니다.


딥러닝을 한다면?

정규화가 일반적으로 유리함 (뉴런이 0-1 범위 내에서 안정적으로 학습)

통계적 분석을 한다면?

표준화가 적합 (평균을 중심으로 데이터가 분포하도록 조정)

데이터에 이상치가 많다면?

표준화가 더 적합 (극단적인 값이 영향을 덜 미침)

데이터의 범위를 유지하는 것이 중요한 경우?

정규화가 사용 (최소-최대 범위를 유지)


다음 수업에서는 범주형 데이터 인코딩에 대해 알아보겠습니다.

Mission
0 / 1

다음 중 빈칸에 들어갈 가장 적절한 단어는 무엇인가요?

일반적으로 데이터에 이상치가 많다면 가 더 적합합니다.
정규화
표준화
이상치 제거
데이터 증강

Lecture

AI Tutor

Design

Upload

Notes

Favorites

Help