데이터의 정답지, 레이블
머신러닝에서 레이블은 모델이 예측해야 하는 정답
에 해당하는 값입니다.
특히 정답과 함께 주어지는 데이터를 바탕으로 머신러닝 모델을 학습하는 지도 학습
에서 레이블이 필수적으로 사용됩니다.
레이블의 예시
레이블은 문제의 유형에 따라 다르게 정의됩니다.
이진 분류(Binary Classification)
예/아니오, 스팸/비스팸과 같이 두 개의 클래스로 나누는 경우 (0
또는 1
)
다중 클래스 분류(Multi-Class Classification)
고양이, 개, 사람, 자동차처럼 여러 개의 클래스를 분류하는 경우 (0
, 1
, 2
, 3
, ...)
회귀(Regression)
주택 가격 예측처럼 연속적인 값을 예측하는 경우 (실수 값
)
레이블은 왜 중요할까?
레이블은 모델이 무엇을 학습해야 하는지를 정의하는 핵심 요소입니다.
데어테에 잘못된 레이블이 부여되면 모델이 잘못된 패턴을 학습할 수 있으므로, 정확한 데이터 레이블링(Labeling)
이 매우 중요합니다.
다음 시간에는 특징과 레이블을 활용해 머신러닝 모델을 학습할 때, 각 특징이 얼마나 중요한지 판단하는 요소인 가중치(Weight)
에 대해 알아보겠습니다.
Mission
0 / 1
레이블은 지도 학습에서 모델이 학습해야 하는 정답에 해당하는 값이다.
True
False
Lecture
AI Tutor
Design
Upload
Notes
Favorites
Help