학습 자료

모델의 예측 성능을 평가하는 재현율

머신러닝에서 분류 모델의 성능을 평가할 때 정밀도뿐만 아니라 재현율(Recall)도 중요한 지표입니다.

재현율은 모델이 실제 양성 데이터를 얼마나 놓치지 않고 예측했는지를 나타냅니다.

재현율은 다음과 같이 계산합니다.

Recall=TPTP+FN\text{Recall} = \frac{TP}{TP + FN}

여기서 각 용어의 의미는 다음과 같습니다.

  • TP (True Positive): 실제 양성이고, 모델이 양성으로 예측한 경우

  • FN (False Negative): 실제 양성이지만, 모델이 음성으로 잘못 예측한 경우

쉽게 말해, 재현율은 머신러닝 모델이 실제 양성인 상황을 얼마나 정확하게 찾아냈는지를 의미합니다.

암 진단 모델에서 재현율이 높다면 실제 암 환자를 대부분 암으로 예측했다는 의미입니다.


재현율이 중요한 경우

재현율이 중요한 대표적인 사례는 다음과 같습니다.

1. 질병 진단 시스템 (암 진단 모델)

암 환자를 놓치는 것은 매우 치명적인 결과를 초래할 수 있습니다.

따라서 암 진단 모델에서는 정밀도보다 재현율을 더 중요하게 고려해야 합니다.

재현율이 낮으면 암 환자를 건강한 사람으로 잘못 예측할 가능성이 커집니다.

2. 재난 경보 시스템

화재 경보, 지진 경보 등의 시스템에서는 한 번이라도 위험을 놓치는 것이 치명적입니다.

따라서 거짓 경보(False Positive)가 늘어나더라도 재현율을 높이는 것이 중요합니다.


재현율의 한계

재현율이 높은 모델이 항상 좋은 것은 아닙니다.

재현율을 지나치게 높이면 반대로 정밀도(Precision)가 낮아질 가능성이 큽니다.

예를 들어 금융 사기 탐지 모델에서 재현율을 높이기 위해 의심스러운 거래를 넓게 잡으면, 정상적인 거래도 사기 거래로 잘못 탐지될 수 있습니다.

따라서 모델 평가에서는 정밀도와 재현율을 함께 고려해야 합니다.

정밀도와 재현율 사이의 균형을 맞추기 위해 F1-Score라는 종합적인 평가 지표를 사용하기도 합니다.

다음 수업에서는 F1-Score에 대해 알아보겠습니다.

Mission
0 / 1

모델의 예측 성능을 평가할 때 재현율(Recall)이 중요한 이유는 무엇인가요?

모델의 계산 속도를 높이기 위해

모델의 복잡성을 줄이기 위해

실제 양성 데이터를 놓치지 않기 위해

모델의 데이터 수집 비용을 줄이기 위해

학습 자료

AI 튜터

디자인

업로드

수업 노트

즐겨찾기

도움말