학습 자료

머신러닝에 알고리즘이 필요한 이유

머신러닝 모델이 스스로 학습하려면 주어진 데이터를 어떻게 분석하고 학습할지 정해주는 규칙이 필요합니다.

이 규칙을 알고리즘이라고 합니다.

쉽게 말하면 사람이 직접 규칙을 정해주지 않아도, AI 모델이 데이터를 보고 패턴을 학습할 수 있도록 하는 방법이 알고리즘입니다.

머신러닝 알고리즘을 쉽게 설명하면?

알고리즘은 요리 레시피와 같습니다.

재료(데이터)가 있어도, 요리하는 방법(알고리즘)을 모르면 맛있는 음식을 만들 수 없습니다.

같은 재료를 사용해도, 요리법에 따라 결과(예측, 분류 등)가 달라집니다.

어떤 요리는 볶아야 하고, 어떤 요리는 재료를 섞어야 하며, 어떤 요리는 오래 끓여야 할 수도 있습니다.

이와 같이 알고리즘은 데이터를 활용해서 최적의 결과를 얻는 과정(학습 방법)을 정해주는 역할을 합니다.

대표적인 머신러닝 알고리즘

머신러닝에 사용되는 알고리즘은 굉장히 다양합니다.

아래에서 대표적인 머신러닝 알고리즘을 소개합니다.

로지스틱 회귀 (Logistic Regression)

확률을 계산해서 결과를 예측하는 알고리즘입니다.

특히 두 가지 중 하나를 선택해야 하는 이진 분류 문제에서 많이 사용됩니다.

예를 들어 "이 이메일이 스팸인가요?"라는 질문에 대해, "스팸일 확률이 85%" 같은 방식으로 결과를 도출합니다.

이때 결과값이 0(0%)과 1(100%) 사이의 확률 값으로 나오며, 일정 기준(예: 50%)을 넘으면 해당 클래스로 분류됩니다.

선형 회귀 (Linear Regression)

숫자 값을 예측하는 알고리즘으로, 데이터를 이용해 직선(다차원에서는 평면)을 그려서 미래 값을 예측합니다.

예를 들어 키가 160cm일 때 평균 몸무게가 55kg이고, 키가 170cm일 때 65kg이라면, 이 두 점을 이용해 직선을 그려 키가 175cm이면 약 70kg일 것이라고 예측합니다.

결정 트리 (Decision Tree)

질문을 통해 답을 찾아가는 방식으로 데이터를 분류하는 알고리즘입니다.

마치 스무고개 게임처럼 질문을 차례로 하면서 정답을 찾아갑니다.

예를 들어 "이 동물은 포유류인가요?"라는 질문을 시작으로 "네" 또는 "아니오"에 따라 다른 질문을 던지면서 최종적으로 동물을 맞출 수 있습니다.

신경망 (Neural Networks)

인간의 뇌처럼 학습하는 알고리즘으로, 여러 개의 뉴런으로 이루어진 층을 통해 데이터를 학습합니다.

신경망은 입력층, 은닉층, 출력층으로 구성됩니다.

각 뉴런은 이전 층의 뉴런들과 연결되어 있으며, 이 연결을 통해 복잡한 패턴을 학습할 수 있습니다.

예를 들어, 얼굴을 인식하는 신경망은 다음과 같이 동작합니다.

첫 번째 층은 이미지의 밝기 차이를 분석
두 번째 층은 눈, 코, 입의 형태를 감지
마지막 층은 얼굴의 주인이 누구인지 예측

K-최근접 이웃 (KNN)

비슷한 데이터를 찾아서 예측하는 알고리즘입니다.

어떤 데이터를 분류할 때, 주변에 있는 K개의 가장 가까운 데이터(이웃)를 참고해서 결과를 결정합니다.

예를 들어, 새로운 과일이 들어왔을 때:

이 과일이 기존 데이터 중 어떤 과일들과 가까운지 확인합니다.

가장 가까운 K개의 과일을 찾아보고, 그중에서 다수가 사과라면, 이 과일도 "사과"라고 판단합니다.

다음 수업에서는 선형 회귀 알고리즘을 시작으로, 각 알고리즘에 대해 자세히 알아보겠습니다.

Mission

0 / 1

`질문`을 통해 답을 찾아가는 방식으로 데이터를 분류하는 알고리즘을 무엇이라고 하나요?

신경망

결정 트리

군집화

강화 학습