단층 퍼셉트론의 한계
퍼셉트론은 학생들의 성적을 기준으로 합격(1)
과 불합격(0)
을 나누는 것처럼, 입력값을 받고 간단한 기준에 따라 두 그룹으로 나눕니다.
만약 시험 점수가 50점
이상이면 합격(1)
, 50점 미만이면 불합격(0)
이라고 정할 수 있습니다.
이렇게 하나의 선(기준)
을 정해서 나눌 수 있는 문제는 단층 퍼셉트론이 쉽게 해결할 수 있습니다.
하지만 모든 문제가 이렇게 간단하게 나뉘지는 않습니다.
퍼셉트론이 해결할 수 없는 문제
예를 들어 아래와 같은 규칙은 두 입력값이 다를 때
(0,1 또는 1,0일 때)만 1
을 출력합니다.
입력값 1 () | 입력값 2 () | 출력값 () |
---|---|---|
0 | 0 | 0 |
0 | 1 | 1 |
1 | 0 | 1 |
1 | 1 | 0 |
이러한 문제를 XOR 문제라고 합니다.
이 문제를 (x, y) 좌표로 나타내면 아래와 같습니다.
-
(0,0)
과(1,1)
은 출력값이0
이므로 같은 그룹 -
(0,1)
과(1,0)
은 출력값이 1이므로 같은 그룹
이제 한 개의 직선으로 이 두 그룹을 나누려고 하면 어떻게 될까요?
어떤 방법으로 선을 그어도 완벽하게 두 그룹을 나눌 수 없습니다.
퍼셉트론은 이렇게 직선 하나로 그룹을 분류하는 문제를 해결할 수 없습니다.
이렇게 직선으로 나눌 수 없는 문제를 비선형 문제라고 합니다. 비선형 문제는 곡선과 같은 보다 복잡한 그래프로 문제를 해결합니다.
다층 퍼셉트론으로 비선형 문제 해결하기
다층 퍼셉트론(Multi-Layer Perceptron, MLP)
은 여러 개의 퍼셉트론을 층 형태로 연결한 인공신경망입니다.
단층 퍼셉트론이 직선 하나로 데이터를 분류하는 것과 달리, 다층 퍼셉트론은 여러 층을 거쳐 입력 데이터를 변형하여 더 복잡한 패턴을 학습할 수 있습니다.
다층 퍼셉트론에서 입력층과 출력층 사이에는 은닉층
이 존재합니다.
은닉층에서는 입력 데이터에 가중치
를 적용하고 활성화 함수
를 사용해 새로운 특징을 만들어냅니다.
이러한 변형 과정을 거치면서 원래 선형적으로 나눌 수 없었던 데이터가 새로운 차원으로 변형됩니다.
예를 들어 XOR 문제에서는 원래 2차원 공간에서 하나의 직선으로 구분할 수 없었지만, 은닉층을 거치면서 고차원 공간
(예: 입체적인 3차원 공간)에서 선형적으로 분리 가능한 형태로 변환됩니다.
이렇게 다층 퍼셉트론은 은닉층을 활용해 입력 데이터를 변형하여 비선형 문제를 해결합니다.
단층 퍼셉트론은 XOR 문제를 해결할 수 있다.
Lecture
AI Tutor
Design
Upload
Notes
Favorites
Help