Lecture

단층 퍼셉트론의 한계

퍼셉트론은 학생들의 성적을 기준으로 합격(1)불합격(0)을 나누는 것처럼, 입력값을 받고 간단한 기준에 따라 두 그룹으로 나눕니다.

만약 시험 점수가 50점 이상이면 합격(1), 50점 미만이면 불합격(0)이라고 정할 수 있습니다.

이렇게 하나의 선(기준)을 정해서 나눌 수 있는 문제는 단층 퍼셉트론이 쉽게 해결할 수 있습니다.

하지만 모든 문제가 이렇게 간단하게 나뉘지는 않습니다.


퍼셉트론이 해결할 수 없는 문제

예를 들어 아래와 같은 규칙은 두 입력값이 다를 때(0,1 또는 1,0일 때)만 1을 출력합니다.

입력값 1 (x1x_1)입력값 2 (x2x_2)출력값 (yy)
000
011
101
110

이러한 문제를 XOR 문제라고 합니다.

이 문제를 (x, y) 좌표로 나타내면 아래와 같습니다.


thumbnail-public

  • (0,0)(1,1)은 출력값이 0이므로 같은 그룹

  • (0,1)(1,0)은 출력값이 1이므로 같은 그룹


이제 한 개의 직선으로 이 두 그룹을 나누려고 하면 어떻게 될까요?

어떤 방법으로 선을 그어도 완벽하게 두 그룹을 나눌 수 없습니다.

퍼셉트론은 이렇게 직선 하나로 그룹을 분류하는 문제를 해결할 수 없습니다.

이렇게 직선으로 나눌 수 없는 문제를 비선형 문제라고 합니다. 비선형 문제는 곡선과 같은 보다 복잡한 그래프로 문제를 해결합니다.


다층 퍼셉트론으로 비선형 문제 해결하기

다층 퍼셉트론(Multi-Layer Perceptron, MLP)은 여러 개의 퍼셉트론을 층 형태로 연결한 인공신경망입니다.

단층 퍼셉트론이 직선 하나로 데이터를 분류하는 것과 달리, 다층 퍼셉트론은 여러 층을 거쳐 입력 데이터를 변형하여 더 복잡한 패턴을 학습할 수 있습니다.

다층 퍼셉트론에서 입력층과 출력층 사이에는 은닉층이 존재합니다.

은닉층에서는 입력 데이터에 가중치를 적용하고 활성화 함수를 사용해 새로운 특징을 만들어냅니다.

이러한 변형 과정을 거치면서 원래 선형적으로 나눌 수 없었던 데이터가 새로운 차원으로 변형됩니다.

예를 들어 XOR 문제에서는 원래 2차원 공간에서 하나의 직선으로 구분할 수 없었지만, 은닉층을 거치면서 고차원 공간(예: 입체적인 3차원 공간)에서 선형적으로 분리 가능한 형태로 변환됩니다.

이렇게 다층 퍼셉트론은 은닉층을 활용해 입력 데이터를 변형하여 비선형 문제를 해결합니다.

Mission
0 / 1

단층 퍼셉트론은 XOR 문제를 해결할 수 있다.

True
False

Lecture

AI Tutor

Design

Upload

Notes

Favorites

Help