lesson1Title

lesson2Title

lesson3Title

lesson4Title

lesson5Title

lesson6Title

lesson7Title

lesson8Title

lesson9Title

lesson10Title

lesson11Title

lesson12Title

lesson13Title

aiFundamentalsInActionChapter1Title

aiFundamentalsInActionChapter2Title

aiFundamentalsInActionChapter3Title

aiFundamentalsInActionChapter4Title

# GPT와 기존 신경망 모델(RNN)의 차이점

`GPT`는 기존의 `순환 신경망(RNN)` 기반 모델과는 구조, 학습 방식, 성능 면에서 많은 차이를 보입니다.

이번 수업에서는 GPT와 RNN이 어떻게 다르고, 어떤 점에서 GPT가 더 나은 성능을 보이는지 비교해 보겠습니다.

<br />

## RNN은 어떤 방식으로 작동할까?

RNN은 텍스트와 같이 순서가 중요한 데이터를 처리하는 데 특화된 신경망 구조입니다.

문장을 앞에서부터 한 단어씩 읽어가며, 이전에 본 단어의 정보를 다음 단어 예측에 반영합니다.

예를 들어 "나는 밥을"이라는 문장이 주어졌을 때, RNN은 '나는' → '밥을' 순으로 단어를 하나씩 입력받고, 다음에 나올 단어를 예측합니다.

이처럼 RNN은 순차 데이터(시퀀스)를 처리하는 데 적합하지만, 긴 문장을 처리할수록 앞의 내용을 잊어버리는 **장기 의존성 문제**가 발생하기 쉽습니다.

<br />

## GPT는 어떻게 다를까?

GPT는 트랜스포머 구조를 기반으로 한 언어 모델입니다.

트랜스포머의 핵심인 `셀프 어텐션(Self-Attention)` 메커니즘을 통해 문장 전체를 한 번에 처리하면서, 단어 간의 관계를 효율적으로 학습합니다.

RNN처럼 순서대로 처리하지 않고, 모든 단어가 서로를 동시에 참고하면서 문장의 의미를 파악합니다.

이를 통해 GPT는 긴 문장이나 복잡한 문맥도 잘 이해할 수 있습니다.

또한 GPT는 대규모 데이터를 사전 학습하고 다양한 작업에 범용적으로 활용 가능한 구조를 가지고 있어, **하나의 모델로 다양한 언어 작업**을 수행할 수 있습니다.

<br />

## 예시로 비교해 보기

문장: "고양이가 나무에 올라갔다. 그리고 그것은 소리를 냈다."

- RNN은 앞에서부터 단어를 읽기 때문에, '그것'이 '고양이'를 의미한다는 정보를 잊어버릴 수 있습니다.

- GPT는 전체 문장을 한 번에 바라보며 '그것'과 '고양이' 사이의 관계를 정확히 연결할 수 있습니다.

<br />

GPT는 RNN에 비해 더 빠르고 정교하며, 다양한 언어 작업에 쉽게 적용할 수 있는 모델입니다.

특히 긴 문장을 이해하거나, 문맥을 잘 파악해야 하는 문제에서 매우 큰 장점을 가지고 있습니다.

다음 수업에서는 GPT 모델이 입력값을 이해하는 단위인 `토큰`에 대해 자세히 알아보겠습니다.

GPT 모델은 셀프 어텐션 메커니즘을 통해 문장 전체를 한 번에 처리하면서 단어 간의 관계를 학습합니다. 이는 RNN과 달리 순차적으로 처리하지 않고, 모든 단어가 서로를 동시에 참고하면서 문장의 의미를 파악할 수 있게 합니다.

### GPT는 RNN과 달리 모든 단어가 서로를 동시에 참고하면서 문장의 의미를 파악할 수 있다.