문장을 한 번에 이해하는 트랜스포머 모델
트랜스포머(Transformer)
는 문장의 순서를 따라가지 않고, 전체 문장을 한 번에 처리하는 신경망 모델입니다.
자연어 처리(NLP) 분야에서 널리 사용되고 있으며, GPT, BERT 같은 대형 언어 모델의 핵심 구조입니다.
트랜스포머는 왜 등장했을까요?
기존의 RNN이나 LSTM은 단어를 하나씩 순서대로 처리합니다.
이 방식은 문장의 흐름을 이해하는 데 유리하지만, 처리 속도가 느리고 긴 문장일수록 앞의 정보를 기억하기 어렵다는 한계가 있습니다.
트랜스포머는 이 문제를 해결하기 위해 등장했습니다.
트랜스포머 모델은 모든 단어를 동시에 처리하고, 단어들 간의 관계를 직접 계산하여 전체 문장의 의미를 더 정확하게 이해할 수 있습니다.
다음 수업에서는 트랜스포머의 핵심 구성 요소 중 하나인 셀프 어텐션 메커니즘
에 대해 자세히 알아보겠습니다.
Mission
0 / 1
트랜스포머 모델의 주요 특징은 무엇인가요?
단어를 하나씩 순서대로 처리한다
문장의 흐름을 이해하는 데 유리하다
전체 문장을 한 번에 처리한다
처리 속도가 느리다
Lecture
AI Tutor
Design
Upload
Notes
Favorites
Help