파인튜닝 실습하기
코드프렌즈 파인튜닝 실습 환경은 다음과 같은 3단계로 진행됩니다.
1. 학습 데이터 선택
+ 데이터 선택
버튼을 누르고 학습 데이터 직접 만들거나, 예시 데이터를 선택합니다.
학습 데이터는 JSONL 형식의 데이터를 활용하며, 최소 10개 이상
의 질문과 답변 쌍을 포함해야 합니다.
2. 하이퍼파라미터 설정
배치크기
, 학습률
, 에폭 수
로 구성된 하이퍼파라미터를 설정합니다. 이 3개의 하이퍼파라미터들은 OpenAI에서 GPT 모델을 파인튜닝할 때 입력하는 값과 동일합니다.
3. 파인튜닝 실행
파인튜닝 모델명을 입력하고, 파인튜닝 실행
버튼을 누릅니다. 파인튜닝이 완료되면 튜닝된 모델과 상호작용할 수 있습니다.
[속 시원한 파인튜닝]의 학습 목표는 파인튜닝을 위한 필수 AI 지식을 습득하고, OpenAI 플랫폼에서 스스로 파인튜닝을 수행할 수 있는 능력을 기르는 것입니다. 코드프렌즈에서는 OpenAI의 정책적/기술적 이슈로 실제 파인튜닝을 수행하지 않습니다.
학습이 진행되면 어떤 일이 발생하는 걸까요?
파인튜닝이 진행되며 설정한 하이퍼파라미터에 따라 AI 모델의 가중치와 편향이 업데이트됩니다.
-
가중치(Weights): 입력 데이터의 특정 특징이 얼마나 중요한지 결정
-
편향(Bias): 편향은 모델의 출력이 특정 방향으로 치우치지 않도록 조정하는 값으로, 인경신경망의 활성화 함수(어느 정도의 입력값에 대해 인경신경망이 활성화되는지 결정)를 조절
파인튜닝 실습 체험
다음 수업부터는 파인튜닝에 활용되는 데이터 형식인 JSONL과 AI 기초 이론, 하이퍼파라미터에 대한 상세 내용을 알아보겠습니다.
간단한 파인튜닝 실습을 진행하며 앞으로 학습해나갈 내용을 미리 체험해보세요.
OpenAI에서 GPT 모델을 파인튜닝할 때, 최소 몇 개의 질문과 답변 쌍 데이터가 필요한가요?
Guidelines
AI Tutor
Publish
Design
Upload
Notes
Favorites
Help