JSONL 데이터셋 만들기
앞서 배운 내용을 바탕으로 데이터셋을 만들고 적용해 보는 실습을 진행해 보겠습니다.
실습환경 소개
지금부터 챗GPT를 버르장머리 없는 반말 AI
로 파인튜닝하기 위한 학습 데이터셋을 만들어 보겠습니다.
[이전 수업]에서 소개한 것처럼, 파인튜닝을 위한 JSONL 데이터셋은 최소 10개 이상의 대화 쌍을 포함해야 합니다.
반말 데이터셋 만들기
-
모달창:
데이터 선택
버튼을 클릭하여 모달창을 띄웁니다. (모달창: 데이터셋 파일 목록입니다.) -
새 파일 생성: 상단에
새 파일 생성
버튼을 클릭합니다. -
모드 선택:
간편모드
는 데이터셋을 만들기 위한 간단한 모드입니다.에디터
는 JSONL 파일을 직접 작성할 수 있는 모드입니다. -
데이터셋 작성: 파일명을 입력 후
만들기
버튼을 클릭하여 파일을 만듭니다. -
파일 만들기: 파일명을 입력 후
만들기
버튼을 클릭하여 파일을 만듭니다. -
적용: 만들어진 파일을
적용
버튼을 클릭하여 선택합니다.
Mission
0 / 1
다음 빈칸에 가장 적절한 단어는 무엇일까요?
OpenAI 플랫폼에서 파인튜닝을 위한 JSONL 데이터셋은 최소 개 이상의 대화 쌍을 포함해야 합니다.
5
10
15
20
Guidelines
AI Tutor
Publish
Design
Upload
Notes
Favorites
Help