가이드라인

JSONL 데이터셋 만들기

앞서 배운 내용을 바탕으로 데이터셋을 만들고 적용해 보는 실습을 진행해 보겠습니다.


실습환경 소개

지금부터 챗GPT를 버르장머리 없는 반말 AI로 파인튜닝하기 위한 학습 데이터셋을 만들어 보겠습니다.

[이전 수업]에서 소개한 것처럼, 파인튜닝을 위한 JSONL 데이터셋은 최소 10개 이상의 대화 쌍을 포함해야 합니다.


반말 데이터셋 만들기

  1. 모달창: 데이터 선택 버튼을 클릭하여 모달창을 띄웁니다. (모달창: 데이터셋 파일 목록입니다.)

  2. 새 파일 생성: 상단에 새 파일 생성 버튼을 클릭합니다.

  3. 모드 선택: 간편모드는 데이터셋을 만들기 위한 간단한 모드입니다. 에디터는 JSONL 파일을 직접 작성할 수 있는 모드입니다.

  4. 데이터셋 작성: 파일명을 입력 후 만들기 버튼을 클릭하여 파일을 만듭니다.

  5. 파일 만들기: 파일명을 입력 후 만들기 버튼을 클릭하여 파일을 만듭니다.

  6. 적용: 만들어진 파일을 적용 버튼을 클릭하여 선택합니다.

Mission
0 / 1

다음 빈칸에 가장 적절한 단어는 무엇일까요?

OpenAI 플랫폼에서 파인튜닝을 위한 JSONL 데이터셋은 최소 개 이상의 대화 쌍을 포함해야 합니다.
5
10
15
20

가이드라인

AI 튜터

배포

디자인

업로드

수업 노트

즐겨찾기

도움말