가이드라인
실습
가이드라인

JSONL 데이터셋 만들기

앞서 배운 내용을 바탕으로 데이터셋을 만들고 적용해 보는 실습을 진행해 보겠습니다.


실습환경 소개

지금부터 챗GPT를 버르장머리 없는 반말 AI로 파인튜닝하기 위한 학습 데이터셋을 만들어 보겠습니다.

[이전 수업]에서 소개한 것처럼, 파인튜닝을 위한 JSONL 데이터셋은 최소 10개 이상의 대화 쌍을 포함해야 합니다.


반말 데이터셋 만들기

  1. 모달창: 데이터 선택 버튼을 클릭하여 모달창을 띄웁니다. (모달창: 데이터셋 파일 목록입니다.)

  2. 새 파일 생성: 상단에 새 파일 생성 버튼을 클릭합니다.

  3. 모드 선택: 간편모드는 데이터셋을 만들기 위한 간단한 모드입니다. 에디터는 JSONL 파일을 직접 작성할 수 있는 모드입니다.

  4. 데이터셋 작성: 파일명을 입력 후 만들기 버튼을 클릭하여 파일을 만듭니다.

  5. 파일 만들기: 파일명을 입력 후 만들기 버튼을 클릭하여 파일을 만듭니다.

  6. 적용: 만들어진 파일을 적용 버튼을 클릭하여 선택합니다.

Mission
0 / 1

가이드라인

AI 튜터

배포

디자인

업로드

수업 노트

즐겨찾기

도움말