파인튜닝 총정리
지금까지 학습한 파인튜닝 주요 내용을 총정리해 보겠습니다.
파인튜닝
기존에 훈련된 AI 모델을 특정한 작업이나 목적에 맞게 재훈련하여 성능을 향상시키는 과정
파인튜닝과 프롬프트 엔지니어링 비교
특징 | 파인튜닝 | 프롬프트 엔지니어링 |
---|---|---|
정의 | 사전 학습된 모델을 특정 작업이나 데이터셋에 맞게 재학습 | 모델의 입력 프롬프트를 최적화하여 원하는 출력 결과를 얻는 방법 |
데이터 요구량 | 많은 양의 도메인 특화 데이터 필요 | 상대적으로 적은 양의 데이터로도 가능 |
시간 및 비용 | 모델 재학습에 상당한 시간과 계산 자원 소요 | 프롬프트 최적화는 비교적 짧은 시간 내에 가능 |
유연성 | 특정 작업에 최적화된 모델 생성 가능 | 다양한 작업에 동일 모델을 활용 |
기술적 요구사항 | 딥러닝 및 모델 훈련에 대한 깊은 이해 필요 | 프롬프트 설계와 실험에 대한 이해 필요 |
출력 일관성 | 높은 일관성 보장 | 프롬프트에 따라 출력 결과 변동 |
확장성 | 특정 작업에 한정된 확장성 | 다양한 작업에 유연하게 적용 가능 |
기계 학습 (머신 러닝)
데이터를 분석하고, 그 데이터로부터 패턴을 학습하여 새로운 데이터에 대한 예측이나 결정을 내릴 수 있는 모델을 만드는 과정
지도 학습 (Supervised Learning)
입력 데이터와 해당 데이터에 대한 정답이 주어지는 학습 방식
비지도 학습 (Unsupervised Learning)
정답이 없는 데이터를 사용하여 데이터의 구조나 패턴을 발견하는 학습 방식
강화 학습 (Reinforcement Learning)
강화 학습은 시도와 오류를 통해 보상을 최대화하는 행동을 학습하는 방식
딥러닝
컴퓨터가 사람처럼 학습하는 기술로, 기계학습(Machine Learning)의 하위 분야
AI가 학습한다는 것의 의미
많은 예시 데이터에서 특징을 추출해 패턴을 배우고, 이를 기반으로 새로운 데이터를 정확하게 처리하는 능력을 기르는 것
기술적으로, 새로 입력된 데이터에 대한 출력을 결정하는 알고리즘(특정 작업을 수행하기 위한 단계적 절차)을 만드는 것
가중치
입력 데이터의 특정 특징이 얼마나 중요한지 결정하는 매개변수
편향
모델의 출력이 특정 방향으로 치우치지 않도록 조정하는 매개변수
파인튜닝
기존 모델의 가중치(Weights)와 편향(Bias) 값을 초기 값으로 사용. 새로운 데이터를 학습하면서, 기존에 학습한 패턴의 가중치(weights)와 편향(biases) 등을 조정
데이터셋
AI 모델 학습 및 검증 등 특정한 목적을 위해 수집 및 정리된 데이터의 모음
학습 데이터셋
AI가 처음으로 학습하는 데이터
검증 데이터셋
학습 도중에 AI의 성능을 평가하는 데 사용
테스트 데이터셋
AI가 실제 상황에서 얼마나 잘 작동하는지를 평가하는 데 사용
전처리
데이터를 분석하거나 AI 모델을 학습시키기 전에 데이터를 정리하고 변환하는 과정
JSON
데이터를 저장하고 교환하기 위한 경량의 데이터 형식
JSONL
JSON Lines의 약자로, JSON 데이터를 한 줄씩 저장하는 형식
손실 함수
모델의 출력과 실제 정답 사이의 차이를 계산하는 함수
그래디언트
손실 함수 기울기로, 값을 최소화하는 방향으로 모델의 가중치를 조정
하이퍼파라미터
AI 모델을 훈련시킬 때 설정하는 매개변수
1. 학습률 (Learning Rate)
각 반복마다 모델이 얼마나 크게 변화할 것인지 결정하는 값
2. 배치 크기 (Batch Size)
모델이 한 번에 처리하는 데이터의 양
3. 에폭 수 (Epochs)
전체 데이터셋을 몇 번 반복해서 학습할 것인지를 결정
과적합
AI 모델이 학습 데이터에는 아주 잘 맞춰져 있지만, 학습 데이터에 과도하게 최적화되어 새로운 데이터나 검증 데이터에 대해서는 성능이 좋지 않은 상태
과소적합
AI 모델이 학습 데이터의 패턴을 충분히 학습하지 못해, 학습 데이터와 새로운 데이터 모두에 대해 성능이 좋지 않은 상태
전이 학습
기존에 학습된 모델을 새로운 문제에 적용하는 기법
AI가 학습한다는 것의 기술적 의미를 가장 잘 표현한 것은 무엇인가요?
새로운 데이터를 입력받아 가공하는 것
데이터의 특징을 추출해 패턴을 배우고, 가중치와 편향을 조절하는 것
하이퍼파라미터를 체계적으로 설정하는 것
입력받은 데이터의 품질을 검증하는 것
가이드라인
AI 튜터
배포
디자인
업로드
수업 노트
즐겨찾기
도움말