AI를 학습시킬 때 사용하는 데이터 형식
AI 모델을 학습시키기 위해서는 데이터를 AI가 이해할 수 있는 형식으로 변환해야 합니다.
이번 수업에서는 AI를 학습시키는 데 사용되는 주요 데이터 형식인 CSV
, JSON
, XML
에 대해 알아보겠습니다.
CSV
CSV는 Comma-Separated Values의 약자로, 표(Table) 형식의 데이터를 저장 및 전송합니다.
각 행(가로줄)은 하나의 데이터를 표현하며 나타내며, 각 열은 데이터의 특정 속성을 나타냅니다. 각 열의 값은 쉼표(,)로 구분됩니다.
예를 들어, 학생들의 이름별 수학 및 영어 성적을 저장하는 CSV 파일은 다음과 같이 표현될 수 있습니다.
이름,수학,영어 김철수,85,90 최영희,88,80
CSV는 .csv
파일 확장자를 가진 텍스트 파일로 저장되며, Microsoft Excel, Google Sheets, 데이터베이스 프로그램 등 다양한 데이터 관리 프로그램에서 쉽게 열고 편집할 수 있습니다.
JSON
JSON(JavaScript Object Notation)은 주로 웹 및 모바일 애플리케이션에서 데이터 저장 및 교환을 위해 사용됩니다.
JSON은 객체(Object)와 배열(Array)로 구성되며, 객체는 중괄호 { }
로, 배열은 대괄호 [ ]
로 감싸져 있습니다.
더 자세한 내용은 다음 수업에서 알아보겠습니다.
// 대괄호로 감싼 배열 [ // 중괄호로 감싼 객체 { "이름": "김철수", "수학": 85, "영어": 90 }, { "이름": "최영희", "수학": 88, "영어": 80 } ]
XML
XML(eXtensible Markup Language)은 주로 데이터의 계층 구조를 표현하는 데 사용됩니다.
XML의 주요 요소는 다음과 같습니다:
-
태그:
< >
로 감싸진 데이터로, 데이터의 계층 구조를 표현합니다.- 태그는 시작 태그와 종료 태그로 나뉩니다.
- 시작 태그는
<태그명>
, 종료 태그는</태그명>
으로 표시됩니다.
-
속성: 태그 내에 추가 정보를 제공하기 위해 사용됩니다.
- 태그에 속성을 추가하려면
<태그명 속성명="속성값">
형식을 사용합니다. - 예:
<학생 성별="남">
은 학생 태그에 성별 속성을 추가한 예입니다.
- 태그에 속성을 추가하려면
아래는 JSON 예시를 XML로 표현한 것입니다.
<학생명단> <학생> <이름>김철수</이름> <수학>85</수학> <영어>90</영어> </학생> <학생> <이름>최영희</이름> <수학>88</수학> <영어>80</영어> </학생> </학생명단>
이외에도 이미지 관련 AI 모델을 학습시킬 때는 이미지를 학습 데이터로 사용하며, 자연어 처리 모델을 학습시킬 때는 텍스트 파일(.txt)을 자주 사용합니다.
다음 빈칸에 들어갈 말로 가장 적합한 단어는 무엇일까요?
Guidelines
AI Tutor
Publish
Design
Upload
Notes
Favorites
Help