가이드라인

AI를 학습시킬 때 사용하는 데이터 형식

AI 모델을 학습시키기 위해서는 데이터를 AI가 이해할 수 있는 형식으로 변환해야 합니다.

이번 수업에서는 AI를 학습시키는 데 사용되는 주요 데이터 형식인 CSV, JSON, XML에 대해 알아보겠습니다.


CSV

CSV는 Comma-Separated Values의 약자로, 표(Table) 형식의 데이터를 저장 및 전송합니다.

각 행(가로줄)은 하나의 데이터를 표현하며 나타내며, 각 열은 데이터의 특정 속성을 나타냅니다. 각 열의 값은 쉼표(,)로 구분됩니다.

예를 들어, 학생들의 이름별 수학 및 영어 성적을 저장하는 CSV 파일은 다음과 같이 표현될 수 있습니다.

CSV 예시
이름,수학,영어 김철수,85,90 최영희,88,80

CSV는 .csv 파일 확장자를 가진 텍스트 파일로 저장되며, Microsoft Excel, Google Sheets, 데이터베이스 프로그램 등 다양한 데이터 관리 프로그램에서 쉽게 열고 편집할 수 있습니다.


JSON

JSON(JavaScript Object Notation)은 주로 웹 및 모바일 애플리케이션에서 데이터 저장 및 교환을 위해 사용됩니다.

JSON은 객체(Object)와 배열(Array)로 구성되며, 객체는 중괄호 { }로, 배열은 대괄호 [ ]로 감싸져 있습니다.

더 자세한 내용은 다음 수업에서 알아보겠습니다.


JSON 예시
// 대괄호로 감싼 배열 [ // 중괄호로 감싼 객체 { "이름": "김철수", "수학": 85, "영어": 90 }, { "이름": "최영희", "수학": 88, "영어": 80 } ]

XML

XML(eXtensible Markup Language)은 주로 데이터의 계층 구조를 표현하는 데 사용됩니다.

XML의 주요 요소는 다음과 같습니다:

  1. 태그: < >로 감싸진 데이터로, 데이터의 계층 구조를 표현합니다.

    • 태그는 시작 태그와 종료 태그로 나뉩니다.
    • 시작 태그는 <태그명>, 종료 태그는 </태그명>으로 표시됩니다.
  2. 속성: 태그 내에 추가 정보를 제공하기 위해 사용됩니다.

    • 태그에 속성을 추가하려면 <태그명 속성명="속성값"> 형식을 사용합니다.
    • 예: <학생 성별="남">은 학생 태그에 성별 속성을 추가한 예입니다.

아래는 JSON 예시를 XML로 표현한 것입니다.

XML 예시
<학생명단> <학생> <이름>김철수</이름> <수학>85</수학> <영어>90</영어> </학생> <학생> <이름>최영희</이름> <수학>88</수학> <영어>80</영어> </학생> </학생명단>

이외에도 이미지 관련 AI 모델을 학습시킬 때는 이미지를 학습 데이터로 사용하며, 자연어 처리 모델을 학습시킬 때는 텍스트 파일(.txt)을 자주 사용합니다.

Mission
0 / 1

다음 빈칸에 들어갈 말로 가장 적합한 단어는 무엇일까요?

에서 각 행(가로줄)은 하나의 데이터를 표현하며, 각 열은 쉼표(,)로 구분합니다.
CSV
JSON
XML
HTML

가이드라인

AI 튜터

배포

디자인

업로드

수업 노트

즐겨찾기

도움말