학습 자료

데이터 유형: 정형 vs 비정형

데이터는 모두 같은 모습으로 존재하지 않습니다.

데이터의 형태에 따라 저장 방식, 처리 방법, 분석 전략까지 달라집니다.

데이터 분석을 시작할 때는 가장 먼저 어떠한 데이터를 다뤄야 하는지 파악해야 합니다.

데이터는 크게 두 가지로 나눌 수 있습니다.

정형 데이터(Structured Data)

  • 일정한 규칙과 형식을 따르는 데이터.
  • 데이터베이스에 저장하기 쉽고, 검색·정렬·분석이 용이합니다.

비정형 데이터(Unstructured Data)

  • 정해진 구조가 없는 데이터.
  • 텍스트, 이미지, 영상 등 의미를 이해하려면 맥락을 고려한 추가 처리가 필요합니다.

데이터 유형에 따라 활용하는 도구, 저장 방식, 분석 기법 모두 달라집니다.


분석 전에 던져야 할 질문들

데이터 분석을 시작하기 전에 다음과 같은 부분을 먼저 살펴봐야 합니다.

  • 이 데이터를 저장하거나 조회하기에 가장 적합한 형식은 무엇일까?
  • 분석을 위해 데이터 정제가 얼마나 필요할까?
  • 이 데이터 구조에 맞는 도구나 라이브러리는 무엇일까?

다루는 데이터가 정형인지 비정형인지 알면, 올바른 전략을 세우고 시행착오를 줄일 수 있습니다.

Quiz
0 / 1

구조화된 데이터와 비구조화된 데이터의 주요 차이점은 무엇인가요?

구조화된 데이터는 복잡한 처리 기술을 필요로 하지만, 비구조화된 데이터는 그렇지 않습니다.

비구조화된 데이터는 자유 형식의 데이터로 구성되어 있어 정렬하기 어렵습니다.

구조화된 데이터는 높은 구조화와 정렬이 쉽습니다.

비구조화된 데이터는 고급 비디오 처리 도구가 필요합니다.

학습 자료

AI 튜터

디자인

업로드

수업 노트

즐겨찾기

도움말