Lecture

컴퓨터 비전 AI란?

컴퓨터는 사람처럼 시각을 가지고 있지 않은데, 이미지와 영상을 어떻게 인식할까요?

이를 가능하게 하는 기술이 바로 컴퓨터 비전(Computer Vision)입니다.

컴퓨터 비전은 이미지나 영상과 같은 시각 데이터를 컴퓨터로 처리하고 분석하는 기술로, 자율 주행 자동차부터 보안 시스템까지 다양한 분야에 활용되고 있습니다.

이번 수업에서는 컴퓨터 비전의 개념과 주요 활용 사례를 살펴보고, 간단한 컴퓨터 비전 실습을 진행해 보겠습니다.

아직 모든 코드를 이해하실 필요 없습니다! 컴퓨터 비전에 활용되는 코드가 어떻게 작동하는지 감을 잡는 정도면 충분합니다. Shift + Enter를 눌러 코드를 실행해 보세요. 😊


컴퓨터 비전의 작동 원리

컴퓨터가 이미지를 이해하려면, 먼저 이미지를 디지털 데이터로 변환하는 과정이 필요합니다.

이를 위해 일반적으로 픽셀 기반 처리와 벡터화 처리 방식이 사용됩니다.


1. 픽셀 기반 이미지의 디지털화

컴퓨터가 이미지를 처리하기 위해서는 먼저 이미지를 수많은 픽셀로 변환해야 합니다.


픽셀(Pixel)

디지털 이미지의 최소 단위로, 각 픽셀에는 색상 값이 저장됩니다.

컬러 이미지는 RGB(Red, Green, Blue) 값을 조합하여 색상을 표현하며 , 각 색상은 0부터 255까지의 값을 갖습니다.

RGB 색상 값 예시
RGB(255, 0, 0) = 빨간색 RGB(0, 255, 0) = 초록색 RGB(0, 0, 255) = 파란색 RGB(255, 255, 0) = 노란색 RGB(0, 0, 0) = 검은색 RGB(255, 255, 255) = 흰색

해상도(Resolution)

해상도는 이미지의 픽셀 개수를 의미하며, 해상도가 높을수록 세밀한 이미지 표현이 가능합니다.

예를 들어 1920x1080 해상도의 이미지는 가로 1920픽셀, 세로 1080픽셀로 총 2,073,600개의 픽셀로 구성되어 640x480와 같은 더 작은 해상도의 이미지보다 색상을 더 세밀하게 표현할 수 있습니다.


2. 개체 기반 이미지의 벡터화

벡터 이미지는 수학적 좌표기하학적 형상(선, 곡선, 다각형 등)을 이용해 이미지를 표현합니다.

픽셀 기반 이미지는 확대하면 깨져보일 수 있지만, 벡터 기반 이미지는 확대해도 품질이 유지됩니다.

예를 들어 svg(Scalable Vector Graphics) 형식의 이미지는 벡터 이미지로, 크기를 조정해도 선명한 품질을 유지합니다. 하지만 jpg, png와 같은 픽셀 기반 이미지는 확대하면 픽셀이 보이게 되어 품질이 저하됩니다.

컴퓨터 비전에서 벡터 이미지는 객체 인식과 경계선 감지 등 다양한 작업에서 활용됩니다.


컴퓨터 비전의 주요 용어

컴퓨터 비전을 이해하기 위해 꼭 알아야 할 핵심 개념을 정리해 보겠습니다.


1. 이미지 전처리(Image Preprocessing)

이미지의 밝기 조정, 필터 적용, 노이즈(Noise, 불필요한 정보) 제거 등의 전처리 작업을 수행하는 과정입니다.


2. 객체 검출(Object Detection)

이미지 속에서 자동차, 사람, 동물과 같은 특정 객체를 찾고 위치를 식별합니다.

딥러닝 기반 YOLO, Faster R-CNN 등이 대표적인 객체 검출 모델입니다.


3. 이미지 분류(Image Classification)

이미지를 분석하여 특정 카테고리로 분류합니다.

예를 들어 수백만장의 제품 사진에서 불량품을 찾아낼 경우, 이미지 분류 AI를 활용하면 훨씬 생산적으로 불량품을 분류해낼 수 있습니다.


4. 의미론적 분류(Semantic Segmentation)

이미지의 각 픽셀을 특정 클래스에 할당하여 이미지의 의미를 이해하는 기술입니다.

예를 들어, 자동차, 도로, 보행자와 같은 객체를 각각 다른 색상으로 구분하여 시각적으로 표현합니다.


5. 키포인트 탐지(Keypoint Detection)

이미지에서 특정한 점(키포인트)을 찾아내는 기술입니다.

예를 들어 얼굴의 눈, 코, 입과 같은 특징적인 점을 탐지하여 얼굴의 위치를 추적합니다.


컴퓨터 비전 필수 라이브러리 - OpenCV

컴퓨터 비전을 구현하는 대표적인 파이썬 라이브러리로 OpenCV가 있습니다.

OpenCV는 이미지 처리 및 객체 검출 기능을 제공하는 파이썬 라이브러리로, 컴퓨터 비전 관련 다양한 프로젝트에 사용됩니다.



컴퓨터 비전은 자율주행, 의료, 보안, 산업 자동화, 증강 현실 등 다양한 분야에서 활용되고 있으며, 이미지를 보다 더 빠르고 정확하게 인식하기 위해 지속적으로 발전하고 있습니다.

다음 수업에서는 핵심적인 AI 분야 중 하나인 자연어 처리에 대해 알아보겠습니다.

Mission
0 / 1

OpenCV는 컴퓨터 비전 분야에 자주 사용되는 라이브러리이다.

True
False

Lecture

AI Tutor

Design

Upload

Notes

Favorites

Help