학습 자료

Seaborn의 페어플롯과 히트맵

Seaborn은 변수 간 관계를 탐색하는 데 유용하게 사용할 수 있는 페어플롯(pairplot)히트맵(heatmap)을 제공합니다.


페어플롯: 다변수 관계 시각화

pairplot()은 데이터셋의 모든 숫자형 변수 조합에 대해 자동으로 산점도를 생성합니다.

대각선에는 각 변수의 히스토그램(또는 KDE 플롯)이 표시됩니다.

페어플롯을 사용하면 다음과 같은 작업이 가능합니다.

  • 여러 특성 간 관계를 한눈에 파악
  • 변수 간 상관관계 시각적 식별
  • 이상치 및 비정상적 패턴 감지

예를 들어, tips 데이터셋에서 total_bill, tip, size 같은 숫자형 열을 sns.pairplot()으로 쉽게 비교할 수 있습니다.

페어플롯 예시
import seaborn as sns import matplotlib.pyplot as plt tips = sns.load_dataset("tips") sns.pairplot(tips[["total_bill", "tip", "size"]]) plt.show()

히트맵: 상관관계 행렬 시각화

heatmap()행렬의 값을 색상으로 표현하는 그래프이며, 주로 상관계수 행렬을 시각화하는 데 사용합니다.

히트맵을 활용하면 다음과 같은 작업이 가능합니다.

  • 상관관계 행렬을 색상으로 표현
  • 강한 양(+)·음(-)의 상관관계 강조
  • 머신러닝을 위한 특성 선택에 활용

일반적으로 DataFrame에서 상관관계 행렬을 계산한 뒤 sns.heatmap()으로 플로팅합니다.

색상 그라디언트를 적용하면 관계 강도를 직관적으로 표현할 수 있습니다.

히트맵 예시
import numpy as np corr = tips[["total_bill", "tip", "size"]].corr() sns.heatmap(corr, annot=True, cmap="coolwarm") plt.title("상관관계 히트맵") plt.show()

요약

  • 페어플롯: 산점도와 히스토그램으로 여러 숫자형 변수를 한 번에 비교
  • 히트맵: 색상으로 변수 간 상관관계 강도를 표현하는 행렬 시각화
Quiz
0 / 1

Seaborn에서 페어플롯(pair plot)을 사용할 때의 주요 장점은 무엇인가요?

행렬이나 표에서 값을 색으로 표현한다.

강한 양의 또는 음의 관계를 강조한다.

산점도로 특성 간 관계를 빠르게 파악할 수 있다.

머신러닝에서 특성 선택에 사용된다.

학습 자료

AI 튜터

디자인

업로드

수업 노트

즐겨찾기

도움말