학습 자료

DataFrame 병합과 조인

실제 데이터 작업에서는 정보가 여러 테이블에 흩어져 있는 경우가 많습니다.

예를 들어,한 DataFrame에는 고객 정보가, 다른 DataFrame에는 해당 고객의 주문 정보가 들어 있을 수 있습니다.

이들을 함께 분석하려면 데이터셋을 merge 또는 join으로 결합해야 합니다.


Merge와 Join의 기본

Pandas는 데이터를 결합하기 위한 유용한 메서드를 제공합니다.

  • pd.merge()는 두 DataFrame에서 기준 열의 값이 일치하는 행을 기준으로 결합하며, SQL 조인과 유사하게 동작합니다.
  • .join()은 인덱스 또는 키 열을 사용하여 한 DataFrame에 다른 DataFrame의 열을 추가하는 메서드입니다.

자주 쓰는 조인 유형

조인 유형설명
Inner일치하는 행만 유지
Left왼쪽 DataFrame의 모든 행을 유지하고, 오른쪽에서 일치하는 값을 가져옴
Right오른쪽 DataFrame의 모든 행을 유지하고, 왼쪽에서 일치하는 값을 가져옴
Outer두 DataFrame의 모든 행을 유지하며, 없는 값은 NaN으로 채움

이러한 조인을 통해 포함할 데이터의 범위를 제어하고, 엄격한 일치만 볼지 전체 결합을 할지 선택할 수 있습니다.

Quiz
0 / 1

SQL 조인처럼 열 값에 기반해 두 개의 DataFrame을 병합할 때, pandas에서 어떤 함수를 사용하나요?

공통 열 값을 기준으로 두 개의 DataFrame을 결합하려면, pandas에서 함수를 사용합니다.
pd.concat()
pd.merge()
pd.append()
pd.groupBy()

학습 자료

AI 튜터

디자인

업로드

수업 노트

즐겨찾기

도움말