열과 행 선택
데이터를 분석할 때는 관심 있는 열만 고르거나, 일부 행만 확인하는 등 특정 부분에 집중해야 할 때가 많습니다.
판다스에서는 열 레이블
, 행 위치
, 인덱스 레이블
을 사용해 이를 수행할 수 있습니다.
열 선택하기
열을 선택하는 가장 확실한 방법은 대괄호 안에 열 이름을 넣는 방식입니다.
열 이름으로 선택
data = { "country": ["대한민국", "일본", "중국"], "population": [52, 125, 1420] } df = pd.DataFrame(data) df["population"]
이 코드는 Series
객체를 반환합니다. 이 결과를 변수에 저장해 활용하거나, 조건문과 결합하거나, 계산에 직접 사용할 수도 있습니다.
참고:
df.ColumnName
처럼 점 표기법을 사용하는 방법도 있지만, 열 이름이 유효한 파이썬 식별자일 때만 동작하므로 일반적으로는 권장하지 않습니다.
행 선택하기
Pandas에서 특정 행(Row)을 선택할 때는 두 가지 방법을 사용할 수 있습니다.
iloc[]
: 위치(index) 기반으로 접근loc[]
: 레이블(label) 기반으로 접근
위치로 첫 번째 행 선택
df.iloc[0]
레이블 0인 행 선택
df.loc[0]
두 방법 모두 하나의 행을 Series
형태로 반환합니다.
특정 값 선택하기
아래와 같이 loc
를 사용하면 행과 열을 결합해 특정 셀의 값을 선택할 수 있습니다.
단일 값 선택
df.loc[0, "population"]
위 코드는 "인구" 열에서 첫 번째 행(인덱스 0)
에 해당하는 값을 가져옵니다.
즉, 표 형태의 데이터에서 특정 좌표에 있는 값을 직접 지정해 추출하는 방식입니다.
사용법은 다음과 같습니다.
df.loc[행_라벨, 열_이름]
형태로 사용- 행 레이블은 문자열이나 정수로 지정
- 열 이름은 문자열로 지정
요약
선택자 | 접근 방식 | 예시 |
---|---|---|
df["col"] | 열 이름 기준 | df["나이"] |
df.iloc[i] | 위치 기반 행 | df.iloc[3] |
df.loc[i] | 레이블 기반 행 | df.loc[3] |
df.loc[i, "col"] | 셀 | df.loc[3, "나이"] |
Quiz
0 / 1
Pandas DataFrame에서 열을 선택할 때 df.ColumnName
(점 표기법)을 신뢰성 있게 사용할 수 있다.
○
✕
학습 자료
AI 튜터
디자인
업로드
수업 노트
즐겨찾기
도움말