날짜와 시간 열 다루기
실제 데이터셋에는 판매 기록, 센서 데이터, 사용자 활동 로그처럼 날짜와 시간 정보(timestamp)
가 포함된 경우가 많습니다.
Pandas
를 사용하면 문자열을 datetime
객체로 변환하고 날짜 구성 요소를 쉽게 추출하며 특정 기간으로 데이터를 필터링할 수 있습니다.
문자열을 datetime으로 변환
날짜 데이터를 다루려면 우선 문자열을 datetime
객체로 변환해야 합니다.
열을 datetime으로 변환
df["date"] = pd.to_datetime(df["date"])
변환 후에는 Pandas가 해당 열을 실제 날짜형 데이터로 인식하므로 정렬, 기간 필터링 같은 작업을 손쉽게 수행할 수 있습니다.
날짜 구성 요소 추출
변환된 datetime 열에서는 연도, 월, 일, 시각 등 필요한 정보를 간단히 꺼낼 수 있습니다.
날짜 구성 요소 접근
df["연도"] = df["날짜"].dt.year df["요일"] = df["날짜"].dt.day_name()
시간 기반 필터링
특정 기간에 해당하는 행만 선택하려면 불리언 마스킹을 활용할 수 있습니다.
특정 날짜 이후로 필터링
df[df["날짜"] > "2023-01-01"]
이렇게 하면 기간별 분석, 계절성 패턴 탐색, 이벤트 전후 비교 같은 다양한 시계열 분석 작업을 쉽게 처리할 수 있습니다.
Quiz
0 / 1
Pandas에서는 더 쉬운 분석을 위해 문자열 데이터를 datetime 객체로 직접 변환할 수 있다.
○
✕
학습 자료
AI 튜터
디자인
업로드
수업 노트
즐겨찾기
도움말