Guidelines

데이터 μ²˜λ¦¬μ— νŠΉν™”λœ 파이썬 라이브러리, Pandas

ν’ˆλͺ©λ³„ 맀좜, μ‹œκ°„λ³„ 고객 μœ μž… λ“± XμΆ•κ³Ό YμΆ•μœΌλ‘œ κ΅¬μ„±λœ 데이터λ₯Ό λ‹€λ£° λ•Œ, μ΄λŸ¬ν•œ λ°μ΄ν„°λŠ” 일반적으둜 ν–‰(row, κ°€λ‘œμ€„)κ³Ό μ—΄(column, μ„Έλ‘œμ€„)둜 κ΅¬μ„±λœ ν‘œ ν˜•νƒœλ‘œ ν‘œν˜„λ©λ‹ˆλ‹€.

Pandas(νŒ¬λ”μŠ€)λŠ” νŒŒμ΄μ¬μ—μ„œ ν‘œ ν˜•μ‹μ˜ 데이터λ₯Ό 닀루기 μœ„ν•΄ κ°€μž₯ 널리 μ‚¬μš©λ˜λŠ” νŒ¨ν‚€μ§€ 쀑 ν•˜λ‚˜μž…λ‹ˆλ‹€.

Pandasλ₯Ό ν™œμš©ν•˜λ©΄ 데이터λ₯Ό 뢈러였고 μ €μž₯ν•˜λŠ” 기초적인 μž‘μ—…λΆ€ν„°, 데이터 필터링 및 μ •λ ¬, 톡계 λΆ„μ„κΉŒμ§€ λ‹€μ–‘ν•œ μž‘μ—…μ„ μ²΄κ³„μ μœΌλ‘œ μˆ˜ν–‰ν•  수 μžˆμŠ΅λ‹ˆλ‹€.


Pandas의 데이터 ꡬ쑰 2가지

Pandas의 핡심 데이터 κ΅¬μ‘°λŠ” μ‹œλ¦¬μ¦ˆ(Series)와 λ°μ΄ν„°ν”„λ ˆμž„(DataFrame), 2κ°€μ§€μž…λ‹ˆλ‹€.


1. μ‹œλ¦¬μ¦ˆ(Series)

μ‹œλ¦¬μ¦ˆλŠ” 1차원 데이터 ꡬ쑰둜, μ—‘μ…€μ—μ„œ ν•˜λ‚˜μ˜ μ—΄(Column, μ„Έλ‘œμ€„)κ³Ό λΉ„μŠ·ν•œ κ°œλ…μž…λ‹ˆλ‹€.

파이썬 리슀트(λ°°μ—΄)와 μœ μ‚¬ν•˜κ²Œ 데이터가 순차적으둜 λ‚˜μ—΄λ©λ‹ˆλ‹€.

각 λ°μ΄ν„°λŠ” κ³ μœ ν•œ 인덱슀(Index, λ°μ΄ν„°μ˜ μœ„μΉ˜λ₯Ό λ‚˜νƒ€λ‚΄λŠ” μ‹λ³„μž)λ₯Ό 가지며, 이 인덱슀λ₯Ό 톡해 데이터에 μ ‘κ·Όν•  수 μžˆμŠ΅λ‹ˆλ‹€.

μ‹œλ¦¬μ¦ˆ 생성 μ˜ˆμ‹œ
import pandas as pd # μ‹œλ¦¬μ¦ˆ 생성 data_series = pd.Series([10, 20, 30, 40]) print(data_series) # 좜λ ₯ κ²°κ³Ό # 0 10 # 1 20 # 2 30 # 3 40 # dtype: int64

2. λ°μ΄ν„°ν”„λ ˆμž„(DataFrame)

λ°μ΄ν„°ν”„λ ˆμž„μ€ μ—¬λŸ¬ 개의 μ‹œλ¦¬μ¦ˆλ‘œ κ΅¬μ„±λœ 2차원 데이터 κ΅¬μ‘°μž…λ‹ˆλ‹€.

ν–‰κ³Ό 열이 λͺ¨λ‘ μ‘΄μž¬ν•˜λ©°, 각 열은 μ„œλ‘œ λ‹€λ₯Έ 데이터 νƒ€μž…μ„ κ°€μ§ˆ 수 μžˆμŠ΅λ‹ˆλ‹€.

μ—‘μ…€μ˜ ν‘œ(μŠ€ν”„λ ˆλ“œμ‹œνŠΈ)와 μœ μ‚¬ν•œ κ΅¬μ‘°μž…λ‹ˆλ‹€.

λ°μ΄ν„°ν”„λ ˆμž„ 생성 μ˜ˆμ‹œ
import pandas as pd # ν’ˆλͺ©λ³„ 맀좜 λ°μ΄ν„°ν”„λ ˆμž„ 생성 data_frame = pd.DataFrame({ 'ν’ˆλͺ©': ['사과', 'λ°”λ‚˜λ‚˜', 'λ”ΈκΈ°', '포도'], '맀좜': [1000, 2000, 1500, 3000] }) print(data_frame) # 좜λ ₯ κ²°κ³Ό # ν’ˆλͺ© 맀좜 # 0 사과 1000 # 1 λ°”λ‚˜λ‚˜ 2000 # 2 λ”ΈκΈ° 1500 # 3 포도 3000

μœ„ μ½”λ“œ μ˜ˆμ‹œλ₯Ό 보면 ν’ˆλͺ©κ³Ό λ§€μΆœμ΄λΌλŠ” μ—΄(Column)둜 κ΅¬μ„±λœ λ°μ΄ν„°ν”„λ ˆμž„μ„ μƒμ„±ν•©λ‹ˆλ‹€.

예λ₯Ό λ“€μ–΄ λ°μ΄ν„°ν”„λ ˆμž„μ„ μƒμ„±ν•˜λŠ” μ½”λ“œμ˜ 'ν’ˆλͺ©': ['사과', 'λ°”λ‚˜λ‚˜', 'λ”ΈκΈ°', '포도']λŠ” μ—‘μ…€μ˜ μ—΄(μ„Έλ‘œμ€„)κ³Ό 같은 μ‹œλ¦¬μ¦ˆ(Series)λ₯Ό μƒμ„±ν•˜λ©°, μ΄λŸ¬ν•œ μ‹œλ¦¬μ¦ˆλ₯Ό λͺ¨μ•„ λ°μ΄ν„°ν”„λ ˆμž„μ„ κ΅¬μ„±ν•©λ‹ˆλ‹€.

Mission
0 / 1

Pandas의 데이터 ꡬ쑰 쀑 2차원 λ°°μ—΄λ‘œ μ—¬λŸ¬ 개의 μ‹œλ¦¬μ¦ˆκ°€ λͺ¨μ—¬ λ§Œλ“€μ–΄μ§„ κ΅¬μ‘°λŠ” λ¬΄μ—‡μΈκ°€μš”?

리슀트(List)
νŠœν”Œ(Tuple)
λ°μ΄ν„°ν”„λ ˆμž„(DataFrame)
λ”•μ…”λ„ˆλ¦¬(Dictionary)

Guidelines

AI Tutor

Publish

Design

Upload

Notes

Favorites

Help

Code Editor

Run
Generate

Execution Result