λ°μ΄ν° μ²λ¦¬μ νΉνλ νμ΄μ¬ λΌμ΄λΈλ¬λ¦¬, Pandas
νλͺ©λ³ 맀μΆ, μκ°λ³ κ³ κ° μ μ
λ± XμΆκ³Ό YμΆμΌλ‘ ꡬμ±λ λ°μ΄ν°λ₯Ό λ€λ£° λ, μ΄λ¬ν λ°μ΄ν°λ μΌλ°μ μΌλ‘ ν(row, κ°λ‘μ€)
κ³Ό μ΄(column, μΈλ‘μ€)
λ‘ κ΅¬μ±λ ν ννλ‘ ννλ©λλ€.
Pandas(ν¬λμ€)
λ νμ΄μ¬μμ ν νμμ λ°μ΄ν°λ₯Ό λ€λ£¨κΈ° μν΄ κ°μ₯ λ리 μ¬μ©λλ ν¨ν€μ§ μ€ νλμ
λλ€.
Pandasλ₯Ό νμ©νλ©΄ λ°μ΄ν°λ₯Ό λΆλ¬μ€κ³ μ μ₯νλ κΈ°μ΄μ μΈ μμ λΆν°, λ°μ΄ν° νν°λ§ λ° μ λ ¬, ν΅κ³ λΆμκΉμ§ λ€μν μμ μ 체κ³μ μΌλ‘ μνν μ μμ΅λλ€.
Pandasμ λ°μ΄ν° ꡬ쑰 2κ°μ§
Pandasμ ν΅μ¬ λ°μ΄ν° ꡬ쑰λ μ리μ¦(Series)
μ λ°μ΄ν°νλ μ(DataFrame)
, 2κ°μ§μ
λλ€.
1. μ리μ¦(Series)
μ리μ¦λ 1μ°¨μ λ°μ΄ν° ꡬ쑰
λ‘, μμ
μμ νλμ μ΄(Column, μΈλ‘μ€)κ³Ό λΉμ·ν κ°λ
μ
λλ€.
νμ΄μ¬ 리μ€νΈ(λ°°μ΄)μ μ μ¬νκ² λ°μ΄ν°κ° μμ°¨μ μΌλ‘ λμ΄λ©λλ€.
κ° λ°μ΄ν°λ κ³ μ ν μΈλ±μ€(Index, λ°μ΄ν°μ μμΉλ₯Ό λνλ΄λ μλ³μ)λ₯Ό κ°μ§λ©°, μ΄ μΈλ±μ€λ₯Ό ν΅ν΄ λ°μ΄ν°μ μ κ·Όν μ μμ΅λλ€.
import pandas as pd # μλ¦¬μ¦ μμ± data_series = pd.Series([10, 20, 30, 40]) print(data_series) # μΆλ ₯ κ²°κ³Ό # 0 10 # 1 20 # 2 30 # 3 40 # dtype: int64
2. λ°μ΄ν°νλ μ(DataFrame)
λ°μ΄ν°νλ μμ μ¬λ¬ κ°μ μ리μ¦λ‘ ꡬμ±λ 2μ°¨μ λ°μ΄ν° ꡬ쑰
μ
λλ€.
νκ³Ό μ΄μ΄ λͺ¨λ μ‘΄μ¬νλ©°, κ° μ΄μ μλ‘ λ€λ₯Έ λ°μ΄ν° νμ μ κ°μ§ μ μμ΅λλ€.
μμ μ ν(μ€νλ λμνΈ)μ μ μ¬ν ꡬ쑰μ λλ€.
import pandas as pd # νλͺ©λ³ λ§€μΆ λ°μ΄ν°νλ μ μμ± data_frame = pd.DataFrame({ 'νλͺ©': ['μ¬κ³Ό', 'λ°λλ', 'λΈκΈ°', 'ν¬λ'], '맀μΆ': [1000, 2000, 1500, 3000] }) print(data_frame) # μΆλ ₯ κ²°κ³Ό # νλͺ© λ§€μΆ # 0 μ¬κ³Ό 1000 # 1 λ°λλ 2000 # 2 λΈκΈ° 1500 # 3 ν¬λ 3000
μ μ½λ μμλ₯Ό 보면 νλͺ©
κ³Ό 맀μΆ
μ΄λΌλ μ΄(Column)λ‘ κ΅¬μ±λ λ°μ΄ν°νλ μμ μμ±ν©λλ€.
μλ₯Ό λ€μ΄ λ°μ΄ν°νλ μμ μμ±νλ μ½λμ 'νλͺ©': ['μ¬κ³Ό', 'λ°λλ', 'λΈκΈ°', 'ν¬λ']
λ μμ
μ μ΄(μΈλ‘μ€)κ³Ό κ°μ μ리μ¦(Series)λ₯Ό μμ±νλ©°, μ΄λ¬ν μ리μ¦λ₯Ό λͺ¨μ λ°μ΄ν°νλ μμ ꡬμ±ν©λλ€.
Pandasμ λ°μ΄ν° ꡬ쑰 μ€ 2μ°¨μ λ°°μ΄λ‘ μ¬λ¬ κ°μ μ리μ¦κ° λͺ¨μ¬ λ§λ€μ΄μ§ ꡬ쑰λ 무μμΈκ°μ?
Guidelines
AI Tutor
Publish
Design
Upload
Notes
Favorites
Help
Code Editor
Execution Result