μλ³ λ§€μΆ λ°μ΄ν° λΆμ ν μ΄λ©μΌλ‘ λ³΄κ³ μ λ°μ‘νκΈ°
νμ¬μμ λ§€λ¬ λ§€μΆ λ³΄κ³ μλ₯Ό μμ±ν΄ μ΄λ©μΌλ‘ λ°μ‘νλ μν©!
μλ§μ λ°μ΄ν°λ₯Ό μμμ μΌλ‘ μ²λ¦¬νλ€ λ³΄λ©΄ λΆνμνκ² λ§μ μκ°μ΄ μμλκ³ , μ€μμ μνλ 컀μ§λλ€.
μ΄λ¬ν λ°λ³΅ μμ μ μλννλ©΄ μκ°μ μ μ½ν λΏλ§ μλλΌ μ 무 ν¨μ¨μ±λ λμΌ μ μμ΅λλ€.
μ΄λ² μκ°μλ μμ
νμΌμ μ μ₯λ κ³ κ°λ³ λ§€μΆ λ°μ΄ν°
λ₯Ό νμ΄μ¬μΌλ‘ λΆμνκ³ , λ§μΆ€ν λ³΄κ³ μ
λ₯Ό μ΄λ©μΌλ‘ λ°μ‘νλ λ°©λ²μ λ°°μλ³΄κ² μ΅λλ€.
κ³Όμ μ© λ°μ΄ν°
κ³Όμ μ μ¬μ©ν λ°μ΄ν°λ μλμ κ°μ΄ .xlsx
μμ
νμΌμ μ μ₯λμ΄ μμ΅λλ€.
μ΄ λ°μ΄ν°λ κ³ κ°μ ID, μ΄λ¦, λ§€μΆ κΈμ‘, 맀μΆμΌ λ±μ ν¬ν¨ν©λλ€.
κ³ κ° ID | κ³ κ° μ΄λ¦ | λ§€μΆ κΈμ‘ | 맀μΆμΌ |
---|---|---|---|
101 | νκΈΈλ | 500000 | 2024-01-15 |
102 | κΉμν¬ | 300000 | 2024-01-22 |
101 | νκΈΈλ | 250000 | 2024-02-10 |
101 | νκΈΈλ | 300000 | 2024-02-18 |
103 | μ΄μ² μ | 400000 | 2024-02-14 |
102 | κΉμν¬ | 150000 | 2024-03-05 |
102 | κΉμν¬ | 50000 | 2024-03-08 |
101 | νκΈΈλ | 100000 | 2024-03-18 |
μ΄μ κ°μ μμ λ°μ΄ν°λ₯Ό μ΄μ©ν΄ κ° κ³ κ°μ μλ³ λ§€μΆ λ°μ΄ν°λ₯Ό λΆμνκ³ , μ΄λ©μΌ λ³΄κ³ μλ₯Ό μμ±ν κ²μ λλ€.
μ€μ΅ μ½λ μ€λͺ
μ€μ΅ μ½λλ Pandas
λΌμ΄λΈλ¬λ¦¬λ₯Ό μ¬μ©νμ¬ μμ
νμΌμμ λ°μ΄ν°λ₯Ό λΆλ¬μ€κ³ , νΉμ μ΄μ κΈ°μ€μΌλ‘ κ·Έλ£Ήννμ¬ κ³ κ°λ³ λ§€μΆ κΈμ‘
μ ν©μ°ν©λλ€.
μ§κΈλΆν° μ½λλ₯Ό ν λ¨κ³μ© μ΄ν΄λ³΄κ² μ΅λλ€.
1. μμ νμΌ λΆλ¬μ€κΈ°
Pandasμ read_excel
ν¨μλ‘ Excel νμΌμ λΆλ¬μ¬ μ μμ΅λλ€.
file_path = 'input_file.xlsx' df = pd.read_excel(file_path, sheet_name='Sheet1')
-
file_path
λ λΆλ¬μ¬ Excel νμΌμ κ²½λ‘μ λλ€. -
pd.read_excel
ν¨μλ ν΄λΉ νμΌμ μ½μ΄μ λ°μ΄ν°λ₯Όdf
λΌλ λ°μ΄ν°νλ μμ μ μ₯ν©λλ€. -
sheet_name='Sheet1'
λ Excel νμΌμ νΉμ μνΈ(Sheet1)λ₯Ό μ§μ νμ¬ κ·Έ λ°μ΄ν°λ₯Ό λΆλ¬μ΅λλ€.
2. κ³ κ° IDμ κ³ κ° μ΄λ¦μΌλ‘ κ·Έλ£ΉννκΈ°
grouped = df.groupby(['κ³ κ° ID', 'κ³ κ° μ΄λ¦'])
groupby
ν¨μλ μ§μ ν μ΄(κ³ κ° ID
, κ³ κ° μ΄λ¦
)μ κΈ°μ€μΌλ‘ λ°μ΄ν°λ₯Ό κ·Έλ£Ήνν©λλ€.
λμΌν κ³ κ° IDμ κ³ κ° μ΄λ¦μ κ°μ§ νλ€μ΄ νλμ κ·Έλ£ΉμΌλ‘ λ¬Άμ λλ€.
3. λ§€μΆ κΈμ‘ λ°μ΄ν° μ ννκΈ°
sales_data = grouped['λ§€μΆ κΈμ‘']
κ·Έλ£Ήνλ λ°μ΄ν°μμ 'λ§€μΆ κΈμ‘'μ΄λΌλ μ΄λ§ μ νν©λλ€.
μ΄ μ΄μ μλ κ°λ€μ΄ κ° κ·Έλ£Ήλ³λ‘ μ²λ¦¬λ κ²μ λλ€.
4. κ° κ·Έλ£Ήμ λ§€μΆ κΈμ‘ ν©μ°νκΈ°
total_sales = sales_data.sum()
sum()
ν¨μλ κ° κ·Έλ£Ήμ λ§€μΆ κΈμ‘μ λͺ¨λ λν΄, κ³ κ°λ³λ‘ λ§€μΆ κΈμ‘μ ν©κ³λ₯Ό κ³μ°ν©λλ€.
5. λ°μ΄ν°νλ μμΌλ‘ λ³ννκ³ μΈλ±μ€ μ¬μ€μ νκΈ°
customer_sales = total_sales.reset_index()
reset_index()
ν¨μλ κ·Έλ£Ήνλ κ²°κ³Όλ₯Ό λ€μ μΌλ°μ μΈ λ°μ΄ν°νλ μ νμμΌλ‘ λ³νν©λλ€.
μ΄ κ³Όμ μμ λ°μ΄ν°νλ μμ μΈλ±μ€κ° 0λΆν° μμλμ΄ ν λ²νΈκ° μλ‘ λΆμ¬λ©λλ€.
6. μ΄ μ΄λ¦ λ³κ²½νκΈ°
customer_sales.columns = ['κ³ κ° ID', 'κ³ κ° μ΄λ¦', 'μ΄ λ§€μΆ κΈμ‘']
λ°μ΄ν°νλ μμ μ΄ μ΄λ¦μ λ³κ²½νμ¬ κ³ κ° ID
, κ³ κ° μ΄λ¦
, μ΄ λ§€μΆ κΈμ‘
μΌλ‘ λͺ
ννκ² νμν©λλ€.
customer_sales
λ°μ΄ν°νλ μμ print ν¨μλ‘ μΆλ ₯νλ©΄ λ€μκ³Ό κ°μ κ²°κ³Όλ₯Ό νμΈν μ μμ΅λλ€.
κ³ κ° ID κ³ κ° μ΄λ¦ μ΄ λ§€μΆ κΈμ‘ 0 101 νκΈΈλ 1150000 1 102 κΉμν¬ 500000 2 103 μ΄μ² μ 400000
Guidelines
AI Tutor
Publish
Design
Upload
Notes
Favorites
Help
Code Editor
Execution Result
Output
The document is empty.
Try running the code.