λ¬Έμ μΈμ½λ© λ° λ°μ΄ν° μ²λ¦¬
μΈμ½λ©
μ λ°μ΄ν°λ₯Ό νΉμ νμμΌλ‘ λ³ννλ κ³Όμ μ λ§ν©λλ€.
μΈμ½λ©μ μ»΄ν¨ν° μμ€ν μμ λ°μ΄ν°λ₯Ό μ μ₯, μ²λ¦¬, μ μ‘νλ λ° νμν κ³Όμ μΌλ‘, λ€μν ννμ μ 보(μ: ν μ€νΈ, μ΄λ―Έμ§, μ€λμ€ λ±)λ₯Ό μ»΄ν¨ν°κ° μ΄ν΄ν μ μλ λ°©μμΌλ‘ λ³νν©λλ€.
λ¬Έμ μΈμ½λ©
μ λ¬Έμλ κΈ°νΈλ€μ μ»΄ν¨ν°μμ μ¬μ©ν μ μλ λ°μ΄ν° νμ, μ¦ μ«μλ‘ λ³ννλ κ³Όμ μ
λλ€.
μ»΄ν¨ν°λ κΈ°λ³Έμ μΌλ‘ μ«μλ§μ μ΄ν΄ν μ μκΈ° λλ¬Έμ, μΈκ°μ΄ μ¬μ©νλ λ€μν λ¬Έμ μμ€ν (μ: μνλ²³, νκΈ, νμ, μλΌλΉμ μ«μ λ±)μ μ«μλ‘ λ³ννμ¬ μ μ₯, μ²λ¦¬, μ μ‘ν΄μΌ ν©λλ€.
λ¬Έμ μΈμ½λ©μ μ΄λ¬ν λ³ν κ·μΉμ μ μν κ²μΌλ‘, ASCII, UTF-8, ISO-8859-1μ κ°μ λ€μν λ¬Έμ μΈμ½λ© λ°©μμ΄ μμ΅λλ€.
μΈμ½λ© νμΈ λ° μ€μ νκΈ°
Python requests
λΌμ΄λΈλ¬λ¦¬λ μ¬λ°λ₯Έ μΈμ½λ©μ λλΆλΆ μλμΌλ‘ κ°μ§ν©λλ€.
BeautifulSoup
κ°μ²΄λ₯Ό μμ±ν λ μΈμ½λ©μ λͺ
μμ μΌλ‘ μ§μ ν μλ μμ΅λλ€.
response = requests.get('http://example.com') response.encoding = 'utf-8' # μΈμ½λ© μ€μ soup = BeautifulSoup(response.text, 'html.parser')
λ°μ΄ν° μ μ λ° μ μ₯ λ°©λ²
ν¬λ‘€λ§μΌλ‘ μμ§ν λ°μ΄ν°λ₯Ό ν¨μ¨μ μΌλ‘ μ μ₯νκ³ νμ©νκΈ° μν΄μλ λ°μ΄ν° μ μ λ° μ μ₯ κ³Όμ μ΄ νμν©λλ€.
λ°μ΄ν° μ μ
Pythonμ λ΄μ₯ ν¨μ(μ: strip()
, replace()
)λ₯Ό μ¬μ©ν΄ λΆνμν 곡백, HTML νκ·Έ λ±μ μ κ±°ν©λλ€.
λ°μ΄ν° μ μ₯
ν¬λ‘€λ§ν λ°μ΄ν°λ ν μ€νΈ νμΌ, CSV, JSON λ±μ νμΌ ννλ‘ μ μ₯νκ±°λ, λ³λμ λ°μ΄ν°λ² μ΄μ€μ μ μ₯ν©λλ€.
import json data = {'name': 'Alice', 'link': 'http://example.com'} # JSON νμμΌλ‘ data.json νμΌμ μ μ₯ with open('data.json', 'w', encoding='utf-8') as file: json.dump(data, file, ensure_ascii=False)
μ€μ΅
νλ©΄ μ€λ₯Έμͺ½ μ½λ μ€ν
λ²νΌμ λλ₯΄κ³ , ν¬λ‘€λ§ κ²°κ³Όλ₯Ό νμΈνκ±°λ μ½λλ₯Ό μμ ν΄ λ³΄μΈμ!
Guidelines
AI Tutor
Publish
Design
Upload
Notes
Favorites
Help
Code Editor
Execution Result