HTML λ° JSON μλ΅ μ²λ¦¬νκΈ°
μΉ APIλ₯Ό μ¬μ©νκ±°λ μΉ νμ΄μ§λ₯Ό ν¬λ‘€λ§ν λ, μλ²λ‘λΆν° λ°λ μλ΅μ λ€μν νμμ κ°μ§ μ μμ΅λλ€.
1. HTML μλ΅
μΉ νμ΄μ§μ κ²½μ°, μλ΅μ λκ° HTML νμμΌλ‘ μ΅λλ€. μ μ μΈ HTML λ°μ΄ν°λ BeautifulSoup
κ³Ό κ°μ λΌμ΄λΈλ¬λ¦¬λ‘ λ°μ΄ν°λ₯Ό νμ±νκ³ μΆμΆν μ μμ΅λλ€.
μ΄ κ²½μ° requests
λ‘ HTML νμ΄μ§λ₯Ό μμ²ν ν, BeautifulSoup
λ‘ νμ±νκ³ μνλ λ°μ΄ν°λ₯Ό μΆμΆν©λλ€.
import requests from bs4 import BeautifulSoup response = requests.get('https://example.com') soup = BeautifulSoup(response.text, 'html.parser') # μΉ νμ΄μ§ μ λͺ© μΆμΆ title = soup.find('title').text
2. JSON μλ΅
μλ²μμ μ λ¬νλ API μλ΅μ λλΆλΆ JSON νμμ λλ€.
JSON μλ΅μ λ°μΌλ©΄ response.json()
λ©μλλ₯Ό μ¬μ©ν΄ νμ΄μ¬ κ°μ²΄λ‘ λ³νν μ μμ΅λλ€.
κ°μ²΄ λ³νμ νμ΄μ¬μ λμ λ리(dictionary) ννλ‘ μ΄λ£¨μ΄μ§λ©°, μ΄λ κ² λ³νλ λ°μ΄ν°λ νμ΄μ¬ μ½λλ‘ μ½κ² νμ©ν μ μμ΅λλ€.
μ¬κΈ°μ Pythonμ json
λͺ¨λμ μ¬μ©νμ¬ JSON λ°μ΄ν°λ₯Ό νμ΄μ¬ κ°μ²΄λ‘ λ³νν μ μμ΅λλ€.
import requests from bs4 import BeautifulSoup response = requests.get('https://httpbin.org/get') # JSON λ°μ΄ν° νμ± data = response.json() url = data['url'] # JSON λ°μ΄ν° μΆλ ₯ print(data) print('-' * 20) # JSON λ°μ΄ν° νμ© print("Host:", url)
μ€μ΅
νλ©΄ μ€λ₯Έμͺ½ μ½λ μ€ν
λ²νΌμ λλ₯΄κ³ , ν¬λ‘€λ§ κ²°κ³Όλ₯Ό νμΈνκ±°λ μ½λλ₯Ό μμ ν΄ λ³΄μΈμ!
Guidelines
AI Tutor
Publish
Design
Upload
Notes
Favorites
Help
Code Editor
Execution Result