Guidelines

HTML 및 JSON 응닡 μ²˜λ¦¬ν•˜κΈ°

μ›Ή APIλ₯Ό μ‚¬μš©ν•˜κ±°λ‚˜ μ›Ή νŽ˜μ΄μ§€λ₯Ό 크둀링할 λ•Œ, μ„œλ²„λ‘œλΆ€ν„° λ°›λŠ” 응닡은 λ‹€μ–‘ν•œ ν˜•μ‹μ„ κ°€μ§ˆ 수 μžˆμŠ΅λ‹ˆλ‹€.


1. HTML 응닡

μ›Ή νŽ˜μ΄μ§€μ˜ 경우, 응닡은 λŒ€κ°œ HTML ν˜•μ‹μœΌλ‘œ μ˜΅λ‹ˆλ‹€. 정적인 HTML λ°μ΄ν„°λŠ” BeautifulSoupκ³Ό 같은 라이브러리둜 데이터λ₯Ό νŒŒμ‹±ν•˜κ³  μΆ”μΆœν•  수 μžˆμŠ΅λ‹ˆλ‹€.

이 경우 requests둜 HTML νŽ˜μ΄μ§€λ₯Ό μš”μ²­ν•œ ν›„, BeautifulSoup둜 νŒŒμ‹±ν•˜κ³  μ›ν•˜λŠ” 데이터λ₯Ό μΆ”μΆœν•©λ‹ˆλ‹€.

HTML 데이터 μΆ”μΆœ 예제
import requests from bs4 import BeautifulSoup response = requests.get('https://example.com') soup = BeautifulSoup(response.text, 'html.parser') # μ›Ή νŽ˜μ΄μ§€ 제λͺ© μΆ”μΆœ title = soup.find('title').text

2. JSON 응닡

μ„œλ²„μ—μ„œ μ „λ‹¬ν•˜λŠ” API 응닡은 λŒ€λΆ€λΆ„ JSON ν˜•μ‹μž…λ‹ˆλ‹€.

JSON 응닡을 λ°›μœΌλ©΄ response.json() λ©”μ†Œλ“œλ₯Ό μ‚¬μš©ν•΄ 파이썬 객체둜 λ³€ν™˜ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

객체 λ³€ν™˜μ€ 파이썬의 λ”•μ…”λ„ˆλ¦¬(dictionary) ν˜•νƒœλ‘œ 이루어지며, μ΄λ ‡κ²Œ λ³€ν™˜λœ λ°μ΄ν„°λŠ” 파이썬 μ½”λ“œλ‘œ μ‰½κ²Œ ν™œμš©ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

μ—¬κΈ°μ„œ Python의 json λͺ¨λ“ˆμ„ μ‚¬μš©ν•˜μ—¬ JSON 데이터λ₯Ό 파이썬 객체둜 λ³€ν™˜ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

JSON 데이터 ν™œμš© 예제
import requests from bs4 import BeautifulSoup response = requests.get('https://httpbin.org/get') # JSON 데이터 νŒŒμ‹± data = response.json() url = data['url'] # JSON 데이터 좜λ ₯ print(data) print('-' * 20) # JSON 데이터 ν™œμš© print("Host:", url)

μ‹€μŠ΅

ν™”λ©΄ 였λ₯Έμͺ½ μ½”λ“œ μ‹€ν–‰ λ²„νŠΌμ„ λˆ„λ₯΄κ³ , 크둀링 κ²°κ³Όλ₯Ό ν™•μΈν•˜κ±°λ‚˜ μ½”λ“œλ₯Ό μˆ˜μ •ν•΄ λ³΄μ„Έμš”!

Guidelines

AI Tutor

Publish

Design

Upload

Notes

Favorites

Help

Code Editor

Run
Generate

Execution Result