HTML 및 JSON 응답 처리하기
웹 API를 사용하거나 웹 페이지를 크롤링할 때, 서버로부터 받는 응답은 다양한 형식을 가질 수 있습니다.
1. HTML 응답
웹 페이지의 경우, 응답은 대개 HTML 형식으로 옵니다. 정적인 HTML 데이터는 BeautifulSoup
과 같은 라이브러리로 데이터를 파싱하고 추출할 수 있습니다.
이 경우 requests
로 HTML 페이지를 요청한 후, BeautifulSoup
로 파싱하고 원하는 데이터를 추출합니다.
HTML 데이터 추출 예제
import requests from bs4 import BeautifulSoup response = requests.get('https://example.com') soup = BeautifulSoup(response.text, 'html.parser') # 웹 페이지 제목 추출 title = soup.find('title').text
2. JSON 응답
서버에서 전달하는 API 응답은 대부분 JSON 형식입니다.
JSON 응답을 받으면 response.json()
메소드를 사용해 파이썬 객체로 변환할 수 있습니다.
객체 변환은 파이썬의 딕셔너리(dictionary) 형태로 이루어지며, 이렇게 변환된 데이터는 파이썬 코드로 쉽게 활용할 수 있습니다.
여기서 Python의 json
모듈을 사용하여 JSON 데이터를 파이썬 객체로 변환할 수 있습니다.
JSON 데이터 활용 예제
import requests from bs4 import BeautifulSoup response = requests.get('https://httpbin.org/get') # JSON 데이터 파싱 data = response.json() url = data['url'] # JSON 데이터 출력 print(data) print('-' * 20) # JSON 데이터 활용 print("Host:", url)
실습
화면 오른쪽 코드 실행
버튼을 누르고, 크롤링 결과를 확인하거나 코드를 수정해 보세요!
가이드라인
AI 튜터
배포
디자인
업로드
수업 노트
즐겨찾기
도움말
코드 에디터
코드 실행
코드 생성
실행 결과