Guidelines

μ›Ή 크둀링을 μœ„ν•œ HTTP ν•„μˆ˜ 지식

μ›Ή 크둀링을 μ œλŒ€λ‘œ ν•˜κΈ° μœ„ν•΄μ„œλŠ” μ›Ή λΈŒλΌμš°μ € μ£Όμ†Œμ°½μ— http://와 같이 λ“±μž₯ν•˜λŠ” HTTP에 λŒ€ν•œ 이해가 ν•„μš”ν•©λ‹ˆλ‹€.

HTTPλŠ” μ›Ή λΈŒλΌμš°μ €μ™€ μ„œλ²„ κ°„μ˜ 톡신을 λ‹΄λ‹Ήν•˜λŠ” ν”„λ‘œν† μ½œ(톡신 κ·œμΉ™)둜, μš”μ²­κ³Ό 응닡을 톡해 데이터λ₯Ό μ£Όκ³  λ°›κΈ° μœ„ν•œ μ•½μ†μž…λ‹ˆλ‹€.

이번 μˆ˜μ—…μ—μ„œλŠ” HTTP의 κΈ°λ³Έ κ°œλ…κ³Ό μš”μ²­κ³Ό μ‘λ‹΅μ˜ κ°œλ…μ— λŒ€ν•΄ μ•Œμ•„λ³΄κ² μŠ΅λ‹ˆλ‹€.


HTTPλŠ” μ–΄λ–»κ²Œ λ™μž‘ν• κΉŒμš”?

HTTPλŠ” ν΄λΌμ΄μ–ΈνŠΈ(μ›Ή λΈŒλΌμš°μ €)κ°€ μ„œλ²„μ— 데이터λ₯Ό μš”μ²­(Request)ν•˜κ³ , μ„œλ²„κ°€ ν΄λΌμ΄μ–ΈνŠΈμ— 데이터λ₯Ό 응닡(Response)ν•˜λŠ” λ°©μ‹μœΌλ‘œ λ™μž‘ν•©λ‹ˆλ‹€.

μ›Ή 크둀링은 주둜 HTTP μš”μ²­μ„ 톡해 μ›Ή νŽ˜μ΄μ§€μ˜ 데이터λ₯Ό κ°€μ Έμ˜€λŠ” κ³Όμ •μœΌλ‘œ, 이λ₯Ό μœ„ν•΄μ„œλŠ” HTTP μš”μ²­κ³Ό 응닡에 λŒ€ν•œ 이해가 ν•„μš”ν•©λ‹ˆλ‹€.


HTTP μš”μ²­: 데이터λ₯Ό μš”μ²­ν•˜λŠ” 방법

HTTP μš”μ²­(Request)은 μ›Ή λΈŒλΌμš°μ €(λ˜λŠ” 크둀링 ν”„λ‘œκ·Έλž¨)κ°€ μ„œλ²„μ— νŠΉμ • 정보λ₯Ό μš”μ²­ν•˜λŠ” λ©”μ‹œμ§€μž…λ‹ˆλ‹€.

μš”μ²­μ€ 주둜 λ‹€μŒκ³Ό 같은 μš”μ†Œλ‘œ κ΅¬μ„±λ©λ‹ˆλ‹€.

  • λ©”μ„œλ“œ(Method) μ„œλ²„μ— μ–΄λ–€ μž‘μ—…μ„ μš”μ²­ν• μ§€λ₯Ό μ •μ˜ν•©λ‹ˆλ‹€. κ°€μž₯ 많이 μ‚¬μš©ν•˜λŠ” λ©”μ„œλ“œλŠ” GETκ³Ό POSTμž…λ‹ˆλ‹€.

    • GET : μ„œλ²„μ—μ„œ 데이터λ₯Ό κ°€μ Έμ˜¬ λ•Œ μ‚¬μš©ν•©λ‹ˆλ‹€. (예: 화면에 ν‘œμ‹œν•  μ›Ή νŽ˜μ΄μ§€μ˜ HTML 데이터)

    • POST : μ„œλ²„μ— 데이터λ₯Ό 보낼 λ•Œ μ‚¬μš©ν•©λ‹ˆλ‹€. (예: 둜그인 정보λ₯Ό μ„œλ²„μ— 전솑)

GET μš”μ²­ μ˜ˆμ‹œ
GET /index.html HTTP/1.1 Host: www.example.com
  • URL : μš”μ²­ν•  μžμ›μ˜ μœ„μΉ˜λ₯Ό λ‚˜νƒ€λƒ…λ‹ˆλ‹€. 예λ₯Ό λ“€μ–΄, https://www.example.com/index.html이 URLμž…λ‹ˆλ‹€.

  • 헀더(Header) : 좔가적인 정보λ₯Ό λ‹΄κ³  있으며, μš”μ²­μ„ 더 μ„ΈλΆ€μ μœΌλ‘œ μ œμ–΄ν•  수 μžˆμŠ΅λ‹ˆλ‹€. 예λ₯Ό λ“€μ–΄, User-Agent ν—€λ”λŠ” μš”μ²­μ„ 보낸 ν΄λΌμ΄μ–ΈνŠΈμ˜ 정보λ₯Ό μ „λ‹¬ν•©λ‹ˆλ‹€.


HTTP 응닡: μš”μ²­μ— λŒ€ν•œ λ‹΅λ³€

HTTP 응닡(Response)은 μ„œλ²„κ°€ ν΄λΌμ΄μ–ΈνŠΈμ˜ μš”μ²­μ— λŒ€ν•΄ λ³΄λ‚΄λŠ” λ©”μ‹œμ§€μž…λ‹ˆλ‹€.

응닡은 주둜 λ‹€μŒκ³Ό 같은 μš”μ†Œλ‘œ κ΅¬μ„±λ©λ‹ˆλ‹€.

  • μƒνƒœ μ½”λ“œ(Status Code): μš”μ²­μ΄ μ„±κ³΅μ μœΌλ‘œ μ²˜λ¦¬λ˜μ—ˆλŠ”μ§€, 였λ₯˜κ°€ λ°œμƒν–ˆλŠ”μ§€ 등을 λ‚˜νƒ€λƒ…λ‹ˆλ‹€. 예λ₯Ό λ“€μ–΄ 200 OKλŠ” μš”μ²­μ΄ μ„±κ³΅ν–ˆμŒμ„ μ˜λ―Έν•˜κ³ , 404 Not FoundλŠ” μš”μ²­ν•œ μžμ›μ„ 찾을 수 μ—†μŒμ„ μ˜λ―Έν•©λ‹ˆλ‹€.
HTTP 응닡 μ˜ˆμ‹œ
HTTP/1.1 200 OK Content-Type: text/html Content-Length: 342 <html> <body> <h1>Example Page</h1> </body> </html>
  • 헀더(Header) : 응닡에 λŒ€ν•œ μΆ”κ°€ 정보λ₯Ό μ œκ³΅ν•©λ‹ˆλ‹€. 예λ₯Ό λ“€μ–΄ Content-Type ν—€λ”λŠ” μ‘λ‹΅μ˜ 데이터 ν˜•μ‹μ„ λ‚˜νƒ€λƒ…λ‹ˆλ‹€.

  • λ³Έλ¬Έ(Body) : μš”μ²­ν•œ μžμ›μ˜ μ‹€μ œ 데이터가 여기에 ν¬ν•¨λ©λ‹ˆλ‹€. μ›Ή νŽ˜μ΄μ§€μ˜ HTML, 이미지, JSON 데이터 등이 여기에 포함될 수 μžˆμŠ΅λ‹ˆλ‹€.


μ›Ή ν¬λ‘€λ§μ—μ„œλŠ” 주둜 GET μš”μ²­μ„ 톡해 μ›Ή νŽ˜μ΄μ§€μ˜ HTML 데이터λ₯Ό κ°€μ Έμ˜΅λ‹ˆλ‹€.

이후 μ„œλ²„κ°€ λ°˜ν™˜ν•œ μ‘λ‹΅μ˜ μƒνƒœ μ½”λ“œμ™€ 본문을 ν™•μΈν•˜μ—¬, 크둀링이 μ„±κ³΅μ μœΌλ‘œ μ΄λ£¨μ–΄μ‘ŒλŠ”μ§€ νŒλ‹¨ν•©λ‹ˆλ‹€.

Mission
0 / 1

HTTP μš”μ²­ 쀑 μ„œλ²„μ— 데이터λ₯Ό 보낼 λ•Œ μ‚¬μš©ν•˜λŠ” λ©”μ„œλ“œλŠ” λ¬΄μ—‡μΈκ°€μš”?

POST
PUT
GET
DELETE

Guidelines

AI Tutor

Publish

Design

Upload

Notes

Favorites

Help