Guidelines

μ›Ή 크둀링을 μœ„ν•œ HTML ν•„μˆ˜ 지식

μ›Ή 크둀링을 ν•˜λ €λ©΄ λ¨Όμ € μ›Ή νŽ˜μ΄μ§€κ°€ μ–΄λ–»κ²Œ μž‘λ™ν•˜λŠ”μ§€ ꡬ쑰λ₯Ό 이해해야 ν•©λ‹ˆλ‹€.

크둀링에 κ°€μž₯ 핡심적인 κ°œλ… 쀑 ν•˜λ‚˜λŠ” HTMLμž…λ‹ˆλ‹€.

μ§€κΈˆλΆ€ν„° μ›Ή νŽ˜μ΄μ§€μ˜ 'λΌˆλŒ€'라 ν•  수 μžˆλŠ” HTML에 λŒ€ν•΄ κ°„λ‹¨νžˆ μ•Œμ•„λ³΄κ² μŠ΅λ‹ˆλ‹€.

μ°Έκ³  : μ›Ή μž…λ¬Έ + λ‚˜λ§Œμ˜ μ›Ήμ‚¬μ΄νŠΈ λ§Œλ“€κΈ° κ°•μ˜μ—μ„œ HTML에 λŒ€ν•œ 더 μžμ„Έν•œ λ‚΄μš©μ„ 확인해 λ³΄μ„Έμš”.


HTMLμ΄λž€ λ¬΄μ—‡μΈκ°€μš”?

HTML은 HyperText Markup Language의 μ•½μžλ‘œ, μ›Ή νŽ˜μ΄μ§€λ₯Ό κ΅¬μ„±ν•˜λŠ” 데 μ‚¬μš©λ˜λŠ” κΈ°λ³Έ μ–Έμ–΄μž…λ‹ˆλ‹€.

μ‰½κ²Œ 말해, μ›Ή νŽ˜μ΄μ§€μ˜ ꡬ쑰와 λ‚΄μš©μ„ μ •μ˜ν•˜λŠ” 역할을 ν•©λ‹ˆλ‹€.

μ›Ή λΈŒλΌμš°μ €λŠ” 이 HTML을 해석해 μš°λ¦¬κ°€ λ³΄λŠ” μ›Ή νŽ˜μ΄μ§€λ₯Ό 화면에 ν‘œμ‹œν•©λ‹ˆλ‹€.


μ›Ή 크둀링을 μœ„ν•œ HTML ν•„μˆ˜ 지식

μ›Ή 크둀링을 ν•  λ•Œ κ°€μž₯ μ€‘μš”ν•œ 것은 μ›ν•˜λŠ” 데이터λ₯Ό μ •ν™•νžˆ μ°Ύμ•„λ‚΄λŠ” κ²ƒμž…λ‹ˆλ‹€.

이λ₯Ό μœ„ν•΄ μ•Œμ•„λ‘μ–΄μ•Ό ν•  HTML의 핡심 μš”μ†Œλ“€μ„ μ‚΄νŽ΄λ³΄κ² μŠ΅λ‹ˆλ‹€.


1. νƒœκ·Έ(Tag): μ›Ή νŽ˜μ΄μ§€μ˜ 건좕 자재

HTML은 νƒœκ·Έλ‘œ 이루어져 μžˆμŠ΅λ‹ˆλ‹€. νƒœκ·ΈλŠ” <νƒœκ·Έμ΄λ¦„> ν˜•μ‹μœΌλ‘œ μž‘μ„±λ˜λ©°, μ›Ή νŽ˜μ΄μ§€μ˜ 각 μš”μ†Œλ₯Ό μ •μ˜ν•©λ‹ˆλ‹€.

예λ₯Ό λ“€μ–΄ 제λͺ©μ€ <h1>, 단락은 <p> νƒœκ·Έλ‘œ κ°μ‹Έμ„œ ν‘œν˜„ν•©λ‹ˆλ‹€.

νƒœκ·Έμ˜ μˆ˜λŠ” 맀우 λ‹€μ–‘ν•˜λ©°, 각 νƒœκ·ΈλŠ” νŠΉμ •ν•œ μ˜λ―Έμ™€ κΈ°λŠ₯을 κ°–μŠ΅λ‹ˆλ‹€.

κΈ°λ³Έ HTML νƒœκ·Έ μ˜ˆμ‹œ
<h1>이것은 제λͺ©μž…λ‹ˆλ‹€</h1> <p>이것은 λ‹¨λ½μž…λ‹ˆλ‹€.</p>

μœ„ μ½”λ“œμ—μ„œ 확인할 수 μžˆλ“―μ΄, HTML둜 화면에 ν‘œμ‹œλ˜λŠ” λ‹¨μœ„λŠ” <μ‹œμž‘νƒœκ·Έ>으둜 μ‹œμž‘ν•˜κ³ , </μ’…λ£Œνƒœκ·Έ>으둜 λλ‚©λ‹ˆλ‹€.

<μ‹œμž‘νƒœκ·Έ>κ³Ό </μ’…λ£Œνƒœκ·Έ> μ‚¬μ΄μ—λŠ” νƒœκ·Έμ˜ λ‚΄μš©μ΄ λ“€μ–΄κ°‘λ‹ˆλ‹€.

μ΄λ ‡κ²Œ μ‹œμž‘ νƒœκ·Έμ™€ μ’…λ£Œ νƒœκ·Έλ‘œ λ‘˜λŸ¬μ‹ΈμΈ HTML의 μ΅œμ†Œ λ‹¨μœ„λ₯Ό μš”μ†Œ(Element)라고 ν•©λ‹ˆλ‹€.

크둀링 μ‹œμ—λŠ” μ›ν•˜λŠ” 정보가 μ–΄λ–€ μš”μ†Œ μ•ˆμ— μžˆλŠ”μ§€λ₯Ό νŒŒμ•…ν•΄μ•Ό ν•©λ‹ˆλ‹€.


2. 속성(Attribute): νƒœκ·Έμ˜ 성격을 λΆ€μ—¬ν•˜λŠ” μš”μ†Œ

νƒœκ·Έμ—λŠ” 속성이 뢙을 수 μžˆμŠ΅λ‹ˆλ‹€. 속성은 νƒœκ·Έμ˜ 성격을 μ •μ˜ν•˜κ±°λ‚˜ 좔가적인 정보λ₯Ό μ œκ³΅ν•©λ‹ˆλ‹€.

예λ₯Ό λ“€μ–΄ 링크λ₯Ό μƒμ„±ν•˜λŠ” <a> νƒœκ·ΈλŠ” 링크의 λͺ©μ μ§€λ₯Ό μ§€μ •ν•˜λŠ” href 속성과 μƒˆ μ°½μ—μ„œ μ—¬λŠ”μ§€λ₯Ό μ§€μ •ν•˜λŠ” target 속성을 κ°€μ§‘λ‹ˆλ‹€.

속성 μ˜ˆμ‹œ
<a href="https://www.codefriends.net/" target="_blank">

μœ„ HTML μ½”λ“œλŠ” μ½”λ“œν”„λ Œμ¦ˆ 링크λ₯Ό μƒˆ μ°½μ—μ„œ 열도둝 μ§€μ •ν•©λ‹ˆλ‹€.

μ›Ή 크둀링 μ‹œμ—λŠ” 속성값을 κΈ°μ€€μœΌλ‘œ νŠΉμ • μš”μ†Œλ₯Ό μ°ΎλŠ” κ²½μš°κ°€ λ§ŽμŠ΅λ‹ˆλ‹€.

특히 class(λ™μΌν•œ μŠ€νƒ€μΌμ„ μ μš©ν•  λ•Œ μ‚¬μš©)λ‚˜ id(κ³ μœ ν•œ μ‹λ³„μž) 속성은 μ›Ή 크둀링에 λΉˆλ²ˆν•˜κ²Œ μ‚¬μš©ν•©λ‹ˆλ‹€.


3. DOM ꡬ쑰: μ›Ή νŽ˜μ΄μ§€μ˜ 지도

μ›Ή νŽ˜μ΄μ§€λŠ” HTML νƒœκ·Έλ“€μ΄ κ³„μΈ΅μ μœΌλ‘œ 배치된 DOM(Document Object Model) ꡬ쑰λ₯Ό κ°–μŠ΅λ‹ˆλ‹€.

일반적으둜 μ›Ή νŽ˜μ΄μ§€λŠ” <html> νƒœκ·Έ μ•ˆμ— <body>, <body> νƒœκ·Έ μ•ˆμ— <div> λ“±μ˜ μš”μ†Œλ“€μ΄ μ€‘μ²©λ˜μ–΄ μžˆμŠ΅λ‹ˆλ‹€.

DOM ꡬ쑰λ₯Ό μ΄ν•΄ν•˜λ©΄ νŠΉμ • μš”μ†Œκ°€ νŽ˜μ΄μ§€μ—μ„œ 어디에 μœ„μΉ˜ν•΄ μžˆλŠ”μ§€ μ‰½κ²Œ νŒŒμ•…ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

DOM ꡬ쑰 μ˜ˆμ‹œ
<html> <body> <div> <p>단락 λ‚΄μš©</p> </div> </body> </html>

크둀링할 λ•ŒλŠ” 이 DOM ꡬ쑰둜 μœ„κ³„λ₯Ό νŒŒμ•…ν•˜μ—¬ ν•„μš”ν•œ 데이터λ₯Ό μ •ν™•νžˆ μΆ”μΆœν•  수 μžˆλ„λ‘ ν•΄μ•Ό ν•©λ‹ˆλ‹€.

Mission
0 / 1

HTML은 μ›Ή νŽ˜μ΄μ§€μ˜ ꡬ쑰와 λ‚΄μš©μ„ μ •μ˜ν•˜λŠ” 데 μ‚¬μš©λœλ‹€.

O
X

Guidelines

AI Tutor

Publish

Design

Upload

Notes

Favorites

Help