Lecture

CSS μ„ νƒμžλ₯Ό ν™œμš©ν•œ 데이터 μΆ”μΆœ

CSS μ„ νƒμžλŠ” μ—¬λŸ¬ HTML μš”μ†Œ μ€‘μ—μ„œ νŠΉμ • μš”μ†Œλ₯Ό μ„ νƒν•©λ‹ˆλ‹€.


κΈ°λ³Έ CSS μ„ νƒμž

  1. 클래슀 μ„ νƒμž: .classname ν˜•νƒœλ‘œ, ν•΄λ‹Ή 클래슀λ₯Ό 가진 λͺ¨λ“  μš”μ†Œλ₯Ό μ„ νƒν•©λ‹ˆλ‹€.

  2. ID μ„ νƒμž: #idname ν˜•νƒœλ‘œ, νŠΉμ • IDλ₯Ό 가진 μš”μ†Œλ₯Ό μ„ νƒν•©λ‹ˆλ‹€.

  3. μš”μ†Œ μ„ νƒμž: tagname ν˜•νƒœλ‘œ, ν•΄λ‹Ή νƒœκ·Έλ₯Ό 가진 λͺ¨λ“  μš”μ†Œλ₯Ό μ„ νƒν•©λ‹ˆλ‹€.


BeautifulSoupμ—μ„œ CSS μ„ νƒμž μ‚¬μš©

BeautifulSoup의 select() λ©”μ†Œλ“œλ₯Ό μ‚¬μš©ν•˜μ—¬ CSS μ„ νƒμžλ‘œ μš”μ†Œλ₯Ό 찾을 수 μžˆμŠ΅λ‹ˆλ‹€.

CSS μ„ νƒμžλ‘œ μš”μ†Œ μ°ΎκΈ°
soup = BeautifulSoup(html_doc, 'html.parser') # ν΄λž˜μŠ€κ°€ 'my-class'인 λͺ¨λ“  μš”μ†Œ μ°ΎκΈ° class_elements = soup.select('.my-class') # IDκ°€ 'my-id'인 μš”μ†Œ μ°ΎκΈ° id_element = soup.select('#my-id') # λͺ¨λ“  <a> νƒœκ·Έ μ°ΎκΈ° a_elements = soup.select('a')

ν…μŠ€νŠΈ 데이터 μΆ”μΆœ

  • CSS μ„ νƒμžλ‘œ 찾은 μš”μ†Œμ— .text 속성을 μ‚¬μš©ν•˜μ—¬ ν…μŠ€νŠΈ λ‚΄μš©μ„ μΆ”μΆœν•©λ‹ˆλ‹€.
ν…μŠ€νŠΈ 데이터 μΆ”μΆœ
soup = BeautifulSoup(html_doc, 'html.parser') # ν΄λž˜μŠ€κ°€ 'my-class'인 μš”μ†Œμ˜ ν…μŠ€νŠΈ μΆ”μΆœ for el in soup.select('.my-class'): print(el.text) # IDκ°€ 'my-id'인 μš”μ†Œμ˜ ν…μŠ€νŠΈ μΆ”μΆœ print(soup.select_one('#my-id').text)

속성 κ°’ μΆ”μΆœ

  • νŠΉμ • 속성(예: href, src)을 가진 μš”μ†Œμ˜ ν•΄λ‹Ή 속성 값을 μΆ”μΆœν•  수 μžˆμŠ΅λ‹ˆλ‹€.
속성 κ°’ μΆ”μΆœ
# λͺ¨λ“  <a> νƒœκ·Έμ˜ href 속성 κ°’ μΆ”μΆœ for a in soup.select('a'): print(a.get('href')) # 이미지 νƒœκ·Έ(<img>)의 src 속성 κ°’ μΆ”μΆœ for img in soup.select('img'): print(img.get('src'))

μ‚¬μš© μ˜ˆμ‹œ

μ‚¬μš© μ˜ˆμ‹œ
html_doc = """ <div class="content"> <p class="info">This is a paragraph.</p> <a href="http://example.com">Example Link</a> </div> """ soup = BeautifulSoup(html_doc, 'html.parser') # 클래슀 'info'λ₯Ό 가진 <p> νƒœκ·Έμ˜ ν…μŠ€νŠΈ μΆ”μΆœ info_text = soup.select_one('.info').text print(info_text) # λͺ¨λ“  링크(<a>)의 URL μΆ”μΆœ for link in soup.select('a'): print(link.get('href'))

μ‹€μŠ΅

ν™”λ©΄ 였λ₯Έμͺ½ μ½”λ“œ μ‹€ν–‰ λ²„νŠΌμ„ λˆ„λ₯΄κ³ , 크둀링 κ²°κ³Όλ₯Ό ν™•μΈν•˜κ±°λ‚˜ μ½”λ“œλ₯Ό μˆ˜μ •ν•΄ λ³΄μ„Έμš”!

Lecture

AI Tutor

Publish

Design

Upload

Notes

Favorites

Help

Code Editor

Run
Generate

Execution Result