CSS μ νμλ₯Ό νμ©ν λ°μ΄ν° μΆμΆ
CSS μ νμλ μ¬λ¬ HTML μμ μ€μμ νΉμ μμλ₯Ό μ νν©λλ€.
κΈ°λ³Έ CSS μ νμ
-
ν΄λμ€ μ νμ
:.classname
ννλ‘, ν΄λΉ ν΄λμ€λ₯Ό κ°μ§ λͺ¨λ μμλ₯Ό μ νν©λλ€. -
ID μ νμ
:#idname
ννλ‘, νΉμ IDλ₯Ό κ°μ§ μμλ₯Ό μ νν©λλ€. -
μμ μ νμ
:tagname
ννλ‘, ν΄λΉ νκ·Έλ₯Ό κ°μ§ λͺ¨λ μμλ₯Ό μ νν©λλ€.
BeautifulSoupμμ CSS μ νμ μ¬μ©
BeautifulSoupμ select()
λ©μλλ₯Ό μ¬μ©νμ¬ CSS μ νμλ‘ μμλ₯Ό μ°Ύμ μ μμ΅λλ€.
CSS μ νμλ‘ μμ μ°ΎκΈ°
soup = BeautifulSoup(html_doc, 'html.parser') # ν΄λμ€κ° 'my-class'μΈ λͺ¨λ μμ μ°ΎκΈ° class_elements = soup.select('.my-class') # IDκ° 'my-id'μΈ μμ μ°ΎκΈ° id_element = soup.select('#my-id') # λͺ¨λ <a> νκ·Έ μ°ΎκΈ° a_elements = soup.select('a')
ν μ€νΈ λ°μ΄ν° μΆμΆ
- CSS μ νμλ‘ μ°Ύμ μμμ
.text
μμ±μ μ¬μ©νμ¬ ν μ€νΈ λ΄μ©μ μΆμΆν©λλ€.
ν
μ€νΈ λ°μ΄ν° μΆμΆ
soup = BeautifulSoup(html_doc, 'html.parser') # ν΄λμ€κ° 'my-class'μΈ μμμ ν μ€νΈ μΆμΆ for el in soup.select('.my-class'): print(el.text) # IDκ° 'my-id'μΈ μμμ ν μ€νΈ μΆμΆ print(soup.select_one('#my-id').text)
μμ± κ° μΆμΆ
- νΉμ μμ±(μ:
href
,src
)μ κ°μ§ μμμ ν΄λΉ μμ± κ°μ μΆμΆν μ μμ΅λλ€.
μμ± κ° μΆμΆ
# λͺ¨λ <a> νκ·Έμ href μμ± κ° μΆμΆ for a in soup.select('a'): print(a.get('href')) # μ΄λ―Έμ§ νκ·Έ(<img>)μ src μμ± κ° μΆμΆ for img in soup.select('img'): print(img.get('src'))
μ¬μ© μμ
μ¬μ© μμ
html_doc = """ <div class="content"> <p class="info">This is a paragraph.</p> <a href="http://example.com">Example Link</a> </div> """ soup = BeautifulSoup(html_doc, 'html.parser') # ν΄λμ€ 'info'λ₯Ό κ°μ§ <p> νκ·Έμ ν μ€νΈ μΆμΆ info_text = soup.select_one('.info').text print(info_text) # λͺ¨λ λ§ν¬(<a>)μ URL μΆμΆ for link in soup.select('a'): print(link.get('href'))
μ€μ΅
νλ©΄ μ€λ₯Έμͺ½ μ½λ μ€ν
λ²νΌμ λλ₯΄κ³ , ν¬λ‘€λ§ κ²°κ³Όλ₯Ό νμΈνκ±°λ μ½λλ₯Ό μμ ν΄ λ³΄μΈμ!
Lecture
AI Tutor
Publish
Design
Upload
Notes
Favorites
Help
Code Editor
Run
Generate
Execution Result