2026, 새로운 도약을 시작합니다.

python get_text() 질문드립니다. 채택완료

안녕하세요.

python으로 특정 데이터를 가지고 오는데

contents = soup.find('div', attrs={'id' : 'dic_area'}).get_text()

콘텐츠 제작사의 주가 부진이 깊어지는 모습이다.<br><br>20일 증권가에 따르면 이날 콘텐트리중앙은

중간에 <br><br> 이 사라지고 

콘텐츠 제작사의 주가 부진이 깊어지는 모습이다. 20일 증권가에 따르면 이날 콘텐트리중앙은

이렇게 가지고 와서 한줄로 쭉 나옵니다.

내용을 가지고 올때 html 이나 <br><br>까지 다 가지고 올수 있는 방법이 없을까요?

감사합니다.

답변 1개

채택된 답변
+20 포인트
Copy



from bs4 import BeautifulSoup
html = """

  Hello World!


  
    Title
    first paragraph
    second paragraph
    Subtitle
    first paragraph of subtitle
  

"""

# 1. build soup object from html text
soup = BeautifulSoup(html, 'lxml')
print(soup.head.title)
# return'Hello World!'

'lxml' 대신 'html.parser'를 써도 되지만 lxml이 C언어기반으로 작동하므로 속도가 좀 더 빠릅니다

로그인 후 평가할 수 있습니다

답변에 대한 댓글 1개

안녕하세요.
너무 잘되네요
감사합니다.

댓글을 작성하려면 로그인이 필요합니다.

답변을 작성하려면 로그인이 필요합니다.

로그인
🐛 버그신고