python get_text() 질문드립니다.

python get_text() 질문드립니다.

QA

python get_text() 질문드립니다.

본문

안녕하세요.

python으로 특정 데이터를 가지고 오는데

contents = soup.find('div', attrs={'id' : 'dic_area'}).get_text()

 

콘텐츠 제작사의 주가 부진이 깊어지는 모습이다.<br><br>20일 증권가에 따르면 이날 콘텐트리중앙은

 

중간에 <br><br> 이 사라지고 

 

콘텐츠 제작사의 주가 부진이 깊어지는 모습이다. 20일 증권가에 따르면 이날 콘텐트리중앙은

 

이렇게 가지고 와서 한줄로 쭉 나옵니다.

내용을 가지고 올때 html 이나 <br><br>까지 다 가지고 올수 있는 방법이 없을까요?

감사합니다.

 

이 질문에 댓글 쓰기 :

답변 1



from bs4 import BeautifulSoup
html = """
<head>
  <title class="page-title">Hello World!</title>
</head>
<body>
  <div id="content">
    <h1>Title</h1>
    <p>first paragraph</p>
    <p>second paragraph</p>
    <h2>Subtitle</h2>
    <p>first paragraph of subtitle</p>
  </div>
</body>
"""

# 1. build soup object from html text
soup = BeautifulSoup(html, 'lxml')
print(soup.head.title)
# return'<title class="page-title">Hello World!</title>'

 

'lxml' 대신 'html.parser'를 써도 되지만 lxml이 C언어기반으로 작동하므로 속도가 좀 더 빠릅니다

답변을 작성하시기 전에 로그인 해주세요.
전체 87
QA 내용 검색

회원로그인

(주)에스아이알소프트 / 대표:홍석명 / (06211) 서울특별시 강남구 역삼동 707-34 한신인터밸리24 서관 1404호 / E-Mail: admin@sir.kr
사업자등록번호: 217-81-36347 / 통신판매업신고번호:2014-서울강남-02098호 / 개인정보보호책임자:김민섭(minsup@sir.kr)
© SIRSOFT