python get_text() 질문드립니다.
본문
안녕하세요.
python으로 특정 데이터를 가지고 오는데
contents = soup.find('div', attrs={'id' : 'dic_area'}).get_text()
콘텐츠 제작사의 주가 부진이 깊어지는 모습이다.<br><br>20일 증권가에 따르면 이날 콘텐트리중앙은
중간에 <br><br> 이 사라지고
콘텐츠 제작사의 주가 부진이 깊어지는 모습이다. 20일 증권가에 따르면 이날 콘텐트리중앙은
이렇게 가지고 와서 한줄로 쭉 나옵니다.
내용을 가지고 올때 html 이나 <br><br>까지 다 가지고 올수 있는 방법이 없을까요?
감사합니다.
답변 1
from bs4 import BeautifulSoup
html = """
<head>
<title class="page-title">Hello World!</title>
</head>
<body>
<div id="content">
<h1>Title</h1>
<p>first paragraph</p>
<p>second paragraph</p>
<h2>Subtitle</h2>
<p>first paragraph of subtitle</p>
</div>
</body>
"""
# 1. build soup object from html text
soup = BeautifulSoup(html, 'lxml')
print(soup.head.title)
# return'<title class="page-title">Hello World!</title>'
'lxml' 대신 'html.parser'를 써도 되지만 lxml이 C언어기반으로 작동하므로 속도가 좀 더 빠릅니다
!-->
답변을 작성하시기 전에 로그인 해주세요.