파이썬을 이용해서 자유게시판 글 제목 추출하기 정보
파이썬을 이용해서 자유게시판 글 제목 추출하기본문
import requests from bs4 import BeautifulSoup #모든 영어 대화 주체를 추출하는 함수입니다. def get_subjects(): subjects =[] #전체 주제 목록을 보여주는 페이지로의 요청(Request) 객채를 생성합니다. req = requests.get('https://sir.kr/cm_free') html = req.text soup = BeautifulSoup(html,'html.parser') divs = soup.findAll('div',{"class": "sir_ulwrp sir_ul01"}) for div in divs: #내부에 존재하는 <a> 태그들을 추출합니다 links = div.findAll('a',{"class": "title_link"}) #<a> 태그 내붕의 텍스트를 리스트에 삽입합니다. for link in links : subject = link.text subjects.append(subject) return subjects subjects = get_subjects() print('총',len(subjects),'개의 주체를 찾았습니다.') print(subjects)
출력 값
총 30 개의 주체를 찾았습니다.
['\r\n 영카트 사용시 크롬80 버전 업데이트 관련 공지 3 ', '\r\n 강동원 vs 정우성 3 ', '\r\n 하... 복구하느냐 새로 설치하느냐... ㅠㅠ 1 ', '\r\n 초보인데 막상하려니.. 1 ', '\r\n 이온큐브 대체 소프트웨어 https://phpbolt.com/.. 2 ', '\r\n 텔레그램방의 내용을 가져올수도 잇나요 3 ', '\r\n 동양인과 서양인의 차이가 있긴 하군요 2 ', '\r\n 좋은아침입니다~ 2 ', '\r\n php8 부터 구버전 지원중단! 그외 달라진점 6 ', '\r\n 사진.. 2 ', '\r\n 안녕하세용 1 ', '\r\n 사기 치는놈 디진다 2 ', '\r\n 정적사이트에서는 algolia 검색 API를 쓰는 곳이 있네요. 8 ', '\r\n Led Zeppelin - Whole Lotta Love ', '\r\n 윈도우PE 이거 좋네요. 18 ', '\r\n 100만점을 향해! 3 ', '\r\n 코딩을 배워보려고 합니다 도움이 필요합니다 13 ', '\r\n 복날이라 보신을... 4 ', '\r\n 지가 오늘은 마눌에게 간만에 도전을 했어요~ 4 ', '\r\n 다들 수고가 많으십니다 5 ', '\r\n Bob Marley & The Wailers - Stir It Up 1 ', '\r\n hello 7 ', '\r\n 호스팅정보에 무료 호스팅 정보만 있길래.. 4 ', '\r\n 복날이면 꼭!!! 가족을 먹어야겠니?!!!!!!!!!!! 6 ', '\r\n 휴가는 당당하게~! 6 ', '\r\n 오늘은 연차입니다 8 ', '\r\n 질문게시판에 4 ', '\r\n 안녕히 계세요!!! 6 ', '\r\n 미국에서 접속 안되어서 12 ', '\r\n 다들 기초공부는 어떻게 하셨나요? 10 ']
1
댓글 0개