PDF 파일에서 텍스트 추출
본문
서버는 dothome 무료입니다.
.pdf 파일을 업로드 하면 .pdf 파일의 텍스트를 추출하여 필요한 부분을 값으로 가져오고 싶은데
어떤 라이브러리를 사용해야하는지 어떻게 사용해야 하는지 검색만 반나절 하다 여쭤봅니다.
답변 1
pdf를 text로 추출하기 위한 라이브러리는 여러가지가 있습니다.
1. Smalot/PdfParser
2. TCPDF
3. Poppler-utils (pdftotext)
4. XPDF (pdftotext)
등이 있으며 해당 라이브러리를 이용하시려면 구글에서 해당 키워드로 검색해보시기 바랍니다.
원하시는 용도마다 사용법등 조금씩 다르기 때문에 확인해 보시고 원하시는 라이브러리르 활용하시기 바랍니다.
답변을 작성하시기 전에 로그인 해주세요.