pdf 문서의 글씨를 추출하는 오픈소스가 있나요??
본문
저장된 파일을 검사해서 pdf일 경우, pdf내에 글씨를 가져와서 출력하는 것을
만들고 싶은데 어떻게 해야 할 지 모르겠습니다..
답변 2
원본 PDF에 저장된 형식에 따라서 달라집니다.
텍스트형태로 저장했다면 변환프로그램을 활용할수 있지만, 일부는 이미지형태로 PDF로 변환되있는 경우도 있기때문에 모든경우에 대응하실려면 많은 기술이 필요할것 같습니다.
텍스트형태라면 https://stackoverflow.com/questions/14782751/convert-pdf-to-html-in-php 을 참조해보세요.
답변을 작성하시기 전에 로그인 해주세요.