이것은 Tesseract.js 라이브러리를 이용한 그누보드/영카트용 OCR스킨입니다.
OCR이란?
OCR(광학 문자 인식)은 이미지 파일(예: 스캔본, 사진 등)에 담긴 텍스트를 기계가 읽을 수 있는 형식으로 변환하는 기술입니다. 즉 쉽게 말해서 이미지나 PDF에서 문자를 인식하고 텍스트를 추출하는 기술입니다.
적용방법:
일반 게시판 스킨 적용방법과 동일합니다.
특징:
이미지내의 텍스트를 추출하여 wr_1필드에 저장합니다.(write.skin.php 소스내에서 필드변경가능)
게시판 스킨 정보:
-, 5.6.9에서 작업되었습니다.
-, 일반 게시판 스킨 적용방법과 같습니다.
-, https://tesseract.projectnaptha.com/에서 제공하는 자바스크립트 라이브러리를 이용하였습니다.
-, 텍스트가 있는 이미지를 첨부하면 텍스트를 추출하게 되고, 추출된 텍스트는 wr_1에 저장합니다.
-, 텍스트의 양이 많아 저장할 때 잘리는 경우, wr_1필드의 데이타타입을 varchar에서 text로 변경하면 됩니다.
-, 기본적으로 영어/한글 추출합니다. 다른 언어를 추출해야 하는 경우, https://tesseract.projectnaptha.com/를 참조하여 언어타입을 추가/수정하면 됩니다.
-, 이미지내 텍스트 추출은 80%이상 추출되나 이미지의 질에 따라 달라질 수 있습니다.
상호 | 코리아뉴스 |
---|---|
사업장소재지 | 경기도 남양주시 진건읍 용정리 855 |
고객지원 연락처 | 010-3254-5402 |
구매고객 총평점
사용후기가 없습니다.
2025.04.17 version 1.0
1domain 1copy