이것은 Tesseract.js 라이브러리를 이용한 그누보드/영카트용 OCR스킨입니다.
OCR이란?
OCR(광학 문자 인식)은 이미지 파일(예: 스캔본, 사진 등)에 담긴 텍스트를 기계가 읽을 수 있는 형식으로 변환하는 기술입니다. 즉 쉽게 말해서 이미지나 PDF에서 문자를 인식하고 텍스트를 추출하는 기술입니다.
적용방법:
일반 게시판 스킨 적용방법과 동일합니다.
특징:
이미지내의 텍스트를 추출하여 wr_1필드에 저장합니다.(write.skin.php 소스내에서 필드변경가능)
게시판 스킨 정보:
-, 웹학교(https://365ok.co.kr)에서 작업하였습니다.
-, 5.6.9에서 작업되었습니다.
-, 일반 게시판 스킨 적용방법과 같습니다.
-, https://tesseract.projectnaptha.com/에서 제공하는 자바스크립트 라이브러리를 이용하였습니다.
-, 텍스트가 있는 이미지를 첨부하면 텍스트를 추출하게 되고, 추출된 텍스트는 wr_1에 저장합니다.
-, 텍스트의 양이 많아 저장할 때 잘리는 경우, wr_1필드의 데이타타입을 varchar에서 text로 변경하면 됩니다.
-, 기본적으로 영어/한글 추출합니다. 다른 언어를 추출해야 하는 경우, https://tesseract.projectnaptha.com/를 참조하여 언어타입을 추가/수정하면 됩니다.
-, 이미지내 텍스트 추출은 80%이상 추출되나 이미지의 질에 따라 달라질 수 있습니다.
-, 구매 라이센스는 1domain 1copy입니다.
배송
배송 안내 입력전입니다.
교환
교환/반품 안내 입력전입니다.