PDFlib TET
PDF 파일에서 텍스트, 이미지 및 메타데이터를 신뢰할 수 있는 수준으로 추출.
- 라이브러리/컴포넌트 및 명령줄 도구로 사용 가능
- PDF의 텍스트 내용을 Unicode 문자열이나 구조화된 XML로 추출
- 새 4.1 버전은 추출 속도가 크게 개선
설명: PDF Information Retrieval Tool. PDFlib pCOS provides a simple and elegant facility for retrieving any information from a PDF document which is not part of the page contents. For example, PDF metadata, interactive elements (links etc.), or page dimensions ... 더 읽기