SPIKE Document Filter
SDFilter: 비정형 컨텐츠를 활용도 높게
Overview
SDFilter는 구조화되지 않은 콘텐츠에서 가치있는 정보로 활용할 수 있게 필요한 데이터를 추출해 주는 제품입니다.
텍스트 분석부터 검색에 활용하기까지 다양한 방면으로 사용 가능한 추출기 입니다.
SPIKE Document 솔루션 과 함께 사용하면 최고의 정보 분석 툴로 사용할 수 있습니다.
활용방안
- 텍스트 분석 (Enterprise Digital Transformation) / 텍스트 마이닝 (Big data) / Data loss prevention
- 검색(이메일, 아카이빙 시스템) / 이메일 씨큐리티 (스팸) / 개인정보 추출
기능 및 특징
주요특징
- Java 기반 솔루션으로 OS에 상관없이 설치 및 운영
- Pure Java 기반
- Low Memory 사용으로 대규모 서비스 지원
간편한 연동
RESTFul 기반의 API를 통해 제공하여 타 시스템과 연계 용이
지원 문서 포멧
Zip, MS Office, 한글, txt, eml, epub 까지 다양한 포멧 지원
[전체 목록] Zip, Tar, Gzip, Bzip2, 7zip, Alzip, text, MS Word, MS Excel, MS Powerpoint, MS Access, HTML, xml, Rich Text, MIME Message, pdf, chm, autocad, Outlook file, pst, Open document format, HWPV3, HWPV5, HWP XML, iWorks, epub
세부 설정
디테일한 설정을 통해 시스템을 안정적으로 유지 가능
[예시] max file size, max depth of compressed, max file size to load in memory, output characterset