SPIKE Document Filter

SDFilter: 비정형 컨텐츠를 활용도 높게

SPIKE SOLUTION

Overview

SDFilter는 구조화되지 않은 콘텐츠에서 가치있는 정보로 활용할 수 있게 필요한 데이터를 추출해 주는 제품입니다.
텍스트 분석부터 검색에 활용하기까지 다양한 방면으로 사용 가능한 추출기 입니다.

SPIKE Document 솔루션 과 함께 사용하면 최고의 정보 분석 툴로 사용할 수 있습니다.

활용방안

  • 텍스트 분석 (Enterprise Digital Transformation) / 텍스트 마이닝 (Big data) / Data loss prevention
  • 검색(이메일, 아카이빙 시스템) / 이메일 씨큐리티 (스팸) / 개인정보 추출

기능 및 특징

주요특징

  • Java 기반 솔루션으로 OS에 상관없이 설치 및 운영
  • Pure Java 기반
  • Low Memory 사용으로 대규모 서비스 지원

간편한 연동

RESTFul 기반의 API를 통해 제공하여 타 시스템과 연계 용이

지원 문서 포멧

Zip, MS Office, 한글, txt, eml, epub 까지 다양한 포멧 지원

[전체 목록] Zip, Tar, Gzip, Bzip2, 7zip, Alzip, text, MS Word, MS Excel, MS Powerpoint, MS Access, HTML, xml, Rich Text, MIME Message, pdf, chm, autocad, Outlook file, pst, Open document format, HWPV3, HWPV5, HWP XML, iWorks, epub

세부 설정

디테일한 설정을 통해 시스템을 안정적으로 유지 가능

[예시] max file size, max depth of compressed, max file size to load in memory, output characterset

Scroll to Top