SPIKE PDF-ion

스마트 PDF 디지털 인텔리전스 솔루션

SPIKE SOLUTION

Overview

SPIKE PDF-ion은 PDF 문서를 디지털 인텔리전트에 활용하기 위해 다양한 방법으로 문서 내 데이터(텍스트, 이미지 등)를 추출합니다.
PDF-ion으로 추출된 데이터는 각종 AI 및 빅데이터 분석을 위해 최적화된 형태 제공됩니다.

설정에 따라 Plain TEXT 또는 JSON 기반의 데이터를 생성합니다.

샘플 결과

Use Case

  • 텍스트 분석(Enterprise Digital Transformation)
  • 텍스트 마이닝(Big data)
  • 인공지능 텍스트 분석

기능 및 특징

PDF 문서의 특징을 이해하고 그에 맞도록 정확한 데이터 추출을 지원합니다.
또한 커스터마이징을 통해 목차, 어노테이션,폼 등 다양한 정보를 추가 추출할 수 있습니다.

문서의 레이아웃을 최대한 유지하며 추출

  • 문서의 레이아웃을 최대한 유지
  • 이미지 위치에 마크 표시
  • 처리된 문서의 텍스트, 이미지를 인덱스 별로 저장

JSON 기반의 정보 추출

  • 단어, 문단별 구분 추출
  • 글꼴, 크기, 문서 내 위치 등 메타 정보 추출
  • 디버그를 위한 태그 지원

적용고객

Scroll to Top