Open Text Corporation

Open Text Capture Document Reader (DOKuStar)

Klassifikation digitaler Dokumente - Datenextraktion

Open Text Capture Document Reader ist eine Dokumentenanalyse-Software, die unbedient digitale Dokumente klassifiziert, Daten extrahiert und strukturierte Daten abliefert (z.B. TIFF->XML).
Die zentralen Verarbeitungsmodule im Document Reader sind Document Extraction, Adaptive Read Technology (ART) und Adaptive Classification Technology (ACT).

Architektur Open Text Capture Document Reader

Open Text Capture Document Reader arbeitet mit konfigurierbaren Verarbeitungsketten, sogenannten Pipelines. In einer Verarbeitungskette durchläuft ein Dokument nacheinander verschiedene Module. Aus Sicht des aufrufenden Systems stellt sich der Document Reader als eine Komponente (Subsystem) dar.

Open Text Capture Document Reader bietet gegenüber dem bewährten Open Text Capture Document Extraction wesentliche Erweiterungen:

Verwandte Dokumente

English Open Text Capture Document Reader Brochure (English - PDF)