Open Text Corporation

Open Text Capture Document Reader

Open Text Capture Document Reader est un logiciel d'analyse documentaire, qui classe les documents numériques, extrait les données et organise les données structurées (par ex. du format TIFF->format XML) automatiquement. Open Text Capture Document Extraction (DOKuStar) et DOKuStar Adaptive Recognition Technology (ART) sont les deux modules de traitement centraux de Open Text Capture Document Reader. Facultativement, Open Text Capture Document Reader peut être livré avec l'un des deux moteurs ou avec les deux.

Architecture
Architecture

Open Text Capture Document Reader fonctionne avec des chaînes de traitement configurables, appelées Pipelines. Dans une chaîne de traitement, un document passe par les différents modules. Au vue du système appelant, Open Text Capture Document Reader se présente comme un composant (sous-système).

Open Text Capture Document Reader propose, outre Open Text Capture Document Extraction (DOKuStar), qui a fait ses preuves, quatre extensions importantes:

Outre l'extraction de données et la classification réglementées, Open Text Capture Document Reader offre unprocessus éprouvé. Derrière l'appellation ART (Adaptive Recognition Technology, Technologie de reconnaissance adaptative) se cache un processus breveté, dont l'utilisateur se sert pour montrer, à l'aide de sa souris, l'emplacement des informations recherchées dans des exemples de document enregistrés sur le système. Ensuite, ART recherche également ces informations dans des documents analogues. Ce nouveau processus facilite énormément l'optimisation du système et augmente nettement l'efficacité de la fonction de reconnaissance.

Open Text Capture Document Reader peut traiter des documents de plusieurs pages. Le logiciel prend également en charge les structures de document complexes avec sous-documents. Il peut donc mapper rapidement des applications de corbeille d'arrivée.

Les fonctions de reconnaissance peuvent être rapidement adaptées aux exigences précises d'un projet via différentes interfaces de programmation. Les projets et les utilisateurs exigeants ne peuvent pas utiliser un système prêt à l'emploi. L'accès aux bases de données des entreprises ou aux commandes séquentielles, qui dépendent du contenu d'un document, peut être effectué dans une interface Web ou COM.

La répartition de la charge via un cluster de serveur garantit que Open Text Capture Document Reader utilise en permanence la puissance de calcul disponible. L'interface du serveur, comme celle du logiciel de reconnaissance, est très simple d'utilisation. Open Text Capture Document Reader peut être directement intégré dans n'importe quelle application d'entreprise.

Pdf-File