Altova MapForce 2025 Enterprise Edition

Navigation: Composants de structure > PDF > Extracteur PDF de MapForce

Aperçu

Ce chapitre explique comment exécuter l’Extracteur PDF et donne un aperçu général de l’Extracteur PDF et son interface.

Comment exécuter l’Extracteur PDF

Pour lancer l'Extracteur PDF, vous pouvez choisir l’une des options suivantes :

•Vous pouvez exécuter l’Extracteur PDF directement depuis MapForce. Cette option est utile quand vous créez un nouveau modèle d’extraction PDF directement depuis MapForce.

•Vous pouvez aussi lancer l'Extracteur PDF en tant que programme autonome, en démarrant le fichier exécutable Altova MapForce Extracteur PDF depuis le menu Démarrage ou le répertoire d’installation MapForce.

Pour plus d’information sur la création d’un modèle d’extraction PDF, voir Créer un nouveau modèle.

Aperçu GUI

La capture d’écran ci-dessous illustre l’interface de l’Extracteur PDF. L’interface est organisée en cinq parties distinctes :

•la partie supérieure qui contient différentes commandes de menu et de barre d’outils,

•le volet de schéma (partie supérieure gauche), qui vous permet de définir la structure de votre document PDF et les règles d’extraction,

•le volet d’affichage PDF (partie supérieure droite), dans laquelle vous pouvez consulter votre fichier PDF et utilisez les invites visuelles pour définir les règles d’extraction,

•le volet des propriétés (partie inférieure gauche), qui vous permet de définir différentes propriétés et calculer les expressions,

•le volet de sortie (partie inférieure droite), qui montre l’aspect qu’auront vos structure et données de votre document PDF, basés sur les propriétés et la mise en page que vous avez définies.

Volets de Propriétés et de Schéma

La structure d’un modèle créé dans le volet de Schéma consiste en divers objets modèle, qui sont les blocs fondamentaux de création de tout modèle. Les propriétés d’objets modèle sont définies dans le volet Propriétés.

Volet Sortie

Notez que la structure dans le volet de sortie est représentée comme arborescence XML.

Multiples modèles

L’Extracteur PDF vous permet de travailler sur de multiples modèles en même temps. Chaque modèle a sa propre fenêtre séparée. Dans la capture d’écran ci-dessus, il existe uniquement un modèle appelé PDFExtractor1. Tous les modèles d’extraction PDF que vous créez dans l’Extracteur PDF sont enregistrés avec une extension .pxt.

Important

Notez que vous pouvez extraire les données uniquement des documents PDF créés de manière électronique. Les documents scannés ne sont pas pris en charge.

Fonction Recherche

L’Extracteur PDF a une fonction puissante de recherche de texte. Vous pouvez également effectuer une recherche dans la GUI au moment de l´exécution. Pour plus d’information, voir Fonction Recherche et Recherche Texte. Vous pouvez de toute façon regrouper les données PDF par texte trouvé ou non sur une page. Voir Groupe/Filtre pour les détails.