Altova MapForce 2025 Enterprise Edition

L’Extracteur PDF vous permet de rechercher dans la ainsi que lors de l’exécution. Ci-dessous, vous trouverez la fonction ‘text-finding’.

 

L’objet Fractionner et l’Affectation Emplacement/Limite prennent en charge la méthode Trouver Texte qui permet la recherche du texte et l’identification d’un position fractionnée relative au texte.

La méthode Trouver Texte vous permet de spécifier diverses options de filtre. Par exemple, vous pouvez rechercher du texte du poids, de la taille et de la police même.

L’objet Groupe/Filtre peut grouper des données PDF par texte trouvé ou non trouvé sur une page.

Vous pouvez également effectuer vos recherches dans le Mode PDF et les volets de Sortie, utilisant Trouver dialogue. Dépendant du volet, les fonctions ‘text-finding’ varient (voir les détails ci-dessous).

 

Trouver dialogue

Vous pouvez rechercher du texte dans le Mode PDF et les volets Sortie de l’Extracteur PDF. Pour invoquer le dialogue Find, cliquez à l’intérieur d’un volet d’intérêt et appuyez sur Ctrl + F. Vous pouvez également accéder le dialogue via la commande de menu Éditer | Trouver ou via la barre d’outils.

 

Trouver le dialogue dans le volet Sortie

Le dialogue Trouver affiché ci-dessous apparaît dans le volet Sortie de l’Extracteur PDF. Les options Trouver peuvent être spécifiées via les boutons situés en-dessous du champ du terme de recherche (capture d’écran ci-dessous). Lorsqu'une option est activée, la couleur de sa touche change de couleur et devient bleue (voir le bouton Trouver ancre Champ dans la capture d'écran ci-dessous).

PDFEX_FindDialogOutputPane

Options de Recherche

Vous pouvez sélectionner une option parmi les suivantes :

 

Respecter la casse : La recherche sensible à la casse lorsqu’elle est activée (Address n’est pas la même chose que address).

Correspondance du mot entier : Seuls les mots exacts contenus dans le texte seront comparés. Par exemple, pour le string entrée fit, avec Correspondance mot entier activée, seul le mot fit correspondra avec le string de recherche ; le fit dans fitness, par exemple, n’aura pas de correspondance.

Expression régulière : Si cette option est activée, le terme de recherche sera lu en tant qu'expression régulière. Voir Expressions régulières ci-dessous pour une description de l'utilisation des expressions régulières.

Résultats de filtrage : Choisir un ou plusieurs composants de document à l'endroit où vous souhaitez effectuer la recherche.

Trouver ancre : Les items trouvés sont indexés par ordre du document et l’index de l’item sélectionné actuellement se trouve dan le dialogue Recherche. Par exemple, se basant sur l’information dans la capture d’écran ci-dessus, nous pouvons dire que le deuxième item trouvé de quatre est actuellement sélectionné. Cliquer sur Trouver suivant (en surbrillance en bas à droite dans la capture d’écran) vous emmène au prochain item trouvé dans l’ordre de l’index. Toutefois, si l’option Recherche Ancre est sélectionnée, Trouver suivant vous emmène au prochain item trouvé relatif à la position du curseur actuel. Donc, si l’item actuellement sélectionné est le premier (disons, 1 de 4) et que vous devez placer le curseur après l’item item 3, alors Trouver suivant vous emmènera à l’item 4 - et pas à l’item 2 (comme cela aurait été le cas si Recherche Ancre avait été désactivé).

Trouver dans la sélection : Si cette option est activée, elle verrouille la sélection de texte actuelle et limite la recherche à la sélection. Sinon, le document entier sera cherché. Avant de sélectionner une nouvelle série de texte, déverrouillez la sélection actuelle en désactivant l’option Chercher dans la sélection.

 

Basculer entre les résultats de recherche

Tous les résultats de recherche sont mis en surbrillance dans le volet Sortie (voir ci-dessous). Vous pouvez utiliser les boutons Retour et Suivant pour basculer entre les résultats de la recherche.

PDFEX_SearchResOutputPane

Regex

Vous pouvez utiliser des expressions régulières (regex) pour trouver un string de texte. À cette fin, suivez les étapes ci dessous :

 

1.Pour ce faire, veuillez tout d'abord activer l'option Expression régulière (voir Trouver des options ci-dessus). Cette fonction permet de spécifier que le texte contenu dans le champ de saisie doit être évalué en tant qu'expression régulière.

2.Ensuite, saisissez l'expression régulière dans le champ de recherche du terme. Pour aider à créer une expression régulière, cliquez sur le bouton Générateur d'expression régulière, qui est situé à droite du champ de saisie ( capture d'écran ci-dessous).

3.Puis, cliquez sur un item dans le Générateur pour saisir le/s métacaractère/s regex correspondant/s dans le champ de saisie. La capture d'écran ci-dessous montre une expression régulière simple pour trouver tout avant le string king. Pour consulter une brève description des métacaractères, voir la section Métacaractères d'expression régulière ci-dessous.

PDFEX_RegularEx

Métacaractères d'expression régulière

Ci-dessous, vous trouverez une liste des métacaractères d'expression régulière.

 

.

Correspond à n'importe quel caractère. Il s'agit d'un espace réservé pour un seul caractère.

(

Marque le début d'une expression balisée.

)

Marque la fin d'une expression balisée.

(abc)

Les métacaractères ( et ) marquent le début et la fin d'une expression balisée. Les expressions balisées peuvent être utiles lorsque vous devez baliser (« vous souvenir») une région correspondante afin de pouvoir vous y référer ultérieurement (back-reference). Vous pouvez baliser jusqu'à neuf expressions (et puis les back-referencer plus tard, dans le champ Chercher ou Remplacer)

 

Par exemple, (the) \1 correspond au string the the. Cette expression peut être expliquée littéralement comme suit : correspondre au string "the" (et s'en souvenir en tant que région balisée), suivi d'un espace, suivi d'une back-reference à la région balisée correspondante précédemment

\n

n est une variable qui peut prendre des valeurs d'entier de 1 à 9. L'expression se réfère à la première jusqu'à la neuvième région balisée lors du remplacement. Par exemple, si le string de recherche est Fred([1-9])XXX et que le string de remplacement est Sam\1YYY, cela signifie que dans le string de recherche, il y a une expression balisée qui est (implicitement) indexée avec le numéro 1 ; dans le string de remplacement, l'expression balisée est référencée avec \1. Si la commande chercher-remplacer est appliquée à Fred2XXX, cela génèrera Sam2YYY.

\<

Correspond au début d'un mot.

\>

Correspond à la fin d'un mot.

\x

Vous permet d'utiliser un caractère x, qui aurait généralement une signification particulière. Par exemple, \[ serait interprété comme [ et non pas comme le début d'un ensemble de caractères.

[...]

Indique un ensemble de caractères. Par exemple, [abc] signifie un des caractères a, b ou c. Vous pouvez aussi utiliser des séries : par exemple [a-z] pour n'importe quel caractère en minuscule.

[^...]

Le complément des caractères dans l'ensemble. Par exemple, [^A-Za-z] signifie importe quel caractère sauf un caractère alphabétique.

^

Correspond au début d'une ligne (sauf si utilisé dans un ensemble, voir ci-dessus).

$

Correspond à la fin d'une ligne. Par exemple : A+$ pour trouver un ou plusieurs "A" à la fin de la ligne.

*

Correspond 0 ou plus. Par exemple, Sa*m correspond à Sm, Sam, Saam, Saaam etc.

+

Correspond 1 ou plus. Par exemple, Sa+m  correspond à Sam, Saam, Saaam etc.

 

 

Représentation de caractères spéciaux

Veuillez noter les expressions suivantes.

 

\r

Retour de chariot (CR). Vous pouvez utiliser CR (\r) ou LF (\n) pour trouver ou créer une nouvelle ligne

\n

Saut de ligne (LF). Vous pouvez utiliser CR (\r) ou LF (\n) pour trouver ou créer une nouvelle ligne

\t

Caractère de tabulation

\\

Utiliser ce signe pour échapper des caractères qui apparaissent dans l'expression regex, par exemple : \\\n

 

Trouver le dialogue dans le volet Mode PDF

Vous pouvez également effectuer la recherche dans le volet Mode PDF. Le dialogue Trouver dans le volet Mode PDF est illustré ci-dessous. Dans ce dialogue, vous activer les options Match Case et Match Whole Word. Pour les détails, voir Trouver Options ci-dessus.

PDFEX_FindDialogPDFViewPane

Résultats de la recherche dans le volet de l’Aperçu/le Mode PDF

Les résultats de la recherche sont mis en surbrillance dans le volet Mode PDF (capture d’écran ci-dessous). Vous pouvez utiliser les boutons Retour et Suivant pour sauter entre les résultats de la recherche.

PDFEX_SearchResPDFViewPane

Actions avec des résultats de la recherche

Vous pouvez également cliquer avec la touche droite de la souris sur tout résultat de recherche et sélectionnez une option appropriée depuis le menu contextuel :

PDFEX_SearchRes01

Pour une description des options dans le menu contextuel, voir Sélection Modes.

 

© 2018-2024 Altova GmbH