Altova MapForce 2025 Enterprise Edition

Mit dem PDF Extractor können Sie sowohl auf der Benutzeroberfläche als auch zur Laufzeit eine Suche durchführen. Im Folgenden sind die Textsuchfunktionalitäten zusammengefasst:

 

Das Teilen-Objekt und die die Zuweisung einer Position/Umrandung unterstützen die Text suchen-Methode, mit der Sie nach Text suchen und eine Teilungsposition relativ zu diesem Text identifizieren können.

Mit der Text suchen-Methode können Sie verschiedene Filteroptionen definieren. So können Sie z.B. nach Text in einer bestimmten Schriftart, Größe und Breite suchen.

Mit dem Gruppieren/Filtern-Objekt können Sie PDF-Daten nach einem auf einer Seite gefundenem oder nicht gefundenem Text gruppieren.

Über das Suchdialogfeld können Sie auch in der PDF-Ansicht und im Ausgabefenster nach Text suchen. Die Textsuchfunktionen variieren je nach Fenster (nähere Informationen siehe unten).

 

Suchdialogfeld

Sie können in der PDF-Ansicht und im Ausgabefenster des PDF Extractors nach Text suchen. Um das Suchdialogfeld aufzurufen klicken Sie im gewünschten Fester auf Strg + F. Sie können das Dialogfeld auch mit dem Menübefehl Bearbeiten | Suchen oder über die Symbolleiste aufrufen.

 

Suchdialogfeld im Ausgabefenster

Das unten gezeigte Suchdialogfeld wird im Ausgabefenster des PDF Extractors angezeigt. Über Schaltflächen unterhalb des Suchfelds (siehe Abbildung unten) stehen Optionen zum Festlegen der Suchkriterien zur Verfügung. Wenn eine Option aktiv ist, ändert sich die Schaltflächenfarbe in Blau (siehe "Anker suchen"-Schaltfläche in der Abbildung unten).

PDFEX_FindDialogOutputPane

Suchoptionen

Die folgenden Optionen stehen zur Auswahl:

 

GROSS/klein beachten: Wenn die Schaltfläche aktiv ist, wird die Groß- und Kleinschreibung bei der Suche berücksichtigt (Address ist nicht gleich address).

Ganzes Wort: Nur die exakte Wortentsprechung im Text wird gefunden. So wird z.B. bei Eingabe von fit bei Aktivierung der Option ganzes Wort nur das Wort fit gefunden; fit in fitness wird z.B. nicht gefunden.

Regular Expression: Wenn die Option aktiv ist, wird der Suchbegriff als Regular Expression gelesen. Eine Beschreibung zur Verwendung von Regular Expressions finden Sie weiter unten unter Regular Expressions.

Ergebnisse filtern: Wählen Sie eine oder mehrere Dokumentkomponenten, in denen gesucht werden soll.

Anker suchen: Die gefundenen Treffer werden in Dokumentreihenfolge indiziert und der Index des ausgewählten Treffers wird im Dialogfeld "Suchen" angegeben. So sehen wir etwa anhand der Information in der Abbildung oben, dass derzeit der zweite von vier gefundenen Treffern ausgewählt ist. Bei Klick auf Weitersuchen. (in der Abbildung rechts unten markiert) gelangen Sie zum nächsten gefundenen Treffer in der Indexreihenfolge. Wenn allerdings die Option Anker suchen aktiviert ist, gelangen Sie mit Weitersuchen zum nächsten gefundenen Treffer relativ zur aktuellen Cursorposition. Wenn also der aktuell ausgewählte Treffer der erste (z.B. 1 von 4) ist und Sie den Cursor hinter Treffer 3 platzieren, so gelangen Sie mit Weitersuchen zu Treffer 4 und nicht zu Treffer 2 (wie dies der Fall gewesen wäre, wenn Anker suchen deaktiviert gewesen wäre).

In Auswahl suchen: Wenn diese Option aktiv ist, wird der aktuell ausgewählte Text gesperrt und die Suche auf die Auswahl eingeschränkt. Andernfalls wird das gesamte Dokument durchsucht. Bevor Sie einen neuen Textbereich auswählen, heben Sie die aktuelle Auswahl durch Deaktivieren der Option In Auswahl suchen auf.

 

Hin- und Herwechseln zwischen Suchergebnissen

Alle Suchergebnisse werden im Ausgabefenster hervorgehoben (siehe unten). Mil Hilfe der Zurück- und Vorwärts-Schaltflächen können Sie in den Suchergebnissen zurück- und vorwärtsspringen.

PDFEX_SearchResOutputPane

Regex

Sie können zum Suchen eines Text-String Regular Expressions (regex) verwenden. Gehen Sie dazu folgendermaßen vor:

 

1.Aktivieren Sie dazu zuerst die Option Regular Expression (siehe Suchoptionen oben). Dadurch legen Sie fest, dass der Text im Suchfeld als Regular Expression ausgewertet werden soll.

2.Geben Sie als nächstes die Regular Expression in das Suchfeld ein. Hilfe zur Erstellung von Regular Expressions erhalten Sie durch Klick auf die Schaltfläche Regular Expression Builder rechts vom Suchfeld (Abbildung unten).

3.Klicken Sie anschließend auf einen Eintrag im Builder, um die/das entsprechende(n) regex-Metazeichen in das Suchfeld einzugeben. In der Abbildung unten sehen Sie eine einfache Regular Expression, mit der alles, was vor dem String king steht, gefunden wird. Eine kurze Beschreibung zu Metazeichen finden Sie im Abschnitt Regular Expression-Metazeichen weiter unten.

PDFEX_RegularEx

Regular Expression-Metazeichen

In der nachstehenden Liste sehen Sie eine Auflistung von Regular Expression-Metazeichen.

 

.

Steht für jedes beliebige Zeichen. Dies ist ein Platzhalter für ein einzelnes Zeichen.

(

Markiert den Beginn eines markierten Ausdrucks.

)

Markiert das Ende eines markierten Ausdrucks.

(abc)

Die Metazeichen ( und )markieren Beginn und Ende eines markierten Ausdrucks. Markierte Ausdrücke eignen sich dazu, eine gesuchte Region zu markieren ("sich diese zu merken"), um diese später referenzieren zu können (Rückreferenz). Es können bis zu neun Unterausdrücke markiert werden (und später im Feld "Suchen" oder "Ersetzen" rückreferenziert werden).

 

So wird etwa mit (the) \1 der String the the gefunden. Dieser Ausdruck erklärt sich folgendermaßen: Suche den String "the" (und merke ihn Dir als markierte Region), gefolgt von einem Leerzeichen, gefolgt von einer Rückreferenz auf die zuvor gesuchte markierte Region.

\n

n ist eine Variable, die Ganzzahlwerte von 1 bis 9 haben kann. Der Ausdruck bezieht sich auf die erste bis neunte markierte Region bei der Ersetzung. Lautet der Suchstring beispielsweise Fred([1-9])XXX und der Ersetzungsstring Sam\1YYY, so bedeutet dies, dass sich im Suchstring ein markierter Ausdruck befindet, der (implizit) mit der Zahl 1 indiziert ist; im Ersetzungsstring wird der markierte Ausdruck mit \1 referenziert. Wenn der Such- und Ersetzungsbefehl auf Fred2XXX angewendet wird, würde Sam2YYY generiert.

\<

Steht für den Beginn eines Worts.

\>

Steht für das Ende eines Worts.

\x

Damit können Sie ein Zeichen x verwenden, das sonst eine spezielle Bedeutung hätte. So würde z.B. \[ als [ und nicht als Beginn einer Zeichenmenge interpretiert werden.

[...]

Kennzeichnet eine Zeichenmenge, [abc] z.B. steht für jedes der Zeichen a, b oder c. Sie können auch Bereiche angeben, z.B. [a-z] für alle Kleinbuchstaben.

[^...]

Die invertierte Zeichenmenge. [^A-Za-z] z.B. steht für jedes Zeichen mit Ausnahme alphabetischer Zeichen.

^

Steht für den Zeilenanfang (es sei denn dieses Zeichen wird innerhalb einer Menge verwendet, siehe oben).

$

Steht für das Zeilenende. Beispiel: A+$ findet ein oder mehrere A's am Ende der Zeile.

*

Steht für 0 oder öfter. Mit Sa*m werden z.B. Sm, Sam, Saam, Saaam usw. gefunden.

+

Steht für 1 oder öfter. Mit Sa+m werden z.B. Sam, Saam, Saaam usw. gefunden.

 

Darstellung von Sonderzeichen

Beachten Sie die folgenden Ausdrücke.

 

\r

Wagenrücklauf (Carriage Return = CR). Zum Suchen oder Erstellen einer neuen Zeile können Sie entweder CR (\r) oder LF (\n) verwenden.

\n

Neue Zeile (LF). Zum Suchen oder Erstellen einer neuen Zeile können Sie entweder CR (\r) oder LF (\n) verwenden.

\t

Tabulatorzeichen

\\

Verwenden Sie diese Zeichen, um Zeichen, die in Regular Expressions vorkommen, mit einem Escape zu versehen, z.B.: \\\n

 

Suchdialogfeld im PDF-Ansichtsfenster

Sie können auch im PDF-Ansichtsfenster eine Suche durchführen. Unten sehen Sie das Suchdialogfeld im PDF-Ansichtsfenster. In diesem Dialogfeld können Sie die Optionen GROSS/klein beachten und Ganzes Wort aktivieren. Nähere Informationen dazu finden Sie unter Suchoptionen weiter oben.

PDFEX_FindDialogPDFViewPane

Suchergebnisse im PDF-Ansichtsfenster

Die Suchergebnisse werden im PDF-Ansichtsfenster hervorgehoben (siehe Abbildung unten). Mil Hilfe der Zurück- und Vorwärts-Schaltflächen können Sie zwischen den Suchergebnissen zurück- und vorwärtsspringen.

PDFEX_SearchResPDFViewPane

Aktionen mit Suchergebnissen

Sie können auch mit der rechten Maustaste auf die Suchergebnisse klicken und im Kontextmenü die passende Option auswählen.

PDFEX_SearchRes01

Eine Beschreibung der Optionen im Kontextmenü finden Sie unter Auswahlmodi.

 

© 2018-2024 Altova GmbH