PDFpen logo PDFpen SmileOnMyMac logo
 

Hilfe: OCR (Optical Character Recognition - Optische Texterkennung)

OCR nennt sich der Vorgang, bei dem ein Bitmap-Bild, das Text enthält (z.B. ein gescanntes Dokument) in Text umgewandelt wird, den man mit PDFpen and anderen Textverarbeitungsprogrammen auswählen, kopieren und durchsuchen kann.

OCR-Technik erzeugt aus dem Bildtext keinen perfekten Text. Sie müssen den Text, der aus der OCR entsteht, noch korrekturlesen und bearbeiten.

OCR in PDFpen verwenden

  1. Öffnen Sie in PDFpen ein gescanntes PDF
  2. Es erscheint eine Warnbox mit dem Hinweis "Dieses Dokument scheint gescannt zu sein. Wollen Sie eine optische Zeichenerkennung (OCR) darauf ausführen? Nach der OCR können Sie dann Text auswählen." Sie haben drei Möglichkeiten:
    • Abbrechen
      Es wird keine OCR vorgenommen
    • Seite erkennen
      Auf die Seite wird eine OCR ausgeführt
    • Dokument erkennen
      Wenn Ihr Dokument aus mehreren Seiten besteht, wird eine OCR auf alle diese Seiten ausgeführt.

Während PDFpen eine OCR ausführt, erscheint ein Fortschrittsbalken. Der Vorgang kann ein paar Sekunden oder länger dauern, je nach Größe und Inhalt des gescannten Dokuments.

Um eine OCR manuell auszuführen, rufen Sie den Menüpunkt "Bearbeiten/OCR" auf. PDFpen leitet den OCR-Vorgang ein und der Fortschrittsbalken erscheint.

OCR-Text auswählen, kopieren und korrigieren

Der Text, der durch den OCR-Vorgang erzeugt wurde, kann wie jeder andere Text bearbeitet werden. Siehe Arbeiten mit Text.

OCR-Text durchsuchen

Der Text, der durch den OCR-Vorgang erzeugt wurde, kann wie jeder andere Text durchsucht werden. Siehe Suchen innerhalb eines PDFs.

Tipps zum Verbessern der OCR-Ergebnisse Ihres Dokuments:

  • Die Qualität des Ursprungs-Dokument beeinflusst die Qualität des OCR-Vorgangs. Knackige, saubere Vorlagen mit klarem Text führen zu besseren Ergebnissen als zerknitterte, verblasste Fotokopien.
  • Platzieren Sie Ihr Ursprungs-Dokument so gerade wie möglich auf dem Scanner. Wenn Sie ein PDF haben, das nicht gerade, sondern ein wenig gedreht ist, drehen Sie dieses in einem Programm so, dass das Bild gerade (oder entzerrt) ist, bevor Sie es mit PDFpen öffnen.
  • Vergrößern Sie den Kontrast des gesannten Dokuments, so dass der Hintergrund so weiß wie möglich ist.

Wie man PDFpen zwingt, eine OCR durchzuführen

PDFpen betrachtet das Dokument und wenn es ein Bild von der Größe einer Seite bemerkt, geht es davon aus, dass es sich um um ein gescanntes Dokument handelt und bietet automatisch eine OCR an. In manchen Fällen erkennt PDFpen ein gescanntes Dokument jedoch nicht. Der Menüpunkt "Bearbeiten/OCR..." ist dann ausgegraut und kann nicht ausgewählt werden.

  1. Halten Sie die alt- und die Befehlstaste zusammen gedrückt.
  2. Wählen Sie nun den Menüpunkt "Bearbeiten/OCR..." aus.

 

 

 
 
© 2003-2009 SmileOnMyMac, LLC. Alle Rechte vorbehalten.
SmileOnMyMac, PDFpen und PDFpenPro sind eingetragene Warenzeichen von SmileOnMyMac, LLC.