Hilfe

PDFify ist ein kleines macOS-Werkzeug zum Kombinieren von einzelnen Seiten aus verschiedenen Quellen zu einer PDF-Datei und zur Anwendung von Texterkennung, falls erforderlich.

Texterkennung - OCR

Die Texterkennung wird automatisch bei Bildern oder PDF Dateien die keine Textinformationen enthalten angewendet. Sind bereits Textinformationen vorhanden, kann über den OCR-Knopf die Erkennung des gesamten Dokumentes erzwungen werden. OCR kann mit verschiedenen Einstellungen auch mehrmals auf dasselbe Dokument angewendet werden, um optimale Ergebnisse zu erhalten.

Für die Texterkennung stehen zwei Implementierungen zur Auswahl:

Tesseract

Tesseract ist eine sehr ausgereifte Open-Source-Lösung, die von großen Unternehmen unterstützt wird. Die Version 4, die in PDFify verwendet wird, ist auf dem neuesten Stand der Technik und schnell genug für eine komfortable Benutzerfreundlichkeit.

Tesseract

Wenn Tesseract verwendet wird, stehe über 100 Sprachen zur Verfügung. Für jede Sprache stehen separate Datensätze zur Verfügung, optimiert auf Geschwindigkeit und Qualität. Im Einstellungsdialog können Sie zwischen diesen beiden Geschmacksrichtungen als schnell und beste wählen.

Überprüfen Sie die Sprachen, die Sie verwenden möchten. Sie können mehr als eine Sprache auswählen, aber ich würde empfehlen, so wenige wie möglich zu verwenden, idealerweise nur eine.

Apple Vision

Apple Vision OCR ist eine Lösung die seit kurzem in macOS und iOS integriert ist. Vor macOS Big Sur wird hier allerdings nur die englische Sprache unterstützt.

Holtwick-PDFify-2020-vBkRawka@2x

PRO Zur Verbesserung der Ergebnisse ist es möglich die Qualität der Erkennung zu wählen und eine Sprachkorrektur anzuwenden.

Seiten hinzufügen

Sie können mit den folgenden Optionen beginnen:

  1. Öffnen Sie eine vorhandene PDF-Datei mit PDFify. Sie müssen sie manuell OCR anwenden.
  2. Mit einem leeren Dokument beginnen.

rightIn beiden Fällen können Sie neue Seiten am Ende des Dokuments hinzufügen durch Ziehen des Inhalts auf das Fenster oder durch Auswahl von Seiten hinzufügen aus der Toolbar oder den Hauptmenü-Einträgen unter Seiten.

Sie können aber auch Kopieren und Einfügen von Dateien, PDFs, Bildern, Screenshots und mehr.

Sie können experimentieren, es gibt immer Rückgängigmachen, um zum vorherigen Zustand zurückzukehren, falls etwas schiefgelaufen ist.

Continuity Camera / iPhone / iPad

Wenn ein iPhone oder ein iPad vorhanden ist, so erscheint in dem Menü die Option von dort Dokumente zu scannen. PDFify reduziert den sonst bei dieser Option erscheinenden weißen Rand und liefert so ein optimales Ergebnis und das mobile Gerät wird zum handlichen Dokumentenscanner.

Weitere Infos bei Apple.

Desktop Scanner

image-20200915234210882

PDFify bietet einen komfortablen Scanner-Dialog. Er zeigt auf der linken Seite eine Liste aller verfügbaren Geräte. Nach der Auswahl eines Scanners wird die macOS-Scan-Schnittstelle mit den üblichen Optionen angezeigt. Scannen Sie so viele Seiten wie Sie möchten, sie werden an das aktuelle Dokument angehängt und OCR angewendet. Drücken Sie Fertig, um den Dialog zu verlassen.

Tipp

Sie können natürlich beliebige Einstellungen wählen, aber die folgenden haben sich als gute Standardeinstellungen erwiesen:

Typ: Farbe oder Grau. Auflösung: 300dpi.

Achtung

Bei manchen Scannern kommt es zu Problemen beim “Schwarz-Weiß-Modus”. Dieses Problem lässt sich beheben, indem in den Einstellungen von PDFify die Option “Aktiviere Dateityp Auswahl” gesetzt wird. Dadurch wird beim Scannen eine temporäre Datei erzeugt. Leider handelt es sich um einen Fehler im Betriebssystem, der diesen Workaround nötig macht.

ScanSnap

Besonders gute Ergebnisse lassen sich mit einem Dokumentenscanner wie dem ScanSnap des Herstellers FUJITSU erzielen.

Das folgende Video zeigt, wie die App Receipts direkt in ScanSnap Home integriert werden kann. Für PDFify sind die Schritte die gleichen:

https://youtu.be/k4pOgDWYm2U

Dieses Video zeigt, wie die Anwendung Receipts in den älteren ScanSnap Manager integriert wird:

Mails

Aus den meisten E-Mail-Programmen lassen sich ausgewählte Mails per Drag-and-drop nach PDFify ziehen, sowohl auf das Fenster (Seiten hinzufügen) als auch das Dock-Icon (Neues Dokument erstellen). Als Ergebnis wird ein PDF mit DIN A4 Seiten erstellt, was sehr nützlich ist z.B. für Rechnungen aus dem Apple Store oder Google PlayStore, da auf diese Weise der Druckdialog komplett übersprungen werden kann. Die meisten E-Mail-Anwendungen, darunter auch Apple Mail, MailMate, AirMail und Postbox werden unterstützt. Nicht unterstützt wird Spark, dort ist der Umweg über den Druckdialog zu gehen.

Webseiten

Auch Webseiten werden automatisch in PDF-Dateien konvertiert. Ziehen Sie die URL aus Ihrem bevorzugten Browser in ein PDFify-Fenster.

URLs, die sich in der Zwischenablage befinden, können ebenfalls einfach eingefügt werden und die Website wird an das Dokument angehängt.

Mit PDF arbeiten

Squeeze - Dateigröße anpassen

Die Größe der PDF-Datei kann optimiert werden durch Veränderung der Bildqualität. Als Standard stehen folgende Vorgaben zur Verfügung:

  • Original: Die Originaldaten bleiben erhalten. Keine weitere Veränderung der Daten, dabei kann es auch sein, dass bereits Komprimierungen der Originale enthalten sind, wodurch sich ggf. ebenfalls gute Werte ergeben.
  • Leichte Komprimierung: 300 dpi, 80 % Qualität.
  • Mittlere Komprimierung: 144 dpi, 75 % Qualität.
  • Starke Komprimierung: 72 dpi, 50 % Qualität.

Die aktuelle Größe der Datei wird nun in der unteren Statusleiste mittig angezeigt.

Nachdem die Kompression angewendet wurde, wird eine Meldung angezeigt, um wie viel sich die Dateigröße zum vorherigen Wert verändert hat.

PRO In den Einstellungen kann die Optimierung eingestellt werden, die für neu hinzugefügte Seiten verwendet werden soll.

OCR anwenden

OCR auf vorhandene PDF-Seiten anwenden

rightWenn Sie PDF-Dateien öffnen oder PDF-Seiten zu einem Dokument hinzufügen, enthält es möglicherweise bereits Textinformationen, die Sie vielleicht behalten möchten. Daher liegt die Entscheidung, ob diese Seiten mit OCR versehen werden sollen oder nicht, bei Ihnen.

Hintergrund Informationen

Der Grund dafür, dass dies nicht automatisiert wurde, liegt darin, dass du irgendwann einmal eine PDF-Datei haben, die Text enthält, aber wenn Sie sie kopieren und an anderer Stelle einfügen, stellen Sie fest, dass die Zeichen nicht mit ihrer Darstellung übereinstimmen und die Information daher nutzlos ist. Dies ist etwas, was ein Algorithmus nicht zu 100 % identifizieren kann, und daher bleibt diese Entscheidung Ihnen überlassen.

Text kopieren

rightEin Klick, um den gesamten in der aktuellen PDF-Datei enthaltenen reinen Text zu kopieren.

Text lesen

rightLiest den Inhalt der PDF-Datei mit der Standardstimme, die Sie in den macOS-Einstellungen festlegen können. Klicken Sie erneut, um das Lesen zu beenden.

Drucken

rightDrucken Sie das aktuelle Dokument aus.

Teilen

rightDas Dokument mit anderen Anwendungen und Diensten teilen.

Rückgängig / Wiederholen

Alle durchgeführten Operationen können auch rückgängig gemacht oder wiederholt werden. Gehen Sie in das Hauptmenü und wählen Sie Rückgängig oder Wiederholen aus dem Menü Bearbeiten. Sie können auch die Tastaturkürzel CMD + Z oder CMD + SHIFT + Z wie in jeder anderen guten Mac-Anwendung verwenden.

Seiten löschen und rotieren

rightDirekt im PDF können im Kontextmenü die Aktionen zum Löschen oder drehen der aktuell unterm Cursor liegenden Seite ausgewählt werden. In der Thumbnailansicht erscheint nach kurzer Verzögerung eine entsprechende Option.

Info

Das Rotieren einer Seite hat, im Unterschied zu Veränderungen am Dokument, Einfluss auf die Texterkennung. So wird nach einer Rotation eine bereits durchgeführte Texterkennung mit rotiert. Wird allerdings erneute eine Texterkennung durchgeführt, wird die aktuelle Rotation berücksichtigt und wieder Text von oben nach unten erkannt.

Stapelverarbeitung

Dieses neue Feature ermöglicht es, mehrere Dokumente auf einmal in durchsuchbare PDFs zu verwandeln oder deren Dateigröße zu verkleinern. Die Funktion “Create Searchable PDF” lässt sich neben PDFs auch auf Bilder (PNG, JPG, etc.) anwenden, “squeezen” hingegen lassen sich nur PDFs.

Man markiert mehrere Dokumente und wendet eine sogenannte “Schnellaktion” an. Durch die jeweilige Schnellaktion entsteht am selben Speicherort pro Dokument jeweils eine neue Datei mit der Endung “.min.pdf” bzw. “.searchable.pdf”. Möchte man lieber die Original-Datei überschreiben, setzt man nach der unten beschriebenen Einstellung der “Quick Actions” unter “Actions” ein entsprechendes Häkchen.

Diese “Schnellaktionen” (“Quick Actions”) werden direkt im Finder durchgeführt:

  • “Create Searchable PDF”
  • “Squeeze PDF”

Vor der ersten “Stapelverarbeitung” müssen die “Quick Actions” über die rechte Maustaste angepasst…

… und entsprechend ausgewählt werden.

Die hinzugefügten “Quick Actions” werden nun zur Auswahl bei den Schnellaktionen sowie in der Ansicht unterhalb des PDFs angezeigt und können in einem Schritt im Vergleich zur umständlicheren Verarbeitung im UI angewandt werden. Die Einstellungen aus der Hauptapp für Squeeze und OCR werden übernommen.

In der Spaltenansicht im Finder:

Selbstverständlich funktioniert die Schnellaktion auch bei einzelnen Dokumenten.

Gut zu wissen

Installation

Es gibt 3 Möglichkeiten PDFify zu installieren:

  • Download von dieser Homepage.
  • Installation über den App Store.
  • Per Kommandozeile via Homebrew: brew install --cask pdfify (Selbe Version wie von der Homepage).

Beta

Für PDFify (nicht via App Store) stehen Beta-Versionen zur Verfügung, die Einblick in die neueste Entwicklung bieten. Im Hauptmenü kann bei gedrückter ALT-Taste der Punkt “nach Aktualisierung suchen…” ausgewählt werden, um die neueste Beta zu laden. Ein direkter Download ist ebenfalls möglich via pdfify.app/latest-beta.

Feedback zu den neuen beschriebenen Features ist willkommen. Siehe auch “Zukunft” zu weiteren Beteiligungsmöglichkeiten.

Datenschutz

Alle Operationen finden lokal statt und kein Inhalt Ihrer Dokumente wird an irgendeinen Server gesendet. Wir stellen lediglich eine Verbindung zum Internet her, um die Sprachdateien zu laden, Absturzberichte zu versenden oder Support-Meldungen zu senden. Ansonsten findet keinerlei Datenerfassung statt.

Für Einzelheiten siehe Datenschutzerklärung.

Support

Es gibt einen eingebauten Support-Dialog in der Anwendung, der von replies.io betrieben wird und uns hilft, leichter Rückmeldungen an Sie zu erhalten. Wenn diese Dokumentation Ihre Fragen nicht beantwortet hat, ist das der bevorzugte Weg.

Abonnement oder Lizenz PRO

Um alle Funktionen der App vollständig nutzen zu können und kein Wasserzeichen im fertigen PDF zu haben, kann ein monatliches oder jährliches Abo abgeschlossen werden. Eine Testphase ist automatisch enthalten. Alternativ steht auch eine lebenslange Lizenz zur Verfügung, bei der nur ein einmaliger Preis ohne zeitliche Beschränkung zu entrichten ist.

Mit dem Abo oder einer lebenslangen Lizenz wird die Weiterentwicklung der App gefördert. Die Zukunft der App kann über Github mitgestaltet werden. Auch der Support steht jederzeit zur Verfügung.