Hilfe

PDFify ist ein kleines MacOS-Werkzeug zum Kombinieren von Seiten aus verschiedenen Quellen zu einer PDF-Datei und zur Anwendung von Texterkennung, falls erforderlich.

Texterkennung - OCR

Für die Texterkennung stehen zwei Implementierungen zur Verfügung:

  1. Tesseract, einer sehr ausgereiften Open-Source-Lösung, die von großen Unternehmen unterstützt wird. Die Version 4, die in PDFify verwendet wird, ist auf dem neuesten Stand der Technik und schnell genug für eine komfortable Benutzerfreundlichkeit.
  2. Apple Vision OCR, eine Lösung die seit kurzem in macOS und iOS integriert ist. Vor macOS Big Sur wird hier allerdings nur die Englische Sprache unterstützt.

ocr-de@2x

Wenn Tesseract verwendet wird, stehe über 100 Sprachen zur Verfügung. Für jede Sprache stehen separate Datensätze zur Verfügung, optimiert auf Geschwindigkeit und Qualität. Im Einstellungsdialog können Sie zwischen diesen beiden Geschmacksrichtungen als schnell und beste wählen.

Überprüfen Sie die Sprachen, die Sie verwenden möchten. Sie können mehr als eine auswählen, aber ich würde empfehlen, so wenige wie möglich zu verwenden, idealerweise nur eine davon.

Seiten hinzufügen

Sie können mit den folgenden Optionen beginnen:

  1. Öffnen Sie eine vorhandene PDF-Datei mit PDFify. Sie müssen sie manuell OCR anwenden
  2. Mit einem leeren Dokument beginnen

rightIn beiden Fällen können Sie neue Seiten am Ende des Dokuments hinzufügen durch Ziehen des Inhalts auf das Fenster oder durch Auswahl von Seiten hinzufügen aus der Toolbar oder den Hauptmenü-Einträgen unter Seiten.

Sie können aber auch Kopieren und Einfügen von Dateien, PDFs, Bildern, Screenshots und mehr.

Sie können experimentieren, es gibt immer Rückgängigmachen, um zum vorherigen Zustand zurückzukehren, falls etwas schief gelaufen ist.

Scanner

image-20200915234210882

PDFify bietet einen komfortablen Scanner-Dialog. Er zeigt auf der linken Seite eine Liste aller verfügbaren Geräte. Nach der Auswahl eines Scanners wird die MacOS-Scan-Schnittstelle mit den üblichen Optionen angezeigt. Scannen Sie so viele Seiten wie Sie möchten, sie werden an das aktuelle Dokument angehängt und OCR angewendet. Drücken Sie Fertig, um den Dialog zu verlassen.

Tipp Sie können natürlich beliebige Einstellungen wählen, aber die folgenden haben sich als gute Standardeinstellungen erwiesen:

Typ: Farbe oder Schwarzweiß
Auflösung: 300dpi

ScanSnap

Besonders gute Ergebnisse lassen sich mit einem Dokumentenscanner wie dem ScanSnap des Herstellers FUJITSU erzielen. Dort wird die Verwendung der hauseigenen OCR-Software Abbyy Fine Reader empfohlen.

Das folgende Video zeigt, wie die App Receipts direkt in ScanSnap Home integriert werden kann. Für PDFify sind die Schritte die gleichen:

 
Play video

Dieses Video zeigt, wie die Anwendung Receipts in den älteren ScanSnap Manager integriert wird:

 
Play video

Mails

Aus den meisten E-Mail Programmen lassen sich ausgewählte Mails per Drag and Drop nach PDFify ziehen. Das funktioniert sowohl auf das Fenster (Seiten hinzufügen) oder das Dock-Icon (Neues Dokument erstellen). Das Ergebnis ist ein PDF mit ordentlichen Seiten. Das ist sehr nützlich für Rechnungen im Apple Store oder Google PlayStore, da Sie den Druckdialog komplett überspringen können. Die meisten E-Mail-Anwendungen, darunter auch Apple Mail, MailMate, AirMail und Postbox werden unterstützt. Nicht unterstützt wird Spark, dort ist der Umweg über den Druckdialog zu gehen.

Webseiten

Auch Webseiten werden automatisch in seitenbezogene PDF-Dateien konvertiert. Ziehen Sie die URL aus Ihrem bevorzugten Browser in ein PDFify-Fenster.

Mit PDF arbeiten

Squeeze

right Verkleinern Sie die Größe der PDF-Datei, indem Sie die Größe der enthaltenen Bilder reduzieren. Dies wird durch zwei Parameter erreicht:

  1. Die Dichte der Pixel im Bild, ausgedrückt durch DPI (dots per inch) zwischen 75 und 600
  2. Die für das Bild verwendete Kompression mit der Wahl zwischen niedrig und durchschnittlich.

Nachdem die Kompression angewendet wurde, erhalten Sie in einem Dialog eine Rückmeldung über das erzielte Ergebnis. Möglicherweise müssen Sie ein wenig damit experimentieren. Wenden Sie einfach undo an und beginnen Sie von vorne.

komprimierte Info

OCR anwenden

OCR auf vorhandene PDF-Seiten anwenden

rightWenn Sie PDF-Dateien öffnen oder PDF-Seiten zu einem Dokument hinzufügen, enthält es möglicherweise bereits Textinformationen, die Sie vielleicht behalten möchten. Daher liegt die Entscheidung, ob diese Seiten mit OCR versehen werden sollen oder nicht, bei Ihnen.

Wenn Sie auf die Schaltfläche OCR in der OCR-Symbolleiste klicken, wird OCR nur auf diese Seiten angewendet, und die Schaltfläche ist auch nur aktiviert, wenn solche Seiten vorhanden sind.

Der Grund dafür, dass dies nicht automatisiert wurde, liegt darin, dass Sie irgendwann einmal eine PDF-Datei haben, die Text enthält, aber wenn Sie sie kopieren und an anderer Stelle einfügen, stellen Sie fest, dass die Zeichen nicht mit ihrer Darstellung übereinstimmen und die Information daher nutzlos ist. Dies ist etwas, was ein Algorithmus nicht zu 100% identifizieren kann, und daher bleibt diese Entscheidung Ihnen überlassen.

Text kopieren

rightEin Klick, um den gesamten in der aktuellen PDF-Datei enthaltenen reinen Text zu kopieren.

Text lesen

rightLiest den Inhalt der PDF-Datei mit der Standardstimme, die Sie in den MacOS-Einstellungen festlegen können. Klicken Sie erneut, um das Lesen zu beenden.

Drucken

rightDrucken Sie das aktuelle Dokument aus.

Teilen

rightDas Dokument mit anderen Anwendungen und Diensten teilen.

Rückgängig / Wiederholen

Alle durchgeführten Operationen können auch rückgängig gemacht oder wiederholt werden. Gehen Sie in das Hauptmenü und wählen Sie Rückgängig oder Wiederholen aus dem Menü Bearbeiten. Sie können auch die Tastaturkürzel CMD + Z oder CMD + SHIFT + Z wie in jeder anderen guten Mac-Anwendung verwenden.

Seiten löschen und rotieren

rightDirekt im PDF können im Kontextmenü die Aktionen zum Löschen oder drehen der aktuell unterm Cursor liegenden Seite ausgewählt werden. In der Thumbnailansicht erscheint nach kurzer Verzögerung eine entsprechende Option.

Gut zu wissen

Datenschutz

Alle Operationen finden lokal statt und kein Inhalt Ihrer Dokumente wird an irgendeinen Server gesendet. Wir stellen lediglich eine Verbindung zum Internet her, um die Sprachdateien zu laden, Absturzberichte zu versenden oder Supportmeldungen zu senden. Ansonsten findet keinerlei Datenerfassung statt.

Für Einzelheiten siehe Datenschutzerklärung.

Support

Es gibt einen eingebauten Supportdialog in der Anwendung, der von replies.io betrieben wird und uns hilft, leichter Rückmeldungen an Sie zu erhalten. Wenn diese Dokumentation Ihre Fragen nicht beantwortet hat, ist das der bevorzugte Weg.

Abonnement oder Lizenz

Um alle Funktionen der App vollständig nutzen zu können und keine Wasserzeichen im fertigen PDF zu haben, kann ein monatliches oder jährliches Abo abgeschlossen werden. Eine Testphase ist automatisch enthalten.

Mit dem Abo oder einer lebenslangen Lizenz wird die Weiterentwicklung der App gefördert. Die Zukunft der App kann über Github mitgestaltet werden. Für weitere Ideen bitte an den Support wenden. Danke.