PDF-OCR
Führe OCR auf einem gescannten PDF aus und lade eine Textdatei mit dem erkannten Text herunter.
100 % in deinem Browser. Deine Datei verlässt dein Gerät nie.
Funktionen
- Sechs eingebaute Sprachen (EN, DE, FR, ES, IT, PT)
- Läuft in deinem Browser – kein Upload
- Fortschrittsanzeige pro Seite
- Reine Textausgabe (.txt)
- Zwischengespeicherte Sprachmodelle bei erneuter Nutzung
- Durchsuchbare PDF-Ausgabe in der nativen App
Über dieses Tool
Tesseract.js läuft komplett in deinem Browser (bei Bedarf geladen – nie bei untätigen Seitenaufrufen). Wähle eine Sprache, lege ein gescanntes PDF ab, und das Tool erzeugt eine saubere .txt-Datei, die du in Word, Notizen oder anderswo einfügen kannst. Die native App erzeugt durchsuchbare PDFs mit eingebetteten Textebenen.
So führt man OCR auf einem PDF aus
-
Sprache wählen
Wähle die vorherrschende Sprache des Dokuments.
-
PDF ablegen
Beste Ergebnisse bei Scans mit ≥ 200 DPI.
-
Auf Erkennung warten
Ein Fortschrittsbalken zeigt den Fortschritt pro Seite.
-
Text herunterladen
Eine .txt-Datei mit einem Abschnitt pro Seite wird gespeichert.
Häufige Fragen
Warum ist der erste Durchlauf langsam?
Die Sprachdaten (~10 MB) werden einmal heruntergeladen und für das nächste Mal zwischengespeichert.
Wie genau ist es?
Tesseract 5 erreicht 95 %+ bei sauberen modernen Scans. Handschrift ist schlecht.
Bekomme ich ein durchsuchbares PDF?
Durchsuchbare PDF-Ausgabe (Textebene über Bildern) gibt es in der nativen App.
Wird mein Scan hochgeladen?
Nein – OCR läuft komplett in deinem Browser.
Kostenlos?
Ja.