Zitat:
Zitat von Luteg
...
Ich suche eine Freeware-Möglichkeit die gescannten PDFs in OCR-PDF umzuwandeln. ... weniger Speicherplatz benötigen und die Struktur der Seiten (Bilder, Tabellen, usw.) nicht "zerstören". Meist verringerte sich bisher die Bildqualität, der Blocksatz des Originals war nicht mehr da oder Teile von Tabellen waren weg oder unleserlich.
Kennt ihr eine gute Lösung?
|
Kenn ich nicht!
Aber wie immer: schon beim Scannen kann man anfangen Platz zu sparen. Es muß ja nicht in Bunt gescannt werden, sondern in Graustufen.
Dann gehts weiter mit der Nachbearbeitung...
Wenn du OCR in Originalstruktur willst, dann geht das auch mit Finereader ... aber wenns (relativ) fehlerfrei sein soll, dann bedeutet das: viel Kontrollarbeit in FR. Für eine gute 1x1 Umsetzung ist aber ein Bildscan die bessere (und einfachere) Variante.
Zitat:
Zitat von Luteg
Es sind ganz normale PDFs, die aus den gescannten jpg-Bildern der einzelnen Seiten bestehen.
Bei 300 Seiten kommen da schon 80-100 MByte zusammen, und da wäre es schön, wenn sie kleiner wären. Das ist alles.
Danke für deine Hinweise.
|
Ich hab dein Chemie-Buch mal in ScanTailor (nach oben, mittig) ausgerichtet. Dort in S/W und S/W mit Bildern ausgegeben. Das Ergebnis ist eine relativ kleine Datei. Nachteil hier ist die sehr kleine Schrift der Bemerkungen, die manchmal etwas schwer lesbar ist. Aber auch hier: manchmal kann man beim Scannen schon für eine bessere Vorlage sorgen.
Die andere Datei hab ich in ST ebenfalls ausgerichtet, aber als Farbbild abgespeichert. Diese hab ich in einem Bildbearbeitungsprogramm in Graustufen umgewandelt, und am Kontrast und der Gammakorrektur "gespielt", um die Artefakte um die Buchstaben zu verringern. Das Ergebnis ist eine kleinere Datei, aber wesentlich größer als ST.
Fazit: Nicht auf Programme verlassen - Automatismen verkleinern schon, aber auf Grund von meist schlechterer Qualität. Wenn man Zeit investiert kann man doch einige MB einsparen.
Hier mal die beiden Dateien zum Vergleich, und als Entscheidungshilfe, was für euch die bessere Wahl ist.
DL
[
Link nur für registrierte Mitglieder sichtbar. Bitte einloggen oder neu registrieren ]