Einzelnen Beitrag anzeigen
Ungelesen 23.10.23, 21:31   #2758
berndbrot
Bewahrer
 
Benutzerbild von berndbrot
 
Registriert seit: Oct 2008
Beiträge: 3.550
Bedankt: 104.413
berndbrot leckt gerne myGully Deckel in der Kanalisation! | 607742028 Respekt Punkteberndbrot leckt gerne myGully Deckel in der Kanalisation! | 607742028 Respekt Punkteberndbrot leckt gerne myGully Deckel in der Kanalisation! | 607742028 Respekt Punkteberndbrot leckt gerne myGully Deckel in der Kanalisation! | 607742028 Respekt Punkteberndbrot leckt gerne myGully Deckel in der Kanalisation! | 607742028 Respekt Punkteberndbrot leckt gerne myGully Deckel in der Kanalisation! | 607742028 Respekt Punkteberndbrot leckt gerne myGully Deckel in der Kanalisation! | 607742028 Respekt Punkteberndbrot leckt gerne myGully Deckel in der Kanalisation! | 607742028 Respekt Punkteberndbrot leckt gerne myGully Deckel in der Kanalisation! | 607742028 Respekt Punkteberndbrot leckt gerne myGully Deckel in der Kanalisation! | 607742028 Respekt Punkteberndbrot leckt gerne myGully Deckel in der Kanalisation! | 607742028 Respekt Punkte
Standard

Zitat:
Zitat von Luteg Beitrag anzeigen
...
Ich suche eine Freeware-Möglichkeit die gescannten PDFs in OCR-PDF umzuwandeln. ... weniger Speicherplatz benötigen und die Struktur der Seiten (Bilder, Tabellen, usw.) nicht "zerstören". Meist verringerte sich bisher die Bildqualität, der Blocksatz des Originals war nicht mehr da oder Teile von Tabellen waren weg oder unleserlich.
Kennt ihr eine gute Lösung?
Kenn ich nicht!
Aber wie immer: schon beim Scannen kann man anfangen Platz zu sparen. Es muß ja nicht in Bunt gescannt werden, sondern in Graustufen.
Dann gehts weiter mit der Nachbearbeitung...
Wenn du OCR in Originalstruktur willst, dann geht das auch mit Finereader ... aber wenns (relativ) fehlerfrei sein soll, dann bedeutet das: viel Kontrollarbeit in FR. Für eine gute 1x1 Umsetzung ist aber ein Bildscan die bessere (und einfachere) Variante.

Zitat:
Zitat von Luteg Beitrag anzeigen
Es sind ganz normale PDFs, die aus den gescannten jpg-Bildern der einzelnen Seiten bestehen.
Bei 300 Seiten kommen da schon 80-100 MByte zusammen, und da wäre es schön, wenn sie kleiner wären. Das ist alles.
Danke für deine Hinweise.
Ich hab dein Chemie-Buch mal in ScanTailor (nach oben, mittig) ausgerichtet. Dort in S/W und S/W mit Bildern ausgegeben. Das Ergebnis ist eine relativ kleine Datei. Nachteil hier ist die sehr kleine Schrift der Bemerkungen, die manchmal etwas schwer lesbar ist. Aber auch hier: manchmal kann man beim Scannen schon für eine bessere Vorlage sorgen.
Die andere Datei hab ich in ST ebenfalls ausgerichtet, aber als Farbbild abgespeichert. Diese hab ich in einem Bildbearbeitungsprogramm in Graustufen umgewandelt, und am Kontrast und der Gammakorrektur "gespielt", um die Artefakte um die Buchstaben zu verringern. Das Ergebnis ist eine kleinere Datei, aber wesentlich größer als ST.
Fazit: Nicht auf Programme verlassen - Automatismen verkleinern schon, aber auf Grund von meist schlechterer Qualität. Wenn man Zeit investiert kann man doch einige MB einsparen.
Hier mal die beiden Dateien zum Vergleich, und als Entscheidungshilfe, was für euch die bessere Wahl ist.
DL
[ Link nur für registrierte Mitglieder sichtbar. Bitte einloggen oder neu registrieren ]
__________________
[ Link nur für registrierte Mitglieder sichtbar. Bitte einloggen oder neu registrieren ]+ [ Link nur für registrierte Mitglieder sichtbar. Bitte einloggen oder neu registrieren ] + [ Link nur für registrierte Mitglieder sichtbar. Bitte einloggen oder neu registrieren ]

»Wenn ich so höre, lese und sehe, was mir über meine Vergangenheit mitgeteilt wird,
habe ich immer öfter den Verdacht, selbst gar nicht dabeigewesen zu sein.«
PETER ENSIKAT (Satiriker aus der DDR)
berndbrot ist offline   Mit Zitat antworten
Die folgenden 4 Mitglieder haben sich bei berndbrot bedankt:
catwiezel (25.10.23), keily24 (25.10.23), Luteg (25.10.23), Rho3 (24.10.23)