Zitat:
Zitat von Luteg
...
Meine Frage ist aber: Kennt jemand eine Möglichkeit, wie man anschließend die als Bild gescannten Textseiten rausschmeißt und dafür eine reine Textseite einfügt, möglichst mit ähnlicher Schriftart, auf jeden Fall mit gleicher Formatierung?
Gibt es so etwas überhaupt?
|
Sowas macht zB der Finereader, aber... wenn du dich auf die Automatik verläßt und nicht K-liest...
Ich würde und mache mir diese Arbeit nicht. Ein gutes Bild-pdf mit hinterlegter OCR ist -
für mich! - die bessere Wahl.
Ich habe zuviel OCR-pdfs gesehen, wo man schon im Titel und den ersten Seiten - beim "Drüberfliegen" - Fehler und falsche Zeichen findet. Diese Vorlagen taugen einen Sch*** für Weiterarbeit.
Außerdem sieht die Formatierung oft auch verunglückt aus. Die originale Schrift ist nicht vorhanden, die Zeichen- und Wortabständes passen nicht uswusf.
Wenn man das alles passend macht, muß man viel Arbeit investieren.