Einzelnen Beitrag anzeigen
Ungelesen 06.08.21, 18:57   #1653
berndbrot
Bewahrer
 
Benutzerbild von berndbrot
 
Registriert seit: Oct 2008
Beiträge: 3.241
Bedankt: 92.043
berndbrot leckt gerne myGully Deckel in der Kanalisation! | 561567182 Respekt Punkteberndbrot leckt gerne myGully Deckel in der Kanalisation! | 561567182 Respekt Punkteberndbrot leckt gerne myGully Deckel in der Kanalisation! | 561567182 Respekt Punkteberndbrot leckt gerne myGully Deckel in der Kanalisation! | 561567182 Respekt Punkteberndbrot leckt gerne myGully Deckel in der Kanalisation! | 561567182 Respekt Punkteberndbrot leckt gerne myGully Deckel in der Kanalisation! | 561567182 Respekt Punkteberndbrot leckt gerne myGully Deckel in der Kanalisation! | 561567182 Respekt Punkteberndbrot leckt gerne myGully Deckel in der Kanalisation! | 561567182 Respekt Punkteberndbrot leckt gerne myGully Deckel in der Kanalisation! | 561567182 Respekt Punkteberndbrot leckt gerne myGully Deckel in der Kanalisation! | 561567182 Respekt Punkteberndbrot leckt gerne myGully Deckel in der Kanalisation! | 561567182 Respekt Punkte
Standard

Vorarbeit macht der Scantailor. Wer beim Scannen und im ST gut vorarbeitet hat weniger Probleme beim OCR.
Dazu nutze ich Abby finereader8! portable - die neuen Versionen machen auch nichts besser, nur mehr unnötige Formatierungen. Beim Weitergeben an word wird bei Layout übernehmen nicht das Originallayout übernommen, sondern nur: Tabellen, Absätze, Schriftarten - also alles fette, kursive und Zeilenumbrüche und ... die Leerzeilen (wenn sie richtig gesetzt - geEntert - sind). Alle anderen Formatierungen - Letterspacing, verschiedene Schriftgrößen etc. - bringen nur Unordnung in Word.
In word 2003 (weil nur hier meine AddIns funktionieren!!) wird das layout, also die Formatierung, gemacht. Hier werden auch mit den AddIns verschiedenste Korrekturen gemacht: zB kann man Buchstabenabstände auf 0 setzen. Man überprüft auf: Stimmigkeit der Anführungszeichen, der Absatzmarken, auf ungewöhnliche Zeichen im Text und auf Stimmigkeit bestimmter Anfangsworte und Scanfehler. Hier kann man eine Liste mit häufig auftrenden Scanfehlern erweitern, den sogenannten Suspekts. zB kommt es manchmal vor, daß heben im OCR erkannt wird, was aber lieben sein soll. heben geht durch jede Rechtschreibkontrolle ... aber als Suspekt wird es bei der Kontrolle angezeigt, und du erkennst aus dem Kontext ob es da richtig ist oder doch lieben heißen sollte.
Nach diesen Kontrollen kommt dann die Word-Rechtschreibkontrolle und wird dann in Atlantis - Word 2003 kanns noch nicht - als epub gespeichert. Dieses wird dann in Sigil noch überarbeitet, die CSS und die span-tags durchgesehen. ...und nochmal Rechtschreibkontrolle! Da ich hier ein minimales Wörterbuch nutze - und nicht erweiter! - finde ich oft noch Fehler die bei Word und Finereader - auch da wurde auf Scanfehler und Rechtschreibung geprüft - nicht angezeigt wurden.
Also: viel Überprüfen und Kontrollieren! Nie auf die automatischen Ergebnisse verlassen!!!
Und nie ein pdf in calibre automatisch zum ePub konvertieren!!!!!! Da kommt nur Sch*** raus!
Na? immer noch Lust?!
Für ein ordentliches ePub braucht man Zeit.

Achso, der EnnoMo hat seine NBI 1955/16 überarbeitet. Die Mittelseite war nicht so gut.
__________________
[ Link nur für registrierte Mitglieder sichtbar. Bitte einloggen oder neu registrieren ]+ [ Link nur für registrierte Mitglieder sichtbar. Bitte einloggen oder neu registrieren ] + [ Link nur für registrierte Mitglieder sichtbar. Bitte einloggen oder neu registrieren ]

»Wenn ich so höre, lese und sehe, was mir über meine Vergangenheit mitgeteilt wird,
habe ich immer öfter den Verdacht, selbst gar nicht dabeigewesen zu sein.«
PETER ENSIKAT (Satiriker aus der DDR)

Geändert von berndbrot (07.08.21 um 16:12 Uhr)
berndbrot ist gerade online   Mit Zitat antworten
Die folgenden 4 Mitglieder haben sich bei berndbrot bedankt:
EnnoMo (07.08.21), Erazor63 (06.08.21), krisch64 (08.08.21), Rho3 (06.08.21)