myGully.com Boerse.SH - BOERSE.AM - BOERSE.IO - BOERSE.IM Boerse.BZ .TO Nachfolger
Zurück   myGully.com > Computer & Technik > Programmierung
Seite neu laden

RegExp

Willkommen

myGully

Links

Forum

 
Antwort
Themen-Optionen Ansicht
Ungelesen 20.07.13, 14:03   #1
Charif
Anfänger
 
Registriert seit: Jun 2013
Beiträge: 3
Bedankt: 0
Charif ist noch neu hier! | 0 Respekt Punkte
Standard RegExp

Hallo,

binn auf der Suche nach der Richtigen Syntax, für einen Regulären Ausdruck, der bei einiegen html-Dokumenten etwas suchen und ersetzen soll. Das ganze soll in dem Programm "Sigil" Stattfinden, muss es aber nicht, würde mir zu not auch noch einen anderren editor runterladen wenn es sein muss.

Das Problem ist einfach das nicht nur ein paar Worte ersetzt werden sollen, sondern mehrere Absätze mit Zeilenumbrüchen und das sich der Mittlere Teil, des zu findenden Abschitts, auch noch immer ein wenig von den anderren html-Dokumenten unterscheidet.

<p>&nbsp; &nbsp; &nbsp;</p><s***** src="common/js/prototype.js" type="text/javas*****">
</s*****>

<p>&nbsp; &nbsp; &nbsp;</p><s***** src="common/js/lightbox.js" type="text/javas*****">
</s*****><s***** src="common/prettify.js" type="text/javas*****">
</s*****><s***** src="common/openwin.js" type="text/javas*****">
</s*****>

Also immer nur die ersten und letzen ca. 5 Zeichen sind bei allen html-Dokumenten gleich, gibt es vieleicht so eine art universal-Syntax ?
Charif ist offline   Mit Zitat antworten
Ungelesen 23.07.13, 13:02   #2
id1213
Anfänger
 
Registriert seit: May 2012
Beiträge: 9
Bedankt: 9
id1213 ist noch neu hier! | 0 Respekt Punkte
Standard

[ Link nur für registrierte Mitglieder sichtbar. Bitte einloggen oder neu registrieren ]
hast wohl nicht gesehen, erster beispiel hilft dir weiter o. willst es anders ?

bei solchen fragen wie deine, solltest du ein vorher/nachher beispiel geben

dein post habe ich 5 mal gelesen
id1213 ist offline   Mit Zitat antworten
Ungelesen 24.07.13, 23:22   #3
fryx
Mitglied
 
Benutzerbild von fryx
 
Registriert seit: Jul 2012
Beiträge: 382
Bedankt: 72
fryx gewöhnt sich langsam dran | 84 Respekt Punkte
Standard

Bei Regex Fragen immer Input und gewünschten Output posten, sonst wird das nix.
Generell sollte man HTML, XML, JSON uä. nicht mit Regex sondern speziellen Tools parsen.
__________________
[ Link nur für registrierte Mitglieder sichtbar. Bitte einloggen oder neu registrieren ] | [ Link nur für registrierte Mitglieder sichtbar. Bitte einloggen oder neu registrieren ] | [ Link nur für registrierte Mitglieder sichtbar. Bitte einloggen oder neu registrieren ] |[ Link nur für registrierte Mitglieder sichtbar. Bitte einloggen oder neu registrieren ]
fryx ist offline   Mit Zitat antworten
Ungelesen 26.07.13, 19:03   #4
Charif
Anfänger
 
Registriert seit: Jun 2013
Beiträge: 3
Bedankt: 0
Charif ist noch neu hier! | 0 Respekt Punkte
Standard

Der link ist gut aber, das Beispiel dort passt nicht ganz, weil der Mittlere Teil der Syntax variabel/flexibel sein muss. So zum Beispiel hat es manchmahl funktioniert: "<p>&nbsp;.*?</s*****>" .

Aber eben auch nur machmahl, besser gesagt selten. Ersetzt werden sollten die Abschnitte durch nichts, dachte das währe klar. "Sigil" achtet aber leider bei der erstellung einer ebub-datei nicht darauf, das Dokument selbständig zu splitten. Was dazu führt das ein Großteil des Dokumentes nicht angezeigt wird, weil sich epub-dateien nicht wie üblich scrollen lassen. Selber splitten ist mir zu aufwändig. Das ganze wird nun in einem anderren Editor, mit einer zuverlässigeren "Suchen & Ersetzen" funktion erledigt, mit ein wenig css angepasst und als pdf gespeichert. Dadurch das es ein pdf wird, fällt auch der Aufwand mit dem Splitten der Dokumente in der höhe, weg.
Charif ist offline   Mit Zitat antworten
Ungelesen 31.07.13, 04:41   #5
id1213
Anfänger
 
Registriert seit: May 2012
Beiträge: 9
Bedankt: 9
id1213 ist noch neu hier! | 0 Respekt Punkte
Standard

woher soll 'Sigil' und deren programmierer wissen was du denkst/willst ?
kannst das sogar melden, machst das ?
nimm einzelne dateien als quelle, dann hast du vermutlich geteiltes epub, kA
aber wie so oft, die anderen sind schuld, ich selbst doch NICHT !
(zukunftige spiele gibts ohne nutzer-interaktion, um spieler nicht zu überfordern)

halbautomatische aufteilung, ist nur ein beispiel, du musst es 'deinem' dokument anpassen/fragen

hier 1 (2 weil ich mir nicht sicher bin ob du es vertikal/horizontal haben willst) bild(er) zum anschauen

vertikal angeordnet
[ Link nur für registrierte Mitglieder sichtbar. Bitte einloggen oder neu registrieren ]
horizontal angeordnet
[ Link nur für registrierte Mitglieder sichtbar. Bitte einloggen oder neu registrieren ]

bilder 1-2 bevor
bilder 3-5 während
bild 6 danach


die überschrften haben bei mir <h3 ... tags - bild 1. zeile 38
denn tag in der zeile 26 umgehe ich
in dem ich nur den teil des dokuments auswähle
den ich aufteilen will, alles in quelltext-ansicht
cursor ans ende des dokuments setzen, nach ganz unten scrollen links-click
dann
zur ersten überschrift/kapitel scrollen (zeile 38, nach oben) umschalttaste-links-click am zeilenanfang
text ist ausgewählt

menu - Suche - Mark Selected Text

menu - Suche - Suchen & Ersetzen

in der such-ersetz-box unten
suche:
Code:
<h3
ersetze:
Code:
<hr class="sigil_split_marker" />\n\n  <h3
regex muss hier vermutlich gar nicht sein, kA
nun ersetze alle-knopf um 'aufteiltag' einzutragen

Code:
<hr class="sigil_split_marker" />
ist sigils aufteiltag
\n\n sind zwei neue zeilen
<h3 wieder rein

rechts unten bekommst anzahl vorgenommener änderungen

jetzt kannst in der buchtext-ansicht die aufteil-linien überprüfen/anschauen (bild 4.)

nun das aufteilen

menu - Bearbeiten - Teilung an Markierungen

fertig


zukunftig stell bessere fragen, sag gleich was du willst
kein syntax & co. quatsch
id1213 ist offline   Mit Zitat antworten
Ungelesen 03.08.13, 01:25   #6
waldfee0071
Ist öfter hier
 
Benutzerbild von waldfee0071
 
Registriert seit: Nov 2009
Beiträge: 222
Bedankt: 189
waldfee0071 ist noch neu hier! | 0 Respekt Punkte
Standard

also wenn ich schon 3 &nbsp vor dem javas***** sehe um ne seite zu formatieren solltest du dir glaub ich eher nochmal gedanken um html un css machen.
__________________
[ Link nur für registrierte Mitglieder sichtbar. Bitte einloggen oder neu registrieren ]
waldfee0071 ist offline   Mit Zitat antworten
Ungelesen 28.08.13, 23:30   #7
Charif
Anfänger
 
Registriert seit: Jun 2013
Beiträge: 3
Bedankt: 0
Charif ist noch neu hier! | 0 Respekt Punkte
Standard

@id1213

Es wahren rund 120 einzelne html-Dateien als Quelle und es wurde keine automatische teilung vorgenommen wie ich es erwartet hätte. Dein Beispiel mit den Aufteil-Linien, ist zwar wirklich interessant, aber auch sehr aufwändig im vergleich zu der Lösung die ich mir gesucht habe.

Außerdem hatte ich zuanfang geschrieben was ich wollte, nähmlich eine art Universal-Syntax oder anders formuliert, die richtiegen Satzzeichen, die zusammen zu der Regel werden, die ich benötigte um bestimmte Satzzeichen zu entfernen. Das Problem das Sigil das Dokument nicht wie erwartet, automatisch aufsplittet, kahm erst spähter hinzu.

Ich will auch nicht Sigil schlecht reden, wenn man sich mit dem Programm sehr gut auskennt oder dazu bereit ist viel zeit zu investieren um Programm-intern lösungen zu finden, dan kann mann das von mir aus tun, das wollte ich aber eben nicht mehr.

Den Suchen & Ersetzen teil habe ich wie gesagt nun in einem anderren Editor erledigt, hat auch viel besser funktioniert. Danach dann den überarbeitten html-code per copy & paste in ein Textverarbeitungsprogramm geladen und dort den letzen Feinschliff mit Formatvorlagen vorgenommen (Seitenaufteilung, Bildgröße etc.). Und dann als wieder bearbeitbares PDF abgespeichert. Hat mann auf die Weise ein paar Kapitel vertiggestellt kann man sie bei bedarf mit "PDF Split and Merge" zusammenfügen, so macht mann sich nur Arbeit für Kapitel die mann auch wirklich lesen will.

@waldfee0071

Der Code ist nicht von mir, sondern wahllos aus der Mitte der Runtergeladenen html-Dateien Kopiert und sollte als zu entferneneder Beispielcode dienen.
Charif ist offline   Mit Zitat antworten
Antwort


Forumregeln
Du kannst keine neue Themen eröffnen
Du kannst keine Antworten verfassen
Du kannst keine Anhänge posten
Du kannst nicht deine Beiträge editieren

BB code is An
Smileys sind An.
[IMG] Code ist An.
HTML-Code ist Aus.

Gehe zu


Alle Zeitangaben in WEZ +1. Es ist jetzt 21:02 Uhr.


Sitemap

().