Einzelnen Beitrag anzeigen
Ungelesen 27.03.15, 17:45   #6
mande
Anfänger
 
Registriert seit: Apr 2010
Beiträge: 24
Bedankt: 28
mande ist noch neu hier! | 0 Respekt Punkte
Standard

Wenn du das Dokument genauso auslesen willst wie es der Browser darstellt bleibt dir nichts anderes übrig als clientseitige S*****s ablaufen zu lassen und erst dann den Dom-Tree zu holen.
Mittels Java kann ich dir hierfür 2 Möglichkeiten empfehlen.

http://www.seleniumhq.org/ wird z.B. für Automatentests verwendet um das UI von HTML-Seiten programmatisch zu testen. Ist jedoch nicht darauf beschränkt.

Spätestens seit Java 8 ist JavaFX auch tatsächlich in der Runtime angekommen, darin gibts einen eigenen Browser namens WebView, verwendet im Hintergrund denselben Renderer bzw. S*****engine wie Chrome. Mit diesem kannst du auch sobald die Webseite im Hintergrund fertig geladen wurde das aktuelle Dokument holen.
mande ist offline   Mit Zitat antworten