Inhalt aus dynamischer Webseite auslesen?

Anfängerfragen zum Programmieren mit PureBasic.
Kaeru Gaman
Beiträge: 17389
Registriert: 10.11.2004 03:22

Beitrag von Kaeru Gaman »

anscheinend doch. ich kenn die site nich und nch den quelltext, aber wenn es "dynamisch generiert" ist, warum sollte es nicht den link enthalten können, von dem aus man hingekommen ist?
probierst mal von ner anderen site aus, poste den link mal im mülleimer und geh von dort aus hin, wenn dann der mülleimer-thread im quelltext auftaucht, dann ist es so.
Der Narr denkt er sei ein weiser Mann.
Der Weise weiß, dass er ein Narr ist.
Benutzeravatar
Kiffi
Beiträge: 10711
Registriert: 08.09.2004 08:21
Wohnort: Amphibios 9

Beitrag von Kiffi »

edel hat geschrieben:Oder aber, was eh besser ist , du nimmst regulaere Ausdruecke .
stimmt. Um noch eine dritte Möglichkeit vorzuschlagen: Man könnte auch das
Dokument-Objekt-Modell (DOM) des WebBrowsers auswerten.

Grüße ... Kiffi
a²+b²=mc²
Benutzeravatar
Alves
Beiträge: 1208
Registriert: 19.04.2006 18:24
Kontaktdaten:

Beitrag von Alves »

@ Kaeru

Habs jetzt so verscuth, wie du gesagt hast. STimmt dort ist der Link zum Mülleimer Thread enthalten.

Zum Testen: PC oder 100 Euro Thread im Trashbucket.
Benutzeravatar
edel
Beiträge: 3667
Registriert: 28.07.2005 12:39
Computerausstattung: GameBoy
Kontaktdaten:

Beitrag von edel »

Sowas nennt sich 'referer', wird bei jedem Klick uebertragen
(kann man abstellen) und dient hier wohl fuer die Statistik.
Zomtec
Beiträge: 33
Registriert: 07.06.2005 14:46
Wohnort: Bayern
Kontaktdaten:

Beitrag von Zomtec »

edel hat geschrieben:Oder aber, was eh besser ist , du nimmst regulaere Ausdruecke .
RegExp findest du hier http://www.purearea.net/pb/german/userlibs.php
Das hört sich gut an. Habe mich bis jetzt zwar noch nicht mit regulären Ausdrücken beschäftigt, aber dank Google gleich 'nen Lösungsansatz zu dem sw3-Beispiel gefunden:

Code: Alles auswählen

<regexp>
<![CDATA[<td bgcolor="#[^"]+" valign="top"><a href='([^>]+)'>(?<artist>.+?)</a></td><td bgcolor="#[^"]+" valign="top"><a href='([^>]+)'>(?<title>[^<]+)</a></td><td bgcolor="#[^"]+"[^v]+valign="top">(?<starttime>[0-9]+:[0-9]+:[0-9]+)</td>]]>
</regexp>
Aus Witterungsgründen ;) konnte ich es noch nicht testen, ich denke so könnte es funktionieren.
mfg
Zomtec
------------
noch PB 3.94
Antworten