Seite 2 von 2

Verfasst: 06.07.2006 12:28
von Kaeru Gaman
anscheinend doch. ich kenn die site nich und nch den quelltext, aber wenn es "dynamisch generiert" ist, warum sollte es nicht den link enthalten können, von dem aus man hingekommen ist?
probierst mal von ner anderen site aus, poste den link mal im mülleimer und geh von dort aus hin, wenn dann der mülleimer-thread im quelltext auftaucht, dann ist es so.

Verfasst: 06.07.2006 12:35
von Kiffi
edel hat geschrieben:Oder aber, was eh besser ist , du nimmst regulaere Ausdruecke .
stimmt. Um noch eine dritte Möglichkeit vorzuschlagen: Man könnte auch das
Dokument-Objekt-Modell (DOM) des WebBrowsers auswerten.

Grüße ... Kiffi

Verfasst: 06.07.2006 13:12
von Alves
@ Kaeru

Habs jetzt so verscuth, wie du gesagt hast. STimmt dort ist der Link zum Mülleimer Thread enthalten.

Zum Testen: PC oder 100 Euro Thread im Trashbucket.

Verfasst: 06.07.2006 14:52
von edel
Sowas nennt sich 'referer', wird bei jedem Klick uebertragen
(kann man abstellen) und dient hier wohl fuer die Statistik.

Verfasst: 07.07.2006 07:44
von Zomtec
edel hat geschrieben:Oder aber, was eh besser ist , du nimmst regulaere Ausdruecke .
RegExp findest du hier http://www.purearea.net/pb/german/userlibs.php
Das hört sich gut an. Habe mich bis jetzt zwar noch nicht mit regulären Ausdrücken beschäftigt, aber dank Google gleich 'nen Lösungsansatz zu dem sw3-Beispiel gefunden:

Code: Alles auswählen

<regexp>
<![CDATA[<td bgcolor="#[^"]+" valign="top"><a href='([^>]+)'>(?<artist>.+?)</a></td><td bgcolor="#[^"]+" valign="top"><a href='([^>]+)'>(?<title>[^<]+)</a></td><td bgcolor="#[^"]+"[^v]+valign="top">(?<starttime>[0-9]+:[0-9]+:[0-9]+)</td>]]>
</regexp>
Aus Witterungsgründen ;) konnte ich es noch nicht testen, ich denke so könnte es funktionieren.