Web Tracking
Web Tracking
Hi, kann mir mal jemand kurz erklären, wie das sogenannte Web- Tracking (also Besucheraktivitäten auf der Webseite verfolgen) technisch funktioniert und welche Ergebnisse dabei heraus kommen?
Vielen Dank!
Vielen Dank!
Wenn Du wissen willst, was ein Besucher auf einer Website so angeschaut hat, dann kannst Du das über das Log des Webservers herausfinden.
Das geht zum einen manuell, allerdings sehr mühsam. Deshalb gibt es ausgefuchste Software dafür, mit der kann man herausfinden, wie sich ein Besucher durch die Website navigiert, wie lange welche Seiten betrachtet werden, auf welchen Seiten er den Besuch abbricht usw.
Sehr nützlich, wenn man eine Website optimieren will.
Webtracking gibts auch noch in der Form, dass man herausfinden will, was ein Benutzer generell im Internet macht, d.h. welche Sites er besucht, zB um ihm gezielt Werbung einzublenden. Aber das war nicht die Frage, oder?
Das geht zum einen manuell, allerdings sehr mühsam. Deshalb gibt es ausgefuchste Software dafür, mit der kann man herausfinden, wie sich ein Besucher durch die Website navigiert, wie lange welche Seiten betrachtet werden, auf welchen Seiten er den Besuch abbricht usw.
Sehr nützlich, wenn man eine Website optimieren will.
Webtracking gibts auch noch in der Form, dass man herausfinden will, was ein Benutzer generell im Internet macht, d.h. welche Sites er besucht, zB um ihm gezielt Werbung einzublenden. Aber das war nicht die Frage, oder?
PB 4.02 XP Pro SP2 "Der Code ist willig, aber der Prozessor ist schwach."
Es gibt keine Vista-Witze. Es ist alles wahr!
Es gibt keine Vista-Witze. Es ist alles wahr!
Danke erstmal, wenn ich das richtig verstehe wertet man also das Log aus.
Was ich noch nicht kapiert habe ist: Wenn ich mich z. B. über den Provider MSN einwähle bekomme ich doch eine dynamische IP zugewiesen. Dann kann man zwar verfolgen, was der Nutzer der IP gemacht hat, weiss doch aber nicht, WER wirklich dahinter steckt? Was nützt dann das Tracking?
Was ich noch nicht kapiert habe ist: Wenn ich mich z. B. über den Provider MSN einwähle bekomme ich doch eine dynamische IP zugewiesen. Dann kann man zwar verfolgen, was der Nutzer der IP gemacht hat, weiss doch aber nicht, WER wirklich dahinter steckt? Was nützt dann das Tracking?
Cookies an sich sind reine TXT Dateien, können von sich aus also schon mal gar nicht machen.
Sie können meiner Meinung nach nur von derselben Seite ausgelesen werden, von der sie erstellt wurden.
Schafft es eine fremde Webseite, ein Cookie zu lesen, dass von meiner Website erstellt wurde, kann nur ein trojaner/Virus oder eine dazu fähige Toolbar oder Ähnliches dahinterstecken.
Es ist aber möglich, herauszufinden, von welcher Website ich komme. Dazu gibt es den "Referer". Eigentlich mit doppel-r z schreiben, aber die Schöpfer des HTTP-Protokolls sind auch nur menschen. Jedoch entfernen einige Proxies oder Firewalls den Referrer, sodass der nicht gesendet wird.
Sie können meiner Meinung nach nur von derselben Seite ausgelesen werden, von der sie erstellt wurden.
Schafft es eine fremde Webseite, ein Cookie zu lesen, dass von meiner Website erstellt wurde, kann nur ein trojaner/Virus oder eine dazu fähige Toolbar oder Ähnliches dahinterstecken.
Es ist aber möglich, herauszufinden, von welcher Website ich komme. Dazu gibt es den "Referer". Eigentlich mit doppel-r z schreiben, aber die Schöpfer des HTTP-Protokolls sind auch nur menschen. Jedoch entfernen einige Proxies oder Firewalls den Referrer, sodass der nicht gesendet wird.
Quelle: http://www.cgicorner.ch/download/jsstyle-referer.shtmlhttp://www.cgicorner.ch/download/jsstyle-referer.shtml hat geschrieben:Was ist der Referer und [...]?
Beim Referer handelt es sich um eine Zusatzinformation des Browsers, die dem Webserver mitteilt, welche URL zuletzt besucht wurde. Diese Information wird nur bei einem Klick auf einen Link und nicht bei direkter Eingabe der URL in der Adresszeile übergeben. Dadurch ist es Seitenbetreibern möglich, zu erkennen, von welchen internen oder auch externen Seiten die Besucher auf eine Webseite gelangen. Ebenfalls können die gesuchten Wörter in Suchmaschinen abgefragt werden, da diese in der Regel in der Ergebnis-URL der Suchmaschine noch vorhanden sind.
Der Referer stellt kein Sicherheitsrisiko dar, ermöglicht es Seitenbetreiber jedoch, zusätzliche Informationen über den Benutzer zu erfahren. So könnte z.B. bei einem Besucher von einer Suchmaschine ein bestimmter, zum Suchbegriff passender, Text angezeigt werden, währenddem andere Surfer einen Standard-Text sehen. [...]
PB 4.30
Code: Alles auswählen
Macro Happy
;-)
EndMacro
Happy End
Nehmen wir mal an, dass ich der Betreiber einer Website bin. Die Website sei kommerziell orientiert. Dann kann mir ein Webtracker einiges über meine Besucher erzählen:Hanniball hat geschrieben:Danke erstmal, wenn ich das richtig verstehe wertet man also das Log aus.
Was ich noch nicht kapiert habe ist: Wenn ich mich z. B. über den Provider MSN einwähle bekomme ich doch eine dynamische IP zugewiesen. Dann kann man zwar verfolgen, was der Nutzer der IP gemacht hat, weiss doch aber nicht, WER wirklich dahinter steckt? Was nützt dann das Tracking?
Wer sind meine Besucher?
Anhand der IP sehe ich, ob Du von einer Firma kommst (eigene IP) oder Privatmann (IP aus MSN-Range) bist.
Wann kommen meine Besucher?
Firmenkunden klicken tagsüber, Privatkunden eher abends.
Wie finden sie meine Website?
Der bereits oben erwähnte Referer zeigt mir, über welche Links die Leute auf meine Site gefunden haben. Aus den URLs der Suchmaschinen kann ich erkennen, mit welchen Suchworten gearbeitet wurde.
Welche Seiten sind interessant?
Anhand der Reihenfolge und dem zeitlichen Bezug der durchgeklickten Seiten sehe ich, was für meine Besucher interessant war und was nicht. Und bei welcher Seite sie aufgehört haben.
Was bringt das jetzt?
Ich kenne mein Publikum. Damit kann ich meine Inhalte und meine Werbung besser darauf einstellen.
Ich kann beurteilen, ob meine Website navigierbar ist oder ob die Benutzer nur wirr darauf rumklicken.
Wenn ich jetzt noch mit Cookies arbeite, kann ich Surferprofile erstellen und Inhalte dynamisch präsentieren. D.h. beim nächsten Besuch zeige ich dem Surfer gezielt Werbung zu den Themen, die er gewöhnlich durchklickt. Ich weiß natürlich nicht, dass der Surfer 4711 jetzt der Hanniball ist, aber wenn ich weiß, dass sich der Surfer 4711 für gewöhnlich über (beispielsweise) Kindererziehung informiert, dann werde ich ihm nicht die Porsche-Werbung einblenden, sondern die für Playmobil und Baldrian

Letztlich dient mir das alles dazu, über die Website mehr EUR zu machen.
Die ganze Chose gibts dann noch im großen Stil, websiteübergreifend. Guck mal auf die Homepage von DoubleClick. Oder schau mal bei Wikipedia.
Das alles gibts auch als Offline-Variante, heißt Payback-Karte. Und Payback weiß genau, wer Hanniball ist ...

PB 4.02 XP Pro SP2 "Der Code ist willig, aber der Prozessor ist schwach."
Es gibt keine Vista-Witze. Es ist alles wahr!
Es gibt keine Vista-Witze. Es ist alles wahr!
Aber nur, wenn die eine Website Daten von der anderem Website bekommt / kauft, nicht wahr? Vielleicht ist es möglich, dennoch: Ich kann JavaScript, das wiederum cookies schreiben und lesen kann. Und verdammtnochmal ist es nicht möglich, dass die seite die einstellungen liest, die Google in ein Cookie gestampft hat...Die ganze Chose gibts dann noch im großen Stil, websiteübergreifend. Guck mal auf die Homepage von DoubleClick




@stbi: Sehr gut! Besser kann man das gar nicht erklären!


PB 4.30
Code: Alles auswählen
Macro Happy
;-)
EndMacro
Happy End
- hardfalcon
- Beiträge: 3447
- Registriert: 29.08.2004 20:46
@AND51: Bei Suchmaschinen wie Google werden die Suchwärter und temporäre Suchparameter (Bildgrösse bei der Bildsuche, Einschränkung auf bestimmte Topleveldomains, etc...) mit in der URL (per GET) übergeben. Alles, was per get übergeben wird, ist das, was hinter dem ? in der URL steht. Etwa so:
http://www.google.lu/search?hs=IyB&hl=d ... uche&meta=
http:// : Gibt an, dass die ganze Anfrage an den Google-Server per HTTP abgewickelt wird. Da könnte genausogut FTP oder HTTPS (für eine SSL-verschlüsselte Vebindung, z.B. in Onlineshops) stehen.
www.google.lu Domain des Servers. Die Wird vom DNS-Server deines Providers in eine IP-Addresse übersetzt. Ein DNS-Server ist eine riesige Datenbank, in der drinsteht, welche hinter welcher Domain welche Server-IP steckt. Manche DNS-Server lassen auch zu, dass man die Domain zu einer bestimten IP sucht. Das nennt man dann Reverse DNS (umgedrehtes DNS).
search?hs=IyB&hl=de&safe=off&client=firefox-a&rls=org.mozilla%3Ade%3Aofficial_s&q=purebasic+userlib&btnG=Suche&meta=
Hier wirds interessant. Der Googleserver ist so eingestellt, dass er die Datei "search" ausführt. Das könnte z.B. eine PHP-Datei oder eine ASP-Datei oder sonstwas sein. Jedenfalls eine Webanwendung. BEi den meisten normalen Internetseiten gäbe es da eher sowas wie "dateiname.php".
Hinter "search" kommt ein Fragezeichen. Das trennt den Dateinamen von der GET-Angabe (also von den Parametern, die mit übergeben werden, wenn man exakt diese URL eintippt.)
"hs" ist irgendeine Variable. Die kriegt per "=" den Wert IyB zugewiesen.
Bei "&hl=de" passiert folgendes: es wird nciht nur eine Variable, sondern gleich mehrere übergeben. Die 2. Variable wird an die 1. mit einem "&" angehängt. "hl=de" weisst der Variable "hl" den Wert "de" zu, das heisst bei der Googleseite ganz einfach, dass die seite auf deutsch angezeigt wird. Wenn du das "de" durch "fr" oder "en" ersetzt, dann sollte die Seite auf französisch oder geladen werden. Die ganzen GET-Parameter müssen natürlich speziell codiert werden, weil bekanntlich im Internet die Daten ja nur mit 7 Bit codiert werden können. Für die ganzen sonderzeichen gibts dann noch sowas wie das hier: "%3A". Das "%" gibt an, dass die nächsten 2 Buchstaben/Ziffern der hexadezimale (ASCII?)-Wert des codiertzen Zeichens sind. Leerzeichen werden übrigens grundsätzlich durch ein "+" ersetzt.
//EDIT: zu deinen Cookies: ich weiss zwar nicht, was du da mit JavaScript dran rumfummeln willst, aber die Cokies werden vom Client (also von deinem Internetbrowser) verwaltet. Und der lässt nur die Seite das Cookie auslesen, dies auch geschrieben hat. Er gibt dem Cookie einfach als Dateinamen die URL der seite, die das Cookie rübergeklatscht hat, und fertig. Websiteübergreifendes Tracking, wie z.B. mit Alexa, Doubleclick, Fastclick, etc... funktioniert auch mit Cookies. Da wird einfach auf jeder Seite, die bei dem Webtracking mitmacht, ein Bildchen, ein Popup oder sonstwas vom eigentlichen Webtrackingserver mit auf die Internetseite eingebunden, sondass es immer mitgeladen wird. Und beim Laden klatscht der Webtrackingserver dann halt gleich ein Cookie mit rüber, in das er reinschreibt, auf welchen Seiten, die ebenfalls beim gleichen Webtrackinganbieter sind, du schon rumgesurft bist. Zum Glück gibt es aber auch intelligente Browser, die eine mehr oder weniger vollständige Liste von Webtrackingservern dabei haben. Und die nehmen dann ganz einfach keine Cookies von diesen Servern an.
http://www.google.lu/search?hs=IyB&hl=d ... uche&meta=
http:// : Gibt an, dass die ganze Anfrage an den Google-Server per HTTP abgewickelt wird. Da könnte genausogut FTP oder HTTPS (für eine SSL-verschlüsselte Vebindung, z.B. in Onlineshops) stehen.
www.google.lu Domain des Servers. Die Wird vom DNS-Server deines Providers in eine IP-Addresse übersetzt. Ein DNS-Server ist eine riesige Datenbank, in der drinsteht, welche hinter welcher Domain welche Server-IP steckt. Manche DNS-Server lassen auch zu, dass man die Domain zu einer bestimten IP sucht. Das nennt man dann Reverse DNS (umgedrehtes DNS).
search?hs=IyB&hl=de&safe=off&client=firefox-a&rls=org.mozilla%3Ade%3Aofficial_s&q=purebasic+userlib&btnG=Suche&meta=
Hier wirds interessant. Der Googleserver ist so eingestellt, dass er die Datei "search" ausführt. Das könnte z.B. eine PHP-Datei oder eine ASP-Datei oder sonstwas sein. Jedenfalls eine Webanwendung. BEi den meisten normalen Internetseiten gäbe es da eher sowas wie "dateiname.php".
Hinter "search" kommt ein Fragezeichen. Das trennt den Dateinamen von der GET-Angabe (also von den Parametern, die mit übergeben werden, wenn man exakt diese URL eintippt.)
"hs" ist irgendeine Variable. Die kriegt per "=" den Wert IyB zugewiesen.
Bei "&hl=de" passiert folgendes: es wird nciht nur eine Variable, sondern gleich mehrere übergeben. Die 2. Variable wird an die 1. mit einem "&" angehängt. "hl=de" weisst der Variable "hl" den Wert "de" zu, das heisst bei der Googleseite ganz einfach, dass die seite auf deutsch angezeigt wird. Wenn du das "de" durch "fr" oder "en" ersetzt, dann sollte die Seite auf französisch oder geladen werden. Die ganzen GET-Parameter müssen natürlich speziell codiert werden, weil bekanntlich im Internet die Daten ja nur mit 7 Bit codiert werden können. Für die ganzen sonderzeichen gibts dann noch sowas wie das hier: "%3A". Das "%" gibt an, dass die nächsten 2 Buchstaben/Ziffern der hexadezimale (ASCII?)-Wert des codiertzen Zeichens sind. Leerzeichen werden übrigens grundsätzlich durch ein "+" ersetzt.
//EDIT: zu deinen Cookies: ich weiss zwar nicht, was du da mit JavaScript dran rumfummeln willst, aber die Cokies werden vom Client (also von deinem Internetbrowser) verwaltet. Und der lässt nur die Seite das Cookie auslesen, dies auch geschrieben hat. Er gibt dem Cookie einfach als Dateinamen die URL der seite, die das Cookie rübergeklatscht hat, und fertig. Websiteübergreifendes Tracking, wie z.B. mit Alexa, Doubleclick, Fastclick, etc... funktioniert auch mit Cookies. Da wird einfach auf jeder Seite, die bei dem Webtracking mitmacht, ein Bildchen, ein Popup oder sonstwas vom eigentlichen Webtrackingserver mit auf die Internetseite eingebunden, sondass es immer mitgeladen wird. Und beim Laden klatscht der Webtrackingserver dann halt gleich ein Cookie mit rüber, in das er reinschreibt, auf welchen Seiten, die ebenfalls beim gleichen Webtrackinganbieter sind, du schon rumgesurft bist. Zum Glück gibt es aber auch intelligente Browser, die eine mehr oder weniger vollständige Liste von Webtrackingservern dabei haben. Und die nehmen dann ganz einfach keine Cookies von diesen Servern an.

An diese Möglichkeit habe ich gar nicht gedacht, Shardfalcon hat geschrieben:@AND51:
...
//EDIT: zu deinen Cookies: ich weiss zwar nicht, was du da mit JavaScript dran rumfummeln willst, aber die Cokies werden vom Client (also von deinem Internetbrowser) verwaltet. Und der lässt nur die Seite das Cookie auslesen, dies auch geschrieben hat. Er gibt dem Cookie einfach als Dateinamen die URL der seite, die das Cookie rübergeklatscht hat, und fertig. Websiteübergreifendes Tracking, wie z.B. mit Alexa, Doubleclick, Fastclick, etc... funktioniert auch mit Cookies. Da wird einfach auf jeder Seite, die bei dem Webtracking mitmacht, ein Bildchen, ein Popup oder sonstwas vom eigentlichen Webtrackingserver mit auf die Internetseite eingebunden, sondass es immer mitgeladen wird.

@ all: Wenn eine Seite nach dem Referrer fragt und ich komme gerade von Google und habe nach "purebasic userlib" gesucht, dann sendet mein Browser die Adresse http://www.google.lu/search?hs=IyB&hl=d ... uche&meta= an die Website.
@ hartfalcon: Du hast nach purebasic userlib gesucht, stimmts? bist auch einer, der erkannt hat, dass bei google GROß und KLEIN-schreibung keine rolle spielt...

PB 4.30
Code: Alles auswählen
Macro Happy
;-)
EndMacro
Happy End
- hardfalcon
- Beiträge: 3447
- Registriert: 29.08.2004 20:46
@AND51:
1.) hardfalcon. Ich nenne dich ja auch nicht UND51.
2.) das, was du mit dem Referrer gesagt hast, stimmt, allerdings frage ich mich, ob es nicht auch Browser gibt, die (zumindest auf Wunsch) keinen Referrer senden.
3.) Jo, ich hab nach "purebasic userlib" gesucht. Ich habe ebenfalls erkannt, dass Google sich nicht drum kümmert, ob man die Suchbegriffe groß oder Klein schreibt. Allerdings schert sich Google drum, ob man vor einen Suchbegriff ein "+" oder ein "-" schreibt. Und das ist ziemlich praktisch...
Ausserdem habe ich erkannt, dass man Google als Taschenrechner benutzen kann... (http://www.google.lu/search?hs=XNu&hl=d ... uche&meta=)
Google hat nen Haufen interessanter Features. Siehe http://beta.google.com/
//EDIT: Siehe auch hier für weitere Google-Features:
http://www.google.lu/intl/de/help/features.html
1.) hardfalcon. Ich nenne dich ja auch nicht UND51.

2.) das, was du mit dem Referrer gesagt hast, stimmt, allerdings frage ich mich, ob es nicht auch Browser gibt, die (zumindest auf Wunsch) keinen Referrer senden.
3.) Jo, ich hab nach "purebasic userlib" gesucht. Ich habe ebenfalls erkannt, dass Google sich nicht drum kümmert, ob man die Suchbegriffe groß oder Klein schreibt. Allerdings schert sich Google drum, ob man vor einen Suchbegriff ein "+" oder ein "-" schreibt. Und das ist ziemlich praktisch...

Ausserdem habe ich erkannt, dass man Google als Taschenrechner benutzen kann... (http://www.google.lu/search?hs=XNu&hl=d ... uche&meta=)
Google hat nen Haufen interessanter Features. Siehe http://beta.google.com/
//EDIT: Siehe auch hier für weitere Google-Features:
http://www.google.lu/intl/de/help/features.html