Die verschiedenen Fachausdrücke im Zusammenhang mit der Erfolgskontrolle eines Webauftritts werden meist falsch angewandt. Hier ist ein kurzer Überblick über Logfiles und die wichtigsten Fachbegriffe.
Diese Dateien protokollieren alle Zugriffe auf den Webserver. Anhand dieser
kann man den Erfolg seines Webauftritts kontrollieren. Es gibt zwei verschiedene
Formate die meist genutzt werden: das Common/Extended Logfile Format und das des
Microsoft Webservers.
Normalerweise stellt der Webhoster die Logfiles täglich
oder wöchentlich dem Webmaster zur Verfügung (meist unter "/logs/access.log").
Diese kann man dann herunterladen und in einem geeigneten Analyseprogramm
betrachten. Die Provider stellen im allgemeinen ein solches Programm zur
Verfügung.
Apache-Webserver verwenden meist das im folgenden beschriebene
Common Logfile Format:
IP - LOGINNAME [DATETIME] "KOMMANDO DATEI
PROTOKOLL" CODE BYTES DOMAIN "REFERER" "SYSTEM INFO"
| IP: | entweder IP oder DNS-Adresse des zugreifenden Computers. Meist werden die IPs nicht aufgelöst, da sich die Hoster die zusätzlichen Serverkosten sparen wollen. |
| LOGINNAME: | Name des zugreifenden Users; bei passwortgeschützten Accounts |
| DATETIME: | die Zeit des Zugriffs im Format dd/mmm/yyyy:hh:mm:ss +MEZ |
| KOMMANDO: | Art des Zugriffs: z.B. GET, HEAD |
| DATEI: | Pfad und Name der Datei vom "root" aus gesehen |
| PROTOKOLL: | das Protokoll mit Version |
| CODE: | Rückgabecodes des Webservers z.B. 200 OK, 404 nicht gefunden, ... |
| BYTES: | Anzahl der übertragenen Bytes |
| DOMAIN: | nicht in der Spezifikation, aber bei Puretec-Logfiles gesetzt |
| im Extended-Logfile Format (meist verwendet): | |
| REFERER: | die URL, von der der Zugriff erfolgt |
| SYSTEM INFO: | Informationen über das System wie Browserversion, Betriebssystem, ... |
Hit / Zugriff:
Ein Hit ist ein Zugriff auf den
Webserver; also jeder Eintrag in der Logfile wird als Hit gezählt. Es ist also
egal, ob auf eine Seite, Grafik, ZIP-Datei, oder sonstiges zugegriffen wird.
(Manche Analyseprogramme zählen fehlerhafte Zugriffe nicht mit.)
PageView:
Ein PageView wird registriert, wenn eine
HTML-Seite angefordert wird. PageViews werden meist jeweils für einzelne Seiten
und für alle Seiten zusammen gezählt.
Visits / Besucher:
Als Visit wird der gesamte Aufenthalt eines Besuchers auf
dem Web-Angebot gezählt. Der Besucher wird anhand seiner IP identifiziert, d.h.
alle Zugriffe die eine IP macht, gelten als ein Visit. Der Visit wird erst
ausgelöst, wenn der Besucher "Inhalt" - d.h. eine HTML-Seite - aufruft. Wenn
30min kein Zugriff von dieser IP mehr kommt, dann kann ein neuer Visit von
dieser IP ausgelöst werden.
OnePageViews:
Anzahl der Besucher, die nur eine Seite
abgerufen haben.
PageExits:
Die Häufigkeit mit
der eine bestimmte Seite, vor dem Verlassen des Besuchers abgerufen wurden. Ist
diese Zahl bei einer Seite hoch, so weiß man, wo der Webaufritt den Besucher
abschreckt und was man somit verbessern muß.
Counter:
Ein Counter wird meist auf der Startseite oder in
einem dauerhaft sichtbaren Bereich eines Framesets plaziert. Dieser Counter
zählt je nach Programmierung die "Visits" oder Seitenabrufe. Mit einem Counter muß man seine Logfiles nicht auswerten,
sondern ruft eine Zusammenfassung per Webinterface oder per E-Mail ab. Counter
sind CGI-Skripts, die in den HTML-Code eingebaut werden.