
Ich habe mich endlich dazu durchgerungen: behübschte 404er ("Datei nicht gefunden"), gleich mitsamt e-Mail Benachrichtigung, wenn ein Fehler aufgetreten ist.
Und es wurde mir wieder einmal klar, warum ich das so widerwillig mache.
Eigene 404-Fehlerseiten
In der PHP-Manufaktur gibt es eine sehr gute Anleitung mitsamt praktischem PHP-Schnippsel zur Mail-Benachrichtigung:
Abfangjäger für Fehlermeldungen
Also: Seite anlegen, 1 Wysiwyg, 1 Code-Section. .htaccess angepasst. Und:
Schwupp: 60 Mails in der Mailbox. Alle 5 Minuten. Man sollte wissen: Auch ein im CSS definierter Listenpunkt erzeugt einen Fehler, wenn das Bild dazu nicht vorhanden ist. (ist mir nie aufgefallen, dass das fehlt..) Aber da bin ich nicht allein: Ungefähr 30 Templates aus der Templatesuche haben sich bisher ebenso gemeldet, mit vergessenen Hintergrundbildern und - sehr häufig: Der fromme Wunsch nach einer "print.css" hat nur für die index.php gereicht.
OK - Augen zu und durch: Sichten, Ausbessern, checken.
Ein Job für Masochisten
Es könnte schlimmer kommen.. und es kommt schlimmer ;-)
Der HTTP-Header wird zusätzlch zur Datei mitgeschickt und enthält diverse Informationen - unter anderem auch den Status: 200: Alles OK, 301/302: Weiterleitung (mit URL, wohin), 404: Nicht gefunden, 410: Definitv weg.
Entrückte Bots sind immer wieder ein Problem. Meistens halten die sich nicht an die robots.txt (wichtig: die nicht vergessen!), sondern grasen alles ab, was sie irgendwie finden könnten. Und da gibt es eine Feinheit: Viele davon erkennen einen 404er nicht als solchen, wenn er sich nicht definitiv zu erkennen gibt. Wenn sie dann den HTTP-Header auch nicht auslesen, gibt es Schlamassel: Gibt es auf der 404er-Seite relative Links, zeigen die irgendwo hin - und der Bot verläuft sich blödsinnig in Dateien, die es nicht gibt - die aber brav wieder eine "falsche" 404er zurücksenden. Und weiter gehts.
So kann man in wenigen Minuten auf ein paar hundert Mails kommen - alles Falschmeldungen.
Echte und falsche 404er
Auch die gängigen Bots von Google, Yahoo, Bing... erzeugen viele Fehler, wo gar keine sind. Häufig passiert es nämlich, dass eine eigene Fehlerseite gar keine ist: Sie meldet sich mit "200: Gefunden" und nicht mit "404: nicht gefunden". Schließlich wurde sie ja auch gefunden - die Fehlerseite.
Tipp: Hier kann man überprüfen, was der Server tatsächlich anwortet: HTTP-Header
Weil das so häufig vorkommt, sind Google & Co dazu übergegangen, nicht nur auf den HTTP-Header zu achten, sondern - aktiv - selbst zu schauen. Dazu ruft der Bot eine Seite auf, die es ziemlich sicher nicht gibt. zb "mgfpgf346456ndfafgf.html". Dann schaut er, was da zurückkommt; kommt brav eine Statusmeldung 404, ist alles ok. Kommt aber da 200 - dann merkt er sich, wie die Seite aussieht - und das ist ab jetzt die "offizielle Fehlerseite". Bei Google heißt das "Soft404" und wird wie eine super Erfindung angepriesen, Yahoo macht das seit vielen Jahren so.
Damit das aber auch wirklich sicher ist, holt sich der Bot schon schnell einmal etliche falsche URLs.
Böse Sachen, die es so gibt
Was der Admin heute mit Begeisterung macht, kann er in einem Jahr vergessen haben. Und es gibt ja auch Kunden oder Kollegen, die so locker mal eine Seite umbenennen, zb von "404.php" auf "Fehler.php" ("tztzt.. diese Techniker").
In der .htaccess steht aber immer noch die "404.php".
Das macht zuerst mal gar nichts - und wird lange Zeit niemanden auffallen - solange, bis ein Fehler 404 passiert: Dann nämlich löst die nicht vorhandene 404.php erneut einen 404-Fehler aus, der wiederum einen 404 auslöst, der wiederum einen 404 auslöst, der..
Der Browser hängt in einer Schleife und will sich gar nicht mehr beruhigen, der Counter protokolliert einen Rekord an Page-Impressions: Weil man sie gar nicht oft genug sehen kann, die schöne Seite 404.php ;-)
Persönliches Fazit
Unterscheiden wir: eigene Fehlerseiten und Mail-Benachrichtigung.
Eigene Fehlerseiten sollten eigentlich gar nicht nötig sein - weil es keine Fehler gibt. Zumindest keine fehlenden Seiten. Wer größer umgeräumt hat, sollte in der .htaccess die Weiterleitungen verlegen, statt Bots und Besucher ins mehr oder weniger hübsche Nirvana laufen zu lassen. In der Praxis kommen aber Fehler natürlich vor und es ist nicht viel Aufwand, überhaupt dann, wenn statt der echten, aufrichtigen 404-Fehlerseite eine des Hosters kommt.
Die Mail-Benachrichtigung bei jedem 404-Fehler kann ganz schön Stress machen. Dennoch: Wer sich die Mühe gemacht hat, seine Seiten grün durch den Validator zu bringen, kann auch hier mal den Lurch hinter dem Kasten wegsaugen: Es wird bei jedem etliches zutage treten.
Nach dem ersten Korrekturgang ist man aber dann doch froh, dass man der zuständigen Code-Section ein Ablaufdatum in der Vergangenheit geben kann, um sie wieder zu deaktivieren.
Neuere Themen:
Ältere Themen:
Direkter Sprachwechsel Direkt von "Impressum" zu "Imprint" - Möglichkeiten und Sinnfrage
Kommentare:
13.01.2011
mr-fan
...Dein pesönliches Fazit? Gut - Schlecht so eine Automatik? Eigene Fehlerseiten sind immer ein wenig fescher also ist das eh positiv.
Hast du die automatische Benachrichtigung jetzt ständig laufen?
Grüße Martin
14.01.2011
Chio
Danke für den Hinweis! Etwas durchwachsenes persönliches Fazit wurde nachgereicht.
PS: Wie gefällt dir übrigens meine? ;-)
14.01.2011
mr-fan
...;) die ist natürlich von Dir und einzigartig....das du auch Kabarettwurzeln hast weis ja jeder der auch nur hier auf .at mitliest...
Grüße und Danke fürs Fazit
Martin


