Sinnlose Google-Indizierung
Vor einigen Wochen ist mir bei Änderungen an meiner Blog-Software BetaBlog ein schwerwiegender Fehler unterlaufen. Ich hatte das Archiv auf die einzelnen Jahre aufgeteilt, um es etwas übersichtlicher zu machen. Zum Wechseln der Jahre habe ich einen Zeitstrahl hinzugefügt.
Das Problem war nun, dass ich vergessen hatte, bei Jahren ohne einen Beitrag einen verständlichen Fehler zurückzugeben. Sinnvoll in dem Sinne, dass es auch von Suchmaschinen verstanden wird.
Es gab zwar eine Meldung "Keine Beiträge gefunden", aber zusammen mit einem 200er HTTP-Statuscode. Einen kleinen Ausschnitt der Folgen kann man im folgenden Screenshot sehen:
Den Fehler habe ich bereits nach wenigen Tagen entdeckt und behoben. Jetzt wird ein 404 zurückgegeben. Dennoch wird es einige Zeit dauern, bis die Einträge aus den Suchmaschinen wieder verschwunden sind.
Update 29.03.2012
Seit heute sind die Einträge aus Google raus! Der Cache und die Seitenvorschau funktionierten ja von Anfang an nicht (wird wohl jedes Mal überprüft, ob die Seite ein 404 zurück gibt), aber dennoch waren die Einträge im Index. Nun sind sie endlich raus, scheint also, als wenn sie knapp zwei Monate drin bleiben.
Update 31.03.2012
Seltsam. Seit heute sind die Seiten wieder im Index. Außerdem wird die Cache-Version angezeigt (aber immer noch keine Vorschau).