Canonical-Tag: Ein banaler, aber verheerender Fehler

Seit das sog. Canonical-Tag im Februar 2009 von Google in die Welt der Onsite-Optimierer geworfen wurde, hat sich eine kleine Wissenschaft zur sachgemäßen Anwendung dieses HTML-Elements entwickelt. Kaum ein SEO-Blog kommt ohne Liste der häufigsten oder schlimmsten Canonical-Fehler aus, und bei Gelegenheit werde ich hier auch eine kleine Übersicht dazu schreiben 😉

Heute habe ich einen kleinen, aber wirklich verheerenden Fehler zu bieten, der mir bei der Onpage-Analyse einer Kundenwebsite aufgefallen ist.

Und zwar nicht sofort, muss ich gestehen: Erst nach einer langen Durchsicht, ob die angegebenen Ziel-URLs auch stimmen, kein paralleles Noindex gesetzt ist und was man noch so alles prüft … erst dann sah ich, dass das in diesem Fall sowieso alles Murks ist: Denn das Link-Element war wegen eines unscheinbaren Fehlers unwirksam. Hier mal ein Test: Seht Ihr den Fehler auf den ersten Blick?

<link rel=“canonical“ href="http://www.irgendeine-URL-die-hier-nichts-zur-Sache-tut.html/" />

Nun?

Gänsefüßchen

Genau: Die Anführungszeichen beim rel-Attribut sind nicht gerade, sondern typographisch. Offenbar hatte hier jemand eine Vorlage für seinen Webmaster geschrieben, und zwar in einer gut eingestellten Textverarbeitung.

Copy – paste – passiert!

Besser könnte man das Element gar nicht verstecken. Also immer schön vorsichtig sein mit den Gänsefüßchen!

Wie findet man solche Bugs? Das Tückische ist ja gerade in diesem Fall, dass diese Stelle des Elements bei einer händischen Prüfung wenig Aufmerksamkeit abbekommt, weil die eigentlich kritischen Fehlerquellen z. B. im href-Attribut liegen. Stutzig macht allerdings, dass der Crawler von onpage.org einfach gar kein Canonical auf der kompletten Website gefunden hat. Und so wird es Google vermutlich auch gehen … Wenn ein Crawler also null anzeigt, wo nachweislich etwas steht, solltet Ihr ihm glauben und einmal nach den ganz banalen Fehlern suchen.

Zum besseren Verständnis: Wofür der Canonical-Link da ist

Mit dem Canonical-Link (oft auch „Canonical-Tag“ genannt, was aber nicht richtig ist) bietet Google eine Möglichkeit an, mit Duplicate Content auf einer Website umzugehen. Duplicate Content bedeutet, dass einzelne Seiten derselben Website (fast) gleich sind, das kommt z. B. in Shops öfter vor, wenn Produktlisten nach verschiedenen Merkmalen gefiltert werden können, oder wenn Texte in verschiedenen Kategorien ausgegeben werden. In dieser Situation ist es nett für Google (und gut für die eigenen Rankings), wenn man der Suchmaschine mitteilt, welche „Ausgabe“ des jeweiligen Inhalts „kanonisch“ ist – sozusagen das Original, die beste Version für die Suchergebnisse. Und genau für diesen Zweck gibt es den Canonical-Link, ein Link-Element, das man im Head-Bereich des HTML-Quelltextes einbaut und mit einer Referenz auf die kanonische URL versieht.

Das Attribut „rel“ gibt dabei an, dass es sich bei diesem Link-Element um ein Canonical-Element handelt.

Und bei „href“ findet die Suchmaschine den Verweis auf das kanonische Dokument.

Im hier beschriebenen Fehler bekommt der Crawler also gar nicht erst die Info, dass es sich bei dem Link-Element um „canonical“ handelt, weshalb das komplette Element ignoriert wird – obwohl das href-Attribut richtig befüllt ist. Denn das könnte ja sonstwas sein, es gibt viele verschiedene Link-Elemente.

Bildnachweis: natros@adobe.com