Canonical URLs: Doppelten Content mit htaccess vermeiden

18 März 2010 von Elmar Kommentieren »
Canonical Urls - no more duplicate content

Canonical Urls - no more duplicate content

Ein Thema das nahezu so alt ist, wie der Suchmaschinenindex. Das Problem ist, dass die meisten Webserver so konfiguriert sind, dass diese beiden Anfragen auf die gleiche Datei zeigen:

http://www.elmar-natter.de/blablablubb.html
http://elmar-natter.de/blablablubb.html

Für die Suchmaschine, aufgrund der URL, zwei Seiten mit dem gleichen Inhalt. Bei Google auch mit dem schönen Anglizismus „Duplicate Content“ benannt. Diesen Fauxpas gilt es aber unbedingt zu vermeiden, denn das schwächt eine  Seite ungemein. „Entweder oder“ ist hier die Devise, seit Jahren hat sich allerdings die Variante mit www in den SERP’s durchgesetzt, trotzdem sollten natürlich Anfragen auf Unterseiten ohne www. auf der entsprechenden Seite landen. Dafür dient dieses .htaccess-Skript, welches im Root der Seite platziert werden sollte:

RewriteCond %{HTTP_HOST} !^www.
RewriteCond %{HTTP_HOST} !^$ [NC]
RewriteRule ^(.*) http://www.%{HTTP_HOST}/$1 [R=301,L]

Hier gibts nen kleinen Artikel darüber: 301 Weiterleitung (http://www.nils-haldenwang.de/webentwicklung/seo/duplicate-content-vermeiden-aufrufe-ohne-www-mit-301-weiterleitung-umleiten). Möchte man bestimmte Dateien/Verzeichnisse von ReWrite ausschliessen, ein Beispiel kann hier z.B. ein HTTPS-Proxy sein fügt man VOR den obigen Zeilen, diese ein:

RewriteCond %{REQUEST_URI} !^/(img|gfx|images|css|scripts|layout.css)

So klappts auf mit der Suchmaschine und Canonical URLs, vielen Dank für Ihre Aufmerksamkeit 🙂

Werbung
1 Star2 Stars3 Stars4 Stars5 Stars (No Ratings Yet)
Loading...