Doppelten Content verhindern

Ist eine Domain sowohl mit www als auch ohne www erreichbar,
dann hat man schnell das Problem von doppeltem Content.
Dieser ist kann bei Tante Google und Co. zu Abstrafung im Ranking fuehren.

Bei machen Hostern ist es zudem ueblich, nicht verfuegbare Subdomains einfach mal eben auf die Hauptdomain umzuleiten und dies meist ohne Fehlermeldung o.ae.
Auch das fuehrt zu doppelte Content.

Doppelter Content kann vermieden werden, indem man in der .htacces Datei,
per mod_rewrite Regeln bestimmt, dass eine Seite nur noch ohne/mit www erreichbar ist.

Folgender Code muss dafuer in die .htaccess Datei

Damit die Seite nur noch mit www verfuegbar ist

RewriteEngine On
RewriteCond %{HTTP_HOST} !^www\.deine-domain\.de$ [NC]
RewriteRule ^(.*)$ http://www.deine-domain.de/$1 [R=301,L]

Wenn man nun http://deine-domain.de aufruft wird man automatisch auf http://www.deine-domain.de geleitet.

Damit die Seite nur noch ohne www erreichbar ist:

RewriteEngine On
RewriteCond %{HTTP_HOST} ^([^.]+)\.deine-domain\.de$ [NC]
RewriteRule ^(.*)$ http://deine-domain.de/$1 [R=301,L]

Beim Aufruf von http://www.deine-domain.de wird man automatisch auf http://deine-domain.de geleitet.

Eine bestimmte Subdomain von der Regelung ausschliessen (ohne www Variante)

RewriteCond %{HTTP_HOST} ^([^.]+)\.deine-domain\.de$ [NC] [OR]
RewriteCond %{HTTP_HOST} !^subdomain\.deine-domain\.de$ [NC]
RewriteRule ^(.*)$ http://deine-domain.de/$1 [R=301,L]

Eine bestimmte Subdomain ausschliessen (mit www Variante)

RewriteCond %{HTTP_HOST} !^www\.deine-domain\.de$ [NC] [OR]
RewriteCond %{HTTP_HOST} !^subdomain\.deine-domain\.de$ [NC]
RewriteRule ^(.*)$ http://www.deine-domain.de/$1 [R=301,L]

Wo finde ich die .htacces Datei?

Die htacces Datei befindet sich, sollte sie denn schon vorhanden sein, zumeist im root Verzeichnis, auch als Stammverzeichnis bekannt, des Webspaces.
Manchmal muss man im FTP-Programm erst einstellen, dass auch versteckte Dateien angezegt weden, damit man die .htacces Datei zu gesicht bekommt.

Sollte keine .htacces Datei vorhanden sein, einfach einen stink normalen Editor oeffnen, die gewuenschte Regel hineinschreiben, und als htaccess.txt abspeichern. Danach die Datei auf den Webspace, ins root Verzeichnis, laden und umbennen in .htacces!

Wieso denn auf dem Webspace umbennen und nicht gleich richtig abspeichern?

Windows kann mit .htacces nicht umgehen, da .blablab als Dateiendung gewertet wird,
die Datei haette somit keinen Namen und wird deshalb von Windows erst gar nicht so zugelassen.

Sollte eine .htaccess Datei vorhanden sein, in der RewriteEngine On schon drin stehen, dann bitte darauf achten, dass bei einer Regel RewriteEngine On nicht noch einmal definiert wird.

Webblogs / CMS verwenden meist mode_rewrite, um Suchmaschinen freundliche URLs zu generieren,
dies hat aber zur Folge, dass dabei URLs entstehen wie z.B. http://alice-grafixx.de/brushes.
Auch hier entsteht doppelter Content, denn die Seite waere auch unter http://alice-grafixx.de/brushes/ zu erreichen.

Damit an alle URLs immer ein Schraegstrich hinten angehaengt wird

Diese Regel in die .htaccess Datei packen:
RewriteCond %{REQUEST_URI} ^/[^\.]+[^/]$
RewriteRule ^(.*)$ http://%{HTTP_HOST}/$1/ [R=301,L]

Wichtig!

Das Modul mod_rewrite muss aktiviert sein, damit die Umleitungsregeln auch funktionieren.
Ob mod_rewrite bei dir aktiviert ist, verraet dir bestimmt dein Hoster, oder du fuehrst den Befehl phpinfo() aus, dieser verraet dir mehr ueber die PHP-Konfiguration deines Webspaces….

PHP Konfiguration abfragen

Du moechtest wissen wie es um die PHP-Konfiguration deines Webspaces steht,
dann hilft dir der Befehl phpinfo() bestimmt weiter.

Einfach einen Editor oeffnen
<?php
phpinfo ();
?>
eintippen, als phpinfo.php abspeichern und auf den Webspace laden…

Die momentane PHP-Konfiguration, wird in einer Tabelle uebersichtlich dargestellt und gibt z.B. Auskunft ueber die geladenen Modul, wie z.B. ob mod_rewrite aktiv ist oder nicht.

Man kann sich auch nur bestimmte Teile ausgeben lassen,
dazu stehen folgende Konstanten bereit:

INFO_GENERAL
INFO_CREDITS
INFO_CONFIGURATION
INFO_MODULES
INFO_ENVIRONMENT
INFO_VARIABLES
INFO_LICENSE
INFO_ALL (Voreingestellt, wird beim Aufruf ohne Kontstantenangabe immer ausgegeben)

Der Befehl damit z.B. nur die Module aufgelistet werden, wuerde wie folgt aussehen:
<?php
phpinfo(INFO_MODULES);
?>

Wenn beim Aufrufen der phpinfo.php gar nichts angezeigt wird oder gar der Aufruf nicht moeglich ist,
dann ist das Ausfuehren von PHP-Dateien nicht zulassig, der Webspace unterstuetzt also kein PHP.

Pagerank Update

Vor kurzem fuehrte Tante Google ja mal wieder ein Pagerank Update durch,
dabei ging mir auf den Tutorial Seite von Alice-Grafixx der PR4 floeten. In allen Kategorien war der PR auf Null gefallen.

Ich dachte mir erst nichts dabei, immerhin haben die andern Seiten ja alle ihren PR behalten und Tante Google braucht eben etwas mit dem Update.
Aber als dann nach einer Woche noch immer der PR bei Null war, machte ich mich in den Google Webmastertools auf die Suche nach einer Moeglichen Ursache des enormen Abfalls.

Leider waren dort keine auffaelligen Fehler o.ae. zu sehen.

Also bei Tante Google selbst mal gesucht, dort fand ich dann einige Artikel in denen zu lesen war,
dass so ein enormer PR Verlust meist nur durch double Content hervorgerufen wird.

Tja, des Raetselsloesung war dann ein kleiner Eingriff in die htaccess Datei, um die Permalink-Strucktur zu bearbeiten, denn die Englische Version von Alice-Grafixx enthielt auch die Tutorials, nur die waren natuerlich nicht uebersetzt, weshalb es mir doppelten Content bescherte.

Keine 3 Tage spaeter haben nun alle Tutorial Kategorien auf Alice-Grafixx ihren alten PR wieder …

Was lernen wir nun daraus, man sollte besser auf seine htaccess achten,
wenn man mit mehreren Domains zu gange ist 😛

WordPress Version 2.5

Mein Blog zaehlt nun auch zu denen, die nun unter der Version 2.5 laufen.

Da ich ein Gewohnheitstier bin,
finde ich die neue Aufteilung im WP-Admin ziemlich gewohenungsbeduerftig …
Die neue Optik schaut zwar nett aus, aber eben doch anders.

In der DE Version scheint leider noch nicht alles uebersetz worden zu sein,
so wird mir z.B. beim Beitrag schreiben Manage All Comments, Manage All Post u.ae. unter die Nase gerieben …
Und was ‚Excerpts are optional hand-crafted summaries of your content. ‚ bedeutet, verraet einem nicht englisch sprachigem Menschen auch nur ein Uebersetzungsprogramm …

Meine Plugins laufen zum Glueck noch alle soweit ich erkennen konnte.

Mir geht die staendige Updaterei auf den Nerv,
kaum haste ein Update hinter dich gebracht, schon ist das Naechste zur Stelle.

Nun denn, werd ich mich mal mit der neuen Oberflaeche anfreunden gehen …