Go to main content

Textpattern CMS support forum

You are not logged in. Register | Login | Help

#1 2012-01-22 03:33:38

rentaseo
Member
From: Schwandorf
Registered: 2009-11-30
Posts: 20
Website

[de-de] Parameterisierte Tags trotz rewrite

Textpattern-Version: 4.4.1 (r3575) und tru_tags 3.6 sind bei http://www.foto-blog.org verbaut. Tag section name habe ich auf suedtirol geändert.

Obwohl die Tags wie gewünscht beispielsweise unter foto-blog.org/suedtirol/Eppan/ aufgerufen werden können, sind die Seiten auch unter foto-blog.org/suedtirol/?t=Eppan erreichbar.

Das würde mich nun nicht großartig stören, wenn die Crawler aus einen mir nicht nachvollziehbaren Grund eben diese dubiose parameterisierte Form saugen würden.

Ist das Problem bekannt bzw. eine Lösung dazu?

Ich verzweifle am mod_rewrite, das ich als Krücke verwenden würde. Wahrscheinlich liegt es an der Uhrzeit, aber ich bekomme /suedtirol/?t=TAG einfach nicht auf suedtirol/TAG/ umgeleitet, ohne dass es in eine Schleife läuft.

(Die einfachste Lösung, die TAGS auf noindex zu setzen ist in diesem Fall nicht sinnvoll und die Sperre von /suedtirol/?t in der Robots.txt ist nur der letzte Ausweg.)

Last edited by rentaseo (2012-01-22 03:37:54)

Offline

#2 2012-01-22 08:37:29

jakob
Admin
From: Germany
Registered: 2005-01-20
Posts: 4,612
Website

Re: [de-de] Parameterisierte Tags trotz rewrite

Schöne Seite! Wäre nicht der einfachste Weg Google & Co zu instruieren, nur dein preferierte Permlink-URL zu speichern mit Hilfe von rel=‘canonical’ – also im <head>…</head> Bereich der betreffenden Seiten folgendes einzubauen:

<link rel="canonical" href="http://foto-blog.org/suedtirol/tag-name-hier/" />

Da sind dann gar keine Änderungen an tru_tags oder htaccess notwendig.

Last edited by jakob (2012-01-22 08:39:14)


TXP Builders – finely-crafted code, design and txp

Offline

#3 2012-01-22 14:04:46

phuture303
Member
Registered: 2008-09-14
Posts: 127

Re: [de-de] Parameterisierte Tags trotz rewrite

Weitere Idee: Eine Sitemap erstellen (bspw. rah_sitemap nutzen ) und diese bei den Google Webmastertools angeben. Da ich tru_tags aber nicht nutze, weiß ich nicht, ob da clean-URLS in der Sitemap ankommen – ein Versuch ist es wert :-)

Offline

#4 2012-01-23 14:35:14

merz1
Member
From: Hamburg
Registered: 2006-05-04
Posts: 994
Website

Re: [de-de] Parameterisierte Tags trotz rewrite

tru_tags 3.6 -> gibt’s aktuell als 3.7 :)

Matthias, das crawlen auf die Parameter legt sich irgendwann, wenn Du wirklich überall clean URLs einsetzt.
rel=“canonical” ist ein korrekter Hinweis, aber mir wäre es die ms nicht wert :)
Und die tag-Seiten haben in der Sitemap nichts zu suchen. In die Sitemap sollten die einzelnen Artikel rein. Und es reicht völlig, den RSS-Feed als Sitemap für neue/aktualisierte Artikel anzugeben. Die verlinkten tags ziehen sich die bots dann schon selber.


Get all online mentions of Textpattern via OPML subscription: TXP Info Sources: Textpattern RSS feeds as dynamic OPML

Offline

#5 2012-01-24 05:26:25

rentaseo
Member
From: Schwandorf
Registered: 2009-11-30
Posts: 20
Website

Re: [de-de] Parameterisierte Tags trotz rewrite

merz1 schrieb:

bq. tru_tags 3.6 -> gibt’s aktuell als 3.7

Modifiziertes Plugin

_Matthias , das crawlen auf die Parameter legt sich irgendwann, wenn Du wirklich überall clean URLs einsetzt.
rel=“canonical” ist ein korrekter Hinweis, aber mir wäre es die ms nicht wert_

Ich hatte extra darauf geachtet in der Testphase die Seite hinter .htaccess zu schützen. Es dürfte eigentlich gar nicht dazu kommen! Ist das mit den Parametern ein “known bug”? (Ansonsten komme ich aus SEO-Sicht – bis auf das leidige Thema Dateinamen für Grafiken – gut mit Textpattern sehr gut klar.)

jakob schrieb:

Wäre nicht der einfachste Weg Google & Co zu instruieren, nur dein preferierte Permlink-URL zu speichern mit Hilfe von rel=‘canonical’ …

Den Cannonical Tag setze ich eigentlich nie ein, vor allem nicht, wenn ich Vollzugriff auf das System habe. Aber Danke für den Hinweis, in diesem Ausnahmefall habe ich es verbaut, bis es eine echte Lösung gibt.

Nachtrag

Gibt es irgendwelche Hinweise, warum die Crawler in die parameterisierte Form hinein laufen? In den Feeds sind sie nicht und auch sonst nicht auf der Seite verlinkt. Bisher laufen auch nur der Google- und MSN-Bot auf die t-Parameter, Yandex beispielsweise nicht.

Last edited by rentaseo (2012-01-24 06:48:05)

Offline

#6 2012-01-25 05:15:39

wet
Developer Emeritus
From: Schoerfling, Austria
Registered: 2005-06-06
Posts: 3,324
Website Mastodon

Re: [de-de] Parameterisierte Tags trotz rewrite

Vorschlag (ohne das ich mich mit dem Rest der Sitestruktur beschäftigt habe):

RewriteCond %{QUERY_STRING} ^t=(.*)
RewriteRule .* /suedtirol/%1? [L,NC,R=301]

Das Fragezeichen am Ende des Ersatzstrings in der RewriteRule sorgt dafür, dass der originale QUERY_STRING verworfen wird1. Damit verhindert man die Entstehung einer unendlichen Schleife von Redirects.

1 “Modifying the Query String” in der Doku.

Last edited by wet (2012-01-26 08:17:25)

Offline

Board footer

Powered by FluxBB