Dotclear

Vous n'êtes pas identifié(e).

Annonce

13 février 2024 Sortie de Dotclear 2.29

#1 2013-11-04 22:43:13

prospere
Membre
Lieu : Nantes
Inscription : 2005-11-01
Site Web

/lang/page & duplicate Content

Bonjour,

Je viens de m’apercevoir que Google a référencé en double mes contenus localisés sur le /fr/page/xxx et sur /page/xxx

Exemple :

http://www.geeek.org/page/2
http://www.geeek.org/fr/page/2

Ce qui est étrange c'est que le cela fonctionne pour tout :

http://www.geeek.org/n'importequoi/page/2

Le regexp semble être permissif :
$core->url->register('lang','','^([a-zA-Z]{2}(?:-[a-z]{2})?(?:/page/[0-9]+)?)$',array('dcUrlHandlers','lang'));

Je ne sais pas comment il a trouvé des références vers :  /fr/page

Une idée ?

Dernière modification par prospere (2014-08-29 13:31:23)

Hors ligne

#2 2013-11-18 20:39:52

prospere
Membre
Lieu : Nantes
Inscription : 2005-11-01
Site Web

Re : /lang/page & duplicate Content

Salut,

J'ai un peu creusé le sujet depuis il y a deux semaines.

Il suffit que quelqu'un ai publié un lien avec une URL fausse pour que Google référence le site en duplicate content.

Exemple, si je publie : http://fr.dotclear.org/blog/TrucBidule/page/2

Google référencera deux fois la page et la considérera en contenu dupliqué.

La seule solution pour s'en sortir est de :
- Soit de contrôler la langue passée en paramètre.
- Soit de désactiver l'UrlHandler 'lang' totalement et de corriger la fonction getPageNumber() pour qu'il soit moins permissif.

Hors ligne

#3 2014-08-29 13:33:23

prospere
Membre
Lieu : Nantes
Inscription : 2005-11-01
Site Web

Re : /lang/page & duplicate Content

J'ai l'impression que le problème est ailleurs ...

http://fr.dotclear.org/blog/encore/un/a … ent/page/5

Dernière modification par prospere (2014-08-29 13:33:46)

Hors ligne

#4 2014-08-29 17:00:48

nikrou
Membre
Inscription : 2007-10-02
Site Web

Re : /lang/page & duplicate Content

prospere a écrit :

J'ai l'impression que le problème est ailleurs ...

http://fr.dotclear.org/blog/encore/un/a … ent/page/5

Oulalalala. Le problème est ailleurs comme tu dis.


Je préfère être atteint de parkinson plutôt qu'alzheimer : je prefère renverser un peu de ma bière plutôt qu'oublier de la boire !

Présentez vos photos simplement avec Phyxo !

Hors ligne

#5 2014-08-29 22:31:13

prospere
Membre
Lieu : Nantes
Inscription : 2005-11-01
Site Web

Re : /lang/page & duplicate Content

Le problème semble se localiser dans la fonction home() du lib.urlhandlers.php

Le test réalisé est trop permissif, $n peut être non vide et args peut contenir des paramètres non maitrisés pouvant provoquer des duplicate content.

$n = self::getPageNumber($args);

if ($args && !$n)
 {
         # "Then specified URL went unrecognized by all URL handlers and
         # defaults to the home page, but is not a page number.
         self::p404();
  }

En fait, le ticket a été mis à jour par franck : http://dev.dotclear.org/2.0/ticket/1874

Hors ligne

Vous n'êtes pas identifié(e).

Pied de page des forums

Sites map