Dotclear

Vous n'êtes pas identifié(e).

Annonce

13 février 2024 Sortie de Dotclear 2.29

#1 2017-12-11 09:09:51

i_love_dc
Membre
Inscription : 2007-07-13

Restreindre/ limiter l'indexation de paginiation pages 2/3/4 ...etc

Bonjour.

Sur le home ou sur les catégories, est-il possible de limiter (restreindre) l'indexation de la pagination sur la première page (index) uniquement ?

par exemple :
Indexer "home", mais ne pas indexer "home -  page 2", ou encore, indexer "Ma catégorie" mais ne pas indexer "Ma catégorie - page 2"  ?

.

Dernière modification par i_love_dc (2017-12-11 09:13:56)

Hors ligne

#2 2017-12-11 10:55:24

Philippe
Stagiaire
Lieu : Toulon
Inscription : 2004-06-13
Site Web

Re : Restreindre/ limiter l'indexation de paginiation pages 2/3/4 ...etc

C'est faisable en ajoutant une condition sur la pagination (loop position) dans home.html ou category.html pour la balise meta ROBOTS

première page :

<meta name="ROBOTS" content="{{tpl:BlogMetaRobots}}" />

deuxième et suivantes :

<meta name="ROBOTS" content="NOINDEX" />

Sinon, dans le robots.txt, tu peux demander aux moteurs de ne pas suivre certaines URLs

Disallow : /page/*

Hors ligne

#3 2017-12-11 11:02:12

Franck
Footer de merde
Lieu : Paris
Inscription : 2004-11-09
Site Web

Re : Restreindre/ limiter l'indexation de paginiation pages 2/3/4 ...etc

Oui côté template, en reprenant le bloc

<tpl:Block name="meta-robots">
	<meta name="ROBOTS" content="{{tpl:BlogMetaRobots robots="NOINDEX"}}" />
</tpl:Block>

et en incluant un test sur la pagination en cours avec tpl:PaginationIf pour insérer ou pas la ligne <meta name…


Dotclear addicted since 2004

Hors ligne

#4 2017-12-11 11:02:55

Franck
Footer de merde
Lieu : Paris
Inscription : 2004-11-09
Site Web

Re : Restreindre/ limiter l'indexation de paginiation pages 2/3/4 ...etc

Oups Philippe a été plus rapide que moi :-)


Dotclear addicted since 2004

Hors ligne

#5 2017-12-11 15:49:18

i_love_dc
Membre
Inscription : 2007-07-13

Re : Restreindre/ limiter l'indexation de paginiation pages 2/3/4 ...etc

D’après ce que j'ai compris de vos explications, j'ai fais ca...

<tpl:Entries>
   <tpl:LoopPosition start="1" length="1">
       <tpl:Block name="meta-robots">
         <meta name="ROBOTS" content="{{tpl:BlogMetaRobots}}" />
       </tpl:Block>
   </tpl:LoopPosition>
</tpl:Entries>

<tpl:Entries>
   <tpl:LoopPosition start="2">
       <tpl:Block name="meta-robots">
	 <meta name="ROBOTS" content="{{tpl:BlogMetaRobots robots="NOINDEX"}}" />
       </tpl:Block>
   </tpl:LoopPosition>
</tpl:Entries>

mais ca ne fonctionne pas, je ne sais pas ou est la coquille ??

Hors ligne

#6 2017-12-11 16:13:28

Mirovinben
M comme Mathusalem
Lieu : Dole (Jura)
Inscription : 2007-02-06
Site Web

Re : Restreindre/ limiter l'indexation de paginiation pages 2/3/4 ...etc

Franck a écrit :

et en incluant un test sur la pagination en cours avec tpl:PaginationIf pour insérer ou pas la ligne <meta name…

i_love_dc, dans ton exemple je n'ai pas vu de test tpl:PaginationIf...

Hors ligne

#7 2017-12-11 16:45:33

Philippe
Stagiaire
Lieu : Toulon
Inscription : 2004-06-13
Site Web

Re : Restreindre/ limiter l'indexation de paginiation pages 2/3/4 ...etc

Je crois que c'est moi qui ai induit notre ami en erreur : le test n'est pas sur LoopPosition mais sur PaginationIf, donc :

<tpl:PaginationIf start="0">
    <meta name="ROBOTS" content="{{tpl:BlogMetaRobots robots="NOINDEX"}}" />
</tpl:PaginationIf>

<tpl:PaginationIf start="1">
    <meta name="ROBOTS" content="{{tpl:BlogMetaRobots}}" />
</tpl:PaginationIf>

Et bien sûr il ne faut pas mettre le code dans une boucle tpl:Entries ;)

Hors ligne

#8 2017-12-11 22:55:20

i_love_dc
Membre
Inscription : 2007-07-13

Re : Restreindre/ limiter l'indexation de paginiation pages 2/3/4 ...etc

Effectivement, j'étais loin du compte....

Merci a vous .

PS - Pourquoi ne pas inclure ce comportement directement de les gabarits ?

Hors ligne

#9 2017-12-12 07:04:49

Franck
Footer de merde
Lieu : Paris
Inscription : 2004-11-09
Site Web

Re : Restreindre/ limiter l'indexation de paginiation pages 2/3/4 ...etc

i_love_dc a écrit :


PS - Pourquoi ne pas inclure ce comportement directement de les gabarits ?

Pourquoi empêcher les moteurs d'indexer la totalité du blog ?


Dotclear addicted since 2004

Hors ligne

#10 2017-12-12 07:55:31

i_love_dc
Membre
Inscription : 2007-07-13

Re : Restreindre/ limiter l'indexation de paginiation pages 2/3/4 ...etc

Franck a écrit :
i_love_dc a écrit :


PS - Pourquoi ne pas inclure ce comportement directement de les gabarits ?

Pourquoi empêcher les moteurs d'indexer la totalité du blog ?

Vu que le code (ci-dessus) est vraiment très simple, jme disais qu'indexer les catégories par défaut serait pas mal bien.

En ce qui concerne les "Truc - page2", ca n'a aucune pertinence au niveau des moteurs.
Ce qui change dans la description est uniquement le "n° de page", ce qui est limite du "duplicate-content".

Google ,lui, semble faire la part des choses, il reconnait que ce n’est pas du contenu dupliqué et l'indexe, ensuite, il désindexe ce type de contenu car il manque de pertinence "selon lui"...
Mais on ne connait pas forcément le comportement des autres moteurs qui peut-être "eux" qualifient ça de duplicate et pénaliserait alors la visibilité du blog.

En bref, indexer les billets, le home et les catégories par défaut, mais sans pour autant indexer les "*** - page *" semble "judicieux" et en rien "contre productif".

en re-bref, c'est + mieux pour les utilisateurs (dotcleariens) qu'ils soient lambda ou pas...

.

Dernière modification par i_love_dc (2017-12-12 10:39:04)

Hors ligne

#11 2017-12-13 06:03:03

Franck
Footer de merde
Lieu : Paris
Inscription : 2004-11-09
Site Web

Re : Restreindre/ limiter l'indexation de paginiation pages 2/3/4 ...etc

i_love_dc a écrit :
Franck a écrit :
i_love_dc a écrit :


PS - Pourquoi ne pas inclure ce comportement directement de les gabarits ?

Pourquoi empêcher les moteurs d'indexer la totalité du blog ?

Vu que le code (ci-dessus) est vraiment très simple, jme disais qu'indexer les catégories par défaut serait pas mal bien.

En ce qui concerne les "Truc - page2", ca n'a aucune pertinence au niveau des moteurs.
Ce qui change dans la description est uniquement le "n° de page", ce qui est limite du "duplicate-content".

Hein ? En ce qui me concerne je peux t'assurer que le contenu de la page 2 de mon blog est largement plus différent de la page 1 qu'un simple numéro. Suffit d'aller se rendre compte et voir que la liste des billets affichés est légèrement différente. Peut-être n'est-ce pas le cas chez toi ?

i_love_dc a écrit :

Google ,lui, semble faire la part des choses, il reconnait que ce n’est pas du contenu dupliqué et l'indexe, ensuite, il désindexe ce type de contenu car il manque de pertinence "selon lui"...
Mais on ne connait pas forcément le comportement des autres moteurs qui peut-être "eux" qualifient ça de duplicate et pénaliserait alors la visibilité du blog.

Justifier cette modification sur la base de supposition sur le fonctionnement des autres moteurs, sans compter que comme tu le soulignes Google se débrouille tout seul comme un grand avec SON éventuel contenu dupliqué ; parce qu'il n'est toujours pas démontré que le contenu d'une page 2 soit identique à la page 1. Va falloir m'en dire un peu plus, j'ai du mal à comprendre (probablement mon ignorance des choses concernant le SEO dont je me tape royalement)

i_love_dc a écrit :

En bref, indexer les billets, le home et les catégories par défaut, mais sans pour autant indexer les "*** - page *" semble "judicieux" et en rien "contre productif".

en re-bref, c'est + mieux pour les utilisateurs (dotcleariens) qu'ils soient lambda ou pas...

.

Désolé, la démonstration me semble un peu légère et si j'en juge par l'indexation de mon propre blog (on va dire qu'il est un peu "copieux" avec ses 6600 billets), plutôt bien faite il me semble, je n'ai, à ce jour, jamais reçu d'avertissement de quelque moteur que ce soit à propos d'un éventuel duplicate content.

Ça m'intéresse de comprendre le problème, réellement, et je manque de billes à ce jour pour m'en faire une idée précise.


Dotclear addicted since 2004

Hors ligne

#12 2017-12-13 08:41:00

i_love_dc
Membre
Inscription : 2007-07-13

Re : Restreindre/ limiter l'indexation de paginiation pages 2/3/4 ...etc

Disons que ...

Lorsqu'on regarde cette recherche "Open Time - page " (guillemets comprises).
Dans Google on se rend compte qu'il en prend jusqu’à la page 2 ... sorti de là, impossible de voir la page 3.

Pour aller plus loin :

Dans Google on tape  "Open Time - page " ... 
On tombe sur ces résultats
On voit qu'il prend ces "pages +" et qu'il change le contenu lui même (bref, il ne statut pas sur la balise description.)

Mais surtout, on peut ce rendre compte qu'il ne semble pas lister les X " - pages n°" disponibles du home de ton blog au delà de la page 2.

Afin de s'en assurer :

Dans Google "Open Time - page 3" ...
On tombe sur  rien lol, bizarre mais Google ne semble pas avoir ta page en question dans ses résultats.
Pourtant s'il on pousse un peu plus loin et que l'on fait  "-https://open-time.net/page/3" (sans le tiret), on se rend compte que la page est belle est bien indexé par Google dans ses résultats.

Conclusion :

Les "pages n°" n'ont pas de pertinence/d’intérêt pour les moteurs et ne remontent pas dans les résultats de recherches.
Donc pourquoi ne pas faire l'impasse sur ces indexations inutiles vue la simplicité du code à mettre en place ?

Autre bénéfice :

Celui d'indexer par défaut (d'origine) les catégories .

Grosso-modo, les pages 2, page 3 ..etc non pas forcement d’intérêt, par contre pouvoir trouver un blog par le biais d'une de ces catégorie à un réel intérêt.

Ne serait-ce que si je souhaite consulter ton blog directement via cette recherche "open time dotclear plugin".
Je devrais pouvoir tomber sur l'index de la catégorie ce qui faciliterait la pertinence du résultat, ma recherche et ma navigation.

.

Dernière modification par i_love_dc (2017-12-13 09:36:19)

Hors ligne

#13 2017-12-13 09:53:44

Franck
Footer de merde
Lieu : Paris
Inscription : 2004-11-09
Site Web

Re : Restreindre/ limiter l'indexation de paginiation pages 2/3/4 ...etc

Désolé je ne comprends toujours pas pourquoi il faut que j'enlève l'indexation des pages 2 et suivantes. Que Google ne s'en sert pas, ok, mais sinon ?

Allons plus loin, j'ouvre un nouveau blog, je publie dans la foulée 300 billets (disons avec 5 par pages), sans catégorie, sans mot-clé, …, ça voudrait dire que le moteur d'indexation n'irait pas au delà des 5 premiers billets ? Et les autres, sont perdus à jamais ?

De plus ajuster mon blog pour les besoins de quelqu'un qui monétise les recherches… Et sinon, pour Google tu sembles absolument convaincu qu'il faut modifier le code source — au demeurant j'ai toujours pas compris en quoi ça pénalisait de laisser comme c'était — mais les autres, Qwant et consorts, ça donne quoi ?

Quant à indexer par défaut les catégories, je ne vois pas comment interdire l'indexation des pages 2 et suivantes va rendre ça possible.

Au passage, Google, ou plutôt son robot indexeur, ce sert du sitemap disponible chez moi qui lui mâche le boulot : https://open-time.net/sitemap.xml et il y trouve tous les billets, tous les mot-clés, toutes les catégories, indépendamment de la présentation/pagination ; ça m'étonnerait qu'il cherche ailleurs, ou à la marge.


Dotclear addicted since 2004

Hors ligne

#14 2017-12-13 10:13:51

Philippe
Stagiaire
Lieu : Toulon
Inscription : 2004-06-13
Site Web

Re : Restreindre/ limiter l'indexation de paginiation pages 2/3/4 ...etc

Je ne comprends pas trop le but recherché en voulant désindexer des pages. J'ai plutôt l'impression qu'on essaie de se conformer à l'une des nombreuses légendes entourant le SEO, ici en l'occurrence le duplicate content, que je considère plutôt comme le serpent de mer des référenceurs...

Je ne suis d'ailleurs pas d'accord avec l'analyse de i_love_dc concernant des pages qui ne seraient pas indexées. En effet, si on lance la commande site:open-time.net chez Google, on obtient 2340 résultats, dont plusieurs en première page sont des URLs paginées comme par exemple le second résultat (aujourd'hui et depuis chez moi, ce qui peut varier) : https://open-time.net/obsoletes/page/131

il y en a beaucoup d'autres ainsi, et aucune ne semble désindexée ou mal vue par le robot. L'exemple de recherche "Open Time - page 3" qui ne retourne rien n'est à mon avis pas du tout pertinent. Si on recherche un terme apparaissant dans une des pages censées être désindexées, on trouve bien entendu dans les résultats open-time.net, et bien placé par dessus le marché ;)

Hors ligne

#15 2017-12-13 10:48:09

i_love_dc
Membre
Inscription : 2007-07-13

Re : Restreindre/ limiter l'indexation de paginiation pages 2/3/4 ...etc

je comprend votre point de vue sur les page 2, page 3 etc...
Je le partage également, puisque dans le fond, laisser ces pages ou les enlever importe peu, puisqu'elles ne semblent pas avoir de réelle utilité/importance (positive ou négative d’ailleurs).

A la base, je posai cette question (pouvoir empêcher l'indexation des paes2, pages 3 etc...) car ces dites pages n'ont pas une très grande importance.
Mais ce n'est que mon avis qui n'engage que moi ^^.
C’était également  pour lancer/relancer le débat a propos des catégories.

Puisque nous tombons d'accord au sujet des pages 2 et suivantes (ça reste tel quel), qu'en pensez-vous en ce qui concerne l'indexation par defaut des catégories ?

Hors ligne

Vous n'êtes pas identifié(e).

Pied de page des forums

Sites map