Chez oim, forum libreChez oim, forum libre

favicon Google Recherche avancée  

private life

Vous êtes soucieux de votre vie privée ?
Activez ou désactivez les boutons de réseaux sociaux en 3 clics.



Pages: [1]   En bas

Auteur Sujet: Optimisation de l'indexation de Chez oim (Référencement, SEO)  (Lu 459 fois)

alex

  • Administrateur
  • Dictionnaire ambulant
  • ********
  • Hors ligne Hors ligne
  • Sexe: Homme
  • Messages: 14.043
  • Proprio officiel chez oim !

Salut tous,

Vous le savez tous, chez oim utilise le CMS SMF (Simple Machines Forum) pour gérer tous les posts et topics.
Ce CMS a vu son code source "quelque peu" modifié afin de satisfaire à diverses exigences en matière de sécurité, d'accessibilité, d'optimisation, etc.
Il a également été modifié à la demande de certains ayant signalés des bugs au tous débuts de chez oim et par la suite, ou tout simplement pour satisfaire à une demande particulière.

Une modification de plus vient s'ajouter à la longue liste de celles existant déjà.

Un des gros défaut de SMF réside dans la façon dont il rend ses pages "lisibles" par les moteurs de recherche.
Bien qu'ayant déjà été simplifiées dans une modification antérieure, les adresses des pages de chez oim sont trop mal foutues pour être correctement indexées par les moteurs de recherche.
Ces moteurs de recherche (ou crawler) ont tendance à n'indexer que les premières pages du site en délaissant les plus anciennes.
Ils passent également à côté de nombreux posts et topics qui sont pourtant récents mais qui n'apparaissent pas clairement dans le code des pages.

Pourtant, la lisibilité d'un site est un des points essentiels à ne pas négliger si l'on souhaite voir ce site correctement indexé.

La première solution avait été d'utiliser des adresses lisibles par les crawlers (moteurs de recherche).
Au départ, les adresses des posts et topics étaient rédigées avec des paramètres GET.
Pour faire simple, pour accéder à un post, l'adresse était du style chez-oim.org/index.php?topic=974.30&post=342.0. Les paramètres GET sont ce qui suit le point d'interrogation (?).
Les crawlers ne supportant pas les paramètres GET et ayant les plus grandes difficultés pour indexer ces adresses, les paramètres GET avaient été supprimés afin que ces crawlers aient moins de mal.
Ce n'était pas la panacée, mais Google et Bing s'en sortaient beaucoup mieux !

Ensuite, dans une seconde modification, tous les liens utilisés dans les posts ainsi que beaucoup d'autres liens internes au site ou externes avaient vu leur indexation "contrôlée".
Pour faire simple, cela signifie que les liens inutiles à l'indexation du site sont rédigés en nofollow.
Pour un crawler, l'attribut nofollow sur un lien indique qu'il faut indexer ce lien mais pas le visiter.
Cela permettait de canaliser les crawlers chez oim sans qu'ils "prennent la fuite" vers d'autres sites au détours d'un lien.
Pour ceux qui connaissent et avant qu'on me gueule dessus :
Un lien en nofollow est indexé. Un lien posté chez oim aura donc valeur de backlink pour le site qu'il désigne.



Aujourd'hui, une nouvelle modification, dans le but d'améliorer l'indexation du site, fait son apparition !

Cette nouvelle modification réside dans la création et la modification en temps réel du fichier sitemap du site.
Le fichier sitemap d'un site est la garantie que tout ce qu'il contient sera indexé (il existe des exceptions et restrictions, mais on ne va pas rentrer dans les détails).
Comme son nom l'indique, le sitemap est la carte du site. Il indique aux crawlers où se situent précisément chacun des posts et topics.
Jusqu'à présent, un sitemap existait, mais il fallait le mettre régulièrement à jour.
Dorénavant, ce sitemap sera mis à jour en temps réel.
Cela devrait améliorer notablement notre indexation !

Cette modification apporte également une nouveauté aux membres et visiteurs de chez oim.
Dorénavant, vous disposerez d'un plan du site qui sera, lui aussi, mis à jour en temps réel.
Cela signifie que, comme sur le forum, les topics en tête de liste sont les plus récents.

Le plan du site de chez oim est accessible ici : https://chez-oim.org/index.php?action=kitsitemap

Bien entendu, ce plan ne révèle que ce qui doit l'être. Par exemple, un invité ne tombera jamais sur le plan de la section "Entre nous" qui est réservée aux membres connectés. Seuls ces membres connectés auront un plan de cette section.
Il en va de même pour les différents groupes. Les non observateurs ne verront pas le plan de la section "observateurs".
Les moteurs de recherche ne verront donc que ce qu'ils sont autorisés à voir. Par contre, ils le verront plus efficacement et dans sa totalité.

Ne vous inquiétez donc pas si vous voyez que Google est présent "en masse", comme dorait Dominick. ;)
Il se retrouve avec plusieurs centaines de pages qu'il n'a pas dans son index. Il va donc corriger le tir aussi rapidement que son autorisation le lui permet.
Bing est beaucoup plus mou du genoux. Il n'est pas réactif du tout et mettra donc un long moment avant de rattraper son retard.
Les autres, Yandex, Baidu, Yahoo! (si, si. Il passe encore), etc. continueront de passer avec parcimonie et seront donc à la traine...

Voilà donc pour cette dernière nouvelle modification. En espérant que la lecture de ce post aura été le plus digeste possible.
J'ai essayé de faire au plus simple... :iq:

Je vous rappelle l'adresse du plan du site avant que je ne modifie une nouvelle fois le site pour inclure le lien directement sur la page d'accueil :
https://chez-oim.org/index.php?action=kitsitemap
IP archivée

alex

  • Administrateur
  • Dictionnaire ambulant
  • ********
  • Hors ligne Hors ligne
  • Sexe: Homme
  • Messages: 14.043
  • Proprio officiel chez oim !

Pour ceux qui connaissent, et donc les plus curieux  :

Il est possible que vous vous posiez des questions à la vue du premier sitemap... Si c'est le cas, la suite est pour vous.

Vous remarquerez que le premier sitemap contient une liste de sitemap.
C'est se qu'on appelle un sitemapindex.

Plutôt que d'empiler la liste des topics les uns derrière les autres dans un seul sitemap gigantesque, utiliser un sitemapindex est plus pratique.
Chaque section du forum (Blabla, Présentations, Actu, etc.) possède son propre sitemap qui répertorie les topics de la section.
Ensuite, ces sitemap sont répertoriés dans un sitemap général nommé sitemapindex.

Les crawlers s'en sortent très bien avec ces multiples sitemap si ils sont correctement rédigés.
Plus d'infos ici : https://support.google.com/webmasters/answer/75712?hl=fr

L'avantage de ce système, c'est que l'on peut ajouter ou retirer des rubriques sans avoir à supprimer des centaines d'URL si on ne possédait qu'un seul sitemap.
Si on supprime un dossier d'un sous domaine, une section du forum, etc. il suffit juste de supprimer le sitemap correspondant et l'entrée de ce sitemap dans le sitemapindex.
C'est l'opération inverse si on ajoute du contenu.

Pour finir, l'utilisation d'un sitemapindex est également bien plus claire et propre qu'un seul sitemap regroupant l'ensemble du site.
IP archivée

alex

  • Administrateur
  • Dictionnaire ambulant
  • ********
  • Hors ligne Hors ligne
  • Sexe: Homme
  • Messages: 14.043
  • Proprio officiel chez oim !

Comme convenu, un lien vers le plan du site a été créé.
Il se trouve en bas de page.




Attention !
Ce plan de site ne contient pas les sous domaines mini, contact & coppa.
Les liens vers ces sous domaines sont sur toutes les pages.
Ils ont également été transmis à Bing & Google, accompagnés de leur sitemap respectif, qui les ont indexé.
Donc, seul le plan en temps réel des topics du domaine chez-oim.org est important et est présent dans ce plan.
IP archivée
Pages: [1]   En haut
 

+ Réponse Rapide

Page générée en 0.149 secondes avec 24 requêtes.