Salut tous,
Vous le savez tous, chez oim utilise le
CMS SMF (Simple Machines Forum) pour gérer tous les posts et topics.
Ce
CMS a vu son code source "quelque peu" modifié afin de satisfaire à diverses exigences en matière de sécurité, d'accessibilité, d'optimisation, etc.
Il a également été modifié à la demande de certains ayant signalés des bugs au tous débuts de chez oim et par la suite, ou tout simplement pour satisfaire à une demande particulière.
Une modification de plus vient s'ajouter à la longue liste de celles existant déjà.
Un des gros défaut de SMF réside dans la façon dont il rend ses pages "lisibles" par les moteurs de recherche.
Bien qu'ayant déjà été simplifiées dans une modification antérieure, les adresses des pages de chez oim sont trop mal foutues pour être correctement indexées par les moteurs de recherche.
Ces moteurs de recherche (ou crawler) ont tendance à n'indexer que les premières pages du site en délaissant les plus anciennes.
Ils passent également à côté de nombreux posts et topics qui sont pourtant récents mais qui n'apparaissent pas clairement dans le code des pages.
Pourtant, la lisibilité d'un site est un des points essentiels à ne pas négliger si l'on souhaite voir ce site correctement indexé.
La première solution avait été d'utiliser des adresses lisibles par les crawlers (moteurs de recherche).
Au départ, les adresses des posts et topics étaient rédigées avec des paramètres GET.
Pour faire simple, pour accéder à un post, l'adresse était du style
chez-oim.org/index.php?topic=974.30&post=342.0. Les paramètres GET sont ce qui suit le point d'interrogation (
?).
Les crawlers ne supportant pas les paramètres GET et ayant les plus grandes difficultés pour indexer ces adresses, les paramètres GET avaient été supprimés afin que ces crawlers aient moins de mal.
Ce n'était pas la panacée, mais Google et Bing s'en sortaient beaucoup mieux !
Ensuite, dans une seconde modification, tous les liens utilisés dans les posts ainsi que beaucoup d'autres liens internes au site ou externes avaient vu leur indexation "contrôlée".
Pour faire simple, cela signifie que les liens inutiles à l'indexation du site sont rédigés en
nofollow.
Pour un crawler, l'attribut
nofollow sur un lien indique qu'il faut indexer ce lien mais pas le visiter.
Cela permettait de canaliser les crawlers chez oim sans qu'ils "prennent la fuite" vers d'autres sites au détours d'un lien.
Pour ceux qui connaissent et avant qu'on me gueule dessus :
Un lien en nofollow est indexé. Un lien posté chez oim aura donc valeur de backlink pour le site qu'il désigne.Aujourd'hui, une nouvelle modification, dans le but d'améliorer l'indexation du site, fait son apparition !Cette nouvelle modification réside dans la création et la modification en temps réel du fichier
sitemap du site.
Le fichier
sitemap d'un site est la garantie que tout ce qu'il contient sera indexé (il existe des exceptions et restrictions, mais on ne va pas rentrer dans les détails).
Comme son nom l'indique, le
sitemap est la carte du site. Il indique aux crawlers où se situent précisément chacun des posts et topics.
Jusqu'à présent, un sitemap existait, mais il fallait le mettre régulièrement à jour.
Dorénavant, ce sitemap sera mis à jour en temps réel.
Cela devrait améliorer notablement notre indexation !
Cette modification apporte également une nouveauté aux membres et visiteurs de chez oim.Dorénavant, vous disposerez d'un plan du site qui sera, lui aussi, mis à jour en temps réel.
Cela signifie que, comme sur le forum, les topics en tête de liste sont les plus récents.
Le plan du site de chez oim est accessible ici : https://chez-oim.org/index.php?action=kitsitemapBien entendu, ce plan ne révèle que ce qui doit l'être. Par exemple, un invité ne tombera jamais sur le plan de la section "Entre nous" qui est réservée aux membres connectés. Seuls ces membres connectés auront un plan de cette section.
Il en va de même pour les différents groupes. Les non observateurs ne verront pas le plan de la section "observateurs".
Les moteurs de recherche ne verront donc que ce qu'ils sont autorisés à voir. Par contre, ils le verront plus efficacement et dans sa totalité.
Ne vous inquiétez donc pas si vous voyez que Google est présent "en masse", comme dorait Dominick.
Il se retrouve avec plusieurs centaines de pages qu'il n'a pas dans son index. Il va donc corriger le tir aussi rapidement que son autorisation le lui permet.
Bing est beaucoup plus mou du genoux. Il n'est pas réactif du tout et mettra donc un long moment avant de rattraper son retard.
Les autres, Yandex, Baidu, Yahoo! (si, si. Il passe encore), etc. continueront de passer avec parcimonie et seront donc à la traine...
Voilà donc pour cette dernière nouvelle modification. En espérant que la lecture de ce post aura été le plus digeste possible.
J'ai essayé de faire au plus simple...
Je vous rappelle l'adresse du plan du site avant que je ne modifie une nouvelle fois le site pour inclure le lien directement sur la page d'accueil :
https://chez-oim.org/index.php?action=kitsitemap