Mise à jour : 28 janvier 2017 (voir ajout à la fin de cet article)
Autant les
backlinks sont nécessaires à un site, autant les outils de mesure de ce
backlink qui se multiplient et respectent quand et comme ils le peuvent une certaine éthique, devient problèmatique.
Le commun des mortels ne connait pas le backlink et c'est pourtant aux simples mortels que nous devons ce backlink.
Toi, simple visiteur ou inscrit, tu connais le
backlink pour avoir déjà pratiqué.
Ils s'appellent
backlink. Et c'est pourtant vous, commun des mortels, qui générez ces
backlink pour la plupart.
Si, si ! C'est vrai ! Je vous explique.
Un backlink, c'est quoi ?Un
backlink, c'est un lien vers un autre site.
Un
backlink, c'est tout simplement un lien vers une page, une image, une vidéo, etc. qui vous a donné envie de donner ce lien sur un autre site, un réseau social, la plupart du temps.
Imaginons !
Ici, sur
chez-oim.org, je difuse la vidéo d'un chat qui se retire la fourrure pour se mettre à poil et afficher sa virilité de mâle !
Vous allez jeter le lien vers la page de la vidéo sur Facebook, Twitter, Google+, le blog des amis, etc. Comme sur l'image au dessus.
Tous ces liens que vous allez "lâcher" sur le web vers mon site s'appeleront
backlink.
Un
backlink est un lien qui pointe vers un site grâce à une action humaine. Ce n'est donc pas une pub qui ferait le même boulot sans avoir regardé la vidéo !
Vous savez ce qu'est un
backlink ? Tant mieux ! J'avais un peu peur de ne pas y arriver.
Ne vous inquiètez pas, on ne vous en voudra jamais de faire la pub de notre site avec des liens, bien au contraire.
On vous est extrêment reconnaissant de bien vouloir faire connaitre notre site au delà de tous les autres sites, là bas, dans la plaine des sites que nous ne connaissons pas.
MERCI ET ENCORE MERCI !
"On", c'est qui ?C'est tous les webmasters du monde. Quand vous donnez un lien sur un site Y vers le site X, vous rendez le webmaster du site X heureux.
Retenez ceci, simplement ceci. Vous aimez un site ? Glissez un lien vers ce site sur un autre site (un
backlink ).
Tous les liens n'ont pas la même valeur, mais c'est aux webmasters qu'il appartient de faire le ménage, pas à vous.
A PARTIR D'ICI COMMENCE LA PARTIE "GEEK" DE L'ARTICLE
CETTE PARTIE S'ADRESSE AUX WEBMASTERSVous avez déjà vu des bots passer un temps de fou et pomper une bande passante de folie sur votre site, n'est-ce pas ?
Webmeup, c'est ces nouveaux crawlers qui recherchent uniquement du lien, du
backlink, plus précisément.
Certains de ces crawlers ne se gênent pas et pillent la bande passante d'un site.
Webmeup semble plus raisonnable. J'ai dit semble ! Je n'ai pas regardé les chiffres. Mais quelques chose me dit que si il est présent plusieurs jours de suites, c'est qu'il prend sont temps. Enfin, espérons le.
A l'inverse, on a
Majestic qui est un véritable salopard et qui pille toutes vos pages en un minimum de temps !
Oh oui ! Ce
Majestic respecte le
robots.txt et sa directive
crawl-delai, mais si vous utilisez cette directive
crawl-delai pour ralentir "l'engin", vous aurez plusieurs
Majestic présents simultanément !
Vaste fumisterie ! Un robot est ralenti ? On vous envoie deux robots et même plus ! Les directives du
robots.txt s'adressent à un seul robot, pas un groupe !
Ces nouveaux outils de mesure du
backlink sont utiles pour certains, c'est clair et net. Mais il va falloir mettre le hola ! Ces outils ne peuvent pas tout ce permettre et, à mon avis, Google les a déjà mis à la porte.
Ces outils, tous payants, pillent le réseau le plus rapidement possible afin d'engranger des données à jour. Et pour être à jour, il faut repasser, encore et encore.
Alors quoi ? Blacklistage ? On laisse faire ?
Si ces outils voulaient des renseignements fiables, ils s'adresseraient à Google, n'est ce pas ?
Alors pourquoi passent-ils sur nos sites en effectuant un véritable pillage de la bande passante ? Pourquoi ?
Je suis d'avis que soit ils n'ont pas trouvé d'accord financier avec Google, soit Google ne veut pas de concurrence.
Quoi qu'il en soit, certains bots ne peuvent pas continuer leur ratissage du réseau comme ils le font. A cette heure, il n'est pas rare de fournir plus de 50% de bande passante pour des bots !
Cette emprise sur le réseau doit cesser ! Les points de peering ont leurs règles mais le net à les siennes aussi !
Ici, j'ouvre une brèche, afin de voir l'ampleur du problème. Je n'ai pas de souci à me faire, la bande passante, j'ai jusqu'à plus soif.
N'hésitez pas à me contacter, en répondant à ce post, en me mailant, bref ! Vous êtes webmasters, vous me trouverez.
Il faut faire quelque chose contre ces bots qui nous pillent tous les jours !
D'avance, je tiens à vous remercier, tous, absolument tous, pour votre implication et votre inquiétude de ce que devient le réseau, un trafic en majorité payant.
Merci à tous !Mise à jour du 24 janvier 2017 suivie de celle du 21 mars 20174 outils de mesure du backlink sont maintenant bloqués sur ce site. Ces 4 outils ne seront peut-être pas les seuls.Ces 4 outils sont les suivants :
- Ahrefs
- Majestic
- Semrush
- Webmeup
Ces 4 outils se servent sans aucune retenue et pompent chacun des milliers de pages tous les jours.
La bande passante ? Ils ne connaissent pas, c'est gratuit !
Si il se comportaient de cette façon chez Google, je commence à comprendre pourquoi ça n'a pas duré...
Concernant
Majestic et
Semrush, ils ne font aucune difficulté et respectent le
robots.txtIl est donc très simple de les bloquer en ajoutant 3 lignes à son
robots.txt :
User-agent: MJ12bot
User-agent: SemrushBot-SA
Disallow: /
Attention ! SemrushBot ne respectera votre
robots.txt que quelques jours, certainement dans l'espoir de vous endormir en vous faisant croire qu'il vous obéit. Il convient donc de blacklister sa plage IP (46.229.168.0/24)
J'ai bien tenté de bloquer
Ahrefs de la même façon, puisqu'ils disent respecter
robots.txt sur leur site, mais ça ne marche pas.
Ahrefs ne respecte pas le robots.txt ! C'est toujours bon à savoir.
Du coup, il faut bloquer leurs IPs pour avoir la paix.
Avec un serveur Apache, ajoutez ces lignes dans votre
.htaccess racine pour bloquer
Semrush et
Ahrefs :
Order Allow,Deny
Allow from all
Deny from 163.172.64.0/24
Deny from 163.172.65.0/24
Deny from 163.172.66.0/24
Deny from 46.229.168.0/24
Deny from 148.251.10.183
Vous recevrez encore quelques visites de
Ahrefs sur d'autres IPs, mais ça ne dépassera pas 5 pages par jour.
Bien sûr, ces IPs seront maintenues à jour et, si d'aventure, les deux premiers décidaient de ne plus respecter le
robots.txt, leurs IPs seront données ici même.
Le 28 janvier 2017 :SemrushBot a décidé cette nuit qu'il ne respecterait plus le
robots.txtSa plage IP a donc été ajoutée à la liste de blocages ci dessus.