15 questions à François Goube pour comprendre Majestic

Le 15/09/2014 par Jérôme PASQUELIN

Merci beaucoup François, l’ambassadeur de Majestic en France, d’avoir accepté de répondre à mes questions et tout ça en moins de 24 heures 🙂

J’utilise cet outil et la toolbar Majestic quotidiennement et c’est vrai qu’en creusant un peu sur les indicateurs on se rend compte rapidement qu’on ne les maitrise pas totalement.

Pour ceux qui ne connaissent pas, Majestic SEO est un tool online qui permet de faire des analyses de backlinks (lire les deux billets suivants : Avis sur Majestic SEO  et L’explorateur de site chez Majestic devient gratuit).
En fin d’article, on parlera aussi de OnCrawl, le nouveau projet de François



Qu’est le Trust Flow et comment ça fonctionne?

De ce que j’ai compris, l’équipe de Majestic a flaggé des sites comme étant de « sites de confiance » (sites ayant de la légitimité, de l’ancienneté, de la popularité. Par exemple tous les sites institutionnels / gouvernementaux).
Si j’ai des liens qui pointent de ce genre de sites alors je récupère une partie de leur Trust Flow (une peu comme la pagerank qui se transmet de liens en liens mais là on parle de confiance)
Si j’ai des liens qui pointent de sites qui ont eux même des liens de ces sites de confiance, je récupérè une partie du trust flow mais moindre.
Est ce bien ça?

François :
C’est exactement ça. De la même manière que le Citation Flow, le Trust Flow “s’hérite” de lien en lien.
La différence est que le Citation flow est calculé à partir de l’ensemble des liens de la planètes et de leurs relation les uns aux autres.
Le Trust Flow est calculé et “hérité” à partir d’une liste de sites ayant été évalués comme “de confiance”.

Quels sont les critères principaux pour cet échantillon de sites « de confiance »?

Nous ne communiquons pas sur les critères de cet échantillon afin de préserver la qualité de nos données en évitant que certains s’amusent à manipuler ces metrics (poke SEO high Level).
Toutefois, ce que je peux dire c’est que nous partons d’une liste de près de 1 millions de sites de confiance. Ce sont des sites qui présentent des caractéristiques communes et dont la qualité est indéniable.
Il y a évidemment les sites gouvernementaux, mais pas seulement.
Des sites comme Yellowpages, ou les sites de presse font partie de la liste.
Notre calcul du Trust Flow va bien au delà qu’une simple fonction inverse du nombre de liens provenant de sites de confiance, nous regardons les ancres, les titres, le link profile global du site pour valider si oui ou non le site parait “de confiance”.

Les recherches sur l’évaluation de la popularité ou de la confiance d’un site sont connues, et nombre de brevets ont été déposés par les Yahoo, Google, et Bing.
Selon nous, il y a fort à parier que les grands moteurs de recherche utilisent les mêmes méthodologies de calcul. Nous savons aujourd’hui que la technologie du Knowledge Graph, de même que Panda tend à “classer” les sites par catégories.
C’est pourquoi, nous avons abouti le Topical Trust Flow qui vise à donner une idée claire de la contribution d’une thématique donnée (Voyage, Business, News…) à l’indice de confiance de votre site.
A mon sens, ce paramètre prendra de plus en plus d’importance dans les mois et années qui viennent.

Lorsqu’un des sites de confiance expire et qu’il est remonté par la suite, est ce qu’il est de nouveau noté?

Mon avis en tant que SEO, est que Google modère le score d’un site dans ce cas là.
Concernant Majestic, si le site n’est plus en ligne, nous ne calculons plus son score, si demain il est de nouveau live, il retrouvera son score.

Concrètement un site qui n’est pas dans cet échantillon et qui le devient, comment se comporte son chiffre de Trust flow? Est ce qu’il y a une incidence directe? Quelle est l’incidence sur les sites vers lequel il pointe?

Statistiquement le nombre de sites de cette liste est suffisamment grand pour que l’on ait pas besoin de l’alimenter.La question ne se pose donc pas.
Néanmoins, nous prévoyons d’améliorer la qualité de la liste en l’enrichissant à termes avec des sites trustés par pays. Ce qui améliorera les données disponibles en vue d’un référencement localisé.

Comment est reparti le Trust Flow à à l’intérieur d’un site? (est ce que c’est le même principe que le pagerank?)

Oui exactement.

Comment est réparti le Trust Flow d’un site à l’autre?

J’ai un exemple concret à te donner
Sur un nouveau nom de domaine (mono page – aucun historique), il y a 1 seul backlink qui vient d’une home page
Cette home page a 51 RD, un Trust Flow de 20 et un Citation Flow de 26 (28 et 13 sur le domaine racine). Il y a 172 liens sur cette page dont 167 internes et 5 externes (pas de nofollow)
Le nouveau nom de domaine, après que Majestic ait découvert le lien, attribue à la page un Trust Flow de 10 et un Citation Flow de 10 (6 et 15 sur le domaine racine)

Est ce que tu peux expliquer ça (ou la manière dont ça fonctionne en général)?

François :
Je ne peux pas commenter le détail du calcul pour des raisons de confidentialité.

Qu’est le Citation Flow et comment ça fonctionne?

De ce que je sais, c’est le potentiel SEO (ce qui est appelé communément le “jus”) que peut t’envoyer une URL. Tu pourrais re-expliquer?

François :
Le Citation Flow caractérise la popularité d’une URL.
Il est calculé à partir de la popularité des liens qui pointent vers la page.
Ce critère est calculé notamment à partir du nombre de liens total et du nombre de refdomains. C’est pourquoi, un site spammy peut avoir un Citation Flow satellitaire et un Trust Flow très bas.
En général, les sites dans ce cas sont sujets à des pénalités de type Pinguin.

On prend une page qui a 100 liens externes. On en supprime 99. Le citation flow augmenterait en théorie?

Dans ce cas elle contribuerait effectivement plus à la popularité du lien qui reste.

Cette même page qui a 100 backlinks venant de 100 RD qui sont situés sur 1 meme serveur. Si j’utilise 1 serveur unique / RD avec des classes d’IP différentes, je fais augmenter le CF du coup?

En théorie oui.
Notez quand même que Google est un régistrar et qu’il parvient à identifier des groupes de sites appartenant au même propriétaire, peu importe le nombre d’IP différentes utilisées.

Comment est reparti le CF à à l’intérieur d’un site? Est ce que la page d’accueil transmet, par exemple, le CF sur le même principe que la PR?

Oui, de la même manière que le pagerank.

Est ce que vous faites une différence entre des liens en dofolow et des liens en nofollow? Les liens en nofollow sont il pondérés à la baisse mais quand même pris en compte sur des sites trustés?

Oui nous faisons la différence et elle est évidemment prise en compte dans nos Flow Metrics. (peut petre plus de détails plus tard)

 

Nombre domaines référents

A partir de combien de refering domains, d’après toi, le TF et le CF deviennent des indicateurs fiables pour juger de la qualité et de la puissance d’un site?

François :
Comme je l’ai souvent dit, ce qui compte, c’est la qualité des liens. Mieux vaut peut de liens de bonne qualité que beaucoup de qualité basse ou moyenne.
Après tout est une question de concurrence sur votre thématique. Un marché de niche vous permettra probablement d’avoir de bons résultats avec peu de liens et un Trust peu élevé.
Voir à ce sujet mon article sur l’évaluation de la concurrence (un tool inside ;-))

J’ai déjà rencontré des sites qui approchaient de 40 en Trust Flow avec seulement quelques refering domains et 1 backlink très puissant, donc ça ne me parait pas vraiment représentatif

François :
Si votre site a par exemple un lien depuis le site Elysee.fr, il faut avouer que cela est très puissant, donc je pense que l’évaluation est juste.
S’il y a des cas particulier, nous pouvons étudier la question. N’hésitez pas à utiliser le bouton de feedback sur notre site.

Trust Flow VERSUS Google Pengouin

Sur cette page , j’ai noté cette phrase : « Par expérience, quand il s’agît d’éviter des pénalités de type Pinguin, obtenir des liens depuis des sites à Trust Flow élevé (>40) permet de rester sous le radar. »
Un site qui a des liens de qualité mais avec uniquement des ancres optimisées (=profil de lien non naturel), est ce que vous le prenez en compte et baissez son trust flow?

François :
Non, ce que j’ai voulu dire, c’est qu’un site qui a un Trust élevé peut se permettre d’être plus laxiste sur la sur-optimisation de ses ancres.

Est ce que le calcul du TF et le CF du root domaine est la moyenne de toutes les pages du site?

Non c’est un peu plus complexe que cela. On peut dire que c’est une moyenne pondérée pour faire simple mais en réalité le calcul prend en compte également des éléments comme la qualité des ancres posées sur les sources de liens, les IP qui font des liens…
C’est une mesure assez intelligente puisqu’elle prend en compte un ensemble de paramètres au delà de la moyenne bête et méchante. Ainsi, un NDD dans ta thématique principale (Topical) qui te fait un lien avec une belle ancre va transmettre un peu plus de Trust que si c’est une url ou un « cliquez ici ». C’est ainsi que dans l’état de l’art des moteurs de recherche les éléments sémantiques se transmettent.

Diverses questions pratiques

Pour de l’échange de liens ou du rachat de NDD, tu conseilles des sites qui ont une courbe qui suit au maximum la ligne noire sur le graph (voir au dessus), c’est bien ça? Et si possible la partie foncée des points vers le haut?

François :
Oui aux deux questions

 

Si je prends un NDD expiré (on va dire qu’il n’a des backlinks que sur sa HP) et je fais une 301 vers un autre site. Comment ça se passe au niveau de la transmission du TF / CF du NDD expiré vers le nouveau ND?

François :
Elle sera pondérée, mais tu recevras du jus.

 

J’ai cru comprendre que l’on pouvait utiliser une API light gratuite pour récupérer le TF et le CF. Est ce vrai?
Quelles sont les limitations ou contraintes? Il y a une doc en Français?

François :
Oui il y a une API gratuite.
Il n’y a pas de doc en français, mais les limitations sont suffisamment larges pour que tu n’atteignes pas les limites.
Par exemple c’est la light api qui est inclue dans la toolbar de seobook.

 

Je prends l’exemple de 3 home page de sites de e-commerces connus. Tu choisirais lequel en priorité pour poser un lien?

    • fnac.com qui est en
      • 10 600 RD
      • 522 000 backlinks
      • trust flow à 70
      • citation flow à 57
      • 478 liens internes
      • 606 liens externes (une 20aine en nofollow)
    • grosbill.com qui est en
      • 970 RD
      • 73 000 backlinks
      • trust flow à 52
      • citation flow à 47
      • 434 liens internes
      • 3 liens externes
    • cdiscount.com qui est en
      • 3600 RD
      • 1 300 000 backlinks
      • trust flow à 49
      • citation flow à 57
      • 744 liens internes
      • 42 externes (dont 28 en nofollow)

François :
Fnac.com sans hésiter, le trust est très bon et supérieur au CT. c’est gage d’une grande qualité.

 

Majestic SEO c’est quoi?

C’est un ensemble d’outils en ligne qui permettent d’analyser les backlinks d’un site web. A la différence de leur principal concurrent, ahrefs, ils disposent d’une solution qui leur permet de crawler et d’indexer le web de manière autonome (pas de scrap de google).
A l’heure actuelle leur crawler a parcouru 743 903 776 993 pages ce qui en fait une des bases de données du web les plus exhaustives.
Au niveau des refreshs, leur BDD est mise à jour toutes les heures et les metrics sont recalculés tous les jours.
Une offre gratuite (avec inscription) permet de tester en version restreinte leurs outils SEO et déjà de récolter quelques informations sympas.

Mes utilisations principales :

  • Analyse des backlinks de son site
  • Analyse des backlinks des concurrents
  • L’analyse de noms de domaines expirés, de sites partenaires, annuaires, etc…

La première étape consiste à rentrer l’URL à analyser, choisir l’index et à valider.

majestic_seo

Fresh index et Historic Index : lequel choisir ?

Ce sont deux notions importantes à comprendre :

  • Fresh index : les outils afficheront les résultats issus du crawl des 90 derniers jours.
    On peut considérer que cela représente les backlinks les plus à jours, l’état « en cours » du profil de liens
  • Historic index : cet index contient tous les liens découverts par Majestic SEO sur les 6 dernières années
    Sont inclus les liens toujours en ligne et ceux supprimés depuis 2007 (la suppression est signalée avec une croix)

 

Onglet Summary

Page information / Subdomain Information / Domain information

C’est la synthèse qui regroupe les principales informations au niveau linking d’une URL, d’un sous domaine ou d’un root domain : ce sont les 3 inputs radio juste en dessous du champ de recherche.
(Si vous sélectionnez l’analyse uniquement d’une URL vous n’aurez pas le détail des ‘external backlinks’ : répartition des images, liens nofollow, redirects, frames et liens supprimés)

Note : pour garder une vision globale, l’outil affiche une synthèse des infos de l’index non sélectionné aussi.

Les résultats affichée sont les suivants :

  • Referring domains : nombre de domaines uniques qui font des liens vers l’URL cible.
    A ça se rajoutent le nombre d’IP et les IP de classe C
  • External backlinks : nombre total de backlinks
    En dessous leur répartition : liens images, lien en nofollow, redirections (301, 302 et meta refresh), frames ou iframes et deleted.

Backlink History

On retrouve dans cette partie un aperçu graphique du nombre de backlinks à gauche et du nombre de domaines référents à droite, en non cumulatif.
C’est intéressant pour mesurer les impacts de certaines actions.
En fonction de l’index choisit, c’est sur les 90 derniers jours ou le 12 derniers mois.

majestics_seo_backlinks_historyBacklinks

C’est le top 5 des backlinks sur la période que vous avez choisie.

Anchor text

C’est un graphique représentant les 10 ancres les plus utilisées sur la période choisie.

 

Onglet Backlinks

Cette rubrique regroupe l’ensemble de vos backlinks classés par Citation Flow (du plus important au moins important).
3 informations sont listées pour chaque lien :

  • URL du backlink
  • Ancre du lien
  • URL de votre page

Pour chacune de ces 2 URLs, vous pouvez grâce aux 4 icônes :

  • Accéder au lien
  • Créer un rapport
  • Voir la page dans Majestic site explorer
  • Ajouter à votre bucket

Une option permet de supprimer de l’affichage les backlinks qui ont été perdus (permet de voir ceux qui existent encore) et ce tableau de données est exportable dans un fichier *.csv.

Onglet New et Lost

Cette rubrique regroupe les nouveaux backlinks sur la période sélectionnée et les backlinks perdus
Idem, ils sont classés selon le Citation Flow

Onglet Anchor text

Cette rubrique regroupe les ancres des liens qui pointent vers le site analysé, classées par domaines référents décroissants (rubrique très utile si Google Pengouin est votre ami).
L’option ‘Clean Anchor text’ permet de nettoyer les ancres en enlevant la ponctuation

Onglet Ref Domains

Cette rubrique liste les domaines référents (différentes options permettent de classer par critères : alexa rank, ref domains, …)

François, Parle nous de ton nouveau projet OnCrawl

OnCrawl est le premier outil d’Onsite Monitoring entièrement dédié au référencement naturel. Vous y retrouverez une sorte de Webmaster Tools en mode Super Hero : les données sur votre site sont exhaustives et vous les mettez à jour quand vous voulez. Nous voulons redonner le pouvoir au référenceurs et leur permettre de s’affranchir du GWT.

 

En complément de cet article, je vous invite à lire l’article dédié au plugin Majestic de NinjaLinker

24 Responses to “15 questions à François Goube pour comprendre Majestic”

  • Je m’interroge sur la fréquence d’actualisation du trustflow ?

  • Hello, je crois que c’est MAJ quotidiennement ou très régulièrement.
    Je demande à François voir si il peut te répondre quand il a 5 minutes

  • Bel article sur Majestic. J’ai encore du mal à le maîtriser, mais ça va venir… grâce à ce post.

  • Article vraiment très informatif, par contre j’ai pas bien compris la conclusion que l’on devait en tirer: est ce qu’il dit qu’en gros il faut un site qui ait un TF suppérieur au CF ? Et que c’est à ce moment là que votre site est perçu comme étant de bonne qualité ?

  • l’ outil majesticseo de meme que semrush ou encore secockpit fait desormais partie de la boite a outil du parfait seo amha

  • @supref : les sites spammy ont généralement un CF elevé (bcp de backlinks) et un TF faible (liens de mauvaise qualité)
    Si tu as a un TF supérieur au CF c’est donc un indicateur de qualité (il faut un minimum de backlinks et un minimum de CF aussi, forcément)

  • C’est toujours intéressant d’avoir des explications détaillées sur les flow metrics car tous les SEO utilisent ces indicateurs sans forcément les comprendre. La notion de Trust Flow est souvent incomprise d’ailleurs.

    Pour ma part, ce que j’ai parfois des difficultés à saisir, ce sont les différences entre les indicateurs pour l’URL, le sous-domaine et le domaine principal.

    Par exemple, lorsqu’un site est en http://www., on obtient parfois des scores très bons sur http://www.site.com mais inférieurs lorsque l’on analyse le domaine principal (site.com).

  • Bonjour,
    Donc, si je comprends bien, il faut plutot se focaliser sur le TF pour un lien ? Enfin, merci pour les explications claires car j’avais du mal entre TF et CF.

  • @jeromeweb Ok, merci d’avoir pris la peine de répondre (dieu sait que peu de webmestres le font). Si on résume l’interview le point le plus important est que le TF est l’indicateur le plus important à prendre ne considération même si le CF ne doit pas être négligé, non ?

  • @Cedric,
    Dis moi si tu comprends mieux avec cet exemple :
    – URL : http://www.monsite.com
    – Sous-domaine : http://www.monsite.com/* (toutes les pages qui commencent par http://www.)
    – Domaine monsite.com/* (toutes les pages du domaine – tu peux avoir des pages qui commencent par http://www.monsite.com , http://sousdomaine1.monsite.com, http://sousdomaine2.monsite.com etc…)
    Parfois la page d’accueil a de très bons indicateurs mais les pages profondes du domaines sont pourries, ça fait donc baisser la notation globale sur domaine principal.

    @Mickel, le Trust Flow flow va te permettre de savoir ou non si le site a des liens de qualité (donc ce qu’il va te transmettre) donc oui c’est à privilégier. Après il faut un minimum de CF pour que ça t’envoie vraiment du jus.
    Il ne faut pas oublier non plus qu’un site qui a un fort trust flow peut quand même être pénalisé par pengouin si le profil d’ancre est sur optimisé

    @Supref avec plaisir (désolé par contre je dégage tes URLs profondes sur les comm)
    En complément de la réponse ci dessus, moi j’essaye de privilégier des des sites qui ont un TF >= au CF et dont au moins les 25 premiers % des ancres ne sont pas optimisées.
    Après on peut aller plus loin en regardant la fréquence des nouveaux backlinks, backlinks perdus, les thématiques des backlinks etc…mais ça prend une plombe 🙂

  • Hum … je vois bien ce que tu veux dire. Mais il me semblait que les Flow Metrics étaient des indicateurs de « cumul » et non de « moyenne ». Je n’arrive pas expliquer ça autrement.

    Prenons un exemple : (domaine/sous-domaine/url | TF | CF)
    site.com | 15 | 10
    http://www.site.com | 18 | 20
    http://www.site.com/url1 | 20 | 25

    Si une URL a un CF de 25, c’est qu’elle reçoit déjà une certaine quantité de liens. Cette URL est bien sur le domaine site.com. Donc site.com reçoit également ces liens. Comment peut-il avoir un CF plus faible, alors qu’il reçoit en plus des liens de l’URL en question, les liens qui pointent vers ses autres pages (home page, site.com/url2, etc.)

    Idem pour le Trust Flow. Si une URL en particulier reçoit du trust (des liens depuis des domaines trustés, directement ou indirectement), site.com en bénéficie également non ??

  • Je pense que c’est une moyenne et que le fait de faire des liens sortants ça fait diminuer ton CF : ça se répartit au niveau interne et des liens sortants

    J’envoie un message à François 😉

  • Merci pour les infos.
    Un détail : regardez de près le profil des « liens » externes de la page d’accueil de la Fnac : 99% de liens pointent vers diverses pages du réseau de sites et du sous-domaine … de la FNAC elle-même.

  • C’est pas faux 🙂
    On voit bien sur le summary que le ratio IP / refering domains est particulier (sites satellites et widget)

  • Merci pour ces précisions très utiles. J’utilise Majestic presque tous les jours et je ne comprenais pas bien la différence entre le TF et le CF. Mise à jour réussi. Bravo pour tes billets. Merci et bonne continuation.

  • Super interview bien complémentaire à l’article que j’avais rédigé sur le TF et CF !
    Merci Jérôme !

  • Très belle article qui résume bien l’univers de Majestic

  • Le gros avantage de Majestic (qui a perdu SEO à son nom il y a quelques mois) est selon moi son propre outil de crawl. Pas d’intermédiaire, des données de première main. Un peu comme le crawler de Moz (sans entrer dans la comparaison). L’investissement est bien plus important mais à long terme c’est un gage de qualité. C’est pourquoi j’utilise volontier leurs outils plutôt que ceux des aggrégateurs.

  • Alors moi j’ai du question…
    C’est l’histoire d’un site qui rank bien et quand on regarde dans Majestic il est bien dans la bonne thématique au niveau du TTF. Sauf que quand je regarde les BL faits sur ce site… il n’existe aucun BL issu d’un site de cette thématique. Comment est-ce possible ?
    Merci

  • @Emilie,
    le TTF s’hérite de lien en lien, cela peut venir du fait que les sites qui font des BL recoivent eux-même beaucoup de BL depuis cette thématique.
    Cela étant dit, je pense que le cas est un peu bizarre. Tu peux nous donner l’url ou m’envoyer ça en MP via email / twitter / whatever ici http://fra.ncois.eu ?

  • @Emile,
    J’ai vu ton url sur twitter, cela confirme ma réponse précédente.
    1. Ton site a peu de Refdomains
    2. Les refdomains ont tous en commun d’avoir un TTF ‘Arts et Musique’. C’est donc bien la thématique la plus prépondérante.
    🙂

  • Pour info, l’url en question : https://t.co/yjwFcLJ9Ye

  • Et non François justement… les ref domaines ne sont pas du tout dans la musique… j’ai envoyé le screen des thématiques des ref domaines sur Twitter. On constate qu’aucun des domaines ref n’a pour thématique la musique…

  • Merci pour cet article qui explique tout en détail ! tout est clair maintenant !

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *