Connaître le poids de la diffusion des liens internes de son site internet est une préoccupation majeure de tout référenceur. Cependant certaines personnes peuvent encore se poser la question sur le bien fondé de cette démarche SEO. Voici quelques atouts d’une visualisation de vos liens :

  • Connaître et identifier les pages qui prennent plus de jus que d’autres
  • Apprécier le maillage interne de son site internet
  • Connaître la corrélation existante entre les différentes pages
  • Définir la profondeur de son site en prenant pour origine l’accueil (home) du site
  • Déterminer rapidement les pages orphelines pour corriger le tir si possible
  • Apprécier la qualité de son champ sémantique (avec la formation des clusters)

J’ai récemment été confronté à ces problématiques chez DataLog Finance, éditeur de logiciels de trésorerie, connu notamment pour sa payment factory.

Le principe est simple, récupérer les liens internes via des crawlers, ceux que j’utilise sont les suivants : Xenu, Screaming Frog et Linkexaminer. Pour la suite de cet article, nous utiliserons Screaming Frog (la dame grenouille). Ce dernier est gratuit jusqu’à 500 URLs sinon il devient payant. J’avais déjà évoqué une belle astuce pour l’utiliser presque gratuitement.

Crawler le site à visualiser

On lance le logiciel. Dans le menu principal, on choisit le « mode spider ». Ensuite rentrer l’URL du site à analyser puis cliquer sur « star » pour démarrer le scan du site. Une fois le crawl terminé, nous passons à la phase suivante.

Scan du site

Crawl du site avec Screaming Frog

Exports des URLs et traitement des données

Aller maintenant sur l’onglet « Bulk Export » puis sélectionner « All Inlinks » comme le démontre le schéma ci-dessous puis enregistrer votre fichier au format xsl.

Ouvrez le fichier exporté sous excel et suivez les étapes suivantes pour traiter correctement des données :

  • Nous n’allons conserver que les trois premières colonnes (Type, Source, Destination)
  • Supprimer les doublons. Pour cela, cliquer sur l’onglet « Données » d’Excel puis sur « Supprimer les Doublons » Dans mon cas j’ai eu 3051 cases supprimées comme par magie.
  • Filtrer la première colonne « Type » pour ne conserver que les liens, donc les HREF. Comprenez que les IMG, JS, CSS etc. seront éliminés.
  • Eliminer de la colonne source les éventuels liens qui ne sont pas des liens de votre site. Dans mon cas, il n’y en avait pas.
  • Débarrassez-vous de la colonne « Type ». Nous n’en n’aurons plus besoin. 🙂
  • Enregistrer le fichier exactement en « edges.csv » après avoir renommé « Destination » en « Target ».
edges

Tableau des liens

  • Enregistrer une deuxième fois le fichier en « nodes.csv » en renommant « Source » en « Id » et « Target » en « Destination ».
nodes

Tableau des nœuds

Visualiser votre site avec Gephi

Télécharger Gephi et installer le logiciel sur votre bécane. Il vaut mieux avoir un bon ordinateur pour ne pas voir le logiciel bloqué ou tourné au ralenti.

Une fois Gephi lancé, créer un nouveau projet, donner lui un nom et enregistrer sans plus attendre le projet. Gephi à tendance à beaucoup ramer parfois, cela vous évitera de perdre votre travail. Voici le reste de la procédure.

Import du fichier « nodes.csv » dans Gephi

  • Rendez-vous sur le deuxième onglet « Laboratoire de données »
  • Rassurez-vous d’être dans le « tableau des données »
  • Trouver l’onglet « Importer feuille de calcul ». Nous importerons en premier le fichier nodes.csv en prenant soin de choisir l’option « Table des nœuds »
  • Cliquer ensuite sur « Suivant » pour valider.
  • Cliquez ensuite sur « Terminer »
import-nodes

Importations des nodes (tableau des nœuds)

Import du fichier « edges.csv » dans Gephi

  • Suivre la même procédure que précédemment en important cette fois le fichier « edges.csv » et en choisissant l’option « Table des liens ».
  • Si la petite case « créer les liens manquant » n’est pas cochée, ca sera à vous de la cocher
  • Cliquer sur « terminer »

En vous rendant dans le premier onglet « vue d’ensemble », vous allez trouver un schéma très touffu et illisible. Pas de panique, ce n’est pas la poudre de perlimpinpin que Gephi vous jette aux yeux, c’est juste qu’il reste encore un peu de travail pour améliorer le graphe.

vue d'ensemble

Vue d’ensemble

Donner du poids aux liens dans Gephi

Tout en restant dans l’onglet « vue d’ensemble » nous allons faire un certain nombre d’action dans le sous-onglet « Aspect » :

  • Cliquer sur « Nœuds » puis sur « Taille ». Ensuite choisir « Ranking » puis choisir « degré entrant »
  • Définir ensuite vos tailles minimales et maximales
  • Cliquer sur « Appliquer » tout en bas

Euuuuh rien de spécial ne se passe après ces actions. Pas de panique, nous passons à la spatialisation.

Spatialisation dans Gephi

La spatialisation est un algorithme utilisé par Gephi afin de rapprocher certains éléments ayant une certaine corrélation. Nous allons utiliser « Force Atlas 2 ». Pour se faire :

  • Chercher l’onglet « Spatialisation », soit en bas, soit en haut mais à gauche
  • Sélectionner « Force Atlas 2 »
  • Dissuader les Hubs : oui
  • Empêcher le recouvrement : oui
  • Influence du poids des liens : moi j’ai mis 15 mais mettez ce qui vous arrange
  • Répulsion approximative : non
  • Nombre de processus : moi j’ai mis 10 mais mettez ce qui vous arrange
  • Puis vous exécutez le programme. Il va tourner et au bout de quelques minutes vous pouvez l’arrêter
spatialisation

spatialisation

A partir de ce moment, vous allez y voir plus clair. Les pages ayant plus de liens seront forcément plus grosses.

Visualisation brute

Visualisation brute

Un clic droit sur un lien et vous allez pouvoir déterminer la page en question.

Prévisualisation du graphe dans Gephi

Vous pouvez réaliser une prévisualisation de votre travail en vous rendant dans l’onglet « Prévisualisation » tout en haut. Une là, cliquer sur « Rafraichir » tout en bas. Vous allez voir une jolie figure que vous pourrez exporter et montrer à vos clients.

prévisualisation

Prévisualisation

Sur cette base vous pourrez conseiller votre client sur les différentes optimisations à mettre en place.

D’autres confrères on également écrit sur le même sujet, il peut être intéressant pour vous d’aller lire leurs publications afin de découvrir d’autre façons d’appréhender le sujet :

  • Pourquoi et comment utiliser Gephi en SEO d’Axel JANVIER sur le site seomix.fr
  • Visualiser son maillage interne avec Gephi de Charles ANNONI sur le site GDM-PIXEL

Le SEO est une discipline où la communauté est très forte. Rencontrer du monde lors des événements, permet de découvrir de nouvelles pratiques et techniques. Il a d’ailleurs été question de Gephi et de bien d’autres sujets à Que du Web à Deauville les 27 et 28 Avril 2017. Un grand merci à Julien JIMENEZ qui m’a offert une place d’une valeur de 186 € pour les deux jours de conférences. Vous pouvez allez jeter également un œil sur mon site 🙂