Connaître le poids de la diffusion des liens internes de son site internet est une préoccupation majeure de tout référenceur. Cependant certaines personnes peuvent encore se poser la question sur le bien fondé de cette démarche SEO. Voici quelques atouts d’une visualisation de vos liens :
- Connaître et identifier les pages qui prennent plus de jus que d’autres
- Apprécier le maillage interne de son site internet
- Connaître la corrélation existante entre les différentes pages
- Définir la profondeur de son site en prenant pour origine l’accueil (home) du site
- Déterminer rapidement les pages orphelines pour corriger le tir si possible
- Apprécier la qualité de son champ sémantique (avec la formation des clusters)
J’ai récemment été confronté à ces problématiques chez DataLog Finance, éditeur de logiciels de trésorerie, connu notamment pour sa payment factory.
Le principe est simple, récupérer les liens internes via des crawlers, ceux que j’utilise sont les suivants : Xenu, Screaming Frog et Linkexaminer. Pour la suite de cet article, nous utiliserons Screaming Frog (la dame grenouille). Ce dernier est gratuit jusqu’à 500 URLs sinon il devient payant. J’avais déjà évoqué une belle astuce pour l’utiliser presque gratuitement.
Crawler le site à visualiser
On lance le logiciel. Dans le menu principal, on choisit le « mode spider ». Ensuite rentrer l’URL du site à analyser puis cliquer sur « star » pour démarrer le scan du site. Une fois le crawl terminé, nous passons à la phase suivante.
Crawl du site avec Screaming Frog
Exports des URLs et traitement des données
Aller maintenant sur l’onglet « Bulk Export » puis sélectionner « All Inlinks » comme le démontre le schéma ci-dessous puis enregistrer votre fichier au format xsl.
Ouvrez le fichier exporté sous excel et suivez les étapes suivantes pour traiter correctement des données :
- Nous n’allons conserver que les trois premières colonnes (Type, Source, Destination)
- Supprimer les doublons. Pour cela, cliquer sur l’onglet « Données » d’Excel puis sur « Supprimer les Doublons » Dans mon cas j’ai eu 3051 cases supprimées comme par magie.
- Filtrer la première colonne « Type » pour ne conserver que les liens, donc les HREF. Comprenez que les IMG, JS, CSS etc. seront éliminés.
- Eliminer de la colonne source les éventuels liens qui ne sont pas des liens de votre site. Dans mon cas, il n’y en avait pas.
- Débarrassez-vous de la colonne « Type ». Nous n’en n’aurons plus besoin. 🙂
- Enregistrer le fichier exactement en « edges.csv » après avoir renommé « Destination » en « Target ».
Tableau des liens
- Enregistrer une deuxième fois le fichier en « nodes.csv » en renommant « Source » en « Id » et « Target » en « Destination ».
Tableau des nœuds
Visualiser votre site avec Gephi
Télécharger Gephi et installer le logiciel sur votre bécane. Il vaut mieux avoir un bon ordinateur pour ne pas voir le logiciel bloqué ou tourné au ralenti.
Une fois Gephi lancé, créer un nouveau projet, donner lui un nom et enregistrer sans plus attendre le projet. Gephi à tendance à beaucoup ramer parfois, cela vous évitera de perdre votre travail. Voici le reste de la procédure.
Import du fichier « nodes.csv » dans Gephi
- Rendez-vous sur le deuxième onglet « Laboratoire de données »
- Rassurez-vous d’être dans le « tableau des données »
- Trouver l’onglet « Importer feuille de calcul ». Nous importerons en premier le fichier nodes.csv en prenant soin de choisir l’option « Table des nœuds »
- Cliquer ensuite sur « Suivant » pour valider.
- Cliquez ensuite sur « Terminer »
Importations des nodes (tableau des nœuds)
Import du fichier « edges.csv » dans Gephi
- Suivre la même procédure que précédemment en important cette fois le fichier « edges.csv » et en choisissant l’option « Table des liens ».
- Si la petite case « créer les liens manquant » n’est pas cochée, ca sera à vous de la cocher
- Cliquer sur « terminer »
En vous rendant dans le premier onglet « vue d’ensemble », vous allez trouver un schéma très touffu et illisible. Pas de panique, ce n’est pas la poudre de perlimpinpin que Gephi vous jette aux yeux, c’est juste qu’il reste encore un peu de travail pour améliorer le graphe.
Vue d’ensemble
Donner du poids aux liens dans Gephi
Tout en restant dans l’onglet « vue d’ensemble » nous allons faire un certain nombre d’action dans le sous-onglet « Aspect » :
- Cliquer sur « Nœuds » puis sur « Taille ». Ensuite choisir « Ranking » puis choisir « degré entrant »
- Définir ensuite vos tailles minimales et maximales
- Cliquer sur « Appliquer » tout en bas
Euuuuh rien de spécial ne se passe après ces actions. Pas de panique, nous passons à la spatialisation.
Spatialisation dans Gephi
La spatialisation est un algorithme utilisé par Gephi afin de rapprocher certains éléments ayant une certaine corrélation. Nous allons utiliser « Force Atlas 2 ». Pour se faire :
- Chercher l’onglet « Spatialisation », soit en bas, soit en haut mais à gauche
- Sélectionner « Force Atlas 2 »
- Dissuader les Hubs : oui
- Empêcher le recouvrement : oui
- Influence du poids des liens : moi j’ai mis 15 mais mettez ce qui vous arrange
- Répulsion approximative : non
- Nombre de processus : moi j’ai mis 10 mais mettez ce qui vous arrange
- Puis vous exécutez le programme. Il va tourner et au bout de quelques minutes vous pouvez l’arrêter
spatialisation
A partir de ce moment, vous allez y voir plus clair. Les pages ayant plus de liens seront forcément plus grosses.
Visualisation brute
Un clic droit sur un lien et vous allez pouvoir déterminer la page en question.
Prévisualisation du graphe dans Gephi
Vous pouvez réaliser une prévisualisation de votre travail en vous rendant dans l’onglet « Prévisualisation » tout en haut. Une là, cliquer sur « Rafraichir » tout en bas. Vous allez voir une jolie figure que vous pourrez exporter et montrer à vos clients.
Prévisualisation
Sur cette base vous pourrez conseiller votre client sur les différentes optimisations à mettre en place.
D’autres confrères on également écrit sur le même sujet, il peut être intéressant pour vous d’aller lire leurs publications afin de découvrir d’autre façons d’appréhender le sujet :
- Pourquoi et comment utiliser Gephi en SEO d’Axel JANVIER sur le site seomix.fr
- Visualiser son maillage interne avec Gephi de Charles ANNONI sur le site GDM-PIXEL
Le SEO est une discipline où la communauté est très forte. Rencontrer du monde lors des événements, permet de découvrir de nouvelles pratiques et techniques. Il a d’ailleurs été question de Gephi et de bien d’autres sujets à Que du Web à Deauville les 27 et 28 Avril 2017. Un grand merci à Julien JIMENEZ qui m’a offert une place d’une valeur de 186 € pour les deux jours de conférences. Vous pouvez allez jeter également un œil sur mon site 🙂