Les logs sont un incontournable pour tous les référenceurs. Les logs sont utilisés par les spécialistes du SEO dans l’analyse de site web. Ces données leur permettent de comprendre comment un moteur de recherche parcourt et analyse un site web. 

Comment faire une analyse de logs ? Quels sont les avantages ? Nous vous présentons tout ce qu’il faut savoir sur les analyses de logs pour le SEO.

Qu’est-ce que le log server et Access.log ?

Le fichier log ou Access.log est un fichier qui répertorie les événements se produisant sur le serveur qui héberge un site web. Une ligne dans un fichier log correspond à une demande du navigateur d’accéder à un élément du site web. Sur un fichier log, on est informé de : 

  • l’adresse IP à partir de laquelle a été envoyée la demande au serveur;
  • l’heure, la date et le type de requête du serveur;
  • les codes de statut de réponse HTTP ( 404, 200, …);
  • source de l’URL de la demande;
  • le User-Agent
  • etc.

Les avantages d’une analyse de logs pour le SEO

L’analyse de logs permet de mieux comprendre comment s’effectue le crawl de votre site web par un moteur de recherche. 

Nous vous expliquons ici ce qu’est un crawler SEO.

Vous pouvez savoir quelles pages ou parties de votre site web ont été crawlées par un moteur de recherche et à quelle fréquence. Selon ces données, vous pouvez chercher à détecter les pages les moins crawlées pour les optimiser ou vous concentrer sur les pages les plus performantes.

Vous avez aussi la possibilité de savoir si le crawl s’est effectué sur une version mobile ou desktop, quel code http a été renvoyé, et diverses autres informations. 

A travers ces données, vous pouvez comprendre comment Google, Bing et consorts perçoivent et analysent le contenu de votre site web, pour ensuite envisager une meilleure stratégie SEO.

Les informations à récolter lors d’une analyse de logs

Lors de l’analyse des logs de votre site web, plusieurs informations vous serviront pour booster votre SEO. Nous vous présentons les principales données à prendre en compte : 

Le contenu crawlé par Google

Avant tout, utilisez votre analyse de logs pour repérer les contenus crawlés par Google et ceux qui ne le sont pas. 

Ainsi, il est dans votre intérêt que Google crawle uniquement les pages de votre site web qui sont utiles à votre référencement. Par exemple, sur un site e-commerce, préférez que Google crawle une page produit plutôt qu’une page de formulaire. 

Veillez donc à ce que Google comprenne quels sont les contenus importants de votre site web. 

Si vous remarquez que Google n’explore pas une page que vous jugez importante, il est possible que le problème vienne d’un mauvais maillage interne ou de la faiblesse du contenu de la page. A vous d’analyser la page en question pour comprendre d’où vient le problème.

Avec le fichier log, vous pouvez aussi vérifier à quelle vitesse Google crawl votre site. 

Les codes HTTP

Les fichiers logs permettent également de connaître les codes de réponse http. Vous pouvez déceler les pages qui répondent correctement (code 200) et les pages avec des problèmes 3xx, 4xx ou 5xx.

Si votre Search Console vous informe des problèmes de codes http, il peut arriver qu’elle le fasse plusieurs jours en retard. En analysant les fichiers logs, vous pouvez avoir accès à ces informations bien plus rapidement. Vous pouvez aussi voir la proportion des codes d’erreurs http sur l’ensemble du site.

La vitesse de chargement

En SEO, la vitesse de chargement est un critère important. Un temps de chargement trop lent (plus de 3 secondes) est mauvais pour la qualité de l’expérience utilisateur, et de plus cela peut nuire à votre référencement.

Avec une analyse de logs, vous avez une vision globale des performances de votre site web et de son temps de chargement. Vous pouvez remarquer le moindre changement et le mesurer directement sur chaque page.

Comparer le crawl mobile vs desktop

Les recherches sur mobile n’ont jamais été aussi importantes. Dès lors, il est primordial de chercher à optimiser votre site web sur mobile. A travers une analyse de logs, vous pouvez savoir le nombre exact de visites sur mobile et desktop. Avec ces données, vous pouvez améliorer à la fois l’UX et le référencement de votre site web.

Le taux de crawl

Il est également possible de calculer le taux de crawl (crawl / nombre total de pages) ainsi que le taux de pages actives (nombre de pages actives / nombre total de pages) par catégories du site. On peut aussi mesurer le taux de crawl par niveau de profondeur du site. 

En résumé, le taux de crawl donne des indications sur la perception de votre site par les moteurs de recherche. Ce pourcentage indique le ratio entre le contenu global du site et ce qui est vu concrètement par les  moteurs de recherche.

Crawl Budget ou Budget Crawl

Le budget crawl détermine le nombre de pages maximum que Googlebot peut crawler en un laps de temps donné. Ce concept d’optimisation du budget crawl est discuté auprès des spécialistes du référencement. Certains estiment en effet que les problématiques de budget crawl ne concernent que les très gros sites.

Pour que le budget crawl alloué à votre site web soit mieux utilisé, plusieurs critères sont à prendre en compte. Vous pouvez éviter le contenu dupliqué, optimiser la navigation et les liens internes, ou encore pallier aux problèmes de type 4xx et 5xx. Ainsi, vous facilitez l’exploration et l’indexation  de votre site en ne faisant passer Google que sur des pages pertinentes. 

Comment réaliser une analyse de logs ?

Pour réaliser une analyse de logs, il faut importer les fichiers journaux  de votre serveur dans un outil d’analyse dédié. Voici quelques outils qui vous permettront de réaliser une analyse de logs pour votre site web : Log File Analyser de SEMrush, 1.fr,  Oncrawl, Screaming Frog… Pour plus de précisions, découvrez notre liste des 10 meilleurs outils SEO !