Contactez-nous

Audit technique site internet


I) Les bases


Qu’est-ce que l’audit technique d’un site internet ?

L’audit d’un site internet consiste à analyser et formuler le diagnostic de ce site. Cette analyse peut prendre plusieurs formes de recherches. L’audit pourra porter sur tout ce qui touche à l’aspect technique du site, comme sa structure, son code ou encore son référencement. Elle pourra recouvrir également toute la partie ergonomique du site.


Pourquoi faire l’audit technique de son site ?

Comme expliqué précédemment, l'audit vous permet d'analyser en profondeur votre site internet : son référencement naturel, son ergonomie, sa structure, etc. Elle permet de détecter tous les dysfonctionnements de votre site (baisse de trafic, mauvais ciblage, absence de conversions...) et donc grâce à un constat, d’en améliorer ses performances.

II) Les principales vérifications techniques :


1) Les redirections


a) Le http(s) :

Une simple vérification manuelle permet de vérifier que votre site en « http » renvoie bien sur votre site en « https ». Dans la barre de recherche, il suffit de taper l’url « http » de votre site et vérifier que vous êtes bien redirigé vers l’url « https ». Si le renvoie ne se fait pas, vous pouvez mettre en place une redirection 301 du « http » vers le « https ».


b) Le www

Une vérification manuelle permettra également de voir si votre site en « www » renvoie bien sur la version de votre site sans « www ». Pour vérifier cela, il suffit de taper l’url avec « www » dans la barre de recherche, et vérifier que l’on est bien redirigé vers le site sans « www ». Si le renvoie vers le site sans « www » ne se fait pas, il est recommandé, tout comme le http, de mettre en place une redirection 301 du site avec « www » vers le site sans « www ».


c) Le TLD (Top Level Domains)

Une vérification manuelle permettra de confirmer ou non que les extensions de votre domaine renvoient bien vers votre extension principale. Si « .fr » est l’extension principale choisie, alors toutes les autres extensions devront renvoyer vers « .fr ». Pour vérifier cela, il suffit de taper le nom de domaine dans la barre de recherche et de faire suivre celui-ci par plusieurs types d’extensions (« .com », « .eu » etc..) si le renvoie s’effectue normalement, la redirection fonctionne. Si ce n’est pas le cas, c’est que l’extension testée ne possède pas le domaine. Il faudra alors acheter le domaine à l’extension en question.


2) Les codes http

Les codes http permettent de reconnaître si une requête a réussi ou non, et si ce n’est pas le cas, de déterminer le type d’erreur. En d’autres termes, lorsqu’un internaute tente d’accéder à un site web, son navigateur envoie une requête au serveur web. En réponse à cette requête, le serveur va renvoyer un code d’état transmis dans l’en-tête HTTP. Il existe 5 grandes catégories de codes http :


a) Les 1xx, les codes à but informatif

Ce sont des codes qui indiquent une réponse informative de la part du serveur. Ils n’informent ni d’une erreur ni d’un succès, mais apportent juste une information au client. Il existe 3 types de codes informatifs :

  • • Le code 100 : il indique simplement au client que tout s’est passé comme prévu. Il invite donc le client à poursuivre sa requête ou l’arrêter si celle-ci est terminée.
  • • Le code 101 : c’est une réponse à la requête Upgrade du client. En d’autres termes, il indique au client par quel protocole le serveur passe pour récupérer les données.
  • • Le code 103 : il informe le client du fait que le serveur a bien reçu la requête et qu'il est en train de la traiter. Il s'affiche lorsqu'aucune réponse de succès ou d'échec n'est encore disponible, mais que le serveur prépare une réponse.

b) Les 2xx, les codes OK

Ce sont les codes qui indiquent que la requête a réussi. Parmi ces codes, le plus connu est le code 200 qui indique que tout est ok, c’est-à-dire que la page demandée a été trouvée et se charge correctement. Il existe également 3 autres types de codes importants :

  • • Le code 201 : qui nous indique qu’une requête est créée
  • • Le code 202 : qui nous indique que la requête a été acceptée, mais qu’elle ne garantit pas de résultats
  • • Le code 204 : qui nous indique que la requête a été traitée mais qu’elle n’a aucune information à renvoyer

c) Les 3xx, les redirections

Parmi ces codes de redirection, les plus connus sont les codes 301 et 302. Le code 301 signifie qu’une page a définitivement changé d’adresse, le serveur la redirige alors vers la nouvelle adresse. Le code 302 fonctionne de la même manière mais indique que le changement d’adresse de la page est juste temporaire. Il faut savoir que ce type de redirection n’est pas particulièrement apprécié des moteurs de recherche à cause du SEO.

Il conviendra de privilégier la redirection permanente 301. En effet, si vous utilisez une redirection 302, vous perdrez les backlinks (lien hypertexte qui permet d'envoyer un internaute d'un site web X vers un site web Y) que vous avez pu mettre en place ainsi que la popularité acquise.

Parmi ces codes de redirections, 3 autres sont très importants :

  • • Le code 300 : qui indique qu’il y a plusieurs résultats pour répondre à la requête
  • • Le code 305 : qui indique qu’il faut à nouveau adresser la requête au serveur proxy (qui va jouer un rôle d'intermédiaire en se plaçant entre deux hôtes pour faciliter ou surveiller leurs échanges.)
  • • Le code 310 : qui indique qu’il y a trop de redirections, et que le client doit provoquer une action complémentaire pour que la requête puisse être conduite jusqu'à sa résolution finale.

d) Les 4xx, les erreurs côté client

Le code 404 « page not found » est sûrement le plus connu de tous, puisqu’il indique que la page recherchée n’existe pas. La différence avec le code HTTP 410 « gone » est subtile.

Parmi les autres codes d’erreur, nous retrouvons également :

  • • Le code 401 : accès non autorisé, l’utilisateur doit s'authentifier pour accéder à sa requête
  • • Le code 403 : accès interdit, l’utilisateur n'a pas les droits d'accès au contenu, le serveur va donc refuser l’accès à la requête
  • • Le code 408 : c’est lorsque le temps d’attente côté serveur est écoulé
  • • Le code 414 : l’URL de la requête est plus longue que ce que le serveur est en mesure d'interpréter
  • • Le code 429 : l'utilisateur a émis trop de requêtes dans un laps de temps donné
  • • Le code 450 : indique que le contrôle parental est activé et bloque l’accès à la page

e) Les 5xx, les réponses d’erreur côté serveur

Les codes 5xx indiquent des erreurs du côté du serveur. Le plus courant est le code 503 qui signifie que le serveur n’est pas disponible. Il indique donc à l’utilisateur que le site consulté sera momentanément indisponible. Parmi ces codes 500, nous relevons également :

  • • Le code 504 : ce code est envoyé lorsque le serveur sert de passerelle et ne peut pas donner de réponse dans les temps.
  • • Le code 510 : signifie que des extensions supplémentaires sont requises afin que le serveur puisse satisfaire la requête.

3) Les balises « noindex »

La balise “noindex” est mise en place sur une page web pour indiquer à Google de ne pas indexer cette page web. On l’utilise généralement pour des pages tel que les conditions générales de vente, les mentions légales, les pages de connexion à un espace connecté pour utilisateur etc. L’audit sur ce type de balises permettra de vérifier que toutes les pages qui contiennent cette balise sont bien les pages choisies par le client, et qui ne doivent donc pas être indexées par Google.


4) L’audit SEO de pages web :


1) La balise title

C’est la balise visible dans la page des moteurs de recherche, elle est donc visible pour les internautes. Il est important de ne pas faire d’erreur sur cette balise car c’est elle qui va servir au référencement naturel et donc au positionnement. Pour optimiser cette balise, il est important de respecter un nombre de caractère maximum afin que celle-ci ne soit pas tronquée. Il est recommandé de ne pas dépasser les 65 caractères, et de privilégier l’usage des minuscules. Il est donc important de vérifier que toutes les pages d’un site ont une balise title, qu’il n’y ait pas de titre en double, et que les titres ne soient ni trop courts (moins de 30 caractères) ni trop long.


2) Les balises H1 et H2

La balise H1 correspond au plus gros titre d’une page, il doit être unique pour chaque site internet. La balise H2 correspond aux titres qui viennent dissocier chaque partie d’une page, ce sont des titres de césure. Lors d’un audit, il est important de faire les mêmes vérifications que pour les balises title.


3) La balise meta description

La balise meta description correspond à la courte description qui suit le titre d’un site lorsqu’une requête est faite sur les moteurs de recherche. Elle doit respecter certaines règles bien précises pour garder toutes ses propriétés de référencement naturel. Elle doit résumer le contenu qui se trouve sur votre page, se limiter à 156 caractères, être bien structurée, avoir du sens, et contenir des mots-clés du sujet de votre page.


4) La profondeur des pages

La profondeur des pages correspond au nombre de clic qu’il est nécessaire de faire depuis la homepage pour arriver jusqu’à la page désirée. Plus il y a de nombre de clic, plus la marge sera profonde. Il est recommandé de ne pas aller au-delà des 4 clics.


5) La pagination

La pagination d’un site permet de créer des sous-pages de contenu lorsqu’il y en a beaucoup (par exemple les sites e-commerce avec des nombreux produits pour chaque catégorie). Plus précisément, c’est une technique d’organisation du contenu en plusieurs pages dynamiques. Pour vérifier que la pagination d’un site soit optimisée en terme de référencement, il est recommandé de bien mesurer la pertinence de celui-ci à l’aide d’un crawler et d’un analyseur de logs.


6) Le fil d’Ariane

Le fil d’ariane permet d’indiquer à l’utilisateur et aux robots où ils se trouvent selon le plan du site. Il a une grande importance pour les robots qui se servent de ce code pour se repérer sur le site. Le fil d’ariane a une grande importance pour le SEO, car il permet de réduire le taux de rebond en guidant les visiteurs sur un site internet. Il permet également de faire des liens en arborescence, ce qui contribue au maillage interne. Il est donc important durant un audit de vérifier que le fil d’ariane est présent et pertinent sur un site.


7) La structure des urls

L’url des pages web, ce sont les les liens qui vont apparaître sur les pages des moteurs de recherche, il est donc très important que ces urls soient optimisées. Lors d’un audit, il faut dans un premier temps vérifier que les urls respectent le format ASCII. Les fichiers au format ASCII (American Standard Code for Information Interchange) sont des fichiers textes qui permettent à un document d’être reconnu et lu facilement par n'importe quelle plateforme ou le système d'exploitation. Si les urls ne sont pas conforment, il faudra alors les convertir en ASCII.


8) La balise canonical

C’est un tag qui se trouve dans le code HTML et qui indique aux robots des moteurs de recherche qu’une page web est la version principale afin de la différencier d’un contenu proche ou dupliqué. Cette balise n’est pas à négliger et permettra d’éviter que Google ne détecte du contenu dupliqué. Il faudra donc veiller à ce que cette balise soit placée sur toutes les pages de contenu dupliqué d’un site (ainsi les robots ne perdront pas de temps à analyser cette page et iront directement sur la page principale).


9) L’optimisation des images

Une image trop lourde est une image qui ralenti un site internet. Il est donc important de les alléger au maximum, mais également de renseigner leur attribut ALT afin de confirmer à Google que l’image a bien un lien avec le contenu de la page.


10) Les vérifications d’indexation

a) Le fichier robots.txt :

Les fichiers robots.txt permettent d’indiquer aux robots de Google les pages web que vous ne souhaitez pas voir indexées ni crawlées. Pour vérifier que ce fichier a été mis en place et qu’il contient bien les pages souhaitées, il suffit de taper l’url du site dans la barre de recherche du navigateur, et de terminer l’url par « /robots.txt ».


b) Les fichiers sitemap :

Les fichiers sitemap sont la plupart du temps des fichiers xml qui indiquent aux robots Google les pages qu’il est préférable de crawler en priorité afin de les indexer. La vérification de ces fichiers pourra se faire via Google Search Console, dans la rubrique « Sitemap ».


c) Les rapports d’erreurs Google Search Console :

Les données accessibles via Google Search Console sont des indicateurs clés dans l’audit d’un site, notamment d’un point de vue SEO. Google Search Console analyse les données d’un site et communique des informations sur son référencement. Il est donc important de s’attarder sur les erreurs que l’outils a pu relever sur un site internet.

Adresse
12 bis rue Raynouard 75016 PARIS
Email
contact@goons.fr  
Téléphone
01 88 48 27 45