Qu’est-ce que l’audit technique d’un site internet ?
L’audit d’un site internet consiste à analyser et formuler le diagnostic de ce site. Cette analyse peut prendre plusieurs formes de recherches. L’audit pourra porter sur tout ce qui touche à l’aspect technique du site, comme sa structure, son code ou encore son référencement. Elle pourra recouvrir également toute la partie ergonomique du site.
Pourquoi faire l’audit technique de son site ?
Comme expliqué précédemment, l'audit vous permet d'analyser en profondeur votre site internet : son référencement naturel, son ergonomie, sa structure, etc. Elle permet de détecter tous les dysfonctionnements de votre site (baisse de trafic, mauvais ciblage, absence de conversions...) et donc grâce à un constat, d’en améliorer ses performances.
Une simple vérification manuelle permet de vérifier que votre site en « http » renvoie bien sur votre site en « https ». Dans la barre de recherche, il suffit de taper l’url « http » de votre site et vérifier que vous êtes bien redirigé vers l’url « https ». Si le renvoie ne se fait pas, vous pouvez mettre en place une redirection 301 du « http » vers le « https ».
Une vérification manuelle permettra également de voir si votre site en « www » renvoie bien sur la version de votre site sans « www ». Pour vérifier cela, il suffit de taper l’url avec « www » dans la barre de recherche, et vérifier que l’on est bien redirigé vers le site sans « www ». Si le renvoie vers le site sans « www » ne se fait pas, il est recommandé, tout comme le http, de mettre en place une redirection 301 du site avec « www » vers le site sans « www ».
Une vérification manuelle permettra de confirmer ou non que les extensions de votre domaine renvoient bien vers votre extension principale. Si « .fr » est l’extension principale choisie, alors toutes les autres extensions devront renvoyer vers « .fr ». Pour vérifier cela, il suffit de taper le nom de domaine dans la barre de recherche et de faire suivre celui-ci par plusieurs types d’extensions (« .com », « .eu » etc..) si le renvoie s’effectue normalement, la redirection fonctionne. Si ce n’est pas le cas, c’est que l’extension testée ne possède pas le domaine. Il faudra alors acheter le domaine à l’extension en question.
Les codes http permettent de reconnaître si une requête a réussi ou non, et si ce n’est pas le cas, de déterminer le type d’erreur. En d’autres termes, lorsqu’un internaute tente d’accéder à un site web, son navigateur envoie une requête au serveur web. En réponse à cette requête, le serveur va renvoyer un code d’état transmis dans l’en-tête HTTP. Il existe 5 grandes catégories de codes http :
Ce sont des codes qui indiquent une réponse informative de la part du serveur. Ils n’informent ni d’une erreur ni d’un succès, mais apportent juste une information au client. Il existe 3 types de codes informatifs :
Ce sont les codes qui indiquent que la requête a réussi. Parmi ces codes, le plus connu est le code 200 qui indique que tout est ok, c’est-à-dire que la page demandée a été trouvée et se charge correctement. Il existe également 3 autres types de codes importants :
Parmi ces codes de redirection, les plus connus sont les codes 301 et 302. Le code 301 signifie qu’une page a définitivement changé d’adresse, le serveur la redirige alors vers la nouvelle adresse. Le code 302 fonctionne de la même manière mais indique que le changement d’adresse de la page est juste temporaire. Il faut savoir que ce type de redirection n’est pas particulièrement apprécié des moteurs de recherche à cause du SEO.
Il conviendra de privilégier la redirection permanente 301. En effet, si vous utilisez une redirection 302, vous perdrez les backlinks (lien hypertexte qui permet d'envoyer un internaute d'un site web X vers un site web Y) que vous avez pu mettre en place ainsi que la popularité acquise.
Parmi ces codes de redirections, 3 autres sont très importants :
Le code 404 « page not found » est sûrement le plus connu de tous, puisqu’il indique que la page recherchée n’existe pas. La différence avec le code HTTP 410 « gone » est subtile.
Parmi les autres codes d’erreur, nous retrouvons également :
Les codes 5xx indiquent des erreurs du côté du serveur. Le plus courant est le code 503 qui signifie que le serveur n’est pas disponible. Il indique donc à l’utilisateur que le site consulté sera momentanément indisponible. Parmi ces codes 500, nous relevons également :
La balise “noindex” est mise en place sur une page web pour indiquer à Google de ne pas indexer cette page web. On l’utilise généralement pour des pages tel que les conditions générales de vente, les mentions légales, les pages de connexion à un espace connecté pour utilisateur etc. L’audit sur ce type de balises permettra de vérifier que toutes les pages qui contiennent cette balise sont bien les pages choisies par le client, et qui ne doivent donc pas être indexées par Google.
C’est la balise visible dans la page des moteurs de recherche, elle est donc visible pour les internautes. Il est important de ne pas faire d’erreur sur cette balise car c’est elle qui va servir au référencement naturel et donc au positionnement. Pour optimiser cette balise, il est important de respecter un nombre de caractère maximum afin que celle-ci ne soit pas tronquée. Il est recommandé de ne pas dépasser les 65 caractères, et de privilégier l’usage des minuscules. Il est donc important de vérifier que toutes les pages d’un site ont une balise title, qu’il n’y ait pas de titre en double, et que les titres ne soient ni trop courts (moins de 30 caractères) ni trop long.
La balise H1 correspond au plus gros titre d’une page, il doit être unique pour chaque site internet. La balise H2 correspond aux titres qui viennent dissocier chaque partie d’une page, ce sont des titres de césure. Lors d’un audit, il est important de faire les mêmes vérifications que pour les balises title.
La balise meta description correspond à la courte description qui suit le titre d’un site lorsqu’une requête est faite sur les moteurs de recherche. Elle doit respecter certaines règles bien précises pour garder toutes ses propriétés de référencement naturel. Elle doit résumer le contenu qui se trouve sur votre page, se limiter à 156 caractères, être bien structurée, avoir du sens, et contenir des mots-clés du sujet de votre page.
La profondeur des pages correspond au nombre de clic qu’il est nécessaire de faire depuis la homepage pour arriver jusqu’à la page désirée. Plus il y a de nombre de clic, plus la marge sera profonde. Il est recommandé de ne pas aller au-delà des 4 clics.
La pagination d’un site permet de créer des sous-pages de contenu lorsqu’il y en a beaucoup (par exemple les sites e-commerce avec des nombreux produits pour chaque catégorie). Plus précisément, c’est une technique d’organisation du contenu en plusieurs pages dynamiques. Pour vérifier que la pagination d’un site soit optimisée en terme de référencement, il est recommandé de bien mesurer la pertinence de celui-ci à l’aide d’un crawler et d’un analyseur de logs.
Le fil d’ariane permet d’indiquer à l’utilisateur et aux robots où ils se trouvent selon le plan du site. Il a une grande importance pour les robots qui se servent de ce code pour se repérer sur le site. Le fil d’ariane a une grande importance pour le SEO, car il permet de réduire le taux de rebond en guidant les visiteurs sur un site internet. Il permet également de faire des liens en arborescence, ce qui contribue au maillage interne. Il est donc important durant un audit de vérifier que le fil d’ariane est présent et pertinent sur un site.
L’url des pages web, ce sont les les liens qui vont apparaître sur les pages des moteurs de recherche, il est donc très important que ces urls soient optimisées. Lors d’un audit, il faut dans un premier temps vérifier que les urls respectent le format ASCII. Les fichiers au format ASCII (American Standard Code for Information Interchange) sont des fichiers textes qui permettent à un document d’être reconnu et lu facilement par n'importe quelle plateforme ou le système d'exploitation. Si les urls ne sont pas conforment, il faudra alors les convertir en ASCII.
C’est un tag qui se trouve dans le code HTML et qui indique aux robots des moteurs de recherche qu’une page web est la version principale afin de la différencier d’un contenu proche ou dupliqué. Cette balise n’est pas à négliger et permettra d’éviter que Google ne détecte du contenu dupliqué. Il faudra donc veiller à ce que cette balise soit placée sur toutes les pages de contenu dupliqué d’un site (ainsi les robots ne perdront pas de temps à analyser cette page et iront directement sur la page principale).
Une image trop lourde est une image qui ralenti un site internet. Il est donc important de les alléger au maximum, mais également de renseigner leur attribut ALT afin de confirmer à Google que l’image a bien un lien avec le contenu de la page.
Les fichiers robots.txt permettent d’indiquer aux robots de Google les pages web que vous ne souhaitez pas voir indexées ni crawlées. Pour vérifier que ce fichier a été mis en place et qu’il contient bien les pages souhaitées, il suffit de taper l’url du site dans la barre de recherche du navigateur, et de terminer l’url par « /robots.txt ».
Les fichiers sitemap sont la plupart du temps des fichiers xml qui indiquent aux robots Google les pages qu’il est préférable de crawler en priorité afin de les indexer. La vérification de ces fichiers pourra se faire via Google Search Console, dans la rubrique « Sitemap ».
Les données accessibles via Google Search Console sont des indicateurs clés dans l’audit d’un site, notamment d’un point de vue SEO. Google Search Console analyse les données d’un site et communique des informations sur son référencement. Il est donc important de s’attarder sur les erreurs que l’outils a pu relever sur un site internet.