Hop, on va reprendre les publications et inaugurer notre nouvelle ligne éditoriale avec cet article ! Comme son nom l’indique judicieusement, il est destiné aux personnes qui découvrent le SEO, qu’elles souhaitent se renseigner davantage sur le sujet ou soient amenées à y toucher un peu dans leur métier.
Comme il faut bien commencer par quelque part, on va s’attaquer à l’audit SEO, qu’Aurélien Berrut qualifie avec justesse de psychanalyse digitale. Ne flippez pas, détendez-vous, ça va être tranquille. Il ne s’agit pas de brosser un portrait exhaustif de l’audit mais de survoler quelques points-clefs afin que vous puissiez les réutiliser sans problème au quotidien (ou comprendre de quoi parle votre pote ou collègue SEO).
Amis référenceurs, passez votre chemin : ce n’est pas pour vous, vous allez vous ennuyer.
C’est quoi un audit SEO ?
Un audit SEO, c’est un doc obscur de mille pages un document clair, synthétique et précis s’attachant à relever les facteurs néfastes ou bloquants pour le référencement naturel.
En d’autres termes, il s’agit de trouver les éléments qui pourraient ennuyer votre acquisition de trafic pour votre site (perso ou client). Nous allons partir du principe que tout élément n’ayant que peu ou aucun rapport avec le SEO est ici exclu de l’analyse. On s’en tape donc pas mal de la page LinkedIn mal gérée par le ghostwriter ou que le site ne soit pas très joli (sauf s’il n’est pas fonctionnel et fait fuir les visiteurs – là, c’est à prendre en compte). Nous allons volontairement simplifier et distinguer trois points dans l’audit :
- Une partie technique, où il sera question du nom de domaine, du serveur, de l’optimisation et du code (HTML, CSS, Javascript…) du site. En gros, c’est une partie pour nerds, vous allez devoir vous aider de plusieurs outils.
- Une partie sémantique, où l’on traitera des balises titles et des métadonnées, du choix pertinent (ou pas) des mots-clefs, du balisage (H1, H2…). Globalement, on s’intéresse ici aux contenus textes, c’est votre cerveau qui est sollicité.
- Une partie linking (liens), où l’on analysera les liens entrants vers son site. Si ce dernier est tout jeune, forcément, il ne faut pas s’attendre à en trouver beaucoup. Ça va mobiliser à la fois votre cerveau et quelques outils.
Maintenant que les choses sont au clair, passons en revue ces trois grands points.
La partie technique
Aussi primordiale qu’obligatoire, l’analyse de l’aspect technique d’un site va déjà vous permettre de mieux cerner son écosystème. Première chose : qu’est-ce qu’un site ? Rien de moins que de l’image et du texte mis en forme par du code, et trouvé grâce à une adresse (le nom de domaine). Grosso modo, on a là tout le contenu de l’analyse technique. Vous voyez, ce n’est pas sorcier.
1. Le nom de domaine. On va vérifier deux trucs, et pour commencer son âge : plus il est vieux, mieux c’est, c’est comme le pinard. Google va en effet mieux le considérer. Un domaine avec 10 ans de bouteille aura plus de poids qu’un domaine avec 6 mois au compteur. Ensuite, on vérifie sa syntaxe (la manière dont il est écrit). Pour ce dernier point, attention : les exact match (noms de domaine avec des mots-clefs correspondant à la thématique du site) comme sac-louis-vuitton-pas-cher.fr sont flag par Google (ils les repèrent facilement quoi… Avec tous les problèmes que ça peut poser). Aujourd’hui, on essaie de plus en plus de détacher le nom de domaine de sa thématique. Par exemple, un nom de domaine genre plicoupic.fr pour vendre des smartphones, bah c’est mieux que smartphone-pas-cher.fr. Pour vérifier tout ça, rendez-vous sur Whois.
2. Redirection du domaine. Pour le coup, c’est très simple. Est-ce que votre site monsite.fr redirige bien (redirection 301, et pas une autre, surtout pas une 302) vers www.monsite.fr, ou vice-versa ? Si ce n’est pas le cas, bravo ! Votre site est dupliqué, et ce n’est pas bon du tout pour lui. Vous pouvez vérifier ça via ce petit site.
3. Le serveur (hébergement). Un site web, comme son nom l’indique, existe sur le web. Il est donc hébergé quelque part ; eh bah, on va essayer de voir ce qu’il en retourne à ce sujet. Première chose : sa localisation géographique. Si votre site est français et vend des trucs en France, son serveur doit être français, point barre. Ni Allemand, ni Japonais, mais Français. Pourquoi ? Parce que Google est sensible à la localisation des serveurs. Pour checker ça, regardez sur Whois. Deuxième point : les domaines voisins. Avant d’aller plus loin, petit rappel : on distingue deux types de serveurs, les mutualisés (vous êtes en coloc’ avec d’autres gens) et les dédiés (vous êtes tout seul chez-vous). L’idéal, c’est d’avoir un serveur dédié, mais ce n’est pas toujours nécessaire et en plus ça coûte cher. Avec un serveur mutualisé, vous partagez vos ressources avec d’autres sites. Problème : si d’autres sites font des conneries, vous trinquez aussi.
4. Temps de chargement des pages. Plus un site est rapide, mieux c’est – si votre site est trop lent, Google risque de le déprécier. Et de toute façon, aucun visiteur attendra 10 secondes que votre page d’accueil charge : il va se barrer direct. En général, les sites sont lents à cause du poids des images (trop lourdes), d’un code dégueulasse (contactez votre dev’), de fichier Flash (lourd à charger), ou de trop nombreux fichiers Javascript / CSS chargés à la fois… Ou séparément. Pour vérifier tout ça, rendez-vous sur GTMetrix ou encore Webpagetest. GTMetrix a l’avantage de vous filer quelques pistes d’améliorations claires et explicites (attention, en anglais).
5. Racine du site. J’entends par là « tout ce qui se trouve à la racine du dossier de votre site ». Si vous n’avez pas accès au FTP, un site, c’est ni plus ni moins qu’un dossier avec des fichiers dedans. On va s’attacher à deux fichiers en particuliers, le sitemap et le robots.txt. Le sitemap (généralement en .xml) permet aux moteurs de recherche d’avoir une vue immédiate de l’ensemble du site – en gros, ça l’aide à comprendre où est quoi. Généralement, ce fichier est mis à jour automatiquement. Cela dit, si vous n’avez pas de sitemap, ce n’est pas dramatique. L’autre fichier important, c’est le robots.txt : il invite les moteurs de recherche à ne pas aller voir certains répertoires (mais rien ne lui interdit de ne pas les indexer, la différence est subtile !). Pour ne pas qu’il indexe certaines pages, vous devez utiliser une balise « noindex » dans l’entête HTTP de votre page. Pour vérifier si vous avez ces deux fichiers, il suffit de taper monsite.fr/sitemap.xml ou encore monsite.fr/robots.txt.
6. Architecture du site. Dans cette partie, on vérifie qu’il y a bien une page Mentions légales (obligatoire) et qu’elle est en noindex, que l’on a bien une page 404 (pour voir si vous en avez une, tapez n’importe quoi après la racine de votre nom de domaine, comme monsite.fr/sqkfjnhsdnf, si rien ne se passe ou que vous êtes redirigé sur la page d’accueil, félicitations, vous n’avez pas de page 404. Corrigez vite le tir), que les pages sont toutes monolingues (on ne mélange pas les torchons et les serviettes, sinon le moteur ne va rien comprendre), que vous avez des extensions de pages en .html (si vous n’en avez pas, tant pis, mais c’est un petit bonus. Et ne rajoutez pas d’extension en .html sinon vous allez péter toutes les URL) ou encore que votre menu de navigation ne comporte pas d’erreur. N’hésitez pas à aller vous balader dans le code source, voir si vous trouvez des choses aberrantes (comme du CSS par exemple, alors qu’il devrait se trouver dans un fichier à part).
7. Code source. Courage, c’est le dernier point ! Ici, on va vérifier que le doctype de votre page est bien en français (si votre site est français, naturellement). Il se présente comme ça, par exemple : html lang= »fr » (ça se trouve tout en haut, première ou deuxième ligne). Deuxième chose : vérifier que votre site n’est pas une abomination pleine d’erreurs de code. Pour ce faire, rendez-vous sur le W3C – si vous avez moult erreurs, contactez votre dev’, il se fera un plaisir de les corriger.
La partie sémantique
Toute aussi importante que la partie technique, la partie sémantique s’attache au contenu texte de votre site. La technique, ce sont les fondations et les murs de votre maison ; la sémantique, les meubles, la déco et tout le reste (attention, ce n’est pas péjoratif !). Si vous voulez vendre votre baraque à Google, il va falloir lui plaire au maximum.
1. Indexation. Votre site a-t-il bien été indexé par Google ? Autrement dit, a-t-il bien répertorié toutes vos pages ? On peut le vérifier facilement via la commande site: du célèbre moteur de recherche. Il vous suffit de taper site:monsite.fr et vous aurez aussitôt une liste de toutes les pages indexées. Si vous avez un site de 900 pages et qu’il vous retourne 10 résultats, vous pouvez d’ors et déjà en conclure que vous avez un sérieux problème sur les bras (quel que soit ce problème, à vous de trouver, les causes peuvent en être multiples !). Pour connaître le nombre de pages précis de votre site, vous devez le crawler, c’est-à-dire utiliser un petit logiciel qui va répertorier et vous afficher toutes vos pages. Citons les deux plus connus : ScreamingFrog (attention, limité à 500 URL – si vous en avez davantage, vous ne les verrez pas) et Xenu (plus austère). Vous pourrez ainsi vérifier que vous n’avez pas trop d’erreurs 404 (cela signifie page indisponible – avez-vous pensé à les rediriger (301) vers une page similaire ?) et que vos URL ont été réécrites à l’aide de mots-clefs (et non pas ressembler à de la bouillie, comme monsite.fr/dslkfjdsfjdkgh-01214564.php).
2. Balises Titles. Une balise Title, c’est le titre de votre page HTML – celui qui s’affiche dans les résultats de recherche, ou encore le truc qui s’affiche dans l’onglet de votre navigateur. Ecrire une Title qui envoie du bois, c’est un vrai exercice, délicat et souvent difficile, et il n’existe pas de recette miracle pour faire de bonnes titles ! En principe, elle ne doit pas dépasser 65 caractères (mais Google prend quand même en compte les titles plus longues), contenir des mots-clefs pertinents (les plus importants en premier) et, dans le même temps, donner envie de cliquer aux gens. C’est très dur, ouais. Si vous avez besoin de visualiser la tronche qu’aura votre title dans les résultats de recherche, utilisez Google SERP Snippet Optimizer.
3. Balise méta description. La balise meta description, c’est celle qui s’affiche en-dessous de votre title, soit la description du résultat de recherche. Elle a une importance moindre, quoique des tests SEO ont montré qu’on pouvait ranker avec un mot-clef contenu à l’intérieur ! Du coup, essayez de bien l’écrire pour aguicher l’internaute, avec des mots-clefs adéquats. Les commerçants gueulent dans les marchés pour attirer le chaland – la meta description, c’est un peu pareil.
4. Balise meta keyword. Elle ne sert plus à rien – dans le temps, les SEO la bourrinaient pour remonter facilement dans le classement, mais ça ne fonctionne plus. Si vous voyez des meta keyword sur votre site, esquissez un sourire et préconisez de les supprimer.
5. Balisage sémantique. Le balisage sémantique désigne la manière dont sont structurés les textes, à l’aide de balises h1, h2, h3 (les autres ne servent à rien). D’ailleurs, ce texte est balisé avec des Hn. Dans l’idéal, chaque page devrait comporter du texte (250-300 mots) et balisé avec des expressions-clefs pertinentes (celles sur lesquelles vous souhaitez vous positionner par exemple !). Si votre page parle de fromage, et que votre h1 (la balise la plus importante) est « C’est si bon », c’est zéro pour votre référencement. Pour rappel : une seule H1, plusieurs H2 et plusieurs H3. Si vous voyez plusieurs H1 sur votre page, ça ne va pas vous pénaliser, mais vous diluez la force des mots-clefs que vous y avez inclus. De même, une H2 sur « Mon panier » n’a rien à faire là : elle ne véhicule aucune valeur sémantique. Enfin, jamais de balise Hn vide, ni de balise Hn sur un lien ! Pour voir rapidement le balisage d’une page, vous pouvez installer l’extension Web Developer sur Chrome, ou SEOQuake (pensez à le laisser en « disable », sinon il va vous spammer de pub dans les résultats de recherche).
6. Mise en valeur des informations et page vide. Le texte est-il mis en valeur sur le site, avec du gras (<strong>) par exemple ? Graisser votre texte permet d’attirer l’attention des moteurs de recherche sur une expression en particulier. Quant aux pages vides, c’est-à-dire sans texte, elles sont à proscrire !
7. Texte caché. Si du texte est dissimulé à l’internaute, par quelque moyen que ce soit, c’est du cloaking. Et Google déteste le cloaking.
8. Duplication de contenus. Du contenu texte est-il dupliqué ? Pour le savoir, prenez un petit paragraphe, copiez-le, et recherchez-le dans Google. Si le même texte se trouve sur un ou plusieurs autres sites, bravo, votre site est dupliqué ! La duplication est pénalisante – contactez vite ces sites pour faire retirer ces contenus. Pour rappel, chaque texte doit être unique, original et personnalisé. Et même si vous reprenez une phrase et la reformulez en changeant quelques bouts, ça s’appelle du near duplicate – et c’est repéré aussi !
9. Images. Ici, il convient de vérifier plusieurs choses. Premièrement, les images sont-elles correctement affichées et imbriquées ? Si une image est imbriquée dans une <div> et pas sous la forme <img src= »chemindelimage » alt= »texte pour les moteurs »>, ce n’est pas bon du tout : Google ne peut pas la lire. Ensuite, une image doit bénéficier d’un petit texte descriptif dans la balise alternative (ALT). Sans elle, les moteurs de recherche ne peuvent pas prendre en compte votre image et savoir de quoi il s’agit (encore que, ça ne sera bientôt plus le cas…).
10. Arborescence. Dans cette partie, on vérifie que le site bénéficie bien d’une arborescence (par exemple, monsite.fr/categorie1/sous-categorie1/page1.html) – s’il n’en a pas, c’est ballot mais à vous de voir si vous voulez péter toutes les URL et les rediriger vers des URL propres et ordonnées. On vérifie ensuite le niveau de clics pour accéder aux informations – le maximum étant de 3. Google n’ira pas fouiller dans des pages super profondes (et le visiteur non plus).
11. Maillage interne. Enfin, on vérifie dans cette dernière partie le maillage interne, c’est-à-dire les liens internes de votre site. Sont-ils correctement écrits (en <a href= »lien »>blabla</a> ?). Tous les liens peu importants (vers les mentions légales, les crédits, le panier d’achat, les réseaux sociaux…) doivent être en nofollow, c’est-à-dire que vous empêchez votre site de leur transmettre de l’autorité. Facebook n’en a vraiment pas besoin, rassurez-vous.
La partie linking
En comparaison des deux parties précédentes, le linking sera assez concis. La partie technique = fondations et murs de votre maison. La partie sémantique = meubles et déco. Le linking… C’est l’adresse que vous envoyez à Google pour qu’il trouve votre baraque ! Mais devra-t-il trouver votre adresse dans un bouge infect ou sur le tableau d’affichage de la Mairie ?
1. Ratio liens dofollow / nofollow. Le référencement naturel n’est en rien naturel (oui, c’est paradoxal). On passe notre temps à nous jouer de l’algorithme en espérant qu’on ne soit pas flag. Du coup, quand on fait des liens, il faut veiller à ne pas être trop suspects… A commencer par le ratio dofollow (transmission d’autorité) et nofollow (pas de transmission d’autorité). Si vous faites un lien depuis un important site gouvernemental en dofollow, vers votre tout nouveau site de vente de sac Louis Vuitton, Google va forcément trouver ça suspect. Il faut essayer de garder un profil de liens correct, avec un peu de nofollow, pour que ça ait l’air naturel.
2. Ancres de liens. Les liens restent très puissants pour booster un site. Malheureusement, pour reprendre la phrase d’un collègue, chaque lien est potentiellement toxique. Les ancres de liens sont à la fois très puissantes mais aussi… Très facilement repérables par Google, qui ne manquera pas de blacklister votre page ou votre site si vous bourrinez un peu trop. Par exemple, une ancre telle que « sac Louis Vuitton » utilisée partout, sans aucune variation, va vous attirer des ennuis tôt ou tard. Le mieux, c’est de diversifier au maximum vos ancres pour que, encore une fois, cela ait l’air « naturel ».
3. Types de liens. Là encore, un seul mot : diversifier. Ne pas hésiter à faire des liens en texte ou en image (oui, c’est possible).
Différents outils existent pour l’analyse des liens, le plus connu étant Ahref. Mais vous avez également OpenLinkProfiler, WebMeUp, ou encore Majestic SEO (ce dernier mériterait néanmoins un billet à lui tout seul, je ne rentrerai donc pas dans les détails).
Un armement sommaire… mais ça fera le job
Certes, nous ne sommes pas rentrés dans les détails et il y aurait encore mille choses à dire sur l’audit SEO (la partie concurrentielle par exemple, que nous n’avons pas développée ici). Mais ces quelques points vous suffiront à survivre à votre premier baptême du feu. Il faut surtout vous dire qu’il n’existe pas d’audit SEO parfait – chacun le fait à sa sauce, dans son coin.
Certains privilégieront tel aspect, d’autres prendront en compte les réseaux sociaux, d’autres encore ignoreront tel point… Il y a sans doute autant de modèles d’audit SEO que de cailloux sur terre. Le plus important reste d’être rigoureux et, surtout, attentif aux petits détails – le SEO s’accomplit brique par brique !