SEO cheat sheet

SEO recommandations for devs

Sommaire

Balises html importantes pour le SEO
Les formulaires et le web invisible
Les framework JavaScript modernes
La duplication de contenu
Robots.txt et sitemap.xml
- Le fichier robots.txt
- Le fichier sitemap.xml
Structure et navigation
Redirections
Maillage interne (à faire)
Images
Performances (à faire)
Gestion des langues

Balises html importantes pour le SEO

La balise `<title>`

Peut-être la balise la plus importante de toutes. Son contenu apparait dans le titre de l'onglet du navigateur et dans le texte en bleu dans les résultats de recherche Google. Le contenu de la balise <title> n'est pas visible dans le contenu de la page, c'est une balise 'meta'. Voir la balise h1 pour le titre principal

Chaque page du site doit avoir une balise <title> unique incluant les mots-clés pertinents.

Une balise <title> non optimisée :

<head>
  <title>Accueil</title>
</head>

Une balise <title> optimisée :

<head>
  <title>Location bureaux Nantes - Bureaux locaux</title>
</head>

La balise <title> doit :

faire entre 50 et 70 caractères de long
être présente sur chaque page
être unique (différente sur toutes les pages)
contenir les mots-clés importants pour la page (idéalement au début)

un titre bien écrit influence le taux de clic

La balise meta description

Elle sert à décrire le contenu de la page. Elle apparait dans le texte en noir pour chaque résultat de recherche sur Google. Son contenu n'est pas pris en compte pour le SEO mais elle influence le taux de clic.

<head>
  <meta name="description" content="Nantes : 296 annonces de location de bureaux à Nantes sur BureauxLocaux.com. Trouvez les bureaux de votre entreprise grâce à BureauxLocaux. Toutes les annonces immobilières pour les entreprises.">
</head>

La balise <meta name="description" content ="..."> doit :

faire environ 160 caractères de long
être présente sur chaque page indexable
être unique (différente sur toutes les pages)
décrire précisément le contenu de la page et inciter au clic

Son contenu n'est pas pris en compte pour le ranking mais une description bien écrite influence le taux de clic

La balise `<h1></h1>`

Elle correspond au titre éditorial de la page. Visible dans le contenu, ce titre est le titre principal de la page. Il doit décrire le mieux possible le contenu de la page en utilisant les mots-clés appropriés.

<h1>Location du bureaux à Nantes (44000) - 216 annonces</h1>

La balise <h1> doit :

être présente obligatoirement une et une seule fois par page
être unique (non dupliquée d'une page à l'autre)
décrire le contenu de la page précisément
contenir les mots-clés pertinents
avoir le même 'sens' que le contenu de la balise title, avec des mots-clés différents mais proches si possible

La balise meta robots

Elle indique pour une page donnée si celle-ci doit être indexée par les moteurs de recherche (= enregistrée ou non dans leur base de données) et si les moteurs de recherche doivent suivre les liens présents sur la page ou non

<head>
  <meta name=”robots” content=”index, follow” />
</head>

2 couples de valeurs possibles : [index, noindex] et [follow, nofollow]

index (default) : les moteurs sont autorisés à indexer (enregistrer) la page
noindex : les moteurs ne sont pas autorisés à indexer (enregistrer) la page
follow (default) : les moteurs vont suivre les liens présents sur la page
nofollow : les moteurs ne vont pas suivre les liens présents sur la page

Il existe d'autres directives possibles dans cette balise : Meta robots, maitrisez votre indexation avec cette balise (seo.fr)

La balise canonical

<link rel="canonical" href="https://myhomepage.com" />

Utiliser la balise canonical est un moyen d'indiquer à Google la copie originale d'une page donnée. La bonne utilisation de cette balise permet d'éviter les problèmes de contenu dupliqué.

Par défaut, chaque page devra avoir une balise canonical pointant vers elle-même (self-canonical)
Si la page B est une copie de la page A alors, la page B devra avoir une balise canonical pointant vers la page A

Ne pas utiliser de balise canonical sur la pagination (erreur fréquente)

Les framework JavaScript modernes

De nombreux sites utilisent aujourd'hui toutes les possibilités et les avantages que les frameworks JavaScript modernes comme React, Angular ou Vue proposent. Cependant, construire des sites web avec ces frameworks pose un problème majeur pour le SEO : les moteurs de recherchent ne "voient" pas la structure html "normale" nécessaire pour la bonne compréhension de son contenu. La plupart du temps, uniquement une <div> vide est rendue et présente dans le code source initial. Le framework se chargera d'appeler le reste du contenu et de construire le DOM qui ne sera pas vu par les moteurs de recherche.

Aujourd'hui, les moteurs de recherche interprètent de mieux en mieux le JavaScript et les différents frameworks. Cependant, il faut partir du principe que les moteurs de recherche allouent un temps donné à l'exploration d'un site. Au-delà de ce temps, il quitte le site même s'il n'en a pas exploré tous les contenus. L'interprétation d'une page générée via JavaScript sera beaucoup plus gourmande en ressources que la lecture d'un simple code source en html.

Bonnes pratiques à mettre en place lors de l'utilisation d'un framework JavaScript :

mettre en place le SSR (server-side rendering) : le serveur renvoit directement la version HTML de la page, lisible par les moteurs au moment du crawl.
le pre(rendering peut être une alternative si le SSR est trop complexe à mettre en place
Limiter la taille des bundles JavaScript. Les bundles de petite taille améliorent la vitesse de chargement, l'usage de mémoire et du processeur.
Explorer les Chrome DevTools’ Timeline & JavaScript Profiler pour analyser l'impact du JavaScript.

La duplication de contenu

Duplication de la homepage

Parfois, la page d'accueil d'un site est accessible sur plusieurs URLs, ce qui entraine de la duplication de contenu :

https://www.example.com/
https://www.example.com/home/
https://www.example.com/fr/
https://www.example.com/index.php
https://www.example.com/index.html

À retenir : S'il existe plusieurs URLs accessibles pour la page d'accueil, il faut en choisir une et rediriger (redirect 301) les autres vers la version choisie.

Duplication http/https

Depuis quelques temps, la plupart des sites sont passés en https. Pour autant, certains ont encore leur version http accessible avec un contenu identique, ce qui n'est pas un bon signal pour le SEO.

À retenir :

si le site est en https : s'assurer que les versions http des pages redirigent (redirect 301) vers leur version https
si le site n'est pas en https : le passer en https puis cf point précédent

Duplication à cause du / (slash) de fin

De la même manière que pour le https, une page peut être accessible avec et sans slash de fin (trailing slash) dans son URL. Exemple :

https://example.com
https://example.com/

À retenir : il faut choisir un modèle d'URL (avec ou sans / de fin) et s'assurer que l'autre version redirige (redirect 301) vers le version choisie

Duplication à cause des paramètres d'URL

Les paramètres d'URLs viennent parfois modifier l'apparence de la page sans modifier profondément son contenu (tri, type d'affichage etc.). Une fois encore, ceci peut générer du contenu dupliqué. Il faut donc être vigilent au cas par cas (en fonction du rôle des paramètres).

Exemple :

https://example.com/category/shoes/
https://example.com/category/shoes/?order=price_asc

Ces 2 pages affichent le même contenu. La seconde affiche les produits triès par prix croissant mais le contenu est le même.

À retenir : Lorsque les paramètres d'URLs génèrent de la duplication de contenu, il faut empêcher l'exploration de la version dupliquée. On peut donc par exemple (au cas par cas) :

empêcher l'exploration des paramètres dans le fichier robots.txt : Disallow: /*?*order=
utiliser une balise canonical pour indiquer l'URL de référence (ici l'URL sans paramètre)

Duplication externe

Duplication externe = contenu identique sur plusieurs domaines différents.

Pour être efficace, un contenu doit être unique. Le copier-coller est un no-go absolu en terme de SEO. Il faut être vigilant au contenu publié.

Exemple : importer (copier-coller) les articles de medias dans une section "presse" n'aura aucun bienfait pour le SEO

Robots.txt et sitemap.xml

Le fichier robots.txt

➡️ Le fichier robots.txt indique les répertoires et pages autorisés ou non à l'exploration des moteurs de recherche.

Il est le premier fichier consulté par les crawlers avant d'accéder aux contenu d'un site.
Il doit être situé à la racine du site : https://www.example.com/robots.txt
Il va permettre de donner des instructions de crawl aux robots.

La première ligne concerne l'identification des robots concernés par les règles qui vont suivre. Les crawlers sont identifiés grâce à leur user-agent

Il est possible de donner des instructions différentes en fonction du crawler qui passe sur le site :

user-agent: * : les règles s'appliqueront à tous les robots
user-agent: Googlebot : les règles ne s'appliqueront qu'à Googlebot

Les directives Allow et Disallow :

Allow: / : autorise l'accès à tout le site
Disallow: / : interdit l'accès à tout le site
Allow: /directory : autorise l'accès à tout le répertoire 'directory'
Disallow: /directory : interdit l'accès au répertoire 'directory'

Les règles se cumulent, c'est à dire qu'on peut interdire l'accès à tout un site sauf un répertoire précis :

User-agent: *
Disallow: /
Allow: /directory

❗ IMPORTANT : On indique l'adresse du fichier sitemap.xml de cette manière à la fin du fichier robots.txt :

Sitemap: https://www.example.com/sitemap.xml

Exemple de fichier robots.txt par défaut sur Wordpress :

User-agent: *

# On empêche l'indexation des dossiers sensibles
Disallow: /wp-admin
Disallow: /wp-includes
Disallow: /wp-content/plugins
Disallow: /wp-content/cache
Disallow: /trackback
Disallow: /*.php$
Disallow: /*.inc$
Disallow: /*.gz$

# On désindexe la page de connexion (contenu inutile)
Disallow: /wp-login.php

Sitemap: https://www.example.com/sitemap.xml

Le fichier robots.txt propose de nombreuses options et subtilités que nous n'allons pas détailler ici. Pour plus d'infos, rendez-vous sur cet article : https://smartkeyword.io/seo-technique-seo-robots-txt/

L'expert SEO fera des recommandations sur la manière de remplir correctement ce fichier.

Le fichier sitemap.xml

➡️ Le fichier sitemap.xml communique l'ensemble des URLs indexables aux moteurs de recherche.

Il doit être accessible à la racine du site, idéalement à cette adresse : https://www.example.com/sitemap.xml. Si ça n'est pas le cas, une redirection 301 redirect permanent sera à mettre en place pour rediriger .sitemap.xml vers cette url.

Le fichier sitemap.xml peut ensuite être soumis directement à Google via Google Search Console

Syntaxe du fichier sitemap.xml :

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>http://www.example.com/foo.html</loc>
    <lastmod>2019-06-04</lastmod>
  </url>
  <url>
    <loc>http://www.example.com/foo-bar.html</loc>
    <lastmod>2019-06-04</lastmod>
  </url>
</urlset>

urlset : encapsulation de l'ensemble des URLs
loc : URL absolue de la page répondant en HTTP 200 OK
lastmod : date de dernière modification

❗ ATTENTION : un fichier sitemap ne peut pas contenir plus de 50 000 URLs. Dans ce cas, utiliser un index de sitemaps.

Index de sitemaps

Lorsque le site comporte un très grand nombre de pages ou lorsqu'il en compte plus de 50 000, l'index de sitemaps devient indispensable. Il faut alors créer des fichiers sitemaps différents (par catagories par exemple) et les lier dans un fichier sitemapindex :

<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <sitemap>
    <loc>https://example.com/sitemap1.xml</loc>
    <lastmod>2019-01-01T18:23:17+00:00</lastmod>
  </sitemap>
  <sitemap>
    <loc>https://example.com/sitemap2.xml</loc>
    <lastmod>2019-01-01</lastmod>
  </sitemap>
</sitemapindex>

Génération du fichier sitemap

Les performances de chargement sont importantes également pour le fichier sitemap.xml. Celui-ci doit se charger rapidement. C'est pourquoi il est vivement recommandé de générer un fichier statique à intervales réguliers plutôt que de "générer" le fichier à la volée à chaque appel de l'url /sitemap.xml.

Par exemple : générer toutres les 2 heures en tâche CRON le fichier sitemap avec les URLs mises à jour.

Les images dans le sitemap

Pour faciliter l'exploration des images, on peut aussi les inclure dans le sitemap. C'est une action recommandée lorsque l'enjeu SEO est important autour des images pour le site. La syntaxe est simple, comme pour le fichier sitemap.xml classique, chaque URL (<loc>) est associée aux images intégrées sur celle-ci (<image:image>) :

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
        xmlns:image="http://www.google.com/schemas/sitemap-image/1.1">
  <url>
    <loc>http://example.com/sample.html</loc>
    <image:image>
      <image:loc>http://example.com/image.jpg</image:loc>
    </image:image>
    <image:image>
      <image:loc>http://example.com/photo.jpg</image:loc>
    </image:image>
  </url> 
</urlset>

Les pages à y inclure, celles à exclure

De manière générale on y intègre toutes les pages que l'on souhaite voir indexées sur les moteurs de recherche.

Dans le fichier sitemap, exclure :

la pagination au-delà de la 1ère page
les pages de la section privée (avec formulaire de connexion)
les URLs avec paramètres (s'il existe des équivalents avec URL clean)
les pages "pauvres" (profil, attachement, dossier de redirections, login, logout...)

Les formulaires et le web invisible

Le "web invisible" désigne en fait l'ensemble des contenus non accessibles aux moteurs de recherche. Il peut s'agir de contenus volontairement masqués aux robots car payants (abonnement), restreints (mot de passe), ou non accessibles grâces à différentes directives (robots.txt, meta robots etc.).

La plupart des contenu non accessibles ne le sont pas volontairement. Les robots d'exploration n'ont tout simplement pas les moyens de les crawler car ils sont accessibles derrière un formulaire.

Un robot d'exploration ne rempli ni ne valide les formulaire sur le web. Google ne précise pas la taille de l'appartement qu'il veut acheter comme nous le précise Oseox.

En définitive, les contenus qui sont accessibles uniquement après validation d'un formulaire sont parfaitement invisibles. L'exploration de ces contenus n'aura jamais lieu et le site ne se positionnera jamais grâce à ces contenus.

Exemple : sur un site immobilier, les annonces ne sont accessibles qu'après une recherche avec le module de recherche du site. Google ne verra jamais les annonces.

Solutions :

Utiliser le maillage interne pour rendre les contenus accessibles via des liens hypertextes (ex : un lien vers la page "achat appartement Nantes" existe)
Ne pas utiliser les éléments de formulaire à la place des liens (un <button> n'a pas du tout le même rôle qu'un <a>)
Intégrer les contenus derrière les formulaires au sitemap xml pour offrir un second chemin de navigation en plus du maillage interne
Ne pas utiliser des éléments de formulaires pour charger la pagination (un <button> "Plus de résultats" ne sera jamais déclenché, les items resteront inaccessibles)

Structure et navigation

Structure HTML sémantique

Aujourd'hui, une structure HTML sémantique est un must pour chaque page web. La sémantique aide les moteurs de recherche à évaluer le contenu et à le proposer de la bonne manière aux utilisateurs. Il faut voir la structure sémantique comme la colonne vertébrale du site autour de laquelle s'articule tout le SEO.

utiliser les balises essentielles au SEO mentionnées ici
remplacer les <div> par les éléments sémantiques lorsque cela est possible : <header>, <nav>, <section>, <main>, <aside>, <article>, <footer>

Hiérarchie des titres

Les titres et sous-titres des contenus doivent être structurés avec les balises sémantiques appropriées. Il s'agit des balises <h1>, <h2>, <h3>, <h4>, <h5>, <h6>. Elles sont importantes pour le SEO et l'utilisabilité du site. Voici quelques points à retenir

Chaque page doit posséder obligatoirement un et un seul <h1></h1>
Le contenu de la balise <h1> doit être pertinent par rapport à la page et utiliser des mots-clés cohérents
Les balises de titres sont utilisées pour structurer le contenu central d'une page. On ne doit pas les retrouver dans les parties annexes (pas de <hn></hn> dans le header, menu principal, sidebar, footer etc.)
Les balises de titre n'ont pas pour rôle de styliser le contenu, c'est le rôle d'un CSS bien conçu. (ne pas utiliser une balise titre pour obtenir un certain style)

Un exemple de structure de titres correcte :

<h1>Titre principal</h1>
  
  <h2>Titre de la section 1</h2>
   
    <h3>Sous-titre 1.1</h3>
   
    <h3>Sous-titre 1.2</h3>
  
  <h2>Titre de la section 2</h2>
    
    <h3>Sous-titre 2.1</h3>
    
    <h3>Sous-titre 2.2</h3>

Structure des URLs

Les URLs sont une version humainement lisible des adresses IP des serveurs où sont hébergées les pages. Les moteurs de recherche les utilisent pour déterminer la pertinence d'une page par rapport à une requête de recherche. Elles sont donc importantes pour le référencement.

utiliser des URLs courtes et pertinentes. Idéalement avec des mot-clés
lorsqu'un utilisateur ou un moteur de recherche lit une URL, il doit savoir à quoi s'attendre à lire comme contenu
utiliser uniquement des tirets pour séparer les mots
utiliser uniquement des minuscules, sans caractères spéciaux
utiliser une structure de répertoires claire et simple

URL non optimisée :

https://www.myhomepage.com/blog/title/2379118/?ref_=ttep_ep1

URL optimisée :

https://www.myhomepage.com/shop/trainers/adidas/red-trainers-MB-6400TN

Fil d'Ariane

Pour les sites qui ont un grand nombre de pages et une architecture profonde (nombreuses catégories, sous-catégories etc.) il est recommandé d'utiliser un fil d'Ariane en haut de page pour faciliter la navigation. C'est une aide pour l'utilisateur mais également pour le SEO. En effet, le fil d'Ariane permet de multiplier les liens internes vers les pages "parents" de la page courante.

Exemple pour une fiche produit : le fil d'Ariane contient un lien vers les sous-catégories, vers la catégorie et vers l'accueil de la boutique

Le fil d'Ariane en html (visible sur la page) doit être accompagné des microformats correspondants pour faire comprendre aux moteurs de recherche qu'il s'agit bien d'un fil d'Ariane. On privilégiera le format JSON-LD lorsque c'est possible. Voir les recommandations de Google sur les microformats fil d'Ariane

Pagination

Un système de pagination efficace est indispensable pour un bon SEO. Celui-ci permettra aux robots et aux internautes d'accéder aux contenus les plus profonds en un minimum de clics.

Recommandation : pagination numéraire :

Sur une page n, on présentera les liens hypertextes vers les pages (quand elles existent) n-30, n-20, n-10, n-3,n-2, n-1, n+1,n+2,n+3,n+10, n+20,n+30. Les URLs de ces pages existent et son réécrites correctement (voir point suivant)

Bonnes pratiques sur les pages de listing :

les balises <title> et <h1> des pages de la série mentionnent le numéro de la page courant pour éviter la duplication (sauf page 1)
un emplacement est prévu pour un texte de 500 à 1500 mots sur la 1ère page de la série uniquement
les URLs sont réécrites idéalement sans paramètre (plutôt /page/3/ au lieu de ?page=3)
toutes les pages de la série doivent être en index, follow
toutes les pages de la série ont une balise canonical pointant vers elles-mêmes (self referencing canonical)
il n'est pas nécessaire d'inclure les pages paginées après la page 1 au fichier sitemap.xml
Google a indiqué ne plus prendre en compte les directives rel="prev" et rel="next", il n'est donc plus obligatoire de les utiliser

A éviter :

les systèmes '< précédent - suivant >' qui ne permettent de naviguer que d'une page à l'autre sans saut possible (contenus profonds inaccessibles)
le lazy-loading (JS très mal interprété par les moteurs)
les boutons 'charger la suite' déclenchant un script Javascript

On peut proposer ses systèmes en plus de la pagination numéraire par liens hypertextes mais il ne doivent en aucun cas être les seuls moyens de naviguer.

Exemple de pagination non optimisée : les contenus sont inaccessibles à cause du bouton en JS:

Exemple de pagination optimisée : liens hypertextes et contenus profonds accessibles aisément :

URLs de pagination

Les URLs des pages de listing doivent être 'propres' et facilement compréhensibles. On utilisera donc la réécriture d'URL pour masquer les paramètres s'ils sont utilisés à la base.

Une URL de pagination non optimisée : https://www.bureauxlocaux.com/location/nantes/?page=3&offset=20

Une URL de pagination optimisée : https://www.bureauxlocaux.com/location/nantes/page/3/

la page 1 doit toujours avoir la même url : idéalement /location/nantes/ ou /location/nantes/page/1 mais jamais les 2 à la fois (prévoir une redirection si c'est le cas)

Redirections

Les redirections permanentes 301 Moved Permanently ou temporaires 302 Found sont indispensables en SEO pour indiquer aux moteurs de recherche les nouvelles URLs des pages qui auraient migrées. En effet, les moteurs de recherchent gardent les URLs en mémoire et leur attribuent un certain 'score' SEO. Si une page change d'URL et que rien n'est fait alors celle-ci perd tout son potentiel SEO. Les redirections ont pour objectif de permettre la transmission d'une partie de ce potentiel aux nouvelles pages.

Dans quels cas utiliser les redirections ?

lors d'une refonte, lorsque les URLs sont modifiées
lorsqu'un produit n'est plus en stock
lorsqu'un contenu est modifié/déplacé

Maillage interne = 200 OK liens externes = redirections

Les redirections sont utiles pour les moteurs de recherche qui conservent les URLs des sites en mémoire. Elles sont également utiles à la gestion les liens externes pointant vers votre site, pour les internautes qui tentent d'accéder directement à un contenu. Ceux-ci vont alors solliciter une URL qui n'existe plus, ils vont donc passer par la redirection pour accéder au contenu demandé. Au sein du site, aucun lien ne devrait pointer vers une page en redirection (temporaire ou permanente). Les URLs courantes sont connues et stables et le développeur à la main sur son contenu donc le maillage interne doit pointer uniquement vers des pages en statut http 200 OK

Maillage interne

Le maillage interne d'un site représente l'ensemble des liens créés au sein du site.

Le maillage est un élément déterminant pour un bon SEO car il permet de créer des accès vers les pages les plus importantes.

Les principes à retenir avec le maillage interne :

Les contenus importants doivent être accessibles via des liens (ex: les contenus "cachés" derrière les formulaires)
Les contenus doivent être accessibles en un minimum de clics
L'ancre des liens internes doit être optimisée (pour un lien vers la page des baskets pour homme préférez un lien "Baskets homme" à "Cliquez ici")

Images

Dans certains cas, lorsque le visuel à une place importante dans la stratégie web d'une marque, les images sont un atout majeur pour le SEO. Par exemple, pour un photographe, un site immobilier ou un site comme Pinterest, les images représentent un enjeu stratégique. Elle ne sont donc pas à négliger lors du développement web et doivent être optimisées au maximum.

Comment optimiser ses images pour le SEO :

utiliser des images à la bonne taille : charger autant que possible les images à leur taille d'affichage en pixels (px) et non en taille XXL redimensionnée en css
optimiser ses images : réduire le poids en ko en préservant le même niveau de qualité
utiliser de versions multiples de la même image pour son affichage responsive (grâce à l'attribut srcset)
utiliser des formats d'image nouvelle génération (JPEG 2000, JPEG XR et WebP)
si l'enjeu est grand et les images très nombreuses, utiliser un CDN pour les images (attention à bien le configurer pour que celles-ci soient indexables)
optimiser l'attribut alt="" sur chaque image importante et décrire son contenu comme vous le feriez à une personne malvoyante.
utiliser un nom de fichier compréhensible, qui permette d'identifier le contenu de l'image
ne pas négliger le contexte autour de l'image est important. Placer les images dans un contexte qui permette aux moteurs de recherche de comprendre l'image (paragraphe, légende, commentaires...)

Performances

Gestion des langues

La gestion des langues est un point important pour le SEO d'un site lorsque celui-ci est multilingue. Plusieurs critères sont à prendre en compte :

Sous-domaine ou répertoire

Les différentes versions de langue doivent être accessibles soit dans un répertoire du site :

https://www.example.com/fr/
https://www.example.com/uk/

soit via un sous-domaine du domaine principal :

https://fr.example.com/
https://uk.example.com/

Il est fortement déconseillé d'avoir les versions de langues accessibles via des paramètres d'URL : https://www.example.com?lang=uk

Correspondance entre les différentes versions de pages : balises `hreflang`

Pour que les moteurs de recherche puissent identifier les différentes versions internationales d'une page, il est nécessaire d'indiquer l'URL de ces différentes versions soit dans la balise <head> de la page, soit via le fichier sitemap.xml du site web

Balises hreflang dans la balise <head> de la page pour une page disponible en 3 langues (us, uk, fr) :

  <head>
    ...
    <link rel="alternate" hreflang="en-GB" href="https://www.example.com/uk/s/category/subcategory" />
    <link rel="alternate" hreflang="en-US" href="https://www.example.com/us/s/category/subcategory" />
    <link rel="alternate" hreflang="fr-FR" href="https://www.example.com/fr/s/category/subcategory" />
    ...
  </head>

Ces balises sont à intégrer dans toutes les versions de la page. Chaque page doit renvoyer vers toutes les versions de langue de cette même page, y-compris elle-même.

Balises hreflang dans le fichier sitemap.xml du site :

  <?xml version="1.0" encoding="UTF-8"?>
  <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
    xmlns:xhtml="http://www.w3.org/1999/xhtml">
    <url>
      <loc>https://www.example.com/fr/s/category/subcategory/</loc>
      <xhtml:link 
                 rel="alternate"
                 hreflang="en-GB"
                 href="https://www.example.com/uk/s/category/subcategory/"/>
      <xhtml:link 
                 rel="alternate"
                 hreflang="en-US"
                 href="https://www.example.com/us/s/category/subcategory/"/>
      <xhtml:link 
                 rel="alternate"
                 hreflang="fr-FR"
                 href="https://www.example.com/fr/s/category/subcategory/"/>
    </url>
  </urlset>

Dans le fichier sitemap.xml, on indique l'URL de la page comme habituellement (<loc></loc>) puis on indique chaqune des versions alternatives de cette URL via les balises <xhtml:link rel ="alternate" ... /> y compris sa propre URL (ici l'URL /fr est répétée).

Indiquer les versions localisées : https://developers.google.com/search/docs/advanced/crawling/localized-versions?hl=fr

Sources :

Name		Name	Last commit message	Last commit date
Latest commit History 133 Commits
README.md		README.md
fildAriane.jpg		fildAriane.jpg
pagination-gdc.jpg		pagination-gdc.jpg
pagination.jpg		pagination.jpg
recommandations-google.md		recommandations-google.md
snippet.jpg		snippet.jpg

ggglyke/seo-cheat-sheet

Folders and files

Latest commit

History

Repository files navigation