Un fichier llms.txt est un simple fichier texte placé à la racine de votre site (à l'adresse votresite.ma/llms.txt) qui indique aux modèles d'IA quelles pages sont les plus importantes, propres et fiables à lire en priorité. C'est l'équivalent d'un sommaire écrit pour les machines : au lieu de laisser ChatGPT, Claude ou Perplexity deviner où se trouve votre meilleur contenu au milieu du menu, du pied de page et des bannières de cookies, vous le leur servez sur un plateau, en Markdown, sans bruit.
Ce guide explique ce qu'est réellement llms.txt, pourquoi cette convention émerge, comment le rédiger avec un exemple concret, en quoi il diffère de robots.txt, et où en est honnêtement son adoption au Maroc et ailleurs.
Qu'est-ce qu'un fichier llms.txt exactement ?
Le llms.txt est une proposition de standard apparue en 2024, portée par Jeremy Howard (cofondateur de fast.ai). L'idée part d'un constat technique simple : une page HTML moderne est un cauchemar pour un modèle de langage. Elle contient du JavaScript, des balises de navigation, des scripts publicitaires, des fenêtres de consentement CNDP, des widgets de chat. Pour un humain, le navigateur range tout ça proprement. Pour une IA qui dispose d'une fenêtre de contexte limitée, c'est du gaspillage : elle brûle ses jetons à lire du code au lieu de votre savoir.
Le fichier llms.txt résout ce problème en pointant vers vos pages clés, idéalement en versions Markdown allégées. Il dit à la machine : "voici qui nous sommes, voici nos dix ressources qui comptent, lis celles-là". C'est de l'hospitalité algorithmique. Vous facilitez le travail du crawler, et en retour vous augmentez la probabilité qu'il comprenne correctement votre offre et qu'il vous cite.
Il faut le distinguer de deux cousins. D'abord le sitemap.xml, qui liste toutes vos URL pour les moteurs de recherche classiques : c'est exhaustif et destiné à l'indexation. Le llms.txt, lui, est curé : on n'y met que l'essentiel, hiérarchisé, en langage naturel. Ensuite le robots.txt, qui dit ce qui est autorisé ou interdit au crawl. Le llms.txt ne bloque rien : il recommande. Les deux fichiers sont complémentaires, pas concurrents.
À quoi sert vraiment ce fichier pour le GEO ?
Le llms.txt s'inscrit dans la logique du GEO (Generative Engine Optimization), cet ensemble de leviers qui visent à se faire citer par les IA plutôt qu'à se classer dans dix liens bleus. Si le sujet est nouveau pour vous, commencez par notre guide GEO complet pour le Maroc, qui pose le décor.
Concrètement, le fichier joue trois rôles.
Il réduit le coût d'extraction
Quand un assistant doit récupérer votre contenu en temps réel (Perplexity, ChatGPT en mode recherche, Google AI Overviews), chaque milliseconde et chaque jeton comptent. Une page Markdown propre se lit en une fraction du coût d'une page HTML lourde. Vous devenez la source "facile", et les sources faciles sont citées plus souvent.
Il désambiguïse votre entité
Un bon llms.txt commence par un bloc qui dit clairement qui vous êtes : nom, métier, zone géographique, ce que vous proposez. Pour une agence de Casablanca ou de Rabat, c'est l'occasion d'ancrer "Maroc", "darija", "MAD" et vos services dans la tête de la machine, sans qu'elle ait à le déduire.
Il met en avant vos meilleures preuves
Vous choisissez quoi mettre en vitrine : vos études de cas, vos guides phares, votre page de contact. Vous orientez la lecture vers ce qui construit votre autorité plutôt que de laisser l'IA tomber au hasard sur une vieille page obsolète.
À quoi ressemble un fichier llms.txt ?
Le format est volontairement minimaliste : c'est du Markdown. Un titre H1 avec le nom du site, un paragraphe de résumé (souvent dans un bloc de citation), puis des sections H2 contenant des listes de liens annotés. Voici un exemple réduit pour une PME marocaine fictive :
# Atlas Bois (menuiserie sur mesure, Casablanca)
> Atlas Bois conçoit et fabrique du mobilier sur mesure pour
> particuliers et professionnels au Maroc. Devis en MAD,
> livraison Casablanca, Rabat, Marrakech.
## Ressources principales
- [Nos réalisations](https://atlasbois.ma/realisations.md): galerie de projets livrés
- [Tarifs et délais](https://atlasbois.ma/tarifs.md): fourchettes de prix en dirhams
- [Demander un devis](https://atlasbois.ma/devis.md): formulaire de contact
## Guides
- [Choisir son bois](https://atlasbois.ma/guides/bois.md): chêne, hêtre, contreplaqué
## Optionnel
- [Mentions légales](https://atlasbois.ma/legal.md)
Notez la section "Optionnel" : c'est une convention du standard. Elle signale au modèle que ces liens sont secondaires et peuvent être ignorés si la fenêtre de contexte est saturée. Vous hiérarchisez explicitement.
Il existe aussi une variante, le llms-full.txt. Au lieu de pointer vers les pages, il inclut tout le contenu textuel concaténé dans un seul gros fichier. L'avantage : l'IA n'a qu'un seul appel à faire. L'inconvénient : le fichier peut devenir énorme et dépasser les fenêtres de contexte. Notre conseil pour la plupart des entreprises marocaines : commencez par un llms.txt court et bien curé, et ne passez au llms-full.txt que si vous avez une documentation technique dense (SaaS, API, produit).
Que mettre dans son llms.txt ? La checklist
Voici un tableau de priorisation, du plus utile au plus accessoire, avec une recommandation pour le contexte marocain.
| Élément | Priorité | Pourquoi | Note Maroc | |---|---|---|---| | Nom + une phrase de positionnement | Indispensable | Désambiguïse l'entité | Mentionnez "Maroc" et la ville | | Bloc résumé (citation) | Indispensable | Donne le contexte en 2-3 lignes | Précisez devis en MAD | | 5 à 10 pages clés | Indispensable | Oriente vers vos preuves | Études de cas locales d'abord | | Versions Markdown des pages | Recommandé | Réduit le coût de lecture | Page .md propre, sans menu | | Section "Optionnel" | Recommandé | Hiérarchise pour l'IA | Mentions légales, CNDP ici | | Coordonnées de contact | Recommandé | Facilite la conversion | Téléphone, WhatsApp, email | | Tout votre sitemap | À éviter | Trop de bruit, dilue le signal | Gardez ça pour sitemap.xml | | Mots-clés bourrés | À éviter | Inutile et contre-productif | L'IA n'est pas dupe |
La règle d'or : moins, mais mieux. Un llms.txt de quinze liens triés vaut mieux qu'une liste de deux cents URL où le crawler se perd.
Comment l'héberger et le tester au Maroc ?
La mise en ligne est triviale, et c'est précisément l'argument : le coût est quasi nul.
Étape 1 : créer le fichier
Rédigez votre Markdown dans un éditeur de texte. Nommez-le exactement llms.txt (en minuscules).
Étape 2 : le placer à la racine
Déposez-le pour qu'il soit accessible à https://votresite.ma/llms.txt. Sur un hébergement classique, c'est le dossier racine. Sur Vercel ou Netlify, placez-le dans /public. Sur WordPress, un plugin ou un accès FTP suffit.
Étape 3 : vérifier le type MIME
Le fichier doit être servi en text/plain ou text/markdown, pas téléchargé. Ouvrez l'URL dans un navigateur : si le texte s'affiche, c'est bon. S'il se télécharge, ajustez la configuration de votre serveur.
Étape 4 : tester l'accès des crawlers
Vérifiez dans votre robots.txt que vous n'avez pas bloqué les robots IA (GPTBot, ClaudeBot, PerplexityBot, Google-Extended) si vous voulez être cité. Bloquer ces agents revient à fermer la porte au GEO. C'est un arbitrage stratégique à faire en conscience.
Sur le site de ClaroDigi, nous servons un llms.txt à l'adresse /llms.txt dans le cadre de notre dispositif GEO, en plus d'une bibliothèque bilingue FR/EN de plus de 380 guides. Cohérence du dispositif : un seul de nos clusters de contenu génère à lui seul environ 56 % des impressions de recherche et 97 % des clics du site. Le llms.txt n'est qu'une pièce de cette mécanique, mais c'est la moins chère à poser.
Faut-il y croire ? L'état honnête de l'adoption
Soyons francs : en 2026, le llms.txt n'est pas encore universellement respecté. Aucun des grands moteurs (Google, OpenAI, Anthropic) n'a confirmé publiquement le lire systématiquement comme signal de classement. C'est une convention émergente, pas un standard ratifié comme le sitemap.
Alors pourquoi le poser quand même ? Parce que l'arbitrage coût-bénéfice est imbattable. Rédiger un bon llms.txt prend une à deux heures. Le risque est nul : il ne peut pas vous pénaliser. Et le potentiel est réel : l'adoption progresse côté outils de documentation, certains crawlers le consultent déjà, et la trajectoire du web va clairement vers un trafic de plus en plus médiatisé par l'IA. Poser le fichier aujourd'hui, c'est se positionner avant la généralisation, pas après.
Notre opinion sur ce qui est surévalué : ne sur-investissez pas dans le llms-full.txt si vous n'avez pas de documentation technique dense. Et surtout, n'imaginez pas que le fichier remplace un bon contenu. Le llms.txt rend votre savoir lisible, il ne le crée pas. Le vrai travail reste de produire des pages réellement utiles et structurées en mode réponse d'abord. Pour ce volet, voyez notre guide sur les données structurées et le schema pour la citation IA, qui complète parfaitement le llms.txt côté machine.
Comment intégrer ça dans une stratégie IA cohérente ?
Le llms.txt n'a de sens qu'à l'intérieur d'un dispositif plus large. Tout seul, c'est une carte de visite pour robots. Couplé à une vraie démarche de contenu et de structuration, il devient un multiplicateur. La séquence logique : produire des guides en mode réponse d'abord, les baliser en schema, exposer des versions Markdown propres, puis les lister dans le llms.txt. C'est exactement le type de chaîne que nous opérons dans nos missions de transformation IA, où la visibilité auprès des assistants devient un canal d'acquisition à part entière.
C'est la philosophie du Moteur d'Autorité : donner du savoir utile gratuitement, le rendre trivialement accessible aux humains comme aux machines, gagner la confiance, et recevoir le prospect déjà convaincu. Le llms.txt est l'un des plus petits gestes de ce dispositif, et l'un des plus rentables. Si vous voulez voir comment cette mécanique s'assemble bout à bout pour une entreprise marocaine, explorez notre méthode SEO et GEO au Maroc : le fichier n'est que la partie visible d'un moteur conçu pour transformer du savoir gratuit en leads chauds.
FAQ
Le llms.txt remplace-t-il le robots.txt ou le sitemap.xml ?
Non, les trois coexistent et n'ont pas le même rôle. Le robots.txt autorise ou interdit l'accès des robots. Le sitemap.xml liste exhaustivement vos URL pour l'indexation des moteurs classiques. Le llms.txt, lui, recommande une sélection curée de vos meilleures pages aux modèles d'IA. Gardez les trois.
Est-ce que Google ou ChatGPT lisent vraiment mon llms.txt aujourd'hui ?
Honnêtement, pas de façon garantie ni universelle en 2026. Aucun grand moteur n'a confirmé l'utiliser comme signal officiel. C'est une convention émergente. Mais comme le coût de mise en place est minime et le risque nul, le poser reste un pari rationnel à faible mise et fort potentiel.
Combien de pages dois-je lister dans mon llms.txt ?
Visez la qualité, pas la quantité : entre cinq et quinze liens bien choisis suffisent pour la plupart des PME marocaines. Mettez en avant vos études de cas, vos guides phares et votre page de contact. Reléguez le secondaire (mentions légales, CNDP) dans une section "Optionnel".
Faut-il créer des versions Markdown de mes pages ?
C'est recommandé mais pas obligatoire. Une version .md propre, sans menu ni scripts, réduit le coût de lecture pour l'IA et améliore la fidélité de la citation. Si vous n'avez pas le temps, pointez d'abord vers vos pages HTML existantes : un llms.txt imparfait vaut mieux que pas de llms.txt.
Le llms.txt va-t-il vraiment me faire gagner des clients au Maroc ?
Pas à lui seul. Le fichier rend votre savoir lisible par les machines, mais il ne crée pas ce savoir. Le levier réel, ce sont des contenus réellement utiles, structurés en mode réponse d'abord, que le llms.txt se contente d'exposer proprement. Couplé à une bonne stratégie de contenu, il augmente vos chances d'être cité par les assistants IA que vos prospects consultent déjà.
