Generate clean llms.txt and llms-full.txt files so ChatGPT, Claude, Gemini, and Perplexity can accurately cite your site. Edit everything before download — site name, sections, descriptions, all of it. Works for sites of any size — URLs are fetched in small batches with live progress.
Le fichier llms.txt est un document Markdown placé à la racine d'un site web pour guider les modèles de langage (ChatGPT, Claude, Gemini, Perplexity) vers vos contenus prioritaires. Le générateur llms.txt de ToolsPivot crée automatiquement ce fichier ainsi que sa version complète llms-full.txt, à partir de votre URL, d'un sitemap ou d'une liste de pages collées. Plus de 600 sites majeurs (Anthropic, Stripe, Cloudflare, Zapier) utilisent déjà ce standard proposé par Jeremy Howard en septembre 2024 pour améliorer leur visibilité dans les réponses IA. Générez le vôtre en quelques secondes, modifiez-le dans l'éditeur intégré et téléchargez-le sans créer de compte.
Le générateur llms.txt analyse votre site web par lots de 12 URL avec une barre de progression en temps réel, puis produit deux fichiers conformes au standard llmstxt.org : le fichier llms.txt (index structuré avec titres, descriptions et liens) et le fichier llms-full.txt (contenu complet de chaque page en Markdown). Un éditeur en double panneau vous permet de modifier les titres, descriptions, noms de sections et URL avant le téléchargement.
Cet outil s'adresse aux consultants SEO, responsables marketing, développeurs web et auto-entrepreneurs qui souhaitent optimiser leur visibilité dans les moteurs de recherche IA. Les agences GEO (Generative Engine Optimization) l'utilisent pour générer des fichiers llms.txt conformes au standard pour leurs clients, sans facturer de prestation technique supplémentaire.
Sans fichier llms.txt, les modèles de langage analysent votre site de façon aléatoire : ils peuvent ignorer vos pages stratégiques ou mal interpréter la hiérarchie de votre contenu. Le générateur résout ce problème en crawlant votre site, en regroupant automatiquement les URL par catégories (Blog, Documentation, Produits, Pages légales) et en produisant un fichier prêt à déployer en moins de deux minutes.
Deux fichiers générés simultanément : Vous obtenez le llms.txt (index) et le llms-full.txt (contenu complet) en une seule opération, là où la plupart des concurrents ne produisent que l'index.
Nombre d'URL illimité : L'architecture par lots (chunks de 12 URL) gère aussi bien un site de 10 pages qu'un portail de 2 000 URL. Aucun plafond technique, aucun délai d'expiration côté serveur.
Éditeur intégré avec aperçu en direct : Un panneau scindé affiche les données structurées à gauche et le fichier Markdown rendu à droite. Modifiez un titre, supprimez une URL ou renommez une section : l'aperçu se met à jour en temps réel. Aussi pratique que l'éditeur HTML en ligne pour vérifier votre code.
Trois modes de saisie : Crawl automatique depuis l'URL d'accueil, import direct d'un sitemap.xml ou collage libre d'une liste d'URL. Cette flexibilité couvre les sites protégés par Cloudflare comme les sites classiques.
Regroupement intelligent des URL : Les pages sont automatiquement classées en catégories canoniques (Blog, Documentation, Produits, À propos, Mentions légales). Les sections avec une seule URL sont regroupées dans « Pages » pour éviter un fichier encombré.
Aucune URL perdue : Les pages bloquées par les protections anti-bots sont relancées avec des délais plus longs. Celles qui restent inaccessibles conservent un titre généré à partir du chemin d'URL, modifiable dans l'éditeur.
Gratuit, sans inscription : Aucun compte, aucune clé API, aucune limite de requêtes par utilisateur. Vous générez, modifiez et téléchargez vos fichiers immédiatement.
Validation intégrée : L'outil signale les URL dupliquées, les titres manquants et les descriptions dépassant 200 caractères (recommandation du standard). Vous savez exactement quoi corriger avant de déployer le fichier.
Crawl par lots avec barre de progression : Les URL sont récupérées par groupes de 12 avec un affichage en temps réel du type « 47 / 250 (19 %) ». Vous suivez l'avancement et pouvez annuler à tout instant.
Prise en charge du sitemap.xml : Collez directement l'URL de votre fichier sitemap pour une extraction précise de toutes vos pages indexées, sans crawler la structure HTML de votre site. Vérifiez d'abord que votre sitemap est valide avec le vérificateur d'indexation.
Mode liste libre : Collez n'importe quelle liste d'URL (une par ligne) pour créer un fichier llms.txt personnalisé. Utile pour les sites dont le sitemap est incomplet ou protégé.
Relance automatique en cas d'échec : Le générateur réessaie les URL qui renvoient une erreur avec un délai plus long et une concurrence réduite, ce qui augmente le taux de réussite face aux protections Cloudflare.
En-têtes de navigateur réalistes : Les requêtes utilisent un User-Agent Chrome authentique et des en-têtes HTTP standards, imitant un navigateur classique pour minimiser les blocages.
Concurrence maîtrisée : Trois requêtes simultanées avec un délai de 500 ms entre chaque lot. Cette approche « polie » respecte la charge des serveurs distants et passe sous les seuils de détection les plus courants.
Historique des générations : Les cinq dernières générations sont stockées dans votre navigateur. Un clic suffit pour relancer ou modifier un fichier précédent.
Compatibilité avec le générateur de sitemap : Créez votre sitemap.xml avec le générateur de sitemap, puis importez-le directement dans le générateur llms.txt pour un workflow complet.
Format Markdown conforme : Le fichier produit respecte la syntaxe définie sur llmstxt.org : titre H1 avec le nom du site, description entre guillemets, sections H2 avec liens et descriptions courtes.
Export rapide : Téléchargez le fichier llms.txt, le fichier llms-full.txt ou les deux en un clic. Copiez le contenu dans le presse-papiers si vous préférez un collage direct sur votre serveur.
Choisissez votre mode de saisie. Entrez l'URL de votre site, collez l'adresse de votre sitemap.xml ou collez une liste d'URL manuellement.
Lancez le crawl. L'outil parcourt vos pages par lots de 12, extrait les titres, descriptions et contenus, puis regroupe les URL en sections logiques.
Vérifiez et modifiez dans l'éditeur. L'éditeur en double panneau affiche la structure à gauche et l'aperçu Markdown à droite. Renommez les sections, corrigez les titres, ajoutez ou supprimez des URL selon vos besoins.
Consultez les alertes de validation. Le système signale les erreurs potentielles : URL en double, titres vides, descriptions trop longues. Corrigez avant de télécharger.
Téléchargez vos fichiers. Récupérez le llms.txt et le llms-full.txt, puis placez-les à la racine de votre site (votresite.com/llms.txt). Les deux fichiers sont générés simultanément.
Le fichier llms.txt devient pertinent dès que vous souhaitez contrôler la façon dont les IA génératives interprètent votre site. C'est un levier stratégique de GEO (Generative Engine Optimization) qui complète votre robots.txt et votre sitemap.xml. Voici les scénarios où il apporte le plus de valeur.
Lancement d'une stratégie GEO : Vous voulez que ChatGPT, Claude ou Perplexity citent vos contenus prioritaires plutôt que des pages secondaires.
Refonte ou migration de site : Après une migration, le fichier llms.txt redirige les IA vers les nouvelles URL stratégiques de votre site.
Site de documentation technique : Les portails de documentation (API, SaaS, open source) bénéficient d'un llms-full.txt qui regroupe tout le contenu dans un fichier unique, directement consommable par les assistants de code comme Cursor ou Claude Code.
E-commerce avec catalogue volumineux : Les sites comme ceux hébergés sur Shopify ou PrestaShop peuvent guider les IA vers leurs fiches produits stratégiques plutôt que vers les pages filtres ou les CGV.
Audit de visibilité IA : Avant de déployer votre fichier, le vérificateur SEO vous aide à vérifier que vos pages sont correctement indexées par Google.
Site WordPress sans plugin dédié : Si vous n'utilisez pas de plugin llms.txt (RankMath ou Yoast n'intègrent pas tous cette fonctionnalité), le générateur en ligne vous produit un fichier que vous uploadez via FTP ou le gestionnaire de fichiers de votre hébergeur.
Auto-entrepreneur ou PME sans budget SEO : Les indépendants et petites entreprises françaises peuvent créer un fichier llms.txt professionnel gratuitement, sans prestataire.
Même les sites de petite taille (moins de 20 pages) gagnent à avoir un fichier llms.txt. Les IA consultent de plus en plus ce fichier lorsqu'un utilisateur pose une question contextuelle dans un chatbot, et John Mueller (Google) a confirmé que le fichier ne pose pas de problème de contenu dupliqué tant qu'il ne reproduit pas le HTML à l'identique.
Contexte : Une agence de référencement parisienne audite la visibilité IA de ses clients sur ChatGPT et Perplexity. Processus :
Contexte : Un graphiste freelance à Lyon lance son portfolio sur WordPress et veut apparaître dans les réponses IA locales. Processus :
Contexte : Une boutique en ligne vendant des produits artisanaux français sur PrestaShop souhaite que ses catégories phares soient citées par les IA. Processus :
Contexte : Un développeur publiant une documentation API technique sur un sous-domaine docs.monprojet.fr. Processus :
Contexte : Un consultant vérifie la cohérence entre les méta-descriptions des pages et leur description dans le fichier llms.txt. Processus :
Le standard proposé par Jeremy Howard définit deux fichiers complémentaires qui servent des objectifs distincts. Le fichier llms.txt fonctionne comme un index : il liste vos pages stratégiques avec un titre, un lien et une description courte (moins de 12 mots par page). Les IA l'utilisent pour comprendre la structure de votre site et identifier rapidement les contenus pertinents.
Le fichier llms-full.txt va plus loin : il contient l'intégralité du contenu de vos pages en Markdown, regroupé dans un seul document. Ce format est particulièrement utile pour les assistants de code et les agents IA qui ont besoin de contexte complet pour répondre à des questions techniques. Selon les premières données de logs serveur, le fichier llms-full.txt est consulté plus fréquemment que le llms.txt lorsque les deux sont disponibles.
Points essentiels :
Le générateur de méta-descriptions peut vous aider à rédiger des descriptions courtes et percutantes pour chaque page listée dans votre fichier llms.txt.
Un fichier llms.txt bien structuré ne suffit pas : son déploiement doit respecter quelques règles pour garantir son efficacité auprès des modèles de langage.
Placez le fichier à la racine de votre domaine (votresite.com/llms.txt), jamais dans un sous-dossier. Utilisez un encodage UTF-8 et vérifiez que les caractères accentués (é, è, ç, à) s'affichent correctement. Ajoutez un en-tête noindex pour éviter que le fichier apparaisse dans les résultats de recherche classiques, comme le recommande John Mueller (Google).
Limitez chaque description à 12 mots maximum, comme le préconise le standard. Utilisez des URL absolues (https://votresite.com/page) et non des chemins relatifs (/page). Testez l'accessibilité de votre fichier en visitant votresite.com/llms.txt dans un navigateur après le déploiement. Pour optimiser les méta-balises de vos pages avant de les inclure dans le fichier, le générateur de méta-balises simplifie cette étape.
Points essentiels :
Vérifiez également que votre fichier robots.txt n'empêche pas les crawlers IA d'accéder au fichier llms.txt.
Le fichier llms.txt est un document Markdown placé à la racine d'un site web pour guider les modèles de langage (ChatGPT, Claude, Gemini, Perplexity) vers les contenus prioritaires. Proposé par Jeremy Howard (Answer.AI) en septembre 2024, il fonctionne comme un sitemap conçu spécifiquement pour les IA, en leur fournissant un index structuré de vos pages stratégiques.
Le robots.txt contrôle l'accès des robots d'indexation des moteurs de recherche classiques (Googlebot, Bingbot), tandis que le llms.txt fournit un contexte structuré aux modèles de langage pour qu'ils comprennent et citent correctement votre contenu. Les deux fichiers sont complémentaires et doivent coexister à la racine de votre site.
Le générateur est 100 % gratuit, sans inscription ni clé API requise. Il n'y a aucune limite sur le nombre de générations par utilisateur ni sur le nombre d'URL traitées.
Le nombre d'URL est illimité grâce à l'architecture par lots (chunks de 12 URL). Un site de 10 pages et un portail de 2 000 pages fonctionnent de la même manière, sans délai d'expiration côté serveur.
Non, à condition qu'il ne reproduise pas mot pour mot le contenu HTML de vos pages. John Mueller (Google) a précisé que le fichier ne pose pas de problème de contenu dupliqué et recommande d'ajouter un en-tête noindex pour éviter son indexation dans les résultats de recherche classiques.
Plus de 600 sites majeurs ont adopté ce standard, dont Anthropic, Perplexity, Cloudflare, Stripe, Zapier, Hugging Face, Cursor et Yoast. L'adoption est particulièrement forte dans le secteur de la documentation technique et des outils SaaS.
Visitez votresite.com/llms.txt dans un navigateur. Le contenu Markdown doit s'afficher lisiblement. Vérifiez que les accents français (é, è, ç, à) sont corrects et que toutes les URL sont absolues. Le vérificateur de liens cassés peut confirmer que les URL listées dans votre fichier sont accessibles.
Le générateur analyse le HTML statique et ne rend pas le JavaScript côté client. Les sites SPA (Single Page Application) qui chargent leur contenu uniquement via JavaScript peuvent renvoyer des titres vides. Pour ces sites, le mode « liste libre » reste la meilleure option : collez manuellement les URL de vos pages avec leurs titres.
Régénérez votre fichier après chaque modification structurelle : ajout de nouvelles pages, suppression de contenus, changement de catégories. Pour un blog publiant régulièrement, une mise à jour mensuelle est raisonnable. Le compteur de mots peut vous aider à vérifier la longueur de vos descriptions.
Le fichier llms.txt n'a pas d'impact direct sur le classement Google traditionnel. Son rôle concerne la visibilité dans les moteurs de recherche IA (ChatGPT, Perplexity, Google AI Overviews). C'est un outil de GEO (Generative Engine Optimization) qui complète votre stratégie SEO classique, vérifiable avec le vérificateur d'autorité de domaine.
Oui. Créez un fichier llms.txt par domaine ou sous-domaine. Si votre site utilise des sous-répertoires linguistiques (/fr/, /en/, /de/), vous pouvez générer un fichier unique incluant toutes les versions ou filtrer par langue via le mode liste libre.
Le fichier llms.txt ne collecte ni ne transmet de données personnelles. Il ne contient que des URL publiques, des titres et des descriptions de pages. Aucune donnée utilisateur n'est stockée dans le fichier. Le générateur ne conserve aucune donnée côté serveur : tout le traitement se fait dans votre navigateur.
Le llms.txt est un index léger avec titres, liens et descriptions courtes. Le llms-full.txt contient l'intégralité du contenu de vos pages en Markdown, dans un seul fichier. Le générateur produit les deux simultanément. Vérifiez la qualité de votre contenu avant génération avec le vérificateur de plagiat.
Le générateur utilise un User-Agent Chrome réaliste, des en-têtes HTTP standards et une concurrence limitée (3 requêtes simultanées avec 500 ms de délai). Les URL bloquées sont relancées avec des délais plus longs. Celles qui restent inaccessibles sont conservées dans le fichier avec un titre généré automatiquement à partir du chemin d'URL, modifiable dans l'éditeur.