Generate clean llms.txt and llms-full.txt files so ChatGPT, Claude, Gemini, and Perplexity can accurately cite your site. Edit everything before download — site name, sections, descriptions, all of it. Works for sites of any size — URLs are fetched in small batches with live progress.
El archivo llms.txt funciona como una hoja de ruta que les dice a ChatGPT, Claude, Gemini y Perplexity qué páginas de tu web son importantes y cómo deben interpretarlas. Sin este archivo, los modelos de IA intentan descifrar tu sitio a partir de HTML lleno de menús, scripts y elementos que desperdician su ventana de contexto. El generador de llms.txt de ToolsPivot rastrea tu sitio completo, produce tanto el archivo llms.txt como el llms-full.txt, y te deja editar todo en un editor con vista previa en tiempo real antes de descargar. Gratis, sin registro, sin límite de URLs.
Esta herramienta escanea cualquier sitio web y convierte su estructura en archivos Markdown legibles por modelos de IA, siguiendo la especificación llms.txt propuesta por Jeremy Howard en septiembre de 2024. Funciona con una arquitectura de rastreo por lotes: las URLs se procesan en grupos de 12 con una barra de progreso en tiempo real, así que da igual si tu web tiene 10 páginas o 10.000.
Profesionales SEO, desarrolladores, consultores de marketing digital y propietarios de tiendas online utilizan esta herramienta para controlar cómo los sistemas de IA interpretan y citan su contenido. A diferencia de la mayoría de alternativas que limitan a 50 o 100 URLs y solo generan el archivo índice, ToolsPivot produce ambos formatos en una sola ejecución: el llms.txt ligero y el llms-full.txt con el contenido completo de cada página.
Tras el rastreo, se abre un editor con dos paneles: los datos estructurados a la izquierda y la vista previa Markdown renderizada a la derecha. Puedes cambiar nombres de sección, corregir títulos de páginas, reordenar URLs o eliminar las que no te interesan antes de descargar. Si Cloudflare u otra protección anti-bots bloquea ciertas URLs durante el rastreo, la herramienta reintenta con intervalos más largos. Las URLs que sigan fallando no se pierden: se mantienen en el archivo con un título generado automáticamente a partir de la ruta, y puedes editarlo en el mismo panel.
Dos archivos en cada ejecución: Genera llms.txt (el índice de navegación) y llms-full.txt (contenido completo de cada página) de una sola vez. La mayoría de competidores solo genera el índice.
Sin límite de URLs: La arquitectura por lotes procesa desde 10 hasta 10.000 URLs sin timeouts. No hay topes artificiales ni planes de pago para sitios grandes.
Editor integrado con vista previa: Un panel dividido te permite modificar nombres, descripciones, secciones y títulos individuales con vista previa Markdown en directo. Ningún otro generador gratuito ofrece edición antes de la descarga.
Resistente a protección anti-bots: Cloudflare y sistemas similares bloquean entre el 30% y el 50% de las solicitudes automáticas. Este generador reintenta con retardos más largos y concurrencia reducida, y las URLs que fallen se conservan con títulos autogenerados que puedes corregir.
Sin registro ni API key: Sin crear cuenta, sin verificar email, sin tarjeta de crédito. Pegas tu URL y generas de inmediato. Puedes verificar la precisión de las meta descripciones generadas con el analizador de meta tags antes de publicar.
Agrupación inteligente de secciones: Las URLs se organizan automáticamente en categorías canónicas: Blog, Documentación, Productos, Precios, Legal, etc. Las secciones con un solo elemento se agrupan bajo "Páginas" para mantener el archivo limpio.
Validación integrada: Avisa sobre URLs duplicadas, títulos faltantes y descripciones que superan los 200 caracteres recomendados por la especificación.
Tres modos de entrada: Rastreo automático desde la página principal (descubre páginas vía sitemap y rastreo recursivo), inserción directa de URL de sitemap.xml para máxima precisión, o pegado de una lista personalizada de URLs para sitios protegidos o selecciones específicas.
Motor de rastreo por lotes: Las URLs se procesan en grupos de 12 con concurrencia limitada a 3 solicitudes simultáneas y pausas de 500ms entre lotes. Usa User-Agent y cabeceras de Chrome reales para pasar como un navegador, no como un bot.
Barra de progreso en tiempo real: Muestra el avance exacto ("47 / 250 · 19%") con contador de lotes. Puedes cancelar en cualquier momento con un solo clic.
Editor de doble panel: Edita los datos estructurados a la izquierda mientras la vista previa Markdown se actualiza al instante en el panel derecho. Modifica lo que necesites: nombre del sitio, descripción, encabezados de sección, títulos de páginas, descripciones individuales.
Generación dual de archivos: Produce el llms.txt índice (ligero, menos de 10KB) y el llms-full.txt de contenido (texto completo en Markdown) en una sola sesión de rastreo.
Recuperación de URLs fallidas: Las URLs bloqueadas por protección anti-bots no se eliminan del resultado. Se mantienen con títulos generados a partir de la ruta de la URL para que puedas corregirlos antes de descargar.
Historial de generaciones: Los últimos 5 archivos generados quedan almacenados en tu navegador. Un clic para recargar o regenerar cualquier resultado anterior.
Descarga instantánea: Copia el resultado al portapapeles o descarga ambos archivos como texto plano, listos para subir junto a tu robots.txt y tu mapa del sitio.
Elige el modo de entrada. Selecciona entre tres opciones: introduce la URL de tu página principal para rastreo automático, pega la URL de tu sitemap.xml para descubrimiento preciso, o pega una lista personalizada de URLs.
Lanza el rastreo. Haz clic en generar y el motor comienza a procesar URLs en lotes de 12. La barra de progreso muestra el avance de cada lote para que puedas monitorizar o cancelar en cualquier momento.
Revisa en el editor. Cuando el rastreo termina, se abre una vista de doble panel. El panel izquierdo muestra los datos de cada página organizados en secciones inteligentes. El derecho renderiza la vista previa Markdown.
Edita lo que necesites. Cambia el nombre del sitio, reescribe descripciones, renombra secciones, reordena páginas, elimina URLs irrelevantes o añade las que falten. Corrige cualquier aviso de validación antes de descargar.
Descarga ambos archivos. Exporta tu llms.txt (índice ligero) y tu llms-full.txt (versión con contenido completo). Súbelos al directorio raíz de tu web, la misma carpeta donde vive tu robots.txt, para que queden accesibles en tusitio.com/llms.txt.
Los bots de ChatGPT, Claude, Perplexity y Google AI Overviews ya visitan millones de sitios web a diario. Si no tienen una guía estructurada, estos modelos deciden por su cuenta qué contenido referenciar y cómo resumir tu marca. Un archivo llms.txt te devuelve ese control.
Al lanzar una web nueva: Configura el llms.txt junto con el sitemap y el robots.txt desde el primer día para que los sistemas de IA entiendan la estructura de tu sitio desde el principio.
Tras un rediseño web: Las migraciones cambian las URLs y los modelos de IA pueden seguir referenciando páginas antiguas. Usa el modo de lista personalizada para alimentar al generador con tu inventario actualizado.
Antes de publicar contenido importante: Si vas a lanzar documentación técnica, guías de producto o informes, regenera tu llms.txt para que las herramientas de IA encuentren esas páginas primero. Comprueba que el contenido nuevo esté bien optimizado con la herramienta de investigación de palabras clave antes de publicar.
Si gestionas una tienda online: Dirige a los modelos de IA hacia tus categorías de producto y bestsellers en lugar de páginas de política, carritos o resultados filtrados. La agrupación inteligente separa automáticamente Productos de Legal y Precios.
Si manejas documentación SaaS: Facilita que los asistentes de código como GitHub Copilot y Cursor encuentren tu referencia de API y guías de inicio rápido. Genera el llms-full.txt para que estos asistentes accedan al código completo sin tener que cargar múltiples páginas individuales.
Si publicas un blog con muchos artículos: El soporte ilimitado de URLs significa que un blog con 2.000 entradas se procesa igual que uno con 20. Prioriza tus artículos de mayor valor en el editor para que la IA los cite antes que los borradores antiguos.
Tras una migración de CMS: Pasar de WordPress a Webflow, o de Wix a Shopify, rompe patrones de enlazado interno. Un llms.txt actualizado reconstruye el mapa legible por IA de tu sitio. Utiliza el comprobador de enlaces rotos para detectar URLs muertas y el analizador de enlaces para verificar que tu estructura interna sigue siendo coherente después del cambio.
Contexto: Una tienda con más de 500 productos necesita que los asistentes de compra basados en IA recomienden los artículos correctos. Proceso:
Contexto: Una plataforma SaaS con más de 800 páginas de documentación quiere que los asistentes de código referencien su API con precisión. Proceso:
Contexto: Un blog de salud y bienestar con más de 200 artículos necesita que los buscadores de IA citen su contenido experto en lugar de listicles genéricos. Proceso:
Contexto: Una agencia de marketing digital gestiona 25 sitios web de clientes y necesita optimización IA estandarizada en todos. Proceso:
Son dos archivos con funciones diferentes dentro del mismo estándar, y la mayoría de sitios web se benefician de tener ambos. El llms.txt es el índice. El llms-full.txt es el libro completo. ToolsPivot genera los dos en una sola sesión de rastreo, mientras que la mayoría de generadores solo produce el índice.
llms.txt es un archivo índice ligero, normalmente menos de 10KB. Lista tus páginas más importantes con títulos, URLs y descripciones de una línea. Los modelos de IA lo usan como filtro rápido: deciden qué páginas cargar y en qué orden.
llms-full.txt contiene el texto completo de tus páginas clave en formato Markdown. Los agentes de IA lo consultan cuando necesitan información precisa: especificaciones de API, detalles de producto o texto legal, sin tener que cargar múltiples páginas individuales. Es especialmente útil para documentación técnica, catálogos de e-commerce y bases de conocimiento.
Diferencias principales:
Empresas como Anthropic, Stripe y Cloudflare publican ambos archivos. Si tu sitio es pequeño, empezar solo con llms.txt es suficiente. Añade llms-full.txt cuando manejes documentación extensa o necesites control preciso sobre cómo los sistemas de IA citan tu contenido.
El archivo va en el directorio raíz de tu web, la misma carpeta donde están tu robots.txt e index.html. Una vez subido, debe ser accesible en tusitio.com/llms.txt.
WordPress: Accede al Administrador de Archivos en tu cPanel o conéctate por FTP (FileZilla funciona bien). Navega hasta la carpeta public_html y sube ambos archivos allí. También puedes automatizar el proceso con plugins como AIOSEO, Yoast SEO (que ya incluye soporte para llms.txt en versiones recientes) o el plugin dedicado Website LLMs.txt.
Shopify: Ve a Configuración > Archivos. Sube el llms.txt y luego crea una página personalizada o una redirección en tu tema para servir el archivo en /llms.txt. El sistema de archivos de Shopify no admite archivos de texto en la raíz de forma nativa, así que necesitarás una ruta proxy a través de la configuración del tema.
Webflow: Sube el archivo a través del Asset Manager de tu proyecto y configura una redirección de URL o un snippet de código personalizado en la cabecera de tu sitio para servirlo desde la ruta raíz.
Hosting estático y servidores propios: Coloca ambos archivos en tu directorio raíz. Si usas Vercel, Netlify o plataformas similares, añádelos a tu carpeta public o static y se servirán automáticamente.
Después de subirlos, verifica visitando tusitio.com/llms.txt en el navegador. Deberías ver el contenido Markdown en texto plano. Pasa tu web por el comprobador SEO para confirmar que todo sigue funcionando correctamente después de la subida.
Ambos archivos viven en el directorio raíz de tu web y se comunican con sistemas automatizados, pero sirven para cosas fundamentalmente distintas.
robots.txt indica a los rastreadores de buscadores tradicionales como Googlebot y Bingbot qué páginas pueden rastrear o ignorar. Controla el comportamiento de indexación para motores que construyen un índice almacenado de la web. Te permite gestionar qué agentes acceden a tu sitio, bloquear directorios específicos y apuntar a los rastreadores hacia tu sitemap. El generador de robots.txt de ToolsPivot se encarga de esta configuración.
llms.txt indica a los modelos de lenguaje qué contenido es más importante y cómo interpretarlo. No bloquea el acceso: organiza y prioriza la información para modelos que trabajan con ventanas de contexto limitadas. Los modelos de IA no rastrean e indexan tu web como lo hacen los buscadores. Obtienen contenido en tiempo de inferencia; es decir, extraen información cuando un usuario hace una pregunta, no en un ciclo de rastreo programado.
Necesitas ambos archivos. El robots.txt gestiona cómo los buscadores indexan tus páginas. El llms.txt gestiona cómo los modelos de IA entienden y citan tu contenido. Uno no sustituye al otro, e ignorar cualquiera de los dos deja un hueco en tu estrategia de visibilidad.
Ninguna herramienta lo hace todo perfecto, y la transparencia genera más confianza que el marketing.
Sitios web con JavaScript pesado: El generador usa análisis de HTML estático, no un navegador headless. Las aplicaciones de página única (SPA) construidas con React, Vue o Angular que cargan contenido enteramente por JavaScript del lado del cliente devolverán títulos y descripciones mayormente vacíos. Para SPAs con mucho JavaScript, una herramienta basada en navegador headless como Firecrawl dará mejores resultados.
Sin regeneración programada: La herramienta genera bajo demanda. Si tu sitio cambia con frecuencia, tendrás que regenerar y resubir los archivos manualmente. Para la mayoría de sitios de contenido, una revisión trimestral es suficiente.
Calidad de las descripciones IA: La reescritura de descripciones con IA usa la configuración de IA existente en la plataforma. Herramientas dedicadas de escritura con IA pueden producir textos más pulidos para las descripciones, aunque siempre puedes refinarlas en el editor integrado.
Para sitios de contenido, blogs, portales de documentación y tiendas online construidos en plataformas que renderizan en servidor como WordPress, Shopify o Webflow, estas limitaciones rara vez importan. Pasa tu web por el comprobador de velocidad de carga si no estás seguro de si tu sitio renderiza en servidor o en cliente.
Un archivo llms.txt es un documento Markdown estructurado que se coloca en el directorio raíz de tu sitio web para que los modelos de lenguaje (LLMs) entiendan mejor tu contenido y estructura. Funciona como una guía para sistemas de IA como ChatGPT, Claude, Gemini y Perplexity, de forma similar a como el robots.txt orienta a los rastreadores de buscadores.
El robots.txt controla qué páginas pueden rastrear e indexar los buscadores. El llms.txt organiza tu contenido para que los modelos de IA entiendan qué ofrece tu web y qué páginas priorizar durante la inferencia. El robots.txt bloquea o permite acceso; el llms.txt aporta estructura y contexto. Necesitas ambos.
Sí, completamente gratis sin registro, sin verificación de email, sin API key y sin tarjeta de crédito. No hay planes de pago, ni límites por usuario, ni topes de URLs.
El estándar llms.txt todavía está en desarrollo y ningún proveedor de IA ha confirmado oficialmente soporte completo. Sin embargo, más de 2.000 sitios web incluyendo Anthropic, Cloudflare, Stripe y Zapier ya publican archivos llms.txt. La adopción temprana no tiene riesgo (es un archivo de texto pequeño) y posiciona tu web para aprovechar los beneficios conforme crezca la adopción.
No hay límite. La arquitectura de rastreo por lotes procesa URLs en grupos de 12, así que da igual si tu sitio tiene 10 páginas o 10.000. La mayoría de herramientas competidoras limitan a 50 o 100 URLs.
El generador reintenta las URLs bloqueadas con intervalos más largos y concurrencia reducida. Las URLs que sigan fallando no se eliminan del archivo: se mantienen con títulos generados automáticamente a partir de la ruta, y puedes editarlos en el editor integrado antes de descargar.
El llms.txt es un índice ligero con los títulos y descripciones breves de tus páginas clave. El llms-full.txt contiene el texto completo de esas páginas en formato Markdown. ToolsPivot genera ambos archivos en una sola sesión, mientras que la mayoría de alternativas solo produce el índice.
Sí. Un editor de doble panel se abre tras finalizar el rastreo. El panel izquierdo muestra los datos estructurados y el derecho renderiza una vista previa Markdown en directo. Puedes cambiar el nombre del sitio, reescribir descripciones, renombrar secciones, reordenar páginas, eliminar URLs o añadir nuevas.
Tres modos: rastreo de URL de inicio (descubrimiento automático vía sitemap y rastreo recursivo), inserción directa de URL de sitemap.xml (máxima precisión) y pegado de lista personalizada de URLs (ideal para archivos curados o sitios protegidos contra bots).
No. Un archivo llms.txt es un documento de texto plano, normalmente menos de 10KB. Se aloja en tu directorio raíz igual que el robots.txt y no tiene impacto alguno en la velocidad de carga, el rendimiento del servidor ni el posicionamiento SEO existente.
No. Tu sitemap XML indica a los buscadores qué páginas rastrear e indexar. El llms.txt indica a los modelos de IA qué contenido priorizar y cómo interpretar tu sitio. Necesitas ambos para tener visibilidad completa tanto en búsqueda tradicional como en búsqueda por IA.
Actualízalo cada vez que añadas o elimines páginas importantes, publiques contenido significativo, completes un rediseño o cambies la estructura de URLs. Para la mayoría de sitios de contenido, una revisión trimestral es un buen mínimo. El panel de historial guarda tus últimos 5 resultados para regenerar rápidamente.
Sí. Los archivos generados funcionan con cualquier plataforma porque son archivos de texto estándar. Súbelos a tu directorio raíz a través del administrador de archivos de tu hosting, un cliente FTP o la configuración específica de tu plataforma. Los usuarios de WordPress también pueden automatizar las actualizaciones con plugins como AIOSEO o Yoast SEO.
Es un estándar propuesto creado por Jeremy Howard en septiembre de 2024, no una especificación oficial del W3C o el IETF. La adopción está creciendo rápidamente en la comunidad de desarrolladores y SEO, y grandes empresas ya lo están implementando. El esfuerzo mínimo y el riesgo nulo de añadir el archivo hacen que la adopción temprana sea una decisión práctica.