tavily-map

Par tavily-ai · skills

Découvrez et listez toutes les URLs d'un site web sans en extraire le contenu, via la CLI Tavily. Utilisez cette skill lorsque l'utilisateur souhaite trouver une page spécifique sur un grand site, lister toutes les URLs, visualiser la structure du site, localiser quelque chose sur un domaine, ou dit « map the site », « find the URL for », « what pages are on », « list all pages », ou « site structure ». Plus rapide que le crawling — retourne uniquement les URLs. Indispensable quand vous connaissez le site mais pas la page exacte. Combinez avec extract pour une récupération ciblée du contenu.

npx skills add https://github.com/tavily-ai/skills --skill tavily-map

tavily map

Découvrez des URLs sur un site web sans extraire le contenu. Plus rapide que le crawling.

Avant d'exécuter toute commande

Si tvly ne se trouve pas sur PATH, installez-le d'abord :

curl -fsSL https://cli.tavily.com/install.sh | bash && tvly login

Ne sautez pas cette étape ni ne vous rabattez sur d'autres outils.

Consultez tavily-cli pour des méthodes d'installation alternatives et des options d'authentification.

Quand l'utiliser

  • Vous devez trouver une sous-page spécifique sur un grand site
  • Vous voulez une liste de toutes les URLs avant de décider ce qu'extraire ou crawler
  • Étape 3 du workflow : search → extract → map → crawl → research

Démarrage rapide

# Découvrir toutes les URLs
tvly map "https://docs.example.com" --json

# Avec filtrage en langage naturel
tvly map "https://docs.example.com" --instructions "Find API docs and guides" --json

# Filtrer par chemin
tvly map "https://example.com" --select-paths "/blog/.*" --limit 500 --json

# Map profond
tvly map "https://example.com" --max-depth 3 --limit 200 --json

Options

Option Description
--max-depth Niveaux de profondeur (1-5, défaut : 1)
--max-breadth Liens par page (défaut : 20)
--limit Max d'URLs à découvrir (défaut : 50)
--instructions Guidance en langage naturel pour filtrer les URLs
--select-paths Motifs regex séparés par virgule à inclure
--exclude-paths Motifs regex séparés par virgule à exclure
--select-domains Regex séparé par virgule pour les domaines à inclure
--exclude-domains Regex séparé par virgule pour les domaines à exclure
--allow-external / --no-external Inclure les liens externes
--timeout Attente max (10-150 secondes)
-o, --output Enregistrer la sortie dans un fichier
--json Sortie JSON structurée

Pattern Map + Extract

Utilisez map pour trouver la bonne page, puis extract-la. C'est souvent plus efficace que crawler un site entier :

# Étape 1 : Trouver la documentation d'authentification
tvly map "https://docs.example.com" --instructions "authentication" --json

# Étape 2 : Extraire la page spécifique que vous avez trouvée
tvly extract "https://docs.example.com/api/authentication" --json

Conseils

  • Map ne découvre que des URLs — pas d'extraction de contenu. Utilisez extract ou crawl pour le contenu.
  • Map + extract surpasse crawl quand vous n'avez besoin que de quelques pages spécifiques d'un grand site.
  • Utilisez --instructions pour un filtrage sémantique quand les motifs de chemin ne suffisent pas.

Voir aussi

  • tavily-extract — extraire le contenu des URLs que vous découvrez
  • tavily-crawl — extraction en masse quand vous avez besoin de nombreuses pages

Skills similaires