tavily map
Découvrez des URLs sur un site web sans extraire le contenu. Plus rapide que le crawling.
Avant d'exécuter toute commande
Si tvly ne se trouve pas sur PATH, installez-le d'abord :
curl -fsSL https://cli.tavily.com/install.sh | bash && tvly login
Ne sautez pas cette étape ni ne vous rabattez sur d'autres outils.
Consultez tavily-cli pour des méthodes d'installation alternatives et des options d'authentification.
Quand l'utiliser
- Vous devez trouver une sous-page spécifique sur un grand site
- Vous voulez une liste de toutes les URLs avant de décider ce qu'extraire ou crawler
- Étape 3 du workflow : search → extract → map → crawl → research
Démarrage rapide
# Découvrir toutes les URLs
tvly map "https://docs.example.com" --json
# Avec filtrage en langage naturel
tvly map "https://docs.example.com" --instructions "Find API docs and guides" --json
# Filtrer par chemin
tvly map "https://example.com" --select-paths "/blog/.*" --limit 500 --json
# Map profond
tvly map "https://example.com" --max-depth 3 --limit 200 --json
Options
| Option | Description |
|---|---|
--max-depth |
Niveaux de profondeur (1-5, défaut : 1) |
--max-breadth |
Liens par page (défaut : 20) |
--limit |
Max d'URLs à découvrir (défaut : 50) |
--instructions |
Guidance en langage naturel pour filtrer les URLs |
--select-paths |
Motifs regex séparés par virgule à inclure |
--exclude-paths |
Motifs regex séparés par virgule à exclure |
--select-domains |
Regex séparé par virgule pour les domaines à inclure |
--exclude-domains |
Regex séparé par virgule pour les domaines à exclure |
--allow-external / --no-external |
Inclure les liens externes |
--timeout |
Attente max (10-150 secondes) |
-o, --output |
Enregistrer la sortie dans un fichier |
--json |
Sortie JSON structurée |
Pattern Map + Extract
Utilisez map pour trouver la bonne page, puis extract-la. C'est souvent plus efficace que crawler un site entier :
# Étape 1 : Trouver la documentation d'authentification
tvly map "https://docs.example.com" --instructions "authentication" --json
# Étape 2 : Extraire la page spécifique que vous avez trouvée
tvly extract "https://docs.example.com/api/authentication" --json
Conseils
- Map ne découvre que des URLs — pas d'extraction de contenu. Utilisez
extractoucrawlpour le contenu. - Map + extract surpasse crawl quand vous n'avez besoin que de quelques pages spécifiques d'un grand site.
- Utilisez
--instructionspour un filtrage sémantique quand les motifs de chemin ne suffisent pas.
Voir aussi
- tavily-extract — extraire le contenu des URLs que vous découvrez
- tavily-crawl — extraction en masse quand vous avez besoin de nombreuses pages