firecrawl-agent

Par firecrawl · cli

Extraction de données autonome alimentée par l'IA, capable de naviguer sur des sites complexes et de retourner du JSON structuré. Utilisez cette skill lorsque l'utilisateur souhaite des données structurées à partir de sites web, doit extraire des niveaux de tarification, des listes de produits, des entrées d'annuaires, ou toute donnée sous forme de JSON avec un schéma. Se déclenche sur « extraire des données structurées », « récupérer tous les produits », « extraire les informations de tarification », « extraire en JSON », ou lorsque l'utilisateur fournit un schéma JSON pour des données web. Plus puissant que le scraping simple pour l'extraction structurée multi-pages.

npx skills add https://github.com/firecrawl/cli --skill firecrawl-agent

firecrawl agent

Extraction autonome alimentée par l'IA. L'agent navigue sur les sites et extrait des données structurées (prend 2-5 minutes).

Quand l'utiliser

  • Vous avez besoin de données structurées à partir de sites complexes multi-pages
  • Un scraping manuel nécessiterait de naviguer sur de nombreuses pages
  • Vous voulez que l'IA détermine où se trouvent les données

Démarrage rapide

# Extraire des données structurées
firecrawl agent "extract all pricing tiers" --wait -o .firecrawl/pricing.json

# Avec un schéma JSON pour une sortie structurée
firecrawl agent "extract products" --schema '{"type":"object","properties":{"name":{"type":"string"},"price":{"type":"number"}}}' --wait -o .firecrawl/products.json

# Concentrer l'attention sur des pages spécifiques
firecrawl agent "get feature list" --urls "<url>" --wait -o .firecrawl/features.json

Options

Option Description
--urls <urls> URLs de départ pour l'agent
--model <model> Modèle à utiliser : spark-1-mini ou spark-1-pro
--schema <json> Schéma JSON pour la sortie structurée
--schema-file <path> Chemin d'accès au fichier de schéma JSON
--max-credits <n> Limite de crédits pour cette exécution d'agent
--wait Attendre la fin de l'agent
--pretty Affichage JSON formaté
-o, --output <path> Chemin du fichier de sortie

Conseils

  • Utilisez toujours --wait pour obtenir les résultats en ligne. Sans cela, retourne un ID de job.
  • Utilisez --schema pour une sortie prévisible et structurée — sinon l'agent retourne des données au format libre.
  • Les exécutions d'agent consomment plus de crédits qu'un scraping simple. Utilisez --max-credits pour plafonner les dépenses.
  • Pour une extraction simple d'une seule page, préférez scrape — c'est plus rapide et moins cher.

Voir aussi

Skills similaires