Web Scraping & Crawling

Extraction de donnees web : crawlers, RSS, Apify, indexation.

6 skills

# Skill Source Description Maj
1 speech-to-text elevenlabs/skills Transcrire de l'audio en texte avec détection de locuteurs et horodatage précis. 237 14j
2 tavily-dynamic-search tavily-ai/skills Filtrer et extraire des résultats web sans polluer la fenêtre de contexte. 291 1mo
3 mapbox-mcp-runtime-patterns mapbox/mapbox-agent-skills Intégrer des capacités géospatiales Mapbox dans des applications IA via MCP. 55 1mo
4 tavily-cli tavily-ai/skills Rechercher, extraire, crawler et analyser le web via Tavily CLI. 291 1mo
5 tavily-best-practices tavily-ai/skills Accéder à des données web en temps réel via une API de recherche optimisée pour les LLMs. 291 1mo
6 elevenlabs-transcribe elevenlabs/skills Transcrire de l'audio en texte avec identification des locuteurs et streaming temps réel. 237 3mo

À propos de cette sélection

L'outillage de scraping web a longtemps ressemblé à un chantier artisanal : un script Playwright bricolé, un cron qui tombe en silence, des sélecteurs CSS qui rendent l'âme dès qu'un front-end se restructure. Les agents IA changent la donne. Ils ont besoin d'accéder au web de façon fiable, autonome et reproductible, et c'est précisément ce que couvrent les skills web scraping & crawling rassemblés ici. De quoi piloter un navigateur headless pour extraire des données structurées depuis des pages dynamiques, ou brancher un agent sur un moteur de recherche comme Tavily et Brave sans écrire une ligne de parsing. Ces skills s'adressent aux développeurs Python ou TypeScript qui alimentent des pipelines de données, construisent des agents de veille ou enrichissent des datasets pour du fine-tuning. L'écosystème couvre déjà une bonne partie des cas d'usage courants.