Data & IA

Skills pour LLM, bases vectorielles, training de modeles et scraping web.

175 skills

# Skill Source Description Δ
1 open-source browser-use/browser-use Automatiser la navigation web en Python avec des agents IA configurables. 94 033 1076
2 arize-annotation github/awesome-copilot Créer et gérer des configs d'annotation pour labelliser des spans IA via Arize. 33 040 563
3 arize-experiment github/awesome-copilot Gérer et exporter des expériences d'évaluation de modèles IA via Arize. 33 040 563
4 dataverse-python-advanced-patterns github/awesome-copilot Générer du code Python production-ready pour interagir avec l'API Dataverse via son SDK. 33 040 563
5 dataverse-python-production-code github/awesome-copilot Générer du code Python production-ready pour interagir avec l'API Dataverse. 33 040 563
6 doublecheck github/awesome-copilot Vérifier automatiquement les affirmations d'une réponse IA avec sourçage détaillé. 33 040 563
7 geofeed-tuner github/awesome-copilot Créer et optimiser des feeds de géolocalisation IP au format CSV selon RFC 8805. 33 040 563
8 phoenix-evals github/awesome-copilot Construire et valider des évaluateurs LLM pour applications IA en production. 33 040 563
9 phoenix-tracing github/awesome-copilot Instrumenter des applications LLM avec Phoenix via le tracing OpenInference. 33 040 563
10 python-mcp-server-generator github/awesome-copilot Générer un serveur MCP Python complet, production-ready, avec outils typés et gestion d'erreurs. 33 040 563
11 agent-governance github/awesome-copilot Appliquer des règles de sécurité et de conformité aux actions d'un agent IA. 33 040 563
12 agentic-eval github/awesome-copilot Implémenter des boucles d'évaluation itératives pour affiner et améliorer les sorties d'agents IA. 33 040 563
13 bigquery-pipeline-audit github/awesome-copilot Auditer un pipeline BigQuery pour coûts, sécurité et fiabilité en production. 33 040 563
14 datanalysis-credit-risk github/awesome-copilot Nettoyer et sélectionner des variables pour modélisation de risque crédit. 33 040 563
15 eval-driven-dev github/awesome-copilot Construire un pipeline d'évaluation automatisé end-to-end pour applications Python utilisant un LLM. 33 040 563
16 mini-context-graph github/awesome-copilot Construire et interroger un graphe de connaissances persistant combinant wiki, entités et sources brutes. 33 040 563
17 jupyter-notebook openai/skills Créer et structurer des notebooks Jupyter reproductibles pour expériences ou tutoriels. 19 156 540
18 projection-patterns wshobson/agents Construire des projections et read models pour systèmes event-sourced en CQRS. 35 424 412
19 airflow-dag-patterns wshobson/agents Orchestrer des pipelines de données Apache Airflow avec patterns, opérateurs et déploiement. 35 424 412
20 data-quality-frameworks wshobson/agents Implémenter des frameworks de qualité de données avec Great Expectations, dbt et contrats. 35 424 412
21 spark-optimization wshobson/agents Optimiser les jobs Apache Spark avec partitionnement, mémoire et gestion des shuffles. 35 424 412
22 hybrid-search-implementation wshobson/agents Combiner recherche vectorielle et par mots-clés pour améliorer le rappel RAG. 35 424 412
23 langchain-architecture wshobson/agents Construire des agents IA sophistiqués avec LangChain, LangGraph et gestion d'état. 35 424 412
24 llm-evaluation wshobson/agents Évaluer les performances des LLM via métriques automatisées, jugement humain et A/B testing. 35 424 412
25 similarity-search-patterns wshobson/agents Implémenter une recherche vectorielle sémantique efficace et scalable en production. 35 424 412
26 vector-index-tuning wshobson/agents Optimiser les index vectoriels HNSW pour maximiser rappel, vitesse et mémoire. 35 424 412
27 ml-pipeline-workflow wshobson/agents Orchestrer un pipeline MLOps complet de l'ingestion des données au déploiement en production. 35 424 412
28 backtesting-frameworks wshobson/agents Construire des systèmes de backtesting robustes pour évaluer fiablement des stratégies de trading. 35 424 412
29 risk-metrics-calculation wshobson/agents Calculer la VaR, CVaR et métriques de risque pour la gestion de portefeuille. 35 424 412
30 nextflow-development anthropics/knowledge-work-plugins Déployer et exécuter des pipelines bioinformatiques nf-core sur données locales ou publiques. 12 182 231
31 instrument-data-to-allotrope anthropics/knowledge-work-plugins Convertir des fichiers instruments au format standardisé Allotrope Simple Model pour LIMS. 12 182 231
32 scvi-tools anthropics/knowledge-work-plugins Analyser des données single-cell multi-modales avec les modèles probabilistes scvi-tools. 12 182 231
33 single-cell-rna-qc anthropics/knowledge-work-plugins Automatiser le contrôle qualité de données single-cell RNA-seq selon les bonnes pratiques scverse. 12 182 231
34 create-viz anthropics/knowledge-work-plugins Générer des visualisations de données professionnelles avec Python selon les meilleures pratiques. 12 182 231
35 data-visualization anthropics/knowledge-work-plugins Créer des visualisations de données efficaces avec Python selon les meilleures pratiques. 12 182 231
36 statistical-analysis anthropics/knowledge-work-plugins Analyser des données statistiques avec tendances, distributions et tests d'hypothèses. 12 182 231
37 aoti-debug pytorch/pytorch Diagnostiquer et corriger les erreurs courantes d'AOTInductor avec méthode. 99 930 164
38 pt2-bug-basher pytorch/pytorch Déboguer les erreurs de compilation PyTorch 2 via Dynamo, Inductor et AOTAutograd. 99 930 164
39 hf-mcp huggingface/skills Connecter des assistants IA au Hub Hugging Face pour modèles, datasets et jobs GPU. 10 498 84
40 hf-cli huggingface/skills Gérer dépôts, fichiers et authentification sur le Hub Hugging Face via CLI. 10 498 84
41 huggingface-community-evals huggingface/skills Évaluer localement des modèles Hugging Face Hub avec inspect-ai ou lighteval. 10 498 84
42 huggingface-paper-publisher huggingface/skills Publier, gérer et lier des articles de recherche sur Hugging Face Hub. 10 498 84
43 huggingface-llm-trainer huggingface/skills Entraîner des modèles de langage avec TRL sur l'infrastructure cloud Hugging Face Jobs. 10 498 84
44 huggingface-trackio huggingface/skills Suivre, visualiser et piloter des expériences d'entraînement ML en temps réel. 10 498 84
45 huggingface-vision-trainer huggingface/skills Entraîner des modèles de vision (détection, classification, segmentation) sur GPU cloud Hugging Face. 10 498 84
46 train-sentence-transformers huggingface/skills Entraîner des modèles sentence-transformers bi-encodeur, cross-encoder ou SPLADE selon le cas d'usage. 10 498 84
47 agent-framework-azure-ai-py microsoft/skills Créer des agents persistants sur Azure AI Foundry avec outils intégrés et gestion de conversation. 2 316 55
48 azure-ai-contentunderstanding-py microsoft/skills Extraire du contenu sémantique multimodal depuis documents, vidéos, audios et images. 2 316 55
49 azure-ai-language-conversations-py microsoft/skills Implémenter l'analyse conversationnelle Azure AI avec le SDK Python dédié. 2 316 55
50 azure-ai-ml-py microsoft/skills Gérer les ressources Azure ML via le SDK Python v2. 2 316 55

À propos de cette sélection

L'outillage autour de l'IA générative a mûri vite, mais de façon inégale. Les abstractions haut niveau prolifèrent pendant que le bas niveau (embeddings, kernels GPU, pipelines de fine-tuning) reste souvent sous-documenté et morcelé. Les skills data & IA réunis ici couvrent précisément cette zone. Un ingénieur ML qui veut déboguer un kernel Metal ou optimiser un graphe PyTorch trouvera des ressources issues directement des équipes PyTorch. Un dev backend qui bascule vers du RAG trouvera de quoi brancher Qdrant, construire ses pipelines de vecteurs et interroger des modèles via l'API Claude d'Anthropic. Python domine largement le corpus, ce qui reflète l'état réel de l'écosystème. Les profils data engineers habitués à Astronomer ont aussi leur place, avec des skills couvrant l'orchestration de workflows au plus près de la prod.