Data & IA

Skills pour LLM, bases vectorielles, training de modeles et scraping web.

175 skills

#	Skill	Source	Description		Δ
1	open-source	browser-use/browser-use	Automatiser la navigation web en Python avec des agents IA configurables.	94 033	106
2	arize-annotation	github/awesome-copilot	Créer et gérer des configs d'annotation pour labelliser des spans IA via Arize.	33 040	60
3	arize-experiment	github/awesome-copilot	Gérer et exporter des expériences d'évaluation de modèles IA via Arize.	33 040	60
4	dataverse-python-advanced-patterns	github/awesome-copilot	Générer du code Python production-ready pour interagir avec l'API Dataverse via son SDK.	33 040	60
5	dataverse-python-production-code	github/awesome-copilot	Générer du code Python production-ready pour interagir avec l'API Dataverse.	33 040	60
6	doublecheck	github/awesome-copilot	Vérifier automatiquement les affirmations d'une réponse IA avec sourçage détaillé.	33 040	60
7	geofeed-tuner	github/awesome-copilot	Créer et optimiser des feeds de géolocalisation IP au format CSV selon RFC 8805.	33 040	60
8	phoenix-evals	github/awesome-copilot	Construire et valider des évaluateurs LLM pour applications IA en production.	33 040	60
9	phoenix-tracing	github/awesome-copilot	Instrumenter des applications LLM avec Phoenix via le tracing OpenInference.	33 040	60
10	python-mcp-server-generator	github/awesome-copilot	Générer un serveur MCP Python complet, production-ready, avec outils typés et gestion d'erreurs.	33 040	60
11	agent-governance	github/awesome-copilot	Appliquer des règles de sécurité et de conformité aux actions d'un agent IA.	33 040	60
12	agentic-eval	github/awesome-copilot	Implémenter des boucles d'évaluation itératives pour affiner et améliorer les sorties d'agents IA.	33 040	60
13	bigquery-pipeline-audit	github/awesome-copilot	Auditer un pipeline BigQuery pour coûts, sécurité et fiabilité en production.	33 040	60
14	datanalysis-credit-risk	github/awesome-copilot	Nettoyer et sélectionner des variables pour modélisation de risque crédit.	33 040	60
15	eval-driven-dev	github/awesome-copilot	Construire un pipeline d'évaluation automatisé end-to-end pour applications Python utilisant un LLM.	33 040	60
16	mini-context-graph	github/awesome-copilot	Construire et interroger un graphe de connaissances persistant combinant wiki, entités et sources brutes.	33 040	60
17	projection-patterns	wshobson/agents	Construire des projections et read models pour systèmes event-sourced en CQRS.	35 424	49
18	airflow-dag-patterns	wshobson/agents	Orchestrer des pipelines de données Apache Airflow avec patterns, opérateurs et déploiement.	35 424	49
19	data-quality-frameworks	wshobson/agents	Implémenter des frameworks de qualité de données avec Great Expectations, dbt et contrats.	35 424	49
20	spark-optimization	wshobson/agents	Optimiser les jobs Apache Spark avec partitionnement, mémoire et gestion des shuffles.	35 424	49
21	hybrid-search-implementation	wshobson/agents	Combiner recherche vectorielle et par mots-clés pour améliorer le rappel RAG.	35 424	49
22	langchain-architecture	wshobson/agents	Construire des agents IA sophistiqués avec LangChain, LangGraph et gestion d'état.	35 424	49
23	llm-evaluation	wshobson/agents	Évaluer les performances des LLM via métriques automatisées, jugement humain et A/B testing.	35 424	49
24	similarity-search-patterns	wshobson/agents	Implémenter une recherche vectorielle sémantique efficace et scalable en production.	35 424	49
25	vector-index-tuning	wshobson/agents	Optimiser les index vectoriels HNSW pour maximiser rappel, vitesse et mémoire.	35 424	49
26	ml-pipeline-workflow	wshobson/agents	Orchestrer un pipeline MLOps complet de l'ingestion des données au déploiement en production.	35 424	49
27	backtesting-frameworks	wshobson/agents	Construire des systèmes de backtesting robustes pour évaluer fiablement des stratégies de trading.	35 424	49
28	risk-metrics-calculation	wshobson/agents	Calculer la VaR, CVaR et métriques de risque pour la gestion de portefeuille.	35 424	49
29	jupyter-notebook	openai/skills	Créer et structurer des notebooks Jupyter reproductibles pour expériences ou tutoriels.	19 156	48
30	nextflow-development	anthropics/knowledge-work-plugins	Déployer et exécuter des pipelines bioinformatiques nf-core sur données locales ou publiques.	12 182	38
31	instrument-data-to-allotrope	anthropics/knowledge-work-plugins	Convertir des fichiers instruments au format standardisé Allotrope Simple Model pour LIMS.	12 182	38
32	scvi-tools	anthropics/knowledge-work-plugins	Analyser des données single-cell multi-modales avec les modèles probabilistes scvi-tools.	12 182	38
33	single-cell-rna-qc	anthropics/knowledge-work-plugins	Automatiser le contrôle qualité de données single-cell RNA-seq selon les bonnes pratiques scverse.	12 182	38
34	create-viz	anthropics/knowledge-work-plugins	Générer des visualisations de données professionnelles avec Python selon les meilleures pratiques.	12 182	38
35	data-visualization	anthropics/knowledge-work-plugins	Créer des visualisations de données efficaces avec Python selon les meilleures pratiques.	12 182	38
36	statistical-analysis	anthropics/knowledge-work-plugins	Analyser des données statistiques avec tendances, distributions et tests d'hypothèses.	12 182	38
37	aoti-debug	pytorch/pytorch	Diagnostiquer et corriger les erreurs courantes d'AOTInductor avec méthode.	99 930	21
38	pt2-bug-basher	pytorch/pytorch	Déboguer les erreurs de compilation PyTorch 2 via Dynamo, Inductor et AOTAutograd.	99 930	21
39	ai-engineering	elophanto/elophanto	Concevoir, déployer et optimiser des modèles IA/ML en production de bout en bout.	72	13
40	autonomous-experimentation	elophanto/elophanto	Exécuter une boucle d'expérimentation autonome pour optimiser métriquement n'importe quel code.	72	13
41	data-analytics	elophanto/elophanto	Analyser des données, créer des dashboards et automatiser des rapports décisionnels.	72	13
42	data-engineering	elophanto/elophanto	Concevoir et opérer des pipelines de données fiables, scalables et observables à grande échelle.	72	13
43	sales-data-extraction	elophanto/elophanto	Surveiller des répertoires Excel et extraire automatiquement les métriques de vente normalisées.	72	13
44	web3-polymarket	elophanto/elophanto	Interagir avec Polymarket pour placer des ordres et gérer un portefeuille de prédiction.	72	13
45	hf-mcp	huggingface/skills	Connecter des assistants IA au Hub Hugging Face pour modèles, datasets et jobs GPU.	10 498	7
46	hf-cli	huggingface/skills	Gérer dépôts, fichiers et authentification sur le Hub Hugging Face via CLI.	10 498	7
47	huggingface-community-evals	huggingface/skills	Évaluer localement des modèles Hugging Face Hub avec inspect-ai ou lighteval.	10 498	7
48	huggingface-paper-publisher	huggingface/skills	Publier, gérer et lier des articles de recherche sur Hugging Face Hub.	10 498	7
49	huggingface-llm-trainer	huggingface/skills	Entraîner des modèles de langage avec TRL sur l'infrastructure cloud Hugging Face Jobs.	10 498	7
50	huggingface-trackio	huggingface/skills	Suivre, visualiser et piloter des expériences d'entraînement ML en temps réel.	10 498	7

À propos de cette sélection

L'outillage autour de l'IA générative a mûri vite, mais de façon inégale. Les abstractions haut niveau prolifèrent pendant que le bas niveau (embeddings, kernels GPU, pipelines de fine-tuning) reste souvent sous-documenté et morcelé. Les skills data & IA réunis ici couvrent précisément cette zone. Un ingénieur ML qui veut déboguer un kernel Metal ou optimiser un graphe PyTorch trouvera des ressources issues directement des équipes PyTorch. Un dev backend qui bascule vers du RAG trouvera de quoi brancher Qdrant, construire ses pipelines de vecteurs et interroger des modèles via l'API Claude d'Anthropic. Python domine largement le corpus, ce qui reflète l'état réel de l'écosystème. Les profils data engineers habitués à Astronomer ont aussi leur place, avec des skills couvrant l'orchestration de workflows au plus près de la prod.