Data & IA

Skills pour LLM, bases vectorielles, training de modeles et scraping web.

175 skills

#	Skill	Source	Description		Maj
1	hf-cli	huggingface/skills	Gérer dépôts, fichiers et authentification sur le Hub Hugging Face via CLI.	10 498	1h
2	deepstream-dev	nvidia/skills	Développer des pipelines DeepStream SDK avec les bonnes pratiques et règles d'architecture NVIDIA.	87	6h
3	deepstream-import-vision-model	nvidia/skills	Importer et benchmarker des modèles de détection d'objets dans DeepStream via TensorRT.	87	6h
4	cudaq-guide	nvidia/skills	Guider l'utilisateur dans CUDA-Q : installation, simulation GPU et accès QPU.	87	6h
5	evaluation	nvidia/skills	Générer et exécuter des configurations YAML d'évaluation de modèles LLM via NeMo Evaluator.	87	6h
6	exec-local-compile	nvidia/skills	Compiler TensorRT-LLM depuis les sources sur un nœud de calcul avec GPU.	87	6h
7	flashinfer-upgrade	nvidia/skills	Mettre à jour automatiquement le package flashinfer-python dans TensorRT-LLM.	87	6h
8	cuopt-user-rules	nvidia/skills	Optimiser des problèmes de routage et logistique avec cuOpt via des échanges guidés.	87	6h
9	arize-annotation	github/awesome-copilot	Créer et gérer des configs d'annotation pour labelliser des spans IA via Arize.	33 040	2j
10	arize-experiment	github/awesome-copilot	Gérer et exporter des expériences d'évaluation de modèles IA via Arize.	33 040	2j
11	web3-polymarket	elophanto/elophanto	Interagir avec Polymarket pour placer des ordres et gérer un portefeuille de prédiction.	72	3j
12	monkey-patch-kernels-to-transformers	nvidia/skills	Intégrer des kernels TileGym dans Transformers via monkey-patching pour optimiser les LLM.	87	6j
13	delegating-to-otto	astronomer/agents	Déléguer des tâches complexes Airflow à l'agent Otto via l'Astro CLI.	364	6j
14	adding-cutile-kernel	nvidia/skills	Intégrer un nouvel opérateur cuTile dans TileGym selon un workflow structuré étape par étape.	87	7j
15	converting-cutile-to-triton	nvidia/skills	Convertir des kernels cuTile en kernels Triton via un workflow structuré en cinq phases.	87	7j
16	cutile-python	nvidia/skills	Écrire, déboguer et optimiser des kernels GPU haute performance avec cuTile Python.	87	7j
17	byob	nvidia/skills	Créer des benchmarks d'évaluation personnalisés pour LLM avec NeMo Evaluator.	87	7j
18	cuopt-numerical-optimization-api-python	nvidia/skills	Modéliser et résoudre des problèmes LP, MILP et QP avec cuOpt GPU d'NVIDIA.	87	7j
19	cuopt-routing-api-python	nvidia/skills	Résoudre des problèmes de routage VRP/TSP/PDP avec l'API Python cuOpt.	87	7j
20	experiment-analyzer	datadog-labs/agent-skills	Analyser et comparer des expériences LLM via leurs métriques, dimensions et événements.	110	7j
21	eval-bootstrap	datadog-labs/agent-skills	Générer du code d'évaluation Python à partir de traces de production LLM Datadog.	110	8j
22	train-sentence-transformers	huggingface/skills	Entraîner des modèles sentence-transformers bi-encodeur, cross-encoder ou SPLADE selon le cas d'usage.	10 498	8j
23	pinecone-full-text-search	pinecone-io/skills	Créer et interroger un index full-text-search Pinecone avec l'API preview.	12	8j
24	using-dbt-index	dbt-labs/dbt-agent-skills	Interroger localement les artefacts dbt via une base DuckDB sans connexion entrepôt.	501	10j
25	running-dbt-commands	dbt-labs/dbt-agent-skills	Exécuter des commandes dbt efficacement avec sélecteurs, prévisualisation et variables.	501	10j
26	mini-context-graph	github/awesome-copilot	Construire et interroger un graphe de connaissances persistant combinant wiki, entités et sources brutes.	33 040	10j
27	setting-up-astro-project	astronomer/agents	Initialiser et configurer un projet Airflow avec l'Astro CLI.	364	10j
28	airflow	astronomer/agents	Gérer, diagnostiquer et opérer des workflows Airflow via des commandes CLI dédiées.	364	10j
29	ai-engineering	elophanto/elophanto	Concevoir, déployer et optimiser des modèles IA/ML en production de bout en bout.	72	12j
30	autonomous-experimentation	elophanto/elophanto	Exécuter une boucle d'expérimentation autonome pour optimiser métriquement n'importe quel code.	72	12j
31	data-analytics	elophanto/elophanto	Analyser des données, créer des dashboards et automatiser des rapports décisionnels.	72	12j
32	data-engineering	elophanto/elophanto	Concevoir et opérer des pipelines de données fiables, scalables et observables à grande échelle.	72	12j
33	sales-data-extraction	elophanto/elophanto	Surveiller des répertoires Excel et extraire automatiquement les métriques de vente normalisées.	72	12j
34	adding-model-support	nvidia/skills	Intégrer un nouveau modèle LLM ou VLM dans le framework Megatron-Bridge.	87	13j
35	mlm-bridge-training	nvidia/skills	Comparer et valider les pertes entre Megatron-LM et Bridge sur GPU.	87	13j
36	parity-testing	nvidia/skills	Vérifier la parité des poids et des passes avant entre modèles HF et Megatron.	87	13j
37	perf-activation-recompute	nvidia/skills	Optimiser la mémoire GPU en recomputant sélectivement les activations pendant la rétropropagation.	87	13j
38	perf-megatron-fsdp	nvidia/skills	Configurer et valider l'entraînement distribué avec Megatron FSDP dans Bridge.	87	13j
39	perf-moe-dispatcher-selection	nvidia/skills	Sélectionner le dispatcher MoE optimal selon le matériel, le modèle et le degré EP.	87	13j
40	perf-moe-hardware-configs	nvidia/skills	Configurer les paramètres matériels optimaux pour entraîner des modèles MoE sur GPU.	87	13j
41	perf-moe-long-context	nvidia/skills	Optimiser l'entraînement long-contexte des modèles MoE avec parallélisme et recompute.	87	13j
42	perf-moe-optimization-workflow	nvidia/skills	Optimiser l'entraînement de modèles MoE en gérant mémoire, communication et calcul.	87	13j
43	perf-moe-vlm-training	nvidia/skills	Optimiser l'entraînement de VLM MoE avec FSDP ou parallélisme 3D.	87	13j
44	perf-parallelism-strategies	nvidia/skills	Sélectionner la stratégie de parallélisme optimale selon la taille du modèle et le matériel.	87	13j
45	perf-sequence-packing	nvidia/skills	Configurer le packing de séquences pour le finetuning LLM et VLM optimisé.	87	13j
46	perf-tp-dp-comm-overlap	nvidia/skills	Configurer le chevauchement des communications TP/DP/PP pour optimiser l'entraînement distribué.	87	13j
47	recipe-recommender	nvidia/skills	Indexer les recettes d'entraînement et recommander la configuration optimale pour LLM.	87	13j
48	speech-to-text	elevenlabs/skills	Transcrire de l'audio en texte avec détection de locuteurs et horodatage précis.	237	13j
49	airflow-hitl	astronomer/agents	Intégrer des points de validation humaine dans un DAG Airflow via des opérateurs déférables.	364	14j
50	authoring-dags	astronomer/agents	Créer et valider des DAGs Airflow via le CLI af en suivant les bonnes pratiques.	364	14j

À propos de cette sélection

L'outillage autour de l'IA générative a mûri vite, mais de façon inégale. Les abstractions haut niveau prolifèrent pendant que le bas niveau (embeddings, kernels GPU, pipelines de fine-tuning) reste souvent sous-documenté et morcelé. Les skills data & IA réunis ici couvrent précisément cette zone. Un ingénieur ML qui veut déboguer un kernel Metal ou optimiser un graphe PyTorch trouvera des ressources issues directement des équipes PyTorch. Un dev backend qui bascule vers du RAG trouvera de quoi brancher Qdrant, construire ses pipelines de vecteurs et interroger des modèles via l'API Claude d'Anthropic. Python domine largement le corpus, ce qui reflète l'état réel de l'écosystème. Les profils data engineers habitués à Astronomer ont aussi leur place, avec des skills couvrant l'orchestration de workflows au plus près de la prod.