Training & Fine-tuning

Entrainement et fine-tuning de modeles, MLOps, recherche scientifique.

87 skills

# Skill Source Description Δ
1 arize-annotation github/awesome-copilot Créer et gérer des configs d'annotation pour labelliser des spans IA via Arize. 33 040 563
2 arize-experiment github/awesome-copilot Gérer et exporter des expériences d'évaluation de modèles IA via Arize. 33 040 563
3 autoresearch github/awesome-copilot Automatiser des expérimentations itératives sur du code jusqu'à atteindre un objectif mesurable. 33 040 563
4 datanalysis-credit-risk github/awesome-copilot Nettoyer et sélectionner des variables pour modélisation de risque crédit. 33 040 563
5 eval-driven-dev github/awesome-copilot Construire un pipeline d'évaluation automatisé end-to-end pour applications Python utilisant un LLM. 33 040 563
6 jupyter-notebook openai/skills Créer et structurer des notebooks Jupyter reproductibles pour expériences ou tutoriels. 19 156 540
7 backtesting-frameworks wshobson/agents Construire des systèmes de backtesting robustes pour évaluer fiablement des stratégies de trading. 35 424 412
8 scientific-problem-selection anthropics/knowledge-work-plugins Guider les scientifiques dans la sélection et l'évaluation stratégique de problèmes de recherche. 12 182 231
9 statistical-analysis anthropics/knowledge-work-plugins Analyser des données statistiques avec tendances, distributions et tests d'hypothèses. 12 182 231
10 scvi-tools anthropics/knowledge-work-plugins Analyser des données single-cell multi-modales avec les modèles probabilistes scvi-tools. 12 182 231
11 aoti-debug pytorch/pytorch Diagnostiquer et corriger les erreurs courantes d'AOTInductor avec méthode. 99 930 164
12 metal-kernel pytorch/pytorch Implémenter des kernels Metal natifs pour opérateurs PyTorch sur Apple Silicon. 99 930 164
13 pt2-bug-basher pytorch/pytorch Déboguer les erreurs de compilation PyTorch 2 via Dynamo, Inductor et AOTAutograd. 99 930 164
14 huggingface-community-evals huggingface/skills Évaluer localement des modèles Hugging Face Hub avec inspect-ai ou lighteval. 10 498 84
15 huggingface-llm-trainer huggingface/skills Entraîner des modèles de langage avec TRL sur l'infrastructure cloud Hugging Face Jobs. 10 498 84
16 huggingface-trackio huggingface/skills Suivre, visualiser et piloter des expériences d'entraînement ML en temps réel. 10 498 84
17 huggingface-vision-trainer huggingface/skills Entraîner des modèles de vision (détection, classification, segmentation) sur GPU cloud Hugging Face. 10 498 84
18 train-sentence-transformers huggingface/skills Entraîner des modèles sentence-transformers bi-encodeur, cross-encoder ou SPLADE selon le cas d'usage. 10 498 84
19 azure-ai-vision-imageanalysis-java microsoft/skills Analyser des images Azure avec détection d'objets, OCR et génération de légendes en Java. 2 316 55
20 azure-ai-ml-py microsoft/skills Gérer les ressources Azure ML via le SDK Python v2. 2 316 55
21 continual-learning microsoft/skills Implémenter un apprentissage continu entre sessions pour agents IA codeurs. 2 316 55
22 ai-engineering elophanto/elophanto Concevoir, déployer et optimiser des modèles IA/ML en production de bout en bout. 72 16
23 autonomous-experimentation elophanto/elophanto Exécuter une boucle d'expérimentation autonome pour optimiser métriquement n'importe quel code. 72 16
24 ranger-finance elophanto/elophanto Agréger et router des ordres de futures perpétuels sur Solana via plusieurs protocoles. 72 16
25 eval-bootstrap datadog-labs/agent-skills Générer du code d'évaluation Python à partir de traces de production LLM Datadog. 110 6
26 experiment-analyzer datadog-labs/agent-skills Analyser et comparer des expériences LLM via leurs métriques, dimensions et événements. 110 6
27 cudaq-guide nvidia/skills Guider l'utilisateur dans CUDA-Q : installation, simulation GPU et accès QPU. 87 4
28 mlm-bridge-training nvidia/skills Comparer et valider les pertes entre Megatron-LM et Bridge sur GPU. 87 4
29 parity-testing nvidia/skills Vérifier la parité des poids et des passes avant entre modèles HF et Megatron. 87 4
30 perf-activation-recompute nvidia/skills Optimiser la mémoire GPU en recomputant sélectivement les activations pendant la rétropropagation. 87 4
31 perf-megatron-fsdp nvidia/skills Configurer et valider l'entraînement distribué avec Megatron FSDP dans Bridge. 87 4
32 perf-moe-dispatcher-selection nvidia/skills Sélectionner le dispatcher MoE optimal selon le matériel, le modèle et le degré EP. 87 4
33 perf-moe-hardware-configs nvidia/skills Configurer les paramètres matériels optimaux pour entraîner des modèles MoE sur GPU. 87 4
34 perf-moe-long-context nvidia/skills Optimiser l'entraînement long-contexte des modèles MoE avec parallélisme et recompute. 87 4
35 perf-moe-optimization-workflow nvidia/skills Optimiser l'entraînement de modèles MoE en gérant mémoire, communication et calcul. 87 4
36 perf-moe-vlm-training nvidia/skills Optimiser l'entraînement de VLM MoE avec FSDP ou parallélisme 3D. 87 4
37 perf-parallelism-strategies nvidia/skills Sélectionner la stratégie de parallélisme optimale selon la taille du modèle et le matériel. 87 4
38 perf-sequence-packing nvidia/skills Configurer le packing de séquences pour le finetuning LLM et VLM optimisé. 87 4
39 perf-tp-dp-comm-overlap nvidia/skills Configurer le chevauchement des communications TP/DP/PP pour optimiser l'entraînement distribué. 87 4
40 recipe-recommender nvidia/skills Indexer les recettes d'entraînement et recommander la configuration optimale pour LLM. 87 4
41 accessing-mlflow nvidia/skills Interroger et comparer des runs MLflow via langage naturel et MCP. 87 4
42 evaluation nvidia/skills Générer et exécuter des configurations YAML d'évaluation de modèles LLM via NeMo Evaluator. 87 4
43 launching-evals nvidia/skills Lancer, surveiller et analyser des évaluations de modèles IA via NeMo Evaluator. 87 4
44 ptq nvidia/skills Quantifier un modèle pré-entraîné en checkpoint optimisé via ModelOpt PTQ. 87 4
45 nel-assistant nvidia/skills Générer et exécuter des configurations YAML d'évaluation de modèles via NeMo Evaluator. 87 4
46 byob nvidia/skills Créer des benchmarks d'évaluation personnalisés pour LLM avec NeMo Evaluator. 87 4
47 add-benchmark nvidia/skills Intégrer un benchmark natif ou externe dans le framework NeMo-Gym. 87 4
48 ad-add-fusion-transformation nvidia/skills Ajouter, étendre ou auditer un pass de fusion dans AutoDeploy de TensorRT-LLM. 87 4
49 ad-graph-dump nvidia/skills Visualiser l'évolution des graphes FX après chaque transformation AutoDeploy via dump. 87 4
50 ad-model-onboard nvidia/skills Automatiser l'intégration de modèles HuggingFace dans AutoDeploy avec tests et rapport. 87 4

À propos de cette sélection

Quand un modèle de base commence à produire des réponses trop génériques pour rester crédibles en production, le travail sérieux commence. Cette section s'adresse aux ingénieurs ML et aux équipes qui adaptent, évaluent et débogent des modèles en conditions réelles : affiner un LLM sur un corpus métier avec Hugging Face, tracer des expériences d'entraînement bout en bout, ou remonter un bug de compilation dans le runtime PyTorch avant qu'il bloque un pipeline entier. Les skills training & fine-tuning couvrent un spectre plus large que le seul fine-tuning supervisé. On y trouve des outils d'annotation, de benchmarking, de kernels custom côté NVIDIA, et quelques skills orientés recherche reproductible. L'outillage reste majoritairement Python, avec une densité forte autour des frameworks majeurs. Certains cas avancés demandent encore de composer plusieurs skills ensemble, mais la base est solide.