Pipelines de données

Orchestration et transformation de donnees : Airflow, dbt, Astronomer, ETL et ELT.

97 skills

# Skill Source Description
1 airflow-dag-patterns wshobson/agents Orchestrer des pipelines de données Apache Airflow avec patterns, opérateurs et déploiement. 35 416
2 data-quality-frameworks wshobson/agents Implémenter des frameworks de qualité de données avec Great Expectations, dbt et contrats. 35 416
3 dbt-transformation-patterns wshobson/agents Structurer et optimiser des pipelines de transformation dbt en couches analytiques. 35 416
4 ml-pipeline-workflow wshobson/agents Orchestrer un pipeline MLOps complet de l'ingestion des données au déploiement en production. 35 416
5 projection-patterns wshobson/agents Construire des projections et read models pour systèmes event-sourced en CQRS. 35 416
6 risk-metrics-calculation wshobson/agents Calculer la VaR, CVaR et métriques de risque pour la gestion de portefeuille. 35 416
7 spark-optimization wshobson/agents Optimiser les jobs Apache Spark avec partitionnement, mémoire et gestion des shuffles. 35 416
8 arize-dataset github/awesome-copilot Gérer et exporter des datasets versionnés dans l'espace Arize via CLI. 33 028
9 bigquery-pipeline-audit github/awesome-copilot Auditer un pipeline BigQuery pour coûts, sécurité et fiabilité en production. 33 028
10 dataverse-python-advanced-patterns github/awesome-copilot Générer du code Python production-ready pour interagir avec l'API Dataverse via son SDK. 33 028
11 dataverse-python-production-code github/awesome-copilot Générer du code Python production-ready pour interagir avec l'API Dataverse. 33 028
12 geofeed-tuner github/awesome-copilot Créer et optimiser des feeds de géolocalisation IP au format CSV selon RFC 8805. 33 028
13 mini-context-graph github/awesome-copilot Construire et interroger un graphe de connaissances persistant combinant wiki, entités et sources brutes. 33 028
14 power-bi-model-design-review github/awesome-copilot Auditer et optimiser la conception d'un modèle de données Power BI. 33 028
15 powerbi-modeling github/awesome-copilot Concevoir et optimiser des modèles sémantiques Power BI selon les bonnes pratiques Microsoft. 33 028
16 analyze anthropics/knowledge-work-plugins Analyser des données et répondre à toute question métrique, de la simple requête au rapport formel. 12 181
17 create-viz anthropics/knowledge-work-plugins Générer des visualisations de données professionnelles avec Python selon les meilleures pratiques. 12 181
18 data-context-extractor anthropics/knowledge-work-plugins Extraire le contexte métier d'analystes et générer des skills d'analyse de données sur mesure. 12 181
19 explore-data anthropics/knowledge-work-plugins Profiler un dataset pour révéler sa structure, qualité et patterns clés. 12 181
20 instrument-data-to-allotrope anthropics/knowledge-work-plugins Convertir des fichiers instruments au format standardisé Allotrope Simple Model pour LIMS. 12 181
21 knowledge-synthesis anthropics/knowledge-work-plugins Synthétiser des résultats multi-sources en réponse cohérente, sourcée et fiable. 12 181
22 nextflow-development anthropics/knowledge-work-plugins Déployer et exécuter des pipelines bioinformatiques nf-core sur données locales ou publiques. 12 181
23 search-strategy anthropics/knowledge-work-plugins Transformer une question en recherches parallèles multi-sources et synthétiser les résultats. 12 181
24 single-cell-rna-qc anthropics/knowledge-work-plugins Automatiser le contrôle qualité de données single-cell RNA-seq selon les bonnes pratiques scverse. 12 181
25 sql-queries anthropics/knowledge-work-plugins Écrire des requêtes SQL performantes et lisibles pour tous les grands entrepôts de données. 12 181
26 validate-data anthropics/knowledge-work-plugins Valider une analyse de données pour détecter erreurs, biais et incohérences avant partage. 12 181
27 write-query anthropics/knowledge-work-plugins Générer des requêtes SQL optimisées à partir d'une description en langage naturel. 12 181
28 hf-cli huggingface/skills Gérer dépôts, fichiers et authentification sur le Hub Hugging Face via CLI. 10 497
29 huggingface-tool-builder huggingface/skills Créer des scripts CLI réutilisables pour interagir avec l'API Hugging Face. 10 497
30 azure-ai-document-intelligence-dotnet microsoft/skills Extraire texte, tableaux et données structurées depuis des documents Azure. 2 315
31 deep-agents-memory langchain-ai/langchain-skills Gérer la persistance de fichiers pour agents IA avec backends modulaires éphémères ou permanents. 689
32 answering-natural-language-questions-with-dbt dbt-labs/dbt-agent-skills Répondre à des questions métier en exploitant les meilleures sources de données dbt disponibles. 501
33 building-dbt-semantic-layer dbt-labs/dbt-agent-skills Créer et modifier des composants dbt Semantic Layer : modèles, entités, dimensions et métriques. 501
34 creating-mermaid-dbt-dag dbt-labs/dbt-agent-skills Générer un diagramme Mermaid visuel du DAG dbt d'un modèle donné. 501
35 fetching-dbt-docs dbt-labs/dbt-agent-skills Récupérer et rechercher la documentation dbt en format markdown optimisé pour les LLMs. 501
36 migrating-dbt-core-to-fusion dbt-labs/dbt-agent-skills Trier et classer les erreurs de migration dbt pour guider leur résolution. 501
37 migrating-dbt-project-across-platforms dbt-labs/dbt-agent-skills Migrer un projet dbt entre plateformes de données avec validation automatisée. 501
38 running-dbt-commands dbt-labs/dbt-agent-skills Exécuter des commandes dbt efficacement avec sélecteurs, prévisualisation et variables. 501
39 troubleshooting-dbt-job-errors dbt-labs/dbt-agent-skills Diagnostiquer et résoudre méthodiquement les échecs de jobs dbt Cloud. 501
40 using-dbt-for-analytics-engineering dbt-labs/dbt-agent-skills Construire, modifier et tester des modèles dbt avec rigueur et bonnes pratiques. 501
41 using-dbt-index dbt-labs/dbt-agent-skills Interroger localement les artefacts dbt via une base DuckDB sans connexion entrepôt. 501
42 working-with-dbt-mesh dbt-labs/dbt-agent-skills Configurer et naviguer dans un projet dbt Mesh multi-projets avec des références croisées. 501
43 chdb-datastore clickhouse/agent-skills Remplacer pandas par une alternative ClickHouse-backed, plus rapide et sans changer son code. 428
44 chdb-sql clickhouse/agent-skills Exécuter des requêtes SQL ClickHouse en Python sans serveur sur fichiers, bases et cloud. 428
45 clickhouse-architecture-advisor clickhouse/agent-skills Conseiller en architecture ClickHouse adapté au profil de charge et aux données. 428
46 clickhouse-best-practices clickhouse/agent-skills Appliquer les meilleures pratiques ClickHouse pour schémas, requêtes et ingestion de données. 428
47 clickhouse-js-node-troubleshooting clickhouse/agent-skills Diagnostiquer et résoudre les problèmes courants du client Node.js ClickHouse. 428
48 clickhousectl-local-dev clickhouse/agent-skills Configurer un environnement ClickHouse local complet avec clickhousectl, étape par étape. 428
49 airflow astronomer/agents Gérer, diagnostiquer et opérer des workflows Airflow via des commandes CLI dédiées. 364
50 airflow-adapter astronomer/agents Assurer la compatibilité automatique entre les API Airflow 2.x et 3.x. 364

À propos de cette sélection

L'orchestration de données a longtemps reposé sur des scripts fragiles qu'on ne touchait plus par peur de tout casser. Des acteurs comme Astronomer et dbt Labs ont depuis industrialisé la discipline : DAGs versionnés, transformations testables, lignage de bout en bout. Les skills pipelines de données rassemblés ici couvrent des cas concrets, auditer un pipeline BigQuery pour détecter des dérives de coût ou de fraîcheur, modéliser un dataset pour l'exposer proprement à une couche BI sans multiplier les joins à la main. L'outillage disponible est solide, majoritairement Python, et couvre le spectre du prototypage local au déploiement en production supervisé. Ça parle autant aux data engineers qu'aux ML engineers qui branchent des flux en amont de leurs modèles.