Monitoring & Observabilité

Logs, traces et metriques : OpenTelemetry, Sentry, Application Insights, Grafana.

88 skills

# Skill Source Description Δ
1 arize-instrumentation github/awesome-copilot Instrumenter une application avec le tracing Arize AX via une analyse guidée. 33 040 563
2 power-bi-performance-troubleshooting github/awesome-copilot Diagnostiquer et résoudre les problèmes de performance dans Power BI. 33 040 563
3 flowstudio-power-automate-monitoring github/awesome-copilot Surveiller la santé des flux Power Automate via un cache enrichi de métadonnées de gouvernance. 33 040 563
4 copilot-usage-metrics github/awesome-copilot Récupérer et afficher les métriques d'utilisation de GitHub Copilot via CLI. 33 040 563
5 debian-linux-triage github/awesome-copilot Diagnostiquer et résoudre des problèmes système sur Debian Linux avec outils adaptés. 33 040 563
6 fedora-linux-triage github/awesome-copilot Diagnostiquer et résoudre des problèmes système sur Fedora Linux pas à pas. 33 040 563
7 qdrant-monitoring github/awesome-copilot Surveiller et diagnostiquer les performances d'un déploiement Qdrant en production. 33 040 563
8 qdrant-monitoring-debugging github/awesome-copilot Diagnostiquer les problèmes de performance Qdrant via métriques d'optimisation et mémoire. 33 040 563
9 qdrant-monitoring-setup github/awesome-copilot Configurer la surveillance Qdrant avec Prometheus, alertes et logs centralisés. 33 040 563
10 qdrant-memory-usage-optimization github/awesome-copilot Optimiser et surveiller l'utilisation mémoire de Qdrant pour des performances maximales. 33 040 563
11 qdrant-scaling-data-volume github/awesome-copilot Scaler des volumes de données massifs via multi-tenancy, fenêtre temporelle ou sharding distribué. 33 040 563
12 sentry openai/skills Interroger Sentry en lecture seule pour analyser, diagnostiquer et expliquer les erreurs de production. 19 156 540
13 cost-optimization wshobson/agents Optimiser les coûts cloud sur AWS, Azure, GCP et OCI via des stratégies systématiques. 35 424 412
14 service-mesh-observability wshobson/agents Configurer l'observabilité complète d'un service mesh avec métriques, traces et logs. 35 424 412
15 distributed-tracing wshobson/agents Implémenter le traçage distribué avec Jaeger et Tempo pour visualiser les flux de requêtes. 35 424 412
16 grafana-dashboards wshobson/agents Créer et gérer des dashboards Grafana prêts pour la production avec Prometheus. 35 424 412
17 prometheus-configuration wshobson/agents Configurer Prometheus pour la collecte de métriques, alertes et monitoring d'infrastructure. 35 424 412
18 slo-implementation wshobson/agents Définir et implémenter des SLIs, SLOs et budgets d'erreur pour fiabiliser les services. 35 424 412
19 web-perf cloudflare/skills Auditer les performances web d'une page via Chrome DevTools et Core Web Vitals. 1 539 71
20 azure-monitor-ingestion-java microsoft/skills Envoyer des logs personnalisés vers Azure Monitor via l'API d'ingestion Java. 2 316 55
21 applicationinsights-web-ts microsoft/skills Monitorer les performances et comportements utilisateurs dans les apps web via Application Insights. 2 316 55
22 azure-monitor-opentelemetry-ts microsoft/skills Instrumenter automatiquement des applications Node.js avec Azure Monitor et OpenTelemetry. 2 316 55
23 azure-cost microsoft/skills Analyser, prévoir et optimiser les coûts Azure via des requêtes API ciblées. 2 316 55
24 eas-update-insights expo/skills Consulter les métriques de santé et d'adoption des mises à jour EAS publiées. 1 914 38
25 autonomous-optimization elophanto/elophanto Optimiser et sécuriser le routage LLM via tests parallèles, fallbacks et garde-fous financiers. 72 16
26 runbook-incident-response elophanto/elophanto Gérer un incident de production de bout en bout, du triage au post-mortem. 72 16
27 qdrant-monitoring qdrant/skills Surveiller et diagnostiquer les performances d'un déploiement Qdrant en production. 120 12
28 qdrant-monitoring-debugging qdrant/skills Diagnostiquer les problèmes de performance Qdrant via métriques d'optimisation et mémoire. 120 12
29 qdrant-monitoring-setup qdrant/skills Configurer le monitoring Qdrant avec Prometheus, alertes et logs centralisés. 120 12
30 qdrant-performance-optimization qdrant/skills Optimiser les performances Qdrant : vitesse, indexation et mémoire. 120 12
31 qdrant-memory-usage-optimization qdrant/skills Optimiser et surveiller l'utilisation mémoire de Qdrant pour réduire l'empreinte RAM. 120 12
32 qdrant-minimize-latency qdrant/skills Optimiser la latence des requêtes Qdrant via RAM, CPU et segmentation. 120 12
33 qdrant-scaling-qps qdrant/skills Optimiser le débit de requêtes Qdrant via segmentation, quantization et réplication horizontale. 120 12
34 firebase-crashlytics firebase/agent-skills Intégrer et configurer Crashlytics pour collecter des données de crash Android ou iOS. 284 11
35 agent-skills datadog-labs/agent-skills Gérer la surveillance, les logs et les traces Datadog via un agent IA. 110 6
36 dd-apm datadog-labs/agent-skills Monitorer les performances applicatives avec le tracing distribué et l'instrumentation Kubernetes. 110 6
37 agent-install datadog-labs/agent-skills Installer et configurer l'agent Datadog avec SSI sur des hôtes Linux distants. 110 6
38 enable-ssi datadog-labs/agent-skills Configurer les balises de service unifiées Datadog via SSI sur Linux. 110 6
39 onboarding-summary datadog-labs/agent-skills Générer un rapport de confirmation complet après l'onboarding APM sur un hôte Linux. 110 6
40 troubleshoot-ssi datadog-labs/agent-skills Diagnostiquer et résoudre les échecs d'injection SSI APM sur Linux. 110 6
41 verify-ssi datadog-labs/agent-skills Vérifier l'instrumentation automatique APM SSI sur un hôte Linux via SSH. 110 6
42 dd-logs datadog-labs/agent-skills Rechercher, filtrer et archiver des logs Datadog avec contrôle des coûts. 110 6
43 dd-monitors datadog-labs/agent-skills Créer, gérer et auditer des monitors d'alerting Datadog avec les meilleures pratiques. 110 6
44 dd-pup datadog-labs/agent-skills Interagir avec l'API Datadog via CLI pour logs, monitors, traces et incidents. 110 6
45 service-remapping datadog-labs/agent-skills Créer des règles de remappage APM pour renommer ou regrouper des services Datadog sans réinstrumentation. 110 6
46 dd-audit-ai-activity datadog-labs/agent-skills Auditer l'activité de l'assistant IA Datadog via les journaux d'audit MCP. 110 6
47 dd-audit-cost-spike-investigation datadog-labs/agent-skills Corréler les pics de coût Datadog avec les changements de configuration via l'Audit Trail. 110 6
48 otel-collector dash0hq/agent-skills Configurer et déployer l'OpenTelemetry Collector pour collecter et exporter la télémétrie. 55 4
49 otel-instrumentation dash0hq/agent-skills Implémenter une télémétrie OpenTelemetry de qualité, efficace et sécurisée. 55 4
50 otel-ottl dash0hq/agent-skills Transformer, filtrer et manipuler des données de télémétrie OpenTelemetry via OTTL. 55 4

À propos de cette sélection

L'observabilité est souvent le dernier chantier qu'on branche et le premier qu'on regrette d'avoir bâclé. Quand un agent commence à enchaîner des appels LLM en production, savoir exactement où la latence explose ou quel span a silencieusement échoué transforme radicalement le débogage. Les skills monitoring & observabilité rassemblés ici couvrent des cas concrets : instrumenter un pipeline d'inférence pour en extraire des traces exploitables, ou auditer la consommation réelle d'un assistant Copilot avant que la facture surprenne tout le monde. L'outillage disponible est déjà dense, avec des contributions notables de Datadog Labs et Dash0 couvrant OpenTelemetry, les métriques système sous Linux et le troubleshooting de performance sur des stacks variées. Le profil qui atterrit ici : un SRE ou un ML engineer qui veut enfin piloter avec des données concrètes sous les yeux.