Monitoring & Observabilité

Logs, traces et metriques : OpenTelemetry, Sentry, Application Insights, Grafana.

88 skills

#	Skill	Source	Description		Δ
1	arize-instrumentation	github/awesome-copilot	Instrumenter une application avec le tracing Arize AX via une analyse guidée.	33 040	563
2	power-bi-performance-troubleshooting	github/awesome-copilot	Diagnostiquer et résoudre les problèmes de performance dans Power BI.	33 040	563
3	flowstudio-power-automate-monitoring	github/awesome-copilot	Surveiller la santé des flux Power Automate via un cache enrichi de métadonnées de gouvernance.	33 040	563
4	copilot-usage-metrics	github/awesome-copilot	Récupérer et afficher les métriques d'utilisation de GitHub Copilot via CLI.	33 040	563
5	debian-linux-triage	github/awesome-copilot	Diagnostiquer et résoudre des problèmes système sur Debian Linux avec outils adaptés.	33 040	563
6	fedora-linux-triage	github/awesome-copilot	Diagnostiquer et résoudre des problèmes système sur Fedora Linux pas à pas.	33 040	563
7	qdrant-monitoring	github/awesome-copilot	Surveiller et diagnostiquer les performances d'un déploiement Qdrant en production.	33 040	563
8	qdrant-monitoring-debugging	github/awesome-copilot	Diagnostiquer les problèmes de performance Qdrant via métriques d'optimisation et mémoire.	33 040	563
9	qdrant-monitoring-setup	github/awesome-copilot	Configurer la surveillance Qdrant avec Prometheus, alertes et logs centralisés.	33 040	563
10	qdrant-memory-usage-optimization	github/awesome-copilot	Optimiser et surveiller l'utilisation mémoire de Qdrant pour des performances maximales.	33 040	563
11	qdrant-scaling-data-volume	github/awesome-copilot	Scaler des volumes de données massifs via multi-tenancy, fenêtre temporelle ou sharding distribué.	33 040	563
12	sentry	openai/skills	Interroger Sentry en lecture seule pour analyser, diagnostiquer et expliquer les erreurs de production.	19 156	540
13	cost-optimization	wshobson/agents	Optimiser les coûts cloud sur AWS, Azure, GCP et OCI via des stratégies systématiques.	35 424	412
14	service-mesh-observability	wshobson/agents	Configurer l'observabilité complète d'un service mesh avec métriques, traces et logs.	35 424	412
15	distributed-tracing	wshobson/agents	Implémenter le traçage distribué avec Jaeger et Tempo pour visualiser les flux de requêtes.	35 424	412
16	grafana-dashboards	wshobson/agents	Créer et gérer des dashboards Grafana prêts pour la production avec Prometheus.	35 424	412
17	prometheus-configuration	wshobson/agents	Configurer Prometheus pour la collecte de métriques, alertes et monitoring d'infrastructure.	35 424	412
18	slo-implementation	wshobson/agents	Définir et implémenter des SLIs, SLOs et budgets d'erreur pour fiabiliser les services.	35 424	412
19	web-perf	cloudflare/skills	Auditer les performances web d'une page via Chrome DevTools et Core Web Vitals.	1 539	71
20	azure-monitor-ingestion-java	microsoft/skills	Envoyer des logs personnalisés vers Azure Monitor via l'API d'ingestion Java.	2 316	55
21	applicationinsights-web-ts	microsoft/skills	Monitorer les performances et comportements utilisateurs dans les apps web via Application Insights.	2 316	55
22	azure-monitor-opentelemetry-ts	microsoft/skills	Instrumenter automatiquement des applications Node.js avec Azure Monitor et OpenTelemetry.	2 316	55
23	azure-cost	microsoft/skills	Analyser, prévoir et optimiser les coûts Azure via des requêtes API ciblées.	2 316	55
24	eas-update-insights	expo/skills	Consulter les métriques de santé et d'adoption des mises à jour EAS publiées.	1 914	38
25	autonomous-optimization	elophanto/elophanto	Optimiser et sécuriser le routage LLM via tests parallèles, fallbacks et garde-fous financiers.	72	16
26	runbook-incident-response	elophanto/elophanto	Gérer un incident de production de bout en bout, du triage au post-mortem.	72	16
27	qdrant-monitoring	qdrant/skills	Surveiller et diagnostiquer les performances d'un déploiement Qdrant en production.	120	12
28	qdrant-monitoring-debugging	qdrant/skills	Diagnostiquer les problèmes de performance Qdrant via métriques d'optimisation et mémoire.	120	12
29	qdrant-monitoring-setup	qdrant/skills	Configurer le monitoring Qdrant avec Prometheus, alertes et logs centralisés.	120	12
30	qdrant-performance-optimization	qdrant/skills	Optimiser les performances Qdrant : vitesse, indexation et mémoire.	120	12
31	qdrant-memory-usage-optimization	qdrant/skills	Optimiser et surveiller l'utilisation mémoire de Qdrant pour réduire l'empreinte RAM.	120	12
32	qdrant-minimize-latency	qdrant/skills	Optimiser la latence des requêtes Qdrant via RAM, CPU et segmentation.	120	12
33	qdrant-scaling-qps	qdrant/skills	Optimiser le débit de requêtes Qdrant via segmentation, quantization et réplication horizontale.	120	12
34	firebase-crashlytics	firebase/agent-skills	Intégrer et configurer Crashlytics pour collecter des données de crash Android ou iOS.	284	11
35	agent-skills	datadog-labs/agent-skills	Gérer la surveillance, les logs et les traces Datadog via un agent IA.	110	6
36	dd-apm	datadog-labs/agent-skills	Monitorer les performances applicatives avec le tracing distribué et l'instrumentation Kubernetes.	110	6
37	agent-install	datadog-labs/agent-skills	Installer et configurer l'agent Datadog avec SSI sur des hôtes Linux distants.	110	6
38	enable-ssi	datadog-labs/agent-skills	Configurer les balises de service unifiées Datadog via SSI sur Linux.	110	6
39	onboarding-summary	datadog-labs/agent-skills	Générer un rapport de confirmation complet après l'onboarding APM sur un hôte Linux.	110	6
40	troubleshoot-ssi	datadog-labs/agent-skills	Diagnostiquer et résoudre les échecs d'injection SSI APM sur Linux.	110	6
41	verify-ssi	datadog-labs/agent-skills	Vérifier l'instrumentation automatique APM SSI sur un hôte Linux via SSH.	110	6
42	dd-logs	datadog-labs/agent-skills	Rechercher, filtrer et archiver des logs Datadog avec contrôle des coûts.	110	6
43	dd-monitors	datadog-labs/agent-skills	Créer, gérer et auditer des monitors d'alerting Datadog avec les meilleures pratiques.	110	6
44	dd-pup	datadog-labs/agent-skills	Interagir avec l'API Datadog via CLI pour logs, monitors, traces et incidents.	110	6
45	service-remapping	datadog-labs/agent-skills	Créer des règles de remappage APM pour renommer ou regrouper des services Datadog sans réinstrumentation.	110	6
46	dd-audit-ai-activity	datadog-labs/agent-skills	Auditer l'activité de l'assistant IA Datadog via les journaux d'audit MCP.	110	6
47	dd-audit-cost-spike-investigation	datadog-labs/agent-skills	Corréler les pics de coût Datadog avec les changements de configuration via l'Audit Trail.	110	6
48	otel-collector	dash0hq/agent-skills	Configurer et déployer l'OpenTelemetry Collector pour collecter et exporter la télémétrie.	55	4
49	otel-instrumentation	dash0hq/agent-skills	Implémenter une télémétrie OpenTelemetry de qualité, efficace et sécurisée.	55	4
50	otel-ottl	dash0hq/agent-skills	Transformer, filtrer et manipuler des données de télémétrie OpenTelemetry via OTTL.	55	4

À propos de cette sélection

L'observabilité est souvent le dernier chantier qu'on branche et le premier qu'on regrette d'avoir bâclé. Quand un agent commence à enchaîner des appels LLM en production, savoir exactement où la latence explose ou quel span a silencieusement échoué transforme radicalement le débogage. Les skills monitoring & observabilité rassemblés ici couvrent des cas concrets : instrumenter un pipeline d'inférence pour en extraire des traces exploitables, ou auditer la consommation réelle d'un assistant Copilot avant que la facture surprenne tout le monde. L'outillage disponible est déjà dense, avec des contributions notables de Datadog Labs et Dash0 couvrant OpenTelemetry, les métriques système sous Linux et le troubleshooting de performance sur des stacks variées. Le profil qui atterrit ici : un SRE ou un ML engineer qui veut enfin piloter avec des données concrètes sous les yeux.