Monitoring & Observabilité

Logs, traces et metriques : OpenTelemetry, Sentry, Application Insights, Grafana.

88 skills

#	Skill	Source	Description		Δ
1	arize-instrumentation	github/awesome-copilot	Instrumenter une application avec le tracing Arize AX via une analyse guidée.	33 040	60
2	power-bi-performance-troubleshooting	github/awesome-copilot	Diagnostiquer et résoudre les problèmes de performance dans Power BI.	33 040	60
3	flowstudio-power-automate-monitoring	github/awesome-copilot	Surveiller la santé des flux Power Automate via un cache enrichi de métadonnées de gouvernance.	33 040	60
4	copilot-usage-metrics	github/awesome-copilot	Récupérer et afficher les métriques d'utilisation de GitHub Copilot via CLI.	33 040	60
5	debian-linux-triage	github/awesome-copilot	Diagnostiquer et résoudre des problèmes système sur Debian Linux avec outils adaptés.	33 040	60
6	fedora-linux-triage	github/awesome-copilot	Diagnostiquer et résoudre des problèmes système sur Fedora Linux pas à pas.	33 040	60
7	qdrant-monitoring	github/awesome-copilot	Surveiller et diagnostiquer les performances d'un déploiement Qdrant en production.	33 040	60
8	qdrant-monitoring-debugging	github/awesome-copilot	Diagnostiquer les problèmes de performance Qdrant via métriques d'optimisation et mémoire.	33 040	60
9	qdrant-monitoring-setup	github/awesome-copilot	Configurer la surveillance Qdrant avec Prometheus, alertes et logs centralisés.	33 040	60
10	qdrant-memory-usage-optimization	github/awesome-copilot	Optimiser et surveiller l'utilisation mémoire de Qdrant pour des performances maximales.	33 040	60
11	qdrant-scaling-data-volume	github/awesome-copilot	Scaler des volumes de données massifs via multi-tenancy, fenêtre temporelle ou sharding distribué.	33 040	60
12	cost-optimization	wshobson/agents	Optimiser les coûts cloud sur AWS, Azure, GCP et OCI via des stratégies systématiques.	35 424	49
13	service-mesh-observability	wshobson/agents	Configurer l'observabilité complète d'un service mesh avec métriques, traces et logs.	35 424	49
14	distributed-tracing	wshobson/agents	Implémenter le traçage distribué avec Jaeger et Tempo pour visualiser les flux de requêtes.	35 424	49
15	grafana-dashboards	wshobson/agents	Créer et gérer des dashboards Grafana prêts pour la production avec Prometheus.	35 424	49
16	prometheus-configuration	wshobson/agents	Configurer Prometheus pour la collecte de métriques, alertes et monitoring d'infrastructure.	35 424	49
17	slo-implementation	wshobson/agents	Définir et implémenter des SLIs, SLOs et budgets d'erreur pour fiabiliser les services.	35 424	49
18	sentry	openai/skills	Interroger Sentry en lecture seule pour analyser, diagnostiquer et expliquer les erreurs de production.	19 156	48
19	autonomous-optimization	elophanto/elophanto	Optimiser et sécuriser le routage LLM via tests parallèles, fallbacks et garde-fous financiers.	72	13
20	runbook-incident-response	elophanto/elophanto	Gérer un incident de production de bout en bout, du triage au post-mortem.	72	13
21	azure-monitor-ingestion-java	microsoft/skills	Envoyer des logs personnalisés vers Azure Monitor via l'API d'ingestion Java.	2 316	6
22	applicationinsights-web-ts	microsoft/skills	Monitorer les performances et comportements utilisateurs dans les apps web via Application Insights.	2 316	6
23	azure-monitor-opentelemetry-ts	microsoft/skills	Instrumenter automatiquement des applications Node.js avec Azure Monitor et OpenTelemetry.	2 316	6
24	azure-cost	microsoft/skills	Analyser, prévoir et optimiser les coûts Azure via des requêtes API ciblées.	2 316	6
25	web-perf	cloudflare/skills	Auditer les performances web d'une page via Chrome DevTools et Core Web Vitals.	1 539	5
26	eas-update-insights	expo/skills	Consulter les métriques de santé et d'adoption des mises à jour EAS publiées.	1 914	3
27	firebase-crashlytics	firebase/agent-skills	Intégrer et configurer Crashlytics pour collecter des données de crash Android ou iOS.	284	3
28	qdrant-monitoring	qdrant/skills	Surveiller et diagnostiquer les performances d'un déploiement Qdrant en production.	120	2
29	qdrant-monitoring-debugging	qdrant/skills	Diagnostiquer les problèmes de performance Qdrant via métriques d'optimisation et mémoire.	120	2
30	qdrant-monitoring-setup	qdrant/skills	Configurer le monitoring Qdrant avec Prometheus, alertes et logs centralisés.	120	2
31	qdrant-performance-optimization	qdrant/skills	Optimiser les performances Qdrant : vitesse, indexation et mémoire.	120	2
32	qdrant-memory-usage-optimization	qdrant/skills	Optimiser et surveiller l'utilisation mémoire de Qdrant pour réduire l'empreinte RAM.	120	2
33	qdrant-minimize-latency	qdrant/skills	Optimiser la latence des requêtes Qdrant via RAM, CPU et segmentation.	120	2
34	qdrant-scaling-qps	qdrant/skills	Optimiser le débit de requêtes Qdrant via segmentation, quantization et réplication horizontale.	120	2
35	troubleshooting-astro-deployments	astronomer/agents	Diagnostiquer et résoudre les problèmes de déploiements Astronomer en production via l'Astro CLI.	364	2
36	otel-collector	dash0hq/agent-skills	Configurer et déployer l'OpenTelemetry Collector pour collecter et exporter la télémétrie.	55	1
37	otel-instrumentation	dash0hq/agent-skills	Implémenter une télémétrie OpenTelemetry de qualité, efficace et sécurisée.	55	1
38	otel-ottl	dash0hq/agent-skills	Transformer, filtrer et manipuler des données de télémétrie OpenTelemetry via OTTL.	55	1
39	agent-skills	datadog-labs/agent-skills	Gérer la surveillance, les logs et les traces Datadog via un agent IA.	110	1
40	otel-semantic-conventions	dash0hq/agent-skills	Valider et placer correctement les attributs de télémétrie selon OpenTelemetry Semantic Conventions.	55	1
41	dd-apm	datadog-labs/agent-skills	Monitorer les performances applicatives avec le tracing distribué et l'instrumentation Kubernetes.	110	1
42	agent-install	datadog-labs/agent-skills	Installer et configurer l'agent Datadog avec SSI sur des hôtes Linux distants.	110	1
43	enable-ssi	datadog-labs/agent-skills	Configurer les balises de service unifiées Datadog via SSI sur Linux.	110	1
44	onboarding-summary	datadog-labs/agent-skills	Générer un rapport de confirmation complet après l'onboarding APM sur un hôte Linux.	110	1
45	troubleshoot-ssi	datadog-labs/agent-skills	Diagnostiquer et résoudre les échecs d'injection SSI APM sur Linux.	110	1
46	verify-ssi	datadog-labs/agent-skills	Vérifier l'instrumentation automatique APM SSI sur un hôte Linux via SSH.	110	1
47	dd-logs	datadog-labs/agent-skills	Rechercher, filtrer et archiver des logs Datadog avec contrôle des coûts.	110	1
48	dd-monitors	datadog-labs/agent-skills	Créer, gérer et auditer des monitors d'alerting Datadog avec les meilleures pratiques.	110	1
49	dd-pup	datadog-labs/agent-skills	Interagir avec l'API Datadog via CLI pour logs, monitors, traces et incidents.	110	1
50	error-tracking-android	posthog/skills	Intégrer le suivi d'erreurs PostHog dans une application Android.	37	1

À propos de cette sélection

L'observabilité est souvent le dernier chantier qu'on branche et le premier qu'on regrette d'avoir bâclé. Quand un agent commence à enchaîner des appels LLM en production, savoir exactement où la latence explose ou quel span a silencieusement échoué transforme radicalement le débogage. Les skills monitoring & observabilité rassemblés ici couvrent des cas concrets : instrumenter un pipeline d'inférence pour en extraire des traces exploitables, ou auditer la consommation réelle d'un assistant Copilot avant que la facture surprenne tout le monde. L'outillage disponible est déjà dense, avec des contributions notables de Datadog Labs et Dash0 couvrant OpenTelemetry, les métriques système sous Linux et le troubleshooting de performance sur des stacks variées. Le profil qui atterrit ici : un SRE ou un ML engineer qui veut enfin piloter avec des données concrètes sous les yeux.