vios

Par nvidia-ai-blueprints · video-search-and-summarization

Skill fonctionnel qui expose les REST APIs du microservice VIOS/VST pour gérer caméras, flux RTSP, enregistrements, snapshots et stockage vidéo dans le blueprint NVIDIA VSS.

npx skills add https://github.com/nvidia-ai-blueprints/video-search-and-summarization --skill vios

Rôle du skill vios

Ce skill fait partie du blueprint NVIDIA AI Blueprint for Video Search and Summarization (VSS), un ensemble d'architectures de référence pour construire des agents vidéo accélérés par GPU. Il sert d'interface conversationnelle vers le microservice VIOS (Video IO Service), également désigné VST, qui gère l'ensemble des entrées/sorties vidéo de la plateforme.

Concrètement, ce skill permet à Claude d'interagir directement avec les REST APIs de VIOS via curl : lister les capteurs/caméras configurés, ajouter ou supprimer une caméra par IP (ONVIF) ou via une URL RTSP, consulter les timelines d'enregistrement, extraire un clip vidéo, capturer un snapshot (live ou historique), uploader un fichier vidéo ou nettoyer le stockage. Toutes ces opérations sont exécutées par l'agent lui-même — l'utilisateur n'a pas à saisir de commandes manuellement.

Prérequis et dépendance au déploiement

Avant toute opération, le skill vérifie que le backend VST est accessible sur l'endpoint fourni par le contexte de déploiement VSS. Si VIOS est injoignable, il propose automatiquement de déclencher le skill /deploy avec le profil base (ou un profil alternatif nommé par l'utilisateur) avant de poursuivre. Cette logique de garde évite les erreurs silencieuses dues à un backend absent.

Une limitation connue concerne les conteneurs résiduels d'un déploiement précédent avec le profil alerts : ils peuvent provoquer des réponses HTTP 502 sur certaines routes (/sensor/list, /sensor/<id>/streams). La solution recommandée est de relancer un déploiement propre via /deploy pour éliminer ces conflits de ports.

Structure et référence API

Le skill s'appuie sur une Service Map couvrant huit familles d'opérations (version/health, gestion des capteurs, streams, timelines, extraction de clips, snapshots live et historiques, upload/suppression de fichiers). La référence complète des paramètres et des réponses est externalisée dans references/api-reference.md, que le skill consulte lors de l'invocation de chaque opération. Les réponses JSON sont systématiquement formatées via jq, et les téléchargements binaires (clips, snapshots) sont écrits dans des fichiers locaux.

Skills similaires