Media & Creative

Generation et manipulation de contenu visuel : video, audio, images, illustration.

54 skills

# Skill Source Description Δ
1 algorithmic-art anthropics/skills Générer des philosophies algorithmiques visuelles en art génératif p5.js. 134 665 4217
2 brand-guidelines anthropics/skills Appliquer l'identité visuelle Anthropic à des présentations PowerPoint automatiquement. 134 665 4217
3 canvas-design anthropics/skills Générer une philosophie esthétique visuelle et l'exprimer graphiquement en artefacts. 134 665 4217
4 slack-gif-creator anthropics/skills Créer des GIFs animés optimisés pour Slack avec contrôle précis des paramètres. 134 665 4217
5 adobe-illustrator-scripting github/awesome-copilot Automatiser Adobe Illustrator via ExtendScript pour manipuler, exporter et générer des fichiers vectoriels. 33 040 563
6 draw-io-diagram-generator github/awesome-copilot Générer, éditer et valider des diagrammes draw.io avec une structure XML correcte. 33 040 563
7 excalidraw-diagram-generator github/awesome-copilot Générer des diagrammes Excalidraw variés à partir de descriptions en langage naturel. 33 040 563
8 freecad-scripts github/awesome-copilot Générer des scripts Python production pour modélisation 3D dans FreeCAD. 33 040 563
9 plantuml-ascii github/awesome-copilot Générer des diagrammes PlantUML en ASCII art pour environnements textuels. 33 040 563
10 drawio github/awesome-copilot Générer des diagrammes draw.io natifs et les exporter en PNG intégrables. 33 040 563
11 image-manipulation-image-magick github/awesome-copilot Manipuler, redimensionner et convertir des images en lot avec ImageMagick. 33 040 563
12 nano-banana-pro-openrouter github/awesome-copilot Générer, éditer ou composer des images via OpenRouter avec Gemini. 33 040 563
13 generate-image github/awesome-copilot Générer et sauvegarder des images via OpenAI ou Google Gemini. 33 040 563
14 resemble-detect github/awesome-copilot Détecter deepfakes, contenus synthétiques et vérifier l'authenticité de tout média. 33 040 563
15 transloadit-media-processing github/awesome-copilot Encoder, transformer et traiter des médias en pipeline cloud via Transloadit. 33 040 563
16 speech openai/skills Générer des clips audio parlés, en mode simple ou batch, via un CLI dédié. 19 156 540
17 transcribe openai/skills Transcrire des fichiers audio avec identification optionnelle des locuteurs via OpenAI. 19 156 540
18 imagegen openai/skills Générer ou éditer des images pour un projet via outil intégré ou CLI. 19 156 540
19 hatch-pet openai/skills Créer un pet animé compatible Codex depuis un concept ou des images de référence. 19 156 540
20 scribe anthropics/knowledge-work-plugins Transcrire des fichiers audio/vidéo via l'API Zoom AI Scribe en mode synchrone ou batch. 12 182 231
21 video-sdk/linux anthropics/knowledge-work-plugins Développer des bots et applications vidéo headless avec le SDK Zoom sur Linux. 12 182 231
22 video-sdk/windows anthropics/knowledge-work-plugins Développer des applications vidéo personnalisées sur Windows avec le SDK Zoom. 12 182 231
23 pr-walkthrough tldraw/tldraw Générer une vidéo narrée de présentation d'une pull request GitHub avec sous-titres et diapositives. 47 042 147
24 remotion google-labs-code/stitch-skills Créer des vidéos de présentation d'applications en combinant Stitch et Remotion. 5 418 136
25 remotion-best-practices remotion-dev/skills Créer et animer des vidéos programmatiques avec Remotion en React. 3 172 92
26 azure-ai-voicelive-java microsoft/skills Créer des conversations vocales bidirectionnelles en temps réel avec des assistants IA Azure. 2 316 55
27 azure-ai-voicelive-ts microsoft/skills Créer des assistants vocaux bidirectionnels en temps réel avec Azure AI. 2 316 55
28 podcast-generation microsoft/skills Générer des narrations audio réalistes à partir de texte via l'API Azure OpenAI Realtime. 2 316 55
29 figma-generate-diagram figma/mcp-server-guide Générer des diagrammes FigJam en syntaxe Mermaid.js selon le type adapté. 1 420 46
30 figma-generate-library figma/mcp-server-guide Construire des systèmes de design Figma professionnels en orchestrant des workflows multi-phases structurés. 1 420 46
31 macos-metal elophanto/elophanto Rendre des graphes massifs en 3D stéréoscopique sur Vision Pro via Metal. 72 16
32 canvas-design elophanto/elophanto Créer des philosophies visuelles et les exprimer en artefacts graphiques artistiques. 72 16
33 image-prompt-engineering elophanto/elophanto Générer des prompts visuels optimisés pour Midjourney, DALL-E, Stable Diffusion et Flux. 72 16
34 inclusive-visuals elophanto/elophanto Générer des prompts visuels inclusifs et sans biais pour les IA d'images et vidéos. 72 16
35 pumpfun-livestream elophanto/elophanto Diffuser en direct une vidéo locale sur Pump.fun via LiveKit. 72 16
36 remotion-best-practices elophanto/elophanto Créer et rendre des vidéos animées professionnelles avec Remotion et React. 72 16
37 visual-storytelling elophanto/elophanto Concevoir des récits visuels structurés et adaptés à chaque plateforme multimédia. 72 16
38 music elevenlabs/skills Générer de la musique originale à partir de texte, vidéos ou plans de composition détaillés. 237 14
39 sound-effects elevenlabs/skills Générer des effets sonores réalistes à partir de descriptions textuelles via ElevenLabs. 237 14
40 text-to-speech elevenlabs/skills Convertir du texte en parole naturelle multilingue via l'API ElevenLabs. 237 14
41 voice-isolator elevenlabs/skills Isoler des voix et supprimer le bruit de fond d'un fichier audio. 237 14
42 voice-changer elevenlabs/skills Transformer la voix d'un enregistrement audio en préservant émotion et intonation. 237 14
43 rw-generate-audio runwayml/skills Générer audio via Runway API : voix, effets sonores, doublage et conversion vocale. 48 9
44 rw-integrate-audio runwayml/skills Intégrer la génération audio (voix, effets, doublage) via l'API RunwayML. 48 9
45 rw-generate-image runwayml/skills Générer des images via l'API Runway avec modèles et références configurables. 48 9
46 rw-generate-video runwayml/skills Générer des vidéos via l'API Runway à partir de texte, image ou vidéo. 48 9
47 rw-integrate-video runwayml/skills Intégrer la génération vidéo Runway dans du code serveur via l'API SDK. 48 9
48 use-runway-api runwayml/skills Interagir avec l'API Runway pour gérer avatars, documents et générations. 48 9
49 report nvidia/skills Générer un rapport d'analyse vidéo horodaté via l'agent VSS. 87 4
50 visual-design factory-ai/factory-plugins Générer des images et créer des présentations markdown via des outils CLI. 72 3

À propos de cette sélection

Quand un agent doit produire une vidéo explicative, retailler une série d'images pour une campagne ou synthétiser une voix off en plusieurs langues, les skills génériques atteignent vite leurs limites. Cette section regroupe ce qui couvre réellement ces besoins : piloter Runway pour la génération vidéo, appeler ElevenLabs pour cloner une voix ou en produire une à partir d'un script, générer des visuels programmatiquement, manipuler du canvas ou appliquer des brand guidelines dans un workflow automatisé. Les skills media & creative ici s'adressent aux devs qui intègrent du contenu généré dans un produit. L'outillage reste hétérogène, mais un socle solide couvre déjà la majorité des cas d'usage courants, du GIF Slack automatique au diagramme généré à la volée.