qdrant-deployment-options

Par github · awesome-copilot

Guide la sélection du déploiement Qdrant. À utiliser quand quelqu'un demande « comment déployer Qdrant », « Docker vs Cloud », « mode local », « Qdrant embarqué », « Qdrant EDGE », « quelle option de déploiement », « self-hosted vs cloud », ou « déploiement à latence minimale ». À utiliser également lors du choix entre les types de déploiement pour un nouveau projet.

npx skills add https://github.com/github/awesome-copilot --skill qdrant-deployment-options

Quel déploiement Qdrant me faut-il ?

Commencez par identifier vos besoins : ops managées ou contrôle total ? Latence réseau acceptable ou non ? Production ou prototypage ? La réponse se limite à l'une de quatre options.

Pour débuter ou faire un prototype

Utilisez quand : vous construisez un prototype, exécutez des tests, des pipelines CI/CD, ou apprenez Qdrant.

  • Utilisez le mode local (Python seulement) : zéro dépendance, en mémoire ou persisté sur disque, aucun serveur requis Mode local
  • Le format de données du mode local N'EST PAS compatible avec le serveur. Ne l'utilisez pas pour la production ou les benchmarks.
  • Pour un vrai serveur en local, utilisez Docker Démarrage rapide

Passage en production (auto-hébergé)

Utilisez quand : vous avez besoin d'un contrôle total sur l'infrastructure, la résidence des données, ou une configuration personnalisée.

  • Docker est le déploiement par défaut. Ensemble complet des fonctionnalités Qdrant Open Source, setup minimal. Démarrage rapide
  • Vous gérez les opérations : mises à jour, sauvegardes, mise à l'échelle, monitoring
  • Vous devez configurer manuellement le mode distribué pour les clusters multi-nœuds Déploiement distribué
  • Envisagez Hybrid Cloud si vous voulez la gestion Qdrant Cloud sur votre infrastructure Hybrid Cloud

Passage en production (zéro-ops)

Utilisez quand : vous voulez une infrastructure managée avec des mises à jour sans interruption, des sauvegardes automatiques, et un resharding sans gérer les clusters vous-même.

  • Qdrant Cloud gère les mises à jour, la mise à l'échelle, les sauvegardes et le monitoring Qdrant Cloud
  • Supporte automatiquement les mises à jour multi-versions
  • Fournit des fonctionnalités non disponibles en auto-hébergé : /sys_metrics, resharding managé, alertes préconfigurées

Besoin de la latence la plus faible possible

Utilisez quand : un aller-retour réseau vers un serveur est inacceptable. Appareils edge, recherche in-process, ou applications sensibles à la latence.

  • Qdrant EDGE : bindings in-process aux fonctions de shards Qdrant, zéro surcharge réseau Qdrant EDGE
  • Même format de données que le serveur. Peut se synchroniser avec le serveur via des snapshots de shards.
  • Ensemble de fonctionnalités single-node seulement. Pas de mode distribué.

Ce qu'il NE FAUT PAS faire

  • Utiliser le mode local pour la production ou les benchmarks (non optimisé, format de données incompatible)
  • Auto-héberger sans stratégie de monitoring et de sauvegarde (vous perdrez des données ou manquerez les pannes)
  • Choisir EDGE quand vous avez besoin de recherche distribuée (single-node seulement)
  • Opter pour Hybrid Cloud sauf si vous avez des exigences de résidence des données (complexité Kubernetes inutile quand Qdrant Cloud fonctionne)

Skills similaires