bentoml

Par mkurman · zorai

BentoML — service et déploiement de modèles. Créez des services de prédiction depuis n'importe quel framework ML avec OpenAPI/Swagger. Conteneurisez et déployez sur Kubernetes, AWS, GCP, Azure. Batching adaptatif et support GPU.

npx skills add https://github.com/mkurman/zorai --skill bentoml

Aperçu

BentoML empaquette les modèles ML avec des définitions de service, des dépendances, la configuration d'environnement et les cibles de déploiement dans un « Bento » portable. Déploiez sur Kubernetes (Kserve, Seldon), AWS SageMaker, GCP Vertex AI, ou en tant que conteneur Docker autonome.

Installation

uv pip install bentoml

Définition du service

import bentoml
from bentoml.io import JSON
import numpy as np

iris_clf = bentoml.sklearn.get("iris_model:latest")

@bentoml.service
class IrisClassifier:
    def __init__(self):
        self.model = iris_clf.to_runner()
        self.model.init_local()

    @bentoml.api(input=JSON(), output=JSON())
    def classify(self, input_data):
        result = self.model.run(np.array([input_data["features"]]))
        return {"class": int(result[0]), "probabilities": result[1].tolist()}

Build & Déploiement

bentoml build      # creates a Bento
bentoml containerize iris_classifier:latest  # Docker image
docker run -p 3000:3000 iris_classifier:latest

Références

Skills similaires