Run:ai sur AWS — notes de webinaire (inférence et autoscaling)

Conférence

Run:ai sur AWS — notes de webinaire (inférence et autoscaling)

Notes du webinaire Run:ai sur l’exécution et la montée en charge des charges d’inférence sur AWS (Amériques). Run:ai met l’accent sur l’ordonnancement, la visibilité et l’efficacité pour les modèles sur GPU dans des environnements partagés.

Tableau de bord

Vue d’ensemble des jobs et de l’usage des ressources.

Tableau de bord

Tableau de bord (autre vue)

CLI

Opérations et automatisation en ligne de commande.

CLI

Modèles et charge

Vue modèle

Plusieurs instances / scaling

Gestion des charges

Gestion des workloads

Vue infrastructure

Serveurs

Démo

Démo

Défis

Diapositive défis


Pour le détail produit, voir la documentation officielle Run:ai et les offres AWS marketplace ou partenaires.