Hoppa till huvudinnehåll

LEARN, CONNECT, BUILD

Microsoft Reactor

Gå med i Microsoft Reactor och interagera med utvecklare live

Är du redo att komma igång med AI och de senaste teknikerna? Microsoft Reactor tillhandahåller evenemang, utbildning och communityresurser som hjälper utvecklare, entreprenörer och nystartade företag att bygga vidare på AI-teknik med mera. Följ med!

LEARN, CONNECT, BUILD

Microsoft Reactor

Gå med i Microsoft Reactor och interagera med utvecklare live

Är du redo att komma igång med AI och de senaste teknikerna? Microsoft Reactor tillhandahåller evenemang, utbildning och communityresurser som hjälper utvecklare, entreprenörer och nystartade företag att bygga vidare på AI-teknik med mera. Följ med!

Gå tillbaka

Exploring Kaito to streamline AI inference model deployment in Azure Kubernetes

16 juli, 2024 | 9:00 em - 10:00 em (UTC) Samordnad universell tid

  • Format:
  • alt##LivestreamLivestream

Område: Infrastruktur för AI

Språk: Engelska

About this session:
Roy Kim will be presenting Kaito, an operator streamlining AI/ML inference model deployment in Kubernetes. Discover how Kaito simplifies deployment of large open-source inference models like Falcon and LLAMA2. Learn its unique features: managing large model files with container images, preset GPU configurations, auto-provisioning GPU nodes, and hosting on Microsoft Container Registry (MCR). See how Kaito simplifies the workflow of onboarding large AI inference models in Kubernetes.

Learn more and develop your skills in Azure Kubernetes Service with this Microsoft Learn training module:
https://aka.ms/IntroToAKSLearn1

Talare

Relaterade händelser

Händelserna nedan kan också vara av intresse för dig. Var noga med att besöka vår Reaktorns startsida för att se alla tillgängliga händelser.

Delar av denna sida kan vara maskin- eller AI-översatta.