跳到主要內容

學習、聯繫、建置

Microsoft Reactor

加入 Microsoft Reactor 並與開發人員即時互動

準備好開始使用 AI 和最新技術嗎? Microsoft Reactor 提供活動、訓練和社群資源,協助開發人員、企業家和初創公司建置 AI 技術等等。 加入我們!

學習、聯繫、建置

Microsoft Reactor

加入 Microsoft Reactor 並與開發人員即時互動

準備好開始使用 AI 和最新技術嗎? Microsoft Reactor 提供活動、訓練和社群資源,協助開發人員、企業家和初創公司建置 AI 技術等等。 加入我們!

返回

Exploring Kaito to streamline AI inference model deployment in Azure Kubernetes

16 7月, 2024 | 9:00 下午 - 10:00 下午 (UTC) 國際標準時間

  • 格式:
  • alt##Livestream線上直播

主題: AI 基礎結構

語言: 英文

About this session:
Roy Kim will be presenting Kaito, an operator streamlining AI/ML inference model deployment in Kubernetes. Discover how Kaito simplifies deployment of large open-source inference models like Falcon and LLAMA2. Learn its unique features: managing large model files with container images, preset GPU configurations, auto-provisioning GPU nodes, and hosting on Microsoft Container Registry (MCR). See how Kaito simplifies the workflow of onboarding large AI inference models in Kubernetes.

Learn more and develop your skills in Azure Kubernetes Service with this Microsoft Learn training module:
https://aka.ms/IntroToAKSLearn1

演講者

相關活動

下列活動也可能對您感興趣。 務必造訪我們的 Reactor 首頁 以查看所有可用的活動。

本頁面的一部分可能是機器翻譯或人工智能翻譯的.