跳至主要内容
扩音器图标

Microsoft Build //localhost events

注册参加本地活动,利用 Microsoft Foundry 和 GitHub Copilot 在 Azure 上构建和部署 AI 解决方案。

学习、联系、构建

Microsoft Reactor

加入 Microsoft Reactor 并实时与开发人员互动

准备好开始使用 AI 和最新技术了吗? Microsoft Reactor 提供活动、培训和社区资源,帮助开发人员、企业家和初创公司利用 AI 技术等。 快加入我们吧!

学习、联系、构建

Microsoft Reactor

加入 Microsoft Reactor 并实时与开发人员互动

准备好开始使用 AI 和最新技术了吗? Microsoft Reactor 提供活动、培训和社区资源,帮助开发人员、企业家和初创公司利用 AI 技术等。 快加入我们吧!

返回

Exploring Kaito to streamline AI inference model deployment in Azure Kubernetes

16 七月, 2024 | 9:00 下午 - 10:00 下午 (UTC) 协调世界时

  • 形式:
  • alt##Livestream直播

主题: 适用于 AI 的基础结构

语言: 英语

About this session:
Roy Kim will be presenting Kaito, an operator streamlining AI/ML inference model deployment in Kubernetes. Discover how Kaito simplifies deployment of large open-source inference models like Falcon and LLAMA2. Learn its unique features: managing large model files with container images, preset GPU configurations, auto-provisioning GPU nodes, and hosting on Microsoft Container Registry (MCR). See how Kaito simplifies the workflow of onboarding large AI inference models in Kubernetes.

Learn more and develop your skills in Azure Kubernetes Service with this Microsoft Learn training module:
https://aka.ms/IntroToAKSLearn1

主讲人

本页面的部分内容可能是机器翻译或人工智能翻译.