メイン コンテンツにスキップ
megaphone アイコン

Microsoft Build 2026

Microsoft Build で実際のコードと実際のシステムについて詳しく説明します

学ぶ、つながる、構築する

Microsoft Reactor

Microsoft Reactor に参加し、開発者とライブで交流する

AI と最新のテクノロジを使い始める準備はできましたか? Microsoft Reactor は、開発者、起業家、スタートアップ企業が AI テクノロジなどを構築するのに役立つイベント、トレーニング、コミュニティ リソースを提供します。 ご参加ください。

学ぶ、つながる、構築する

Microsoft Reactor

Microsoft Reactor に参加し、開発者とライブで交流する

AI と最新のテクノロジを使い始める準備はできましたか? Microsoft Reactor は、開発者、起業家、スタートアップ企業が AI テクノロジなどを構築するのに役立つイベント、トレーニング、コミュニティ リソースを提供します。 ご参加ください。

戻る

Evaluation-Driven Development: Turning AI Demos into Real Products

27 4月, 2026 | 3:00 午後 - 4:00 午後 (UTC) 協定世界時

  • 形式:
  • alt##Livestreamライブストリーム

トピック: AI アプリケーション

言語: 英語

If you want to move POCs into production, they have to do more than impress. They have to work, at scale. Generative AI demos can feel powerful- fast, fluent, and full of potential. But capability alone doesn’t scale. Without measurement, prototypes stall, trust erodes, and systems never make it to production.

The gap between a compelling demo and a reliable product is rarely the model. It’s the absence of evaluation. To build enterprise-grade AI, you have to measure what you build.

This session introduces the Microsoft.Extensions.AI.Evaluation libraries, designed to make evaluation a first-class part of Gen AI applications. These libraries provide a practical foundation for assessing what matters in real systems: relevance, truthfulness, coherence, completeness, and safety. They include built-in quality, NLP, and safety evaluators, with the flexibility to extend or tailor them to your domain. And as agentic AI takes hold, systems that plan, reason, and take multi-step actions , evaluation becomes even more critical.

We’ll explore how evaluation extends beyond static responses to cover agent workflows, action orchestration, and decision chains. When AI can act, understanding why it acted is as important as the outcome.

By the end, one principle should be clear: You can’t scale AI on intuition alone. You scale it by measuring it.

Key Takeaways:

  • Why evaluation is the foundation of LLM Ops, not an afterthought
  • How to use Microsoft.Extensions.AI.Evaluation to measure response quality - How to evaluate agentic AI, from workflows to reasoning steps

登録をキャンセルする必要がありますか? 登録のキャンセル

登録

Microsoft アカウントでサインインします

サインイン

または自分のメール アドレスを入力して登録してください

*

このイベントに登録することで Microsoft Reactor 倫理規定に同意したことになります.

このページの一部は機械またはAIによって翻訳される場合があります。