Microsoft Foundry のモデルルーター機能を試してみよう!
こんにちは、MS開発部の渋谷です。
AI活用の高度化が進む中で求められるのは、強力なモデルを使えるだけでなく、どれだけシンプルかつ安全にAI基盤を運用できるかという点です。
Microsoft Foundryは、複数のAIモデルを統合的に扱えるエンタープライズ向けプラットフォームです。OpenAI社のモデル以外にも様々なモデルが提供されており、ユーザーは一つのインターフェースから様々な種類のモデルを使い分けることができます。
多数のモデルが用意されているのは便利な一方、どのモデルが一番最適なのか?をユーザーが判断するのは労力のいる作業です。市場の人気や評判ではなく、精度や出力内容で判断をするのには膨大な時間が必要になります。
この課題を解決するのがモデルルーターという機能です。この機能の活用により、アプリケーション側の変更なしに最適なモデルへ推論要求を自動で振り分けられるようになります。
本記事では、モデルルーターを実際に試し、その構成手順と使い勝手を確認していきます。
モデルルーターとは?
Microsoft Foundryのモデルルーターはユーザーの入力内容に合わせて、サービス(Azure)が最適なモデルを自動で選択してくれる機能のことです。
モデルルーター機能がリリースされるまでは、複数のモデルをAzure OpneAI側で作成後、Azure API Managementを使ってルーティングするというアーキテクチャを構築するなどして対応をしていた方が多いのではないかと思います。
日々モデルが多様化する中でモデルを選ぶ基準は、コスト、レイテンシーや回答品質など多岐にわたります。様々なパラメータを考慮した上で最適と考えられるモデルを自動で選択してくれるのがモデルルーターを使用する大きなメリットです。
Microsoft Foundryのモデルルーターで使用できるモデルは、本記事作成時点で以下のようになっています。最新情報は必ず公式ドキュメントをご参照ください。
実際に試してみた
Microsoft Foundryのモデルルータ-機能を実際に試してみます。
まずはAzureポータル上でMicrosoft Foundryをデプロイします。
「Foundry ポータルに移動」をクリックします。
画面上の検索欄に「model-router」と入力し検索をします。(※本記事では新しいFoundryポータルのUIを用いています)
「デプロイ」から「既定の設定」を選択します。(※カスタム設定をするとルーティングモードを変更することが可能です。)
これで準備は完了です。プレイグラウンドで検証をしてみます。まずは簡単な挨拶を送ると「gpt-5-chat-2025-08-07」が選択されたことが分かります。
次に東大入学試験レベルの難易度が高い数学の文章題を解かせてみます。ここでは「Llama-4-Maverick-17B-128E-Instruct-FP8 」が選択されました。
次は公開されている法律の文章を読み込ませて法律の概要と狙いを出力させます。ここでは「o4-mini-2025-04-16」が選択されました。
プロンプトの内容や長さ、難易度によって最適な出力ができると考えられるモデルが自動的に選択されていることが検証できました。
さいごに
今回はMicrosoft Foundryにて提供されているモデルルーターという機能を検証してみました。
マネージドで最適なモデルを自動で選択、ルーティングしてくれるのはとても便利ですね。コスト最適化にも役立つ機能だと思います。一方で毎回必ず同じモデルが選択される保証がないため、より高いレベルでの回答精度が求められるシナリオにおいての活用には注意が必要です。
Microsoft Foundryはアップデートが非常に激しい製品です。最新情報は必ず公式ドキュメントを確認してください。
皆様の業務に少しでもお役に立つ情報をお届けできていれば幸いです。
以上、最後までご愛読いただき
ありがとうございました。
お問い合わせは、
以下のフォームへご連絡ください。




