【Micorsoft Azure】SREエージェントGA!実際にSQLDBの調査と対応をさせてみた

2026.04.02
【Micorsoft Azure】SREエージェントGA!実際にSQLDBの調査と対応をさせてみた

こんにちは、MS開発部の渋谷です。

2025年夏ごろにプレビューで発表されたSREエージェントが2026年3月に一般提供されました。

現代のソフトウェア開発およびシステム運用において、クラウドアーキテクチャの複雑化とそれに伴う運用負荷の増大は、多くの企業が直面する最も深刻な課題の一つとなっています。特に、深夜のアラート対応や繰り返される定型的な障害復旧作業といった運用面の負担が大きい組織も少なくはなかったと思います。それらを解決する製品の1つとしてSREエージェントを実際にAzure SQL DBが遅いという場面で使ってみて動作確認してみました。

SREエージェントのデプロイ

はじめに、SREエージェントをAzureにデプロイします。現在はhttps://sre.azure.com/にアクセスしてSREエージェントをデプロイしていきます。

サブスクリプション、リソース グループ、エージェント名、リージョンフィールドが入力されたエージェントの作成ウィザードのスクリーンショット。

(画像はhttps://learn.microsoft.com/ja-jp/azure/sre-agent/create-and-set-upより引用)

必要な項目を入力してデプロイが完了すると、セットアップガイドに移るのでそこで必要なセットアップを行います。

コード、ログ、デプロイ、インシデントの [接続] ボタンが表示されたデータ ソース カードを示すセットアップ ページのスクリーンショット。

(画像はhttps://learn.microsoft.com/ja-jp/azure/sre-agent/complete-setupより引用)

ここで設定できるソースは、

  • コード:GitHubやAzure DevOpsのリポジトリ
  • ログ:Azure Data Explorer、Datadog、Splunk、Elasticsearch、Dynatrace、New Relic
  • インシデント:Azure MonitorやPagerDuty
  • Azureリソース:サブスクリプションやリソースグループ

を選択できます。それぞれ最適な動作のためには必要な項目ではありますが、今回はAzureリソースとログ(Azure Data Explorer)、Azure Monitorを接続して、最低限の動作確認をします。なお、Azureリソースと接続する際は、接続するリソースグループやサブスクリプションに対するロール割り当ての権限が必要なので注意してください。

今回はSREエージェントとのチャット形式での対話ではなく、Azure Monitor が出したアラートをもとにエージェントに自律的に調査を行ってもらうようにします。その際にインシデント対応計画というものを作成するのですが、インシデントの重大度やアラートのタイトルを使ってどのインシデントを対応するかをフィルタリングできますので、ここの設定を忘れずに行ってください。

 

SREエージェントの動作確認

SREエージェントをデプロイしたのち、SREエージェントを接続したリソースグループ内にContainer AppsとSQL DBをデプロイし、意図的にContainer AppsからSQL DBへ高い並列負荷をかけていきます。Azure Monitorのアラートルールを従来通り設定していると、SREエージェントがそのアラートをトリガーに自動的に調査を開始します。

SREエージェントは、付与されたManaged IDの権限(つまり、対象Azureリソースへの読み取り、もしくは書き込み権限)をもとに、Azure Monitorのログ等を確認しながら原因調査を行います。

そして、調査が完了するとインシデントサマリをSREエージェントがまとめます。内容を見てみると、事象の簡易的な説明(DBのCPU利用率が80%を超えていること)や根本原因の報告をしてくれます。今回は、Deadlock等は起きておらず単純にCPUの負荷が原因だったため、まずは負荷に応じたDBのスケールアップを行ったことが確認できます。

なお、今回簡易的に再現した環境では、Container Appsでホストしているアプリケーションが発行するSQLクエリにN+1問題を意図的に入れていました。先ほどの初期設定でGitHubにあるContainer Appsでホストしているアプリケーションのソースコードを連携していると、SREエージェントはアプリケーションコード側も調査することでしょう。実際、今回の未連携状態でもRecommendationsの中にアプリケーションコードのレビューをした方が良いと書かれています。

まとめ

非常に簡単な内容ではありましたが、SREエージェントのアラート起点の調査について紹介しました。今回紹介したユースケースはほんの一部で、Azure Monitorのアラート起点だけでなく、SREエージェントとの対話の中で、運用の最適化のアドバイスをもらったり、レポートを作成するといったことも考えられます。また、サブエージェントやMCP連携もサポートされているので、引き続きアップデートを追っていきたい製品だと感じました。

以上、最後までご愛読いただき
ありがとうございました。

お問い合わせは、
以下のフォームへご連絡ください。

お問い合わせ

PAGETOP