推しアイデア
開発者が「なぜ障害が起きたのか?」を自然言語で質問すると、ログ・メトリクス・デプロイ履歴・CI/CD情報を統合し、AIエージェントが原因を推論するしてくれる。
開発者が「なぜ障害が起きたのか?」を自然言語で質問すると、ログ・メトリクス・デプロイ履歴・CI/CD情報を統合し、AIエージェントが原因を推論するしてくれる。
クラウドネイティブ環境では、障害調査のためにログ、メトリクス、デプロイ履歴、CI/CDなど複数ツールを横断する必要があり、原因特定に時間がかかる。この課題をAIで解決するため開発した。
Amazon Bedrock AgentCoreを中心に、ログ・メトリクス・デプロイ履歴など複数のDevOpsデータを統合し、AIエージェントが根本原因を推論するアーキテクチャを実装。
・AWS Observability Kiro Power ・AWS DevOps Agent ・Datadog AI ・NewRelic AI システム全体を横断した原因分析は依然として開発者の手作業に依存している。
本プロジェクトでは、ログ・メトリクス・デプロイ履歴・CI/CDなどの情報を統合し、AIエージェントが障害原因を分析する DevOps障害調査支援プラットフォームを提案する。
開発者は IDE や CLI から自然言語で質問することで、「なぜこの障害が発生したのか」を即座に取得できる。



・こうめい(AgentCore内部実装) ・マシュー(MCP実装) ・岸(全体設計)