何が発表された?
AWS Machine Learning Blog で、Amazon Bedrock 上で LLM のツール呼び出しをプログラム経由でまとめて扱う実装パターンが紹介されました。複数のツール呼び出しを逐次ではなくサンドボックス内のコードで完結させることで、トークン消費とレイテンシを抑える狙いとのことです。
メモ
- 記事では 3 つの実装アプローチが取り上げられています: ECS 上で Docker サンドボックスをセルフホストする方法、Amazon Bedrock AgentCore Code Interpreter を使うマネージド型、Anthropic SDK Proxy を経由する方法の 3 つです。
- セルフホスト型は環境を細かく制御できる一方で運用負荷が大きくなる、マネージド型は運用が簡素な一方でカスタマイズの自由度が下がる、というトレードオフとして整理されています。
- AIエージェントで複数のツールを扱う場合、ツール呼び出しの回数や実行環境の設計が、レイテンシやコストに影響することが分かります。実装時には、どの処理をLLMに任せ、どの処理をコード側でまとめるかを整理しておく必要がありそうです。
公式情報
公式タイトル: Implementing programmatic tool calling on Amazon Bedrock
公式ソース: AWS Machine Learning Blog