よくあるご質問

AIエージェントと人工知能ソリューション

本ドキュメントは、お客様のCTOおよびエンジニアリングチームがOKAXIのAIエージェントアプローチを評価される際にお寄せいただく質問をまとめたものです。現在本番稼働中の小売およびコンタクトセンター案件における実務経験を基に回答しています。

AIエージェントと人工知能ソリューション

FAQメインへ戻る

OKAXIのAIエージェントは従来のチャットボットとどう違いますか?

従来のチャットボットはテンプレートや固定ルールに基づいてテキストで応答するに留まります。OKAXIのAIエージェントはチャットボットを超える3つの能力を備えています。第一に、アクションを取る前にマルチステップで自律的に推論します。第二に、外部ツールまたはAPIを自ら呼び出し、リアルタイムデータの取得や操作の実行を行います。第三に、各ステップで人間の介入を必要とせず、業務ワークフローループを自律的に閉じます。

AIエージェントは第三者APIを自律的に呼び出せますか?

はい。OKAXIは各エージェントにツールレジストリを構築します。各ツールは、入出力を明示するJSON Schemaを持つ関数として定義されます。エージェントはコンテキストと現在の目標に基づいて適切なツールを選択し、関数を呼び出し、結果を読み取り、次のステップを判断します。レジストリにはREST APIクライアント、データベースクエリ、ファイルシステムアクセス、外部SaaS APIが含まれます。

OKAXIのAIエージェントはどのように意思決定しますか?

エージェントはObserve Think Actのループで動作します。Observeは現在のワークフロー状態とコンテキストウィンドウを読み取ります。Thinkは利用可能なツールリストを添えてLLMを呼び出し、次のステップを推論します。Actはツールを実行するか、最終回答を返します。ループは目標到達時、または事前定義したイテレーション上限到達時に停止します。

OKAXIアーキテクチャにおけるfunction-callingとtool-callingの動作は?

OKAXIはOpenAI、Anthropic、Google共通のfunction-calling標準を採用しています。各関数はname、description、parametersを定義するJSONスキーマを持ちます。エージェントプロンプトに利用可能関数リストが含まれます。LLMは呼び出すべき関数と具体的な引数を指定するstructured JSONを返します。バックエンドはJSONを受け取り、スキーマを検証し、対応する関数を実行し、結果を次のターンのコンテキストウィンドウに戻します。

AIエージェントは複雑なマルチステップワークフローをどう処理しますか?

OKAXIはワークフローを有向非巡回グラフ (DAG) としてモデル化します。各ノードは推論ステップまたはアクションです。エージェントはランタイム条件に基づいてノード間を遷移できます。ワークフロー状態はRedisまたはPostgreSQLに永続化され、中断後にエージェントが再開できます。長時間実行ワークフローでも、中間判断ごとに監査可能です。

既存のMicroservices環境にAIエージェントをどう統合しますか?

OKAXIはエージェントをRESTエンドポイントまたはgRPCインターフェースで公開します。既存Microservicesはエージェント処理が必要な際にKafkaへイベントを発行します。専用コンシューマがイベントを受信し、エージェントランタイムを呼び出し、Observe Think Actループを実行し、結果を別のトピックへ発行します。コアMicroservicesは内部にLLMが存在することを知る必要がありません。

レガシーMonolithシステムにもAIエージェントを統合できますか?

はい。OKAXIはMonolithの隣にサイドカーサービスを配置します。Monolithはエージェントを呼び出したい時にサイドカーのREST APIを呼ぶだけで済みます。サイドカーはLLMロジック、ツール呼び出し、ワークフローオーケストレーション全体を担います。このアプローチによりMonolithコードベースは無傷のまま、コアビジネスロジックのリファクタリングが不要となります。

OKAXIのAIエージェントアーキテクチャにおけるKafkaの役割は?

Kafkaはエージェントインフラのイベント駆動バックボーンです。主な役割は4つあります。第一に、プロデューサーとエージェントコンシューマー間のバッファとして機能し、トラフィックバースト時の過負荷を防ぎます。第二に、イベントを永続化し、エージェントが再起動後にリプレイ可能です。第三に、同一イベントを異なる責務の複数エージェントへファンアウトします。第四に、ビジネスサービスと、イベントを処理する具体的なエージェントを疎結合化します。

OKAXIのModel Context Protocol (MCP) Serverはどう動作しますか?

MCP ServerはLLMクライアントと企業のデータシステム間のブリッジ層です。サーバーはMCP仕様に従いリソースとツールを公開します。LLMクライアントがMCPリクエストをサーバーに送信すると、サーバーがデータベース、ファイルシステム、または社内APIからデータを読み取り、標準JSONレスポンスを返します。MCPによりエージェントは企業データを参照可能となり、フルコンテンツをプロンプトに貼り付ける必要がなくなります。結果としてトークンコスト削減とアクセス制御の厳格化が両立します。

AI統合はコアビジネスロジックを中断させますか?

いいえ。OKAXIはコアコードの修正を回避するため、Stranglerパターンおよびサイドカーパターンを適用します。すべてのエージェントロジックは、イベントまたはRESTエンドポイントを介して起動される新しい統合層に存在します。エージェントが失敗またはロールバックを要する場合、サーキットブレーカーとフォールバックパスを通じてビジネスコアは正常稼働を継続します。本番デプロイではフィーチャーフラグを用い、コア再デプロイなしでエージェント機能のオンオフが可能です。

OKAXIはLLM APIのトークン使用量をどう最適化しますか?

OKAXIは5つの戦術を適用します。第一に、冗長な指示を排除したミニマルプロンプトテンプレート。第二に、直近N ターンのみを保持するコンテキストウィンドウプルーニング。第三に、長時間セッション向けに詳細履歴をコンパクトサマリーで置換するサマリゼーション。第四に、フルドキュメントを貼り付ける代わりにスキーマ参照を用いるツール説明圧縮。第五に、単純タスクは小型モデル、複雑タスクは大型モデルへ振り分けるモデルルーティング。

OKAXIのプロンプトキャッシングはどう機能しますか?

OKAXIはAnthropicおよびOpenAIネイティブのプロンプトキャッシングを利用可能な場合に活用します。共通のシステムプロンプトおよびツール定義がキャッシュ対象としてマークされます。プロバイダーはプレフィックスを最大1時間キャッシュし、各キャッシュヒットで入力トークンコストを約90 パーセント削減します。OKAXIはまた、頻出プロンプト向けにRedisでクライアント側キャッシュレイヤーを独自構築します。2層のキャッシュにより、繰り返しワークロードでは60 から80 パーセントのコスト削減を実現します。

LLM APIの月次コストをどう管理しますか?

OKAXIはエージェント別および顧客ワークスペース別にクォータを設定します。各リクエストは送信前にトークン使用量を計測します。月次クォータの80 パーセントに達すると、システムは小型モデルへ切り替えるか、緊急性のないタスクを拒否します。リアルタイムダッシュボードはエージェント別、タスク種別別、顧客別のコストを表示します。設定済みしきい値を超えるとアラートがトリガーされます。

タスクごとに適切なモデルサイズを選べますか?

はい。OKAXIはタスク複雑度に基づくモデルルーティングを適用します。インテント分類やセンチメントなどの単純分類タスクは、Claude HaikuまたはGPT-4o-miniなどの小型モデルで実行されます。マルチステップ計画やコード生成などの複雑推論タスクは、Claude SonnetまたはGPT-4oで実行されます。重い推論または長コンテキストタスクは、Claude Opusまたはo1で実行されます。ルーターはタスクメタデータのシグナルに基づきランタイムで判断します。

OKAXIのAIエージェント遅延目標は?

OKAXIはエージェントを3つの遅延層で設計します。リアルタイム層 (フロントラインチャットボット) はp95を3秒未満に設定します。準リアルタイム層 (チケットルーティング、分類) はp95を10秒未満に設定します。バッチ層 (大量レポート、サマリゼーション) はp95を60秒未満で許容します。各層は対応する目標達成のため、異なるモデルサイズおよびキャッシング戦略を使用します。

社内データはLLMプロバイダーへ送信されますか?

デフォルトでは、OKAXIはMCPおよびデータマスキング設定を介して、必要なデータのみをLLMプロバイダーへ送信します。マイナンバー、クレジットカード番号、個人人事情報などの機密フィールドは、プロンプト投入前にredactまたはトークン化されます。OpenAIおよびAnthropicとの契約には、エンタープライズ層向けゼロデータ保持条項が含まれます。より厳格な要件を持つお客様には、クラウドプロバイダー呼び出しではなくオンプレミスLLMを展開します。

OKAXIのプライベートRAGはどうデータを保護しますか?

OKAXIはお客様ごとに専用のベクトルストアを構築します。エンベディングはセルフホストモデル、またはデータレジデンシーが明確なプロバイダーで生成されます。ベクトルストアはテナント間で完全に分離され、顧客横断でエンベディングが共有されることは決してありません。リトリーバルパイプラインはお客様のVPC内で動作します。LLM呼び出しは検索された関連チャンクのみを受け取り、全コーパスを参照することはありません。

OKAXIはオンプレミスLLMをサポートしますか?

はい。OKAXIはお客様のハードウェアに応じてLlama、Mistral、またはQwenを用いてセルフホストLLMを展開します。推論スタックは本番スループット達成のためvLLMまたはTGI上で稼働します。モデルファインチューニングはお客様の社内データ上で行われ、データがVPC外へ出ることはありません。オンプレミスはデータレジデンシー要件、またはHIPAA、GDPR第9条、ベトナムサイバーセキュリティ法などのコンプライアンスを持つお客様に適しています。

OKAXIのAI Gatewayはどうデータを保護しますか?

AI Gatewayはアプリケーションとプロバイダー間に配置されるプロキシ層です。主な機能は4つあります。第一に、送信プロンプト上のPII検出とマスキング。第二に、コンテンツポリシー違反プロンプトをブロックするポリシー強制。第三に、テナント別レート制限とクォータ。第四に、すべてのリクエストとレスポンスの監査ログを、お客様の暗号化ストレージに保存します。Gatewayはお客様のVPC内で動作し、例外はありません。

監査ログとコンプライアンスは?

各エージェントリクエストには、Kafkaイベントからツール呼び出しを経てレスポンスまで貫通するcorrelation IDが付与されます。ログにはプロンプト、ツール呼び出しシーケンス、最終レスポンス、レイテンシ、コストが含まれます。ログは7年保持ポリシーで不変ストレージに保管され、監査コンプライアンスに対応します。お客様はダッシュボードでのログ照会、または社内SIEMへのエクスポートが可能です。OKAXIはOpenTelemetryおよびCloudEventsの標準フォーマットに対応します。

FAQメインへ戻る