LLMオブザーバビリティの標準スタック
LLM 本番運用に必要なオブザーバビリティを trace / eval / cost の3軸で統合する設計と、Langfuse・Helicone・LangSmith の比較を、Zennのトレンド議論を参照しながら整理する。
Growth Lab編集部
読了時間 約12分
読み込み中...
5 件の記事が見つかりました
LLM 本番運用に必要なオブザーバビリティを trace / eval / cost の3軸で統合する設計と、Langfuse・Helicone・LangSmith の比較を、Zennのトレンド議論を参照しながら整理する。
Datadog や New Relic のコストが膨張する2026年、オブザーバビリティ費用を抑える実践を整理する。高カーディナリティ削減・サンプリング戦略・保持期間設計・OpenTelemetry 移行の4軸で、観測品質を落とさずコストを最適化する。
AIコーディング前提のObservabilityを、計測対象レイヤー(コード生成 / レビュー / マージ / 障害)と OpenTelemetry / eBPF / LangSmith / 内製 KPI ダッシュボードの 4 軸で整理し、063 CFR 再定義 / 064 Runbook hub と接続する SRE/Platform/EM 向け選定ガイド。
agent observability の最小スキーマ(3階層 span × 構造化ログ × error taxonomy 5分類)と、症状から修正までの5ステップ解析フローを、OpenTelemetry GenAI Conventions と各 SDK の一次仕様に沿って解説する実務ガイド。
agent loopの脆弱点「状態がメモリにしかない」をcheckpointで解決し、retry/sagaパターンで部分失敗を冪等にリカバリ。step-level observabilityで詰まりを即特定できる実装パターンを解説する。