CLAUDE LABEN
BILLING — 6/15の課金変更が本日発効。Agent SDK・headless・GitHub Actions・他社エージェントがサブスク上限から外れ、別枠の月次クレジット($20/$100/$200・full APIレート・繰越なし)へ移行しましたRETIRED — 本日6/15、Sonnet 4とOpus 4がAPIから引退。旧世代モデルを参照しているスクリプトは最新世代(Opus 4.8など)へ切り替えが必要ですEXPORT — Claude Fable 5・Mythos 5が米政府の輸出管理指令を受け全外国籍ユーザー向けに停止中(6/12)。Anthropicは誤解に基づくとして早期復旧を目指すと表明しましたSAFE — 停止対象は新Mythosクラス2モデルのみで、Opus 4.8など他の全モデルは通常どおり稼働していますSUBAGENTS — Claude Codeでサブエージェントが自身のサブエージェントを生成可能に(最大5階層)。Dynamic workflowsもリサーチプレビューで登場しましたINCIDENT — 6/5にclaude.ai・API・Claude Code・Coworkで広範なエラー率上昇が発生。自動運用ではリトライとフォールバック設計が改めて重要ですBILLING — 6/15の課金変更が本日発効。Agent SDK・headless・GitHub Actions・他社エージェントがサブスク上限から外れ、別枠の月次クレジット($20/$100/$200・full APIレート・繰越なし)へ移行しましたRETIRED — 本日6/15、Sonnet 4とOpus 4がAPIから引退。旧世代モデルを参照しているスクリプトは最新世代(Opus 4.8など)へ切り替えが必要ですEXPORT — Claude Fable 5・Mythos 5が米政府の輸出管理指令を受け全外国籍ユーザー向けに停止中(6/12)。Anthropicは誤解に基づくとして早期復旧を目指すと表明しましたSAFE — 停止対象は新Mythosクラス2モデルのみで、Opus 4.8など他の全モデルは通常どおり稼働していますSUBAGENTS — Claude Codeでサブエージェントが自身のサブエージェントを生成可能に(最大5階層)。Dynamic workflowsもリサーチプレビューで登場しましたINCIDENT — 6/5にclaude.ai・API・Claude Code・Coworkで広範なエラー率上昇が発生。自動運用ではリトライとフォールバック設計が改めて重要です
記事一覧/Claude.ai
Claude.ai/2026-06-15上級

長時間走るエージェントの文脈が静かに劣化する — コンテキスト予算と圧縮の設計

夜通し走るエージェントの判断が朝には雑になる。原因は文脈の蓄積による希釈です。コンテキストを予算として配り、劣化を計測し、圧縮で健全に保つ設計を、動くコードと実測の勘所つきで扱います。

context-engineeringagentscontext-window6prompt-caching6production75

プレミアム記事

朝になると判断が雑になっていた

自動運用しているエージェントを夜通し走らせていて、最初に気づいた異変は「朝のコミットメッセージが急にそっけなくなる」ことでした。深夜0時の出力は丁寧に文脈をたどっているのに、朝6時の同じ種類のタスクでは、指示の前半を無視したような短い応答が返ってくる。モデルを変えたわけでも、プロンプトを変えたわけでもありません。変わっていたのは、セッションに積み上がった文脈の量だけでした。

これは珍しい話ではありません。単発の会話では完璧に動くプロンプトが、長く走らせると期待どおりに振る舞わなくなる。その多くは、モデルの能力ではなく、コンテキストの設計に原因があります。とりわけツールを何十回も呼ぶエージェントでは、過去のツール結果と会話履歴が静かに積み上がり、本当に効かせたい指示を希釈していきます。

ここでは、長時間走るエージェントの文脈を「健全なまま」保つための設計を扱います。コンテキストを予算として捉えて配分し、劣化を計測し、閾値で圧縮を発火させる——この3つを動くコードとともに整理していきます。広い意味でのコンテキストエンジニアリングの話ではありますが、焦点は「走り続けるエージェント特有の腐り方」に絞ります。

なぜ文脈は腐るのか — 蓄積・希釈・位置効果

長いセッションで起きていることは、ざっくり3つに分けられます。

ひとつめは蓄積です。エージェントがツールを呼ぶたび、その入力と出力が履歴に残ります。1回のファイル読み込みが数千トークン、検索結果が1万トークン——これが何十ターンも続けば、本来の指示が占める割合はどんどん小さくなります。

ふたつめは希釈です。コンテキストウィンドウは広くても、モデルが一度に強く参照できる「実効的な注意」は無限ではありません。重要な制約が大量の中間ログに埋もれると、相対的な重みが下がります。個人開発で複数のエージェントを自動運用している私の観測でも、同じシステムプロンプトのまま履歴が15万トークンを超えたあたりから、冒頭の制約を破る応答が目に見えて増えました。これは本番運用で実際にぶつかった注意点で、回避するには文脈量そのものを抑えるしかありません。

みっつめは位置効果です。長い文脈では、中盤に置かれた情報ほど見落とされやすい傾向があります。これは「lost in the middle」として知られる現象で、長いツールログの真ん中に紛れた重要事実は、想像以上に効きません。

結論はシンプルです。コンテキストは「入れば入るほど良い」ものではなく、配分を設計すべき有限の資源として扱う必要があります。

ここまでお読みいただきありがとうございます。

この記事の続きを読む

この先には、実装コードやベンチマーク結果など、実務でお役に立てる内容をご用意しています。このサイトは広告を掲載しておらず、サーバーや開発にかかる費用はメンバーの皆様のご支援で成り立っています。もしお役に立てていましたら、ご支援いただけますと大変ありがたいです。

この記事で得られること
ツール結果と履歴の蓄積で文脈が希釈される仕組みと、それを数値で捉える3つの観測指標
4層にコンテキスト予算を配分し、閾値で圧縮を発火させる実装パターン(Python・動作コード)
プロンプトキャッシュのブレークポイント配置と、2026-06-15 課金変更を踏まえたトークン予算の考え方
Stripe による安全な決済 · いつでもキャンセル可能

この記事を購入する

この先の内容をすべてお読みいただけます。一度のご購入で、いつでも何度でもアクセスできます。このサイトは広告を掲載しておらず、皆さまのご支援がサーバー費用などの運営を支えています。

または
メンバーシップなら全記事が読み放題 →
シェア

お読みいただきありがとうございます

Claude Lab は広告なしで運営しており、サーバー費用などの運営コストはメンバーシップのご支援で賄っています。実装コード・ベンチマーク・本番設計パターンなど、実務でお役立ていただける記事を毎日更新しています。もし読んでよかったと感じていただけましたら、ぜひご覧ください。

  • コピー&ペーストで使える実装コード付き
  • 毎日新しい上級ガイドを追加
  • ¥580/月 または ¥1,480 の永久アクセス
メンバーシップを見る →

関連記事

Claude.ai2026-04-29
Claude AI を本番運用の「デバッグ相棒」にする — ログ要約・原因仮説・再現コードを作らせる実践設計
個人開発者が深夜のアラートに一人で立ち向かう現実を踏まえ、Claudeをデバッグの相棒として本番運用するための具体的な設計図を、3つのプロンプト・前処理パイプライン・落とし穴の回避策まで通しで解説します。
Claude.ai2026-04-22
Claude Design → Claude Codeハンドオフ — デザインから本番実装までを一本化する
Claude DesignとClaude Codeを連結し、LP・プロトタイプ・ダッシュボードを本番実装まで仕上げる完全ワークフローを、実プロジェクトでの試行錯誤込みで解説します。
Claude.ai2026-04-12
Claude が会話の途中で文脈を忘れる原因と、今日からできる5つの対策
Claude が長い会話で前の指示を忘れる・文脈を見失う問題の原因をコンテキストウィンドウの仕組みから解説し、すぐに実践できる5つの対策を紹介します。
📚RECOMMENDED BOOKS
大規模言語モデル入門
山田育矢
LLM開発
生成AIプロンプトエンジニアリング入門
我妻幸長
プロンプト
Claude CodeによるAI駆動開発入門
平川知秀
AI駆動開発
※ アフィリエイトリンクを含みます
もっと見る →