CLAUDE LABEN
FABLE 5 — 米国の輸出規制解除を受け、7月1日よりClaude Fable 5が全世界のユーザーへ提供再開されましたSCIENCE — 研究者向けワークベンチClaude Scienceがベータ公開され、AI for Science支援プログラムの応募は7月15日までですCODE — Claude Codeにdynamic workflows(研究プレビュー)が加わり、週次利用上限は7月13日まで50%引き上げられていますMODEL — Claude Sonnet 5が全プランの既定モデルとなり、導入価格は100万トークンあたり入力$2・出力$10(8月31日まで)ですGATEWAY — Amazon BedrockとGoogle Cloud向けにセルフホスト型のClaude apps gatewayが提供されました(SSO・ポリシー・コスト管理)SECURITY — Fable 5の再提供に合わせ、新しいサイバーセキュリティ分類器が追加されましたFABLE 5 — 米国の輸出規制解除を受け、7月1日よりClaude Fable 5が全世界のユーザーへ提供再開されましたSCIENCE — 研究者向けワークベンチClaude Scienceがベータ公開され、AI for Science支援プログラムの応募は7月15日までですCODE — Claude Codeにdynamic workflows(研究プレビュー)が加わり、週次利用上限は7月13日まで50%引き上げられていますMODEL — Claude Sonnet 5が全プランの既定モデルとなり、導入価格は100万トークンあたり入力$2・出力$10(8月31日まで)ですGATEWAY — Amazon BedrockとGoogle Cloud向けにセルフホスト型のClaude apps gatewayが提供されました(SSO・ポリシー・コスト管理)SECURITY — Fable 5の再提供に合わせ、新しいサイバーセキュリティ分類器が追加されました
記事一覧/Claude Code
Claude Code/2026-07-05上級

Claude Code のネイティブ1Mコンテキストを、いつ使い、いつ使わないか — コストで決める判断ルール

Sonnet 5 が既定になり、Claude Code はネイティブで1Mトークンのコンテキストを扱えるようになりました。大きな窓は便利ですが、広げるほど費用は増えます。全部を窓に入れるべきか、分割して読ませるべきか。実測できる token 見積もりと、状況ごとに答えを出す判断ルールを、動くコードとつまずきどころ付きでまとめます。

Claude Code180Sonnet 55コンテキスト3コスト最適化241M

プレミアム記事

大きなリポジトリを Claude Code に丸ごと渡して、「これで全部読んでくれる」と安心した数十分後。使用量の画面を開いて、手が止まりました。

一度のセッションで、いつもの数倍のトークンを消費していたのです。処理そのものは正しく終わっていました。ただ、その仕事に、その窓の大きさは要らなかった。分割して必要な範囲だけ読ませれば、同じ結果をずっと安く得られたはずでした。

2026年6月30日に Claude Sonnet 5 が全プランの既定モデルになり、Claude Code はネイティブで100万トークンのコンテキストを扱えるようになりました。以前の1Mはベータ扱いで、対象モデルも限られていました。いまは既定で手が届きます。だからこそ、「広いから全部入れる」という発想は、静かに費用を溶かします。

個人開発で複数のサイトの更新を無人で回している私自身、この掛け算に何度も足をすくわれてきました。ここからは、大きな窓をいつ使い、いつ使わないかを、感覚ではなく式で決められるようにしていきます。自分の料金表とリポジトリで見積もれるコードも添えます。

大きな窓は「速さ」ではなく「費用」を変える

まず誤解を解いておきたいことがあります。コンテキストを広げても、モデルが賢くなるわけでも、必ず速くなるわけでもありません。変わるのは、一度に何を見せられるかと、そのために毎ターンいくら払うかです。

Claude Code は会話が進むほど、それまでのやり取りを繰り返し入力として送ります。窓に載せた分は、応答のたびに入力トークンとして課金され続けます。ここが要点です。1万トークンのファイルを窓に置いたまま20ターン往復すれば、その1万トークンは(キャッシュが効かない範囲では)20回ぶん課金され得ます。

つまり大きな窓の費用は「載せた量 × 触った回数」で効いてきます。同じ1万トークンでも、20往復すればキャッシュが効かない範囲では実質20回ぶん、しかも長コンテキスト帯では通常単価の約2倍で課金され得ます。一度きりの読み取りなら誤差ですが、長い探索や反復リファクタでは、この掛け算が効いてきます。なお Sonnet 5 の導入価格は入出力とも Opus 4.8 比でおよそ40%低く、常時回す用途ほどこの差が効きます。

見積もりの式 ― 「窓に全部」対「分割」

判断を式にします。記号を決めます。

記号意味
T_ctx窓に常駐させるトークン数(例: リポ全体)
T_q1回の質問・指示のトークン数
T_out1回の応答トークン数
Nそのセッションでの往復回数
p_in / p_out入力 / 出力の単価(百万トークンあたり)
s_in / s_out長コンテキスト帯の割増係数(例: 入力×2 など)
cプロンプトキャッシュのヒット率(0〜1)

窓に全部載せる場合の入力費用は、毎ターン T_ctx を送り続けるぶんが支配的になります。キャッシュが効く割合 c はキャッシュ読み取りの安い単価で計算されるため、実効の入力費用はおおよそ次のようになります。

入力費用(常駐) ≒ N × T_ctx × p_in × s_in × (1 - c + c × r_cache)

ここで r_cache はキャッシュ読み取り単価と通常入力単価の比(多くの環境で 0.1 前後、つまり約1/10)です。c が高いほど常駐は安くなることが、この式から読み取れます。

分割して必要な範囲だけ読ませる場合は、常駐 T_ctx を送らず、各ターンで必要なファイル片 T_slice(i) だけを送ります。

入力費用(分割) ≒ Σ_i ( T_slice(i) × p_in × s_in' )

s_in' は、載せる総量が長コンテキスト帯を下回るなら割増なしの係数(1.0)になり得ます。ここが分割の効きどころです。200Kトークンの帯を超えるかどうかで割増が変わる料金体系が一般的なので、分割で帯を下回れば係数そのものが下がります。

式にすると当たり前に見えますが、実務で効くのは「N が大きく、c が低く、T_ctx が帯をまたぐ」ときに常駐が急に高くつく、という一点です。

ここまでお読みいただきありがとうございます。

この記事の続きを読む

この先には、実装コードやベンチマーク結果など、実務でお役に立てる内容をご用意しています。このサイトは広告を掲載しておらず、サーバーや開発にかかる費用はメンバーの皆様のご支援で成り立っています。もしお役に立てていましたら、ご支援いただけますと大変ありがたいです。

この記事で得られること
「窓を広げる」と「分割して読ませる」のどちらが安いかを、記事本文の式とPythonコードで実際に見積もる方法(長コンテキスト割増を変数化して自分の料金表に合わせられます)
リポジトリの規模・再訪回数・キャッシュ有無から、1Mを使うかを機械的に決める判断関数の実装(閾値の根拠つき)
1Mを有効化したのに効かない、費用だけ膨らむといった典型的な失敗と、その回避手順
Stripe による安全な決済 · いつでもキャンセル可能

この記事を購入する

この先の内容をすべてお読みいただけます。一度のご購入で、いつでも何度でもアクセスできます。このサイトは広告を掲載しておらず、皆さまのご支援がサーバー費用などの運営を支えています。

または
メンバーシップなら全記事が読み放題 →
シェア

お読みいただきありがとうございます

Claude Lab は広告なしで運営しており、サーバー費用などの運営コストはメンバーシップのご支援で賄っています。実装コード・ベンチマーク・本番設計パターンなど、実務でお役立ていただける記事を毎日更新しています。もし読んでよかったと感じていただけましたら、ぜひご覧ください。

  • コピー&ペーストで使える実装コード付き
  • 毎日新しい上級ガイドを追加
  • ¥580/月 または ¥1,480 の永久アクセス
メンバーシップを見る →

関連記事

Claude Code2026-07-04
1M が既定になっても、全部は詰めない — コンテキスト枠を審査する admission policy と劣化曲線の実測
Sonnet 5 が Claude Code の既定になりネイティブ1Mコンテキストが標準化しました。ハードエラーは消えた代わりに現れた静かな劣化を probe で可視化し、詰め込みを審査する admission policy と有効トークン単価での監視を、動くコードと実測値で共有します。
Claude Code2026-07-02
昨夜の無人セッションはどのモデルで走ったのか — Sonnet 5 既定化を機に整える実行モデルの記録と固定
Claude Code の既定モデルが Sonnet 5 に切り替わり、--model 未指定の無人セッションは静かにモデルが変わります。ヘッドレス出力からモデル名を防御的に抽出して追記記録し、既定ドリフトを検知して固定か追従かを判断する設計を動くコードでまとめました。
Claude Code2026-06-14
繰越されない月次クレジットを月初に枯らさず月末に余らせない — バーンレート配分スケジューラの設計
繰越のない月次クレジットは、使いすぎても使い残しても損になります。残量と経過日数からバーンレートを算出し、ヘッドレス実行のペースを自動調整するスケジューラの設計を、個人開発の自動運用で実測した数値とともにまとめました。
📚RECOMMENDED BOOKS
大規模言語モデル入門
山田育矢
LLM開発
生成AIプロンプトエンジニアリング入門
我妻幸長
プロンプト
Claude CodeによるAI駆動開発入門
平川知秀
AI駆動開発
※ アフィリエイトリンクを含みます
もっと見る →