CLAUDE LABEN
MODEL — Claude Fable 5の輸出規制が解除され、7月1日から全世界のユーザーに提供が再開されましたMODEL — Fable 5はClaude Platform・Claude.ai・Claude Code・Coworkの全てで利用できますSCIENCE — Claude Scienceの研究支援プログラムが最大$30,000のクレジットを提供、応募は7月15日までですCODE — Claude Codeの週次利用上限が7月13日まで50%引き上げられていますCODE — dynamic workflowsが研究プレビューとなり、並列タスクを検証つきで一括処理できますCODE — セルフホスト型gatewayが登場し、SSO・ポリシー・ユーザー別コスト帰属を一元管理できますMODEL — Claude Fable 5の輸出規制が解除され、7月1日から全世界のユーザーに提供が再開されましたMODEL — Fable 5はClaude Platform・Claude.ai・Claude Code・Coworkの全てで利用できますSCIENCE — Claude Scienceの研究支援プログラムが最大$30,000のクレジットを提供、応募は7月15日までですCODE — Claude Codeの週次利用上限が7月13日まで50%引き上げられていますCODE — dynamic workflowsが研究プレビューとなり、並列タスクを検証つきで一括処理できますCODE — セルフホスト型gatewayが登場し、SSO・ポリシー・ユーザー別コスト帰属を一元管理できます
記事一覧/API & SDK
API & SDK/2026-07-03上級

単価が40%下がっても、タスク単価は下がるとは限らない — Opus 4.8 から Sonnet 5 への移行損益をトークン消費プロファイルで測る

Sonnet 5 の導入価格は Opus 4.8 より約40%安ですが、ツール往復が増えるとタスク単価は逆転し得ます。消費ベクトルの記録・並走ハーネス・損益分岐ターン数の逆算までを動くTypeScriptと実測で示します。

Claude API101Sonnet 53コスト設計モデル移行TypeScript21

プレミアム記事

7月2日に Claude Sonnet 5 が各プランの既定モデルになり、導入価格は100万トークンあたり入力 $2・出力 $10 と発表されました。Opus 4.8($5/$25)と比べると入出力とも約40%、導入価格なら約60%安い計算です。私自身、運営しているブログ群の夜間バッチをすぐに切り替えて、翌朝の日次コスト台帳を楽しみに開きました。

ところが下がり幅は約18%。単価は6割引きなのに、です。usage ログを突き合わせて分かったのは、ツールを回すタスクでターン数が中央値5から7に増えており、その2ターンが入力トークンを想像以上に膨らませていたことでした。単価の比較表だけを見てモデル移行の損益を判断すると、この現象は最後まで見えません。

ここでは「タスク当たり実効コスト」という物差しを立てて、消費プロファイルの記録、新旧モデルの並走計測、損益分岐ターン数の逆算までを一続きの設計として組んでいきます。個人開発の少人数運用でも入れられる小さな仕掛けですが、移行判断の精度は目に見えて変わります。

タスク単価は「単価ベクトル × 消費ベクトル」で決まります

モデルの請求は、単価そのものではなく、単価と消費量の内積で決まります。

成分単価側消費側
入力$/MTok(入力)タスク完了までに送った入力トークン総量
出力$/MTok(出力)生成トークン総量
キャッシュ読取入力より大幅に安い読取単価キャッシュにヒットした入力分
リトライ失敗して再実行した分の全成分

単価ベクトルはモデルを替えた瞬間に切り替わりますが、消費ベクトルも同時に変わります。Sonnet 5 は計画とツール利用が強化された「エージェント的」なモデルとされており、実際に使うと、同じタスクでもツールを呼ぶ回数や出力の長さが Opus 4.8 と同じにはなりません。増える系統もあれば減る系統もあります。つまり移行の損益は、単価表からは原理的に読めない、というのが出発点です。

ターン数は入力トークンを二乗で膨らませます

ツールループの各ターンでは、会話履歴全体を入力として送り直します。システムプロンプトと初期コンテキストを S、1往復ごとに増える履歴(tool_result と直前の出力)を d とすると、n ターンのタスクの入力総量はおよそ次のようになります。

入力総量 ≈ n×S + d×(0 + 1 + ... + (n-1)) = n×S + d×n(n-1)/2

第2項が n の二乗で効きます。S = 3,000、d = 1,200(tool_result 800 + 直前出力 400)、1ターンの出力 400 トークンという、私のリンク検証エージェントに近い形状で実額を並べます。

モデルと単価4ターン6ターンOpus 4.8・4ターン比
Opus 4.8($5/$25)$0.136$0.240基準 / +76%
Sonnet 5 導入価格($2/$10)$0.054$0.096-60% / -29%
Sonnet 5 標準価格($3/$15)$0.082$0.144-40% / +6%

同じ4ターンで走れば、割引率は単価どおり60%・40%です。しかし移行後にターンが2つ増えるだけで、導入価格でも節約は29%まで縮み、9月1日以降の標準価格では Opus 4.8 より6%高くなります。「40%安いモデルに替えたのに請求が増えた」は、この形状のタスクでは普通に起こる算術です。プロンプトキャッシュを併用すれば二乗の傾きは緩みますが、キャッシュはモデル単位で分離されるため移行直後はヒットが期待できません。この点はモデル切替とプロンプトキャッシュ再ウォームの設計で扱ったとおりです。

ここまでお読みいただきありがとうございます。

この記事の続きを読む

この先には、実装コードやベンチマーク結果など、実務でお役に立てる内容をご用意しています。このサイトは広告を掲載しておらず、サーバーや開発にかかる費用はメンバーの皆様のご支援で成り立っています。もしお役に立てていましたら、ご支援いただけますと大変ありがたいです。

この記事で得られること
「単価表では安いのに請求が下がらない」原因を、入力トークンがターン数の二乗で膨らむ算術から特定できるようになる
同じタスクを新旧モデルで並走させて、タスク当たり実効コストと消費プロファイルの差を数字で取るハーネスをそのまま導入できる
移行を許容できる増分ターン数(損益分岐)を自分の単価とタスク形状から逆算し、系統ごとに移行判断を下せるようになる
Stripe による安全な決済 · いつでもキャンセル可能

この記事を購入する

この先の内容をすべてお読みいただけます。一度のご購入で、いつでも何度でもアクセスできます。このサイトは広告を掲載しておらず、皆さまのご支援がサーバー費用などの運営を支えています。

または
メンバーシップなら全記事が読み放題 →
シェア

お読みいただきありがとうございます

Claude Lab は広告なしで運営しており、サーバー費用などの運営コストはメンバーシップのご支援で賄っています。実装コード・ベンチマーク・本番設計パターンなど、実務でお役立ていただける記事を毎日更新しています。もし読んでよかったと感じていただけましたら、ぜひご覧ください。

  • コピー&ペーストで使える実装コード付き
  • 毎日新しい上級ガイドを追加
  • ¥580/月 または ¥1,480 の永久アクセス
メンバーシップを見る →

関連記事

API & SDK2026-07-02
9月1日に単価は1.5倍へ戻る — Sonnet 5 導入価格の期限を織り込む実効日付きコスト予測
Claude Sonnet 5 の導入価格 $2/$10 は 2026-08-31 で終わり、9月からは $3/$15 になります。静的な単価表のままでは月次予測が3割ずれる問題を、有効期間つき単価テーブルと予測シミュレータで解く設計をまとめました。
API & SDK2026-07-01
モデルは残るのにパラメータだけ期限切れになる — Claude API リクエストの廃止を日付で先回りする設計
モデル名は有効なまま、指定していたパラメータだけが廃止日を迎えてバッチが落ちることがあります。リクエストを部品に分解し、部品ごとに廃止期限を持たせて起動前に先回りする設計を、TypeScript の動くコードと運用の実測でまとめました。
API & SDK2026-07-01
Claude API のドキュメント抽出が「自信満々に間違える」とき — 沈黙する誤りを不変条件で捕まえる運用メモ
請求書や契約書の構造化抽出で一番怖いのは、クラッシュではなく「スキーマも通り信頼度も高いのに値だけ間違っている」沈黙の誤りです。不変条件・二段抽出・フィールド単位の誤り率で運用する実装メモを共有します。
📚RECOMMENDED BOOKS
大規模言語モデル入門
山田育矢
LLM開発
生成AIプロンプトエンジニアリング入門
我妻幸長
プロンプト
Claude CodeによるAI駆動開発入門
平川知秀
AI駆動開発
※ アフィリエイトリンクを含みます
もっと見る →