CLAUDE LABEN
MODEL — Claude Sonnet 5が全プランの既定モデルになり、計画・ツール利用・自律実行が強化されましたPRICE — Sonnet 5は導入価格が100万トークンあたり入力$2・出力$10で、8月31日まで適用されますMODEL — Sonnet 5の性能はOpus 4.8に迫りつつ、より低価格でエージェントを常時運用できますCODE — Claude CodeがSonnet 5を既定モデルに採用し、ネイティブ1Mトークンのコンテキストに対応しましたCODE — Claude Codeにサンドボックスの資格情報ブロックと組織単位のモデル制限が追加されましたCLOUD — ClaudeがMicrosoft Foundry(Azure)で一般提供され、Azureネイティブで利用できますMODEL — Claude Sonnet 5が全プランの既定モデルになり、計画・ツール利用・自律実行が強化されましたPRICE — Sonnet 5は導入価格が100万トークンあたり入力$2・出力$10で、8月31日まで適用されますMODEL — Sonnet 5の性能はOpus 4.8に迫りつつ、より低価格でエージェントを常時運用できますCODE — Claude CodeがSonnet 5を既定モデルに採用し、ネイティブ1Mトークンのコンテキストに対応しましたCODE — Claude Codeにサンドボックスの資格情報ブロックと組織単位のモデル制限が追加されましたCLOUD — ClaudeがMicrosoft Foundry(Azure)で一般提供され、Azureネイティブで利用できます
記事一覧/API & SDK
API & SDK/2026-07-02中級

9月1日に単価は1.5倍へ戻る — Sonnet 5 導入価格の期限を織り込む実効日付きコスト予測

Claude Sonnet 5 の導入価格 $2/$10 は 2026-08-31 で終わり、9月からは $3/$15 になります。静的な単価表のままでは月次予測が3割ずれる問題を、有効期間つき単価テーブルと予測シミュレータで解く設計をまとめました。

Claude API100Sonnet 5コスト最適化23料金設計3自動運用6

プレミアム記事

Claude Sonnet 5 が既定モデルになった発表を追いかけながら、自動処理のモデル指定を切り替えていた 7 月最初の朝のことです。切り替え自体は数行の変更で終わったのですが、あわせて更新した月次コストの試算シートを眺めていて、手が止まりました。この試算、9 月も正しいのだろうか、と。

Sonnet 5 の $2 / $10(百万トークンあたり入力 / 出力)は導入価格で、2026 年 8 月 31 日までです。9 月からは標準の $3 / $15 に戻ります。つまりいま作った試算は 2 か月後に確実にずれる、それも例外もエラーも出さずに静かにずれる、ということに気づきました。個人開発で複数の自動処理を細く長く回している身としては、コードの破損より請求の予測が黙って外れるほうが困ります。今回は、この「期限つき単価」を予測の仕組みに正面から組み込んだ設計を共有します。

何が、いつ、どれだけ変わるのか

まず事実関係を整理します。2026-06-30 に公開された Sonnet 5 は、次の価格構造を持っています。

モデル適用期間入力(/MTok)出力(/MTok)
claude-sonnet-5(導入価格)2026-06-30 〜 2026-08-31$2$10
claude-sonnet-5(標準価格)2026-09-01 〜$3$15
claude-opus-4-8期限なし$5$25

見てのとおり、入力も出力も同じ 1.5 倍です。この「両方とも 1.5 倍」という点は後で効いてきます。入出力の比率がどんなワークロードでも、Sonnet 5 に載っている部分のコストはちょうど 50% 増えるからです。

もうひとつ注意したいのは、切り替えの時刻境界です。8 月 31 日「まで」がどのタイムゾーンの日付で締まるのかは、請求システムの都合に依存します。予測の用途では厳密に当てる必要はなく、高い側に丸めるのが安全です。私は JST で 8 月 31 日の 0 時以降は標準価格が適用されるものとして見積もる、つまり悪いほうに 1 日ずらす前提を置いています。予測が実請求より少し高く出る分には意思決定を誤りませんが、逆は困るためです。

静的な単価表は 9 月に黙ってずれ始めます

問題の形を先に見せます。モデル単価をコードに直書きしている、よくある実装です。

// Before: 単価が「今日の値」で固定されている
const PRICING: Record<string, { inPerMTok: number; outPerMTok: number }> = {
  "claude-sonnet-5": { inPerMTok: 2, outPerMTok: 10 },  // ← 導入価格を直書き
  "claude-opus-4-8": { inPerMTok: 5, outPerMTok: 25 },
};
 
function estimateCost(model: string, inTok: number, outTok: number): number {
  const p = PRICING[model];
  if (!p) throw new Error(`unknown model: ${model}`);
  return (inTok / 1e6) * p.inPerMTok + (outTok / 1e6) * p.outPerMTok;
}

このコードは 8 月 31 日までは正しく、9 月 1 日からは一律に安すぎる値を返します。例外は出ません。型も通ります。テストも緑のままです。ずれるのは請求書だけです。

どれくらいずれるかを、私自身の運用量で計算してみます。手元の自動処理群は Sonnet 系のモデルでおおむね 1 日あたり入力 6.0M・出力 0.9M トークンを消費しています。30 日換算で入力 180M・出力 27M です。

  • 導入価格: 180 × $2 + 27 × $10 = $360 + $270 = 月 $630
  • 標準価格: 180 × $3 + 27 × $15 = $540 + $405 = 月 $945

差は月 $315 です。そして直書きの単価表で 9 月を予測すると $630 と出ます。実請求 $945 に対して約 33% の過小評価です。3 割違う予測は、予測がないのとあまり変わりません。

ここまでお読みいただきありがとうございます。

この記事の続きを読む

この先には、実装コードやベンチマーク結果など、実務でお役に立てる内容をご用意しています。このサイトは広告を掲載しておらず、サーバーや開発にかかる費用はメンバーの皆様のご支援で成り立っています。もしお役に立てていましたら、ご支援いただけますと大変ありがたいです。

この記事で得られること
導入価格の期限をまたぐと月次コストが実際にいくら跳ねるのか、トークン量から逆算する計算手順
validFrom / validUntil つき単価テーブルと、価格の空白期間を fail-closed で検出する動く TypeScript
価格ステップの前後でモデル選定の損益分岐がどう動くか。恒久判断と期間限定判断を切り分ける基準
Stripe による安全な決済 · いつでもキャンセル可能

この記事を購入する

この先の内容をすべてお読みいただけます。一度のご購入で、いつでも何度でもアクセスできます。このサイトは広告を掲載しておらず、皆さまのご支援がサーバー費用などの運営を支えています。

または
メンバーシップなら全記事が読み放題 →
シェア

お読みいただきありがとうございます

Claude Lab は広告なしで運営しており、サーバー費用などの運営コストはメンバーシップのご支援で賄っています。実装コード・ベンチマーク・本番設計パターンなど、実務でお役立ていただける記事を毎日更新しています。もし読んでよかったと感じていただけましたら、ぜひご覧ください。

  • コピー&ペーストで使える実装コード付き
  • 毎日新しい上級ガイドを追加
  • ¥580/月 または ¥1,480 の永久アクセス
メンバーシップを見る →

関連記事

API & SDK2026-07-01
モデルは残るのにパラメータだけ期限切れになる — Claude API リクエストの廃止を日付で先回りする設計
モデル名は有効なまま、指定していたパラメータだけが廃止日を迎えてバッチが落ちることがあります。リクエストを部品に分解し、部品ごとに廃止期限を持たせて起動前に先回りする設計を、TypeScript の動くコードと運用の実測でまとめました。
API & SDK2026-07-01
Claude API のドキュメント抽出が「自信満々に間違える」とき — 沈黙する誤りを不変条件で捕まえる運用メモ
請求書や契約書の構造化抽出で一番怖いのは、クラッシュではなく「スキーマも通り信頼度も高いのに値だけ間違っている」沈黙の誤りです。不変条件・二段抽出・フィールド単位の誤り率で運用する実装メモを共有します。
API & SDK2026-06-29
中間ファイルを毎回作り直さない — Code Execution のコンテナを跨いで多段パイプラインの状態を保つ
Code Execution ツールのコンテナを container ID で再利用し、生成済みファイルや前処理結果を次のリクエストへ持ち越す設計を解説します。実行時間課金の落とし穴と container_expired の安全な扱い方まで、実装コード付きで整理しました。
📚RECOMMENDED BOOKS
大規模言語モデル入門
山田育矢
LLM開発
生成AIプロンプトエンジニアリング入門
我妻幸長
プロンプト
Claude CodeによるAI駆動開発入門
平川知秀
AI駆動開発
※ アフィリエイトリンクを含みます
もっと見る →