CLAUDE LABEN
MCP — エンタープライズ管理型MCPコネクタが追加。管理者が一度繋げばユーザーは初回ログイン時にゼロタッチで利用できます(Okta連携・Team/Enterpriseベータ)LEGAL — 法務向けMCPコネクタ20以上と実務領域プラグイン12本が公開され、リサーチ・契約・案件管理を扱えますAGENTS — Code w/ ClaudeでManaged Agentsを発表。計画を立て数百のサブエージェントへ分配し、出力を検証してから返しますLIMIT — Pro・Max・Team・EnterpriseのClaude Code 5時間レート枠が2倍に拡大されましたBILLING — 6/15予定だったAgent SDK等の課金分離は撤回(保留)され、従来どおりサブスク上限内で扱われますFIX — スピナーの固着やサブエージェントのトランスクリプト不整合など、Claude Codeの安定性修正が続いていますMCP — エンタープライズ管理型MCPコネクタが追加。管理者が一度繋げばユーザーは初回ログイン時にゼロタッチで利用できます(Okta連携・Team/Enterpriseベータ)LEGAL — 法務向けMCPコネクタ20以上と実務領域プラグイン12本が公開され、リサーチ・契約・案件管理を扱えますAGENTS — Code w/ ClaudeでManaged Agentsを発表。計画を立て数百のサブエージェントへ分配し、出力を検証してから返しますLIMIT — Pro・Max・Team・EnterpriseのClaude Code 5時間レート枠が2倍に拡大されましたBILLING — 6/15予定だったAgent SDK等の課金分離は撤回(保留)され、従来どおりサブスク上限内で扱われますFIX — スピナーの固着やサブエージェントのトランスクリプト不整合など、Claude Codeの安定性修正が続いています
記事一覧/API & SDK
API & SDK/2026-06-20上級

effort パラメータを工程ごとに振り分けて Claude の出力コストと待ち時間を整える

Claude API の effort パラメータは思考・本文・ツール呼び出しを含む出力トークン全体を制御します。一律 high をやめ、工程ごとに段階配分する実装と動的ルーターを、個人開発の自動運用での実測とともに解説します。

Claude API80effortコスト最適化17Opus 4.8Agent

プレミアム記事

個人開発で4つのブログを自動運用していると、1日に何十回も Claude API を呼びます。あるとき請求の内訳を眺めていて、引っかかったことがありました。記事の「カテゴリを判定するだけ」の呼び出しと、「下書き全体をレビューして矛盾を洗い出す」呼び出しが、ほぼ同じトークン単価で動いていたのです。前者は一瞬で終わってほしい軽い処理、後者はじっくり考えてほしい重い処理。なのに、私はどちらも既定のまま、つまり最大限に考える設定で投げていました。私はこの一律設定を、Dolice Labs の自動運用を見直すなかで改めることにしました。

この「一律で全力」をやめる鍵が effort パラメータです。モデルを変えずに、1回の呼び出しがどれだけトークンを使うかの傾向を段階的に指定できます。ここでは、effort が実際に何を制御しているのかを正確に押さえたうえで、工程ごとに振り分ける実装と、入力に応じてレベルを選ぶ動的ルーターを、私自身の自動運用での実測を交えて組み立てます。

effort が制御しているのは「思考」だけではない

effort をめぐる誤解で最も多いのが、「これは拡張思考の深さを決めるスイッチだ」という理解です。半分は正しいのですが、半分は取りこぼしています。

公式ドキュメントの定義はもっと広く、effort は応答に含まれるすべてのトークンに効きます。具体的には次の3種類です。

対象低い effort での傾向
本文・説明前置きを省き、簡潔に答える
ツール呼び出しと引数呼び出し回数を減らし、複数操作をまとめる
拡張思考(有効時)簡単な問題では思考を省くことがある

ここが重要なのは、effort が思考を有効化していないリクエストにも効くという点です。たとえばツールを多用するエージェントでは、effort を下げると「計画を長々と説明してから動く」のではなく「黙って動いて短く報告する」挙動に寄ります。思考のオン・オフとは独立した、トークン消費そのもののつまみだと捉えると設計がぶれません。

レベルは5段階、既定は high

指定できるレベルは5つです。high は既定値で、effort を省いたときとまったく同じ挙動になります。

レベル性格向く工程
max制約なしの最大能力最も深い推論が要る難題
xhigh長時間の探索向けの拡張能力30分超の長尺コーディング・エージェント作業
high(既定)高い能力。未指定と同等複雑な推論・難しい実装
medium速度・コスト・品質の均衡バランス重視のエージェント処理
low最も効率的。能力は少し落ちる分類・短い参照・高頻度処理

注意したいのは、effort は厳密なトークン上限ではなく挙動のシグナルだという点です。low にしても、十分に難しい問題ならモデルはやはり考えます。ただし同じ問題に対して、高い effort のときより考える量を抑える、という相対的な調整になります。max と xhigh は対応モデルが限られるので、使う前に自分のモデルが対応しているか確認してください(Opus 4.8 は両方に対応します)。

ここまでお読みいただきありがとうございます。

この記事の続きを読む

この先には、実装コードやベンチマーク結果など、実務でお役に立てる内容をご用意しています。このサイトは広告を掲載しておらず、サーバーや開発にかかる費用はメンバーの皆様のご支援で成り立っています。もしお役に立てていましたら、ご支援いただけますと大変ありがたいです。

この記事で得られること
effort が制御するのは思考だけでなく本文・ツール呼び出しを含む出力トークン全体である、という前提から設計を組み直す視点
分類・下書き・レビューといった工程ごとに low / medium / high / xhigh を割り当てる、動くルーター実装とBefore/After
Opus 4.8 の adaptive thinking と effort の関係、budget_tokens が 400 を返す落とし穴、計測してから下げる手順
Stripe による安全な決済 · いつでもキャンセル可能

この記事を購入する

この先の内容をすべてお読みいただけます。一度のご購入で、いつでも何度でもアクセスできます。このサイトは広告を掲載しておらず、皆さまのご支援がサーバー費用などの運営を支えています。

または
メンバーシップなら全記事が読み放題 →
シェア

お読みいただきありがとうございます

Claude Lab は広告なしで運営しており、サーバー費用などの運営コストはメンバーシップのご支援で賄っています。実装コード・ベンチマーク・本番設計パターンなど、実務でお役立ていただける記事を毎日更新しています。もし読んでよかったと感じていただけましたら、ぜひご覧ください。

  • コピー&ペーストで使える実装コード付き
  • 毎日新しい上級ガイドを追加
  • ¥580/月 または ¥1,480 の永久アクセス
メンバーシップを見る →

関連記事

API & SDK2026-06-20
Cloudflare AI Gateway を Claude の手前に置くと、見えるはずの数字が見えなくなる — 運用で効いた計装メモ
Cloudflare AI Gateway を Claude API の前段に置いたあと、コスト按分・セマンティックキャッシュの誤ヒット・フォールバックの静かな品質低下・予算の実効化で実際につまずいた箇所と、その手当てをコード付きでまとめます。
API & SDK2026-05-14
Claude API でアプリ内 AI チャットを実装して踏んだ6つの罠 — 個人開発10年・累計5,000万DLの視点から
Claude APIをアプリ内チャットに組み込んで本番で直面した6つの設計ミスを、個人開発10年・累計5,000万DLの経験から解説。コンテキスト設計、ストリーミング、セッション管理、コスト監視の実装パターンを動くコード付きで紹介します。
API & SDK2026-05-12
Haiku 4.5・ストリーミング・プロンプトキャッシングを組み合わせて個人開発アプリのAPIコストを抑えた記録
Claude Haiku 4.5、ストリーミング、プロンプトキャッシングの3つを組み合わせることで、個人開発アプリのAI機能のコストと応答速度を同時に改善した実装パターンを記録します。
📚RECOMMENDED BOOKS
大規模言語モデル入門
山田育矢
LLM開発
生成AIプロンプトエンジニアリング入門
我妻幸長
プロンプト
Claude CodeによるAI駆動開発入門
平川知秀
AI駆動開発
※ アフィリエイトリンクを含みます
もっと見る →