6月9日の朝、Claude Fable 5 公開の知らせを読みながら最初に考えたのは、「すごいのかどうか」ではなく「どの作業で試すか」でした。
Opus を上回る Mythos クラスの一般提供版、100万トークンのコンテキスト、最大128kトークンの出力、そして常時有効の適応思考。発表の言葉はどれも大きいのですが、個人開発の毎日には、新しいモデルが出るたびに隅々まで検証する余裕がありません。しかも今回は事情が少し特殊で、6月22日までは Pro / Max / Team / Enterprise の各プランに追加費用なしで同梱され、6月23日以降は usage credits が必要になります。「無料で確かめられる窓」が2週間だけ開いている状態です。
同じ週には、Agent SDK や headless 実行が API レート準拠の月次クレジットへ移行する6月15日の課金変更も控えていて、検証に充てられる時間は限られていました。そこで触り始める前に、「これだけ確かめれば採用か見送りかを決められる」という観点を3つに絞ることにしました。
観点を先に3つ書き出した理由
新しいモデルの検証は、始める前がいちばん大事だと感じています。過去に何度か「とりあえず触ってみる」から入って丸一日が溶け、結局「なんとなく良さそう」という感想しか残らなかったことがあるからです。私はこの失敗を繰り返さないために、検証の前に観点を書き出して、それ以外はあえて見ないと決める進め方を好みます。
今回書き出した観点は次の3つです。
- 1M コンテキストは「ファイル選定」という前処理を消せるか: これまでの 200K 前提では、レビューを頼む前に「どのファイルを見せるか」を私が選ぶ必要がありました。この選定自体に私の思い込みが入ります
- 常時適応思考は「考えてほしいところで考えない」事故を減らすか: これまでは思考の深さを意識して、モデルやオプションを自分で切り替えていました。その判断を手放せるかどうか
- 高リスク領域での Opus 4.8 フォールバックは実務の邪魔にならないか: 安全機構が日常の開発作業を妨げるなら、使いどころの判断に影響します
逆に、ベンチマークの数字はあえて追わないことにしました。スコアの優劣は発表資料が教えてくれますが、自分の工程のどこを置き換えるかは、自分の作業で確かめるしかありません。
1M コンテキスト — 「渡せる」と「渡すべき」は別物でした
最初に試したのは、運営している Android 壁紙アプリのリポジトリをまとめて渡す横断レビューです。画像キャッシュまわりに前から漠然とした不安があったので、アプリ本体と共有ライブラリのソースを合わせて渡し、「キャッシュ設計の弱点を、モジュールをまたぐ視点で挙げてください」と頼みました。
返ってきた指摘の中で唸ったのは、2つのモジュールでキャッシュキーの生成規則が微妙に違う、というものでした。片方は URL をそのままキーにし、もう片方はクエリパラメータを落としてからキーにしている。それぞれ単体で見れば自然なコードですし、ファイルを選んで渡す方式だったら、私はおそらく片方しか見せていません。横断の不整合は、横断で渡して初めて引っかかる類いの問題でした。
ただ、3日使って分かったのは、「渡せる」と「渡すべき」は別物だということです。質問が曖昧なまま大きなコンテキストを渡すと、総花的な改善点リストが返ってきて、今度は受け取った私のほうが消化しきれません。コンテキストを大きくするほど、質問を鋭くする責任がこちらに移ってくる感覚があります。
落ち着いた先は、普段はこれまで通りモジュール単位で渡し、モジュールをまたぐ依存や不整合を問うときだけ全体を渡す、という使い分けです。以前 Claude API の 200K コンテキストをどう割り振るか に書いた「コンテキストは予算」という考え方は、枠が 1M に広がっても変わらないのだと思います。
常時適応思考 — 思考の深さを「私が決めない」良さ
2つ目の観点は適応思考です。Fable 5 は思考が常時有効で、どれだけ深く考えるかをモデル自身がタスクに応じて決めます。
正直に言うと、最初は警戒していました。軽い質問にまで長考されたら、テンポが崩れて日常使いに向かないからです。3日使った体感では、この心配は外れました。コミットメッセージの相談のような軽い依頼は軽く返ってきて、WorkManager の重複実行のような並行処理の質問では、黙って深く考えてから返ってきます。
印象に残ったやり取りがあります。定期処理の重複実行について聞いたとき、期待していた答えに加えて、「プロセス再起動時の再エンキューで同じ問題が別経路から起きます」という、質問に含めていなかった境界条件を先回りで指摘されました。振り返ると、「考えてほしいところで考えてくれなかった」と感じる事故の多くは、思考オプションの指定を忘れた私側のミスでした。この判断をモデルに任せられるのは、小さいようで毎日効いてくる改善です。
一方で、出力は全体に丁寧なので、結論だけほしい場面では冗長に感じることもありました。「結論を先に、3行で」のような縛りを指示に入れる頻度は、Opus 4.8 のときより増えています。
Opus 4.8 へのフォールバック — 3日間で一度だけ見ました
3つ目の観点は安全機構です。Fable 5 はサイバーセキュリティや生物・化学などの高リスク領域で応答をブロックし、Claude Opus 4.8 へ自動でフォールバックします。発動はセッションの5%未満とされています。
通常のアプリ開発——コードレビュー、リファクタの相談、ビルドエラーの調査——では、フォールバックは一度も発動しませんでした。唯一見たのは、依存ライブラリの既知の脆弱性について踏み込んだ細部を尋ねたときで、このときだけ応答が Opus 4.8 に引き継がれました。
この一度の体験で、設計として良くできていると感じました。「答えられません」で会話が止まるのではなく、答えられる範囲の回答が別のモデルから返ってくるので、調べ物の流れ自体は途切れません。能力の高いモデルに強い安全機構を載せ、断る代わりに引き継ぐ。アプリ側で機能制限を設計するとき、私はつい「できません」のダイアログひとつで済ませがちなので、この「止めずに引き継ぐ」形は自分の設計の引き出しにも加えたいと思いました。Mythos クラスの背景は Claude Mythos — Anthropic 新世代フロンティアモデル にまとめていますが、一般提供版を実務で触って初めて、この安全設計の手触りが分かった気がします。
6月23日以降の使い分けを決めました
3日間の所感を踏まえて、導入期間が終わったあとの立ち位置を先に決めておくことにしました。API 価格は入力 $10 / 出力 $50 per MTok で、Opus 4.8 の standard($5 / $25)のちょうど2倍です。usage credits 前提で常用するには、私の規模では重すぎます。
私の結論はこうです。日常のコード相談とレビューは引き続き Opus 4.8、リポジトリ横断の設計レビューと月に数回の難所だけ Fable 5、軽量なバッチ処理は Haiku のまま。Fable 5 は「常用モデル」ではなく「スポットで呼ぶ専門家」という位置づけにしました。
この使い分けを忘れないように、API 経由の処理では工程ごとにモデルを切り替える小さなヘルパーを書きました。モデル名のハードコードがあちこちに散らばるのを防ぎ、価格や提供条件が変わったときに一箇所だけ見直せばよくするためのコードです。
import anthropic
client = anthropic.Anthropic(api_key="YOUR_API_KEY")
# 工程ごとの使用モデルを一箇所に集約する
# 価格改定や提供条件の変更時は、この辞書だけ見直せばよい
MODEL_BY_TASK = {
"repo_review": "claude-fable-5", # リポジトリ横断レビュー(月数回のスポット起用)
"daily_coding": "claude-opus-4-8", # 日常のコード相談・レビュー
"light_batch": "claude-haiku-4-5-20251001", # 軽量バッチ処理
}
def ask(task_type: str, prompt: str) -> str:
"""工程に応じてモデルを切り替えて問い合わせる"""
model = MODEL_BY_TASK.get(task_type, "claude-opus-4-8") # 不明な工程は標準モデルへ
response = client.messages.create(
model=model,
max_tokens=4096,
messages=[{"role": "user", "content": prompt}],
)
return response.content[0].text
# 例: 横断レビューだけ Fable 5 に渡す
# print(ask("repo_review", "モジュール間でキャッシュキー生成の不整合を探してください"))辞書を一段挟んだだけの素朴な作りですが、6月15日の課金変更と6月23日の Fable 5 有料化が同じ月に重なる今は、この「一箇所で見直せる」が効きます。モデルを増やしたときの可用性側の設計は Claude API の高可用性設計 — Sonnet / Haiku / Opus マルチモデルフォールバックを本番で成立させる に書いた内容がそのまま使えたので、そちらに譲ります。
導入期間が終わる前に、一つだけ試すなら
3日分の所感にすぎないので、この評価は来月には変わっているかもしれません。それでも、いま確かに言えることが一つあります。もし手元に「大きすぎて AI に見せるのを諦めていたリポジトリ」があるなら、6月22日までに一度だけ、それをそのまま Fable 5 に渡して横断レビューを頼んでみてください。前処理なしで全体を見せたときに何が返ってくるかは、無料同梱の窓が開いているうちに確かめておく価値があります。
私自身は「スポットで呼ぶ専門家」という結論に落ち着きましたが、リポジトリの規模や工程が違えば、答えも変わってくるはずです。同じように検証の時間を取りにくい方の参考になれば幸いです。