MAXプラン不要!Claude Codeの使用制限を減らすプロンプト集
—
Claude Codeの使用制限、毎週引っかかっていませんか?
「また制限に引っかかった…」
Claude Codeを日常的に使っていると、こんな場面に毎週遭遇する人、結構多いんじゃないかと思う。
かくいう私もそのひとり。毎日使用制限の残量を確認しながら使うのが習慣になっていた。タスクをまとめて投げたら、あっという間に制限に到達。「MAXプランにすれば解決するのかな…」と思いながらも、なかなか踏み切れずにいた。
そこで試したのが、Everything Claude Code(通称ECC)というガイドをもとにした設定の最適化。
実はこの設定、難しいことは何もない。Claude Code自身にプロンプトを渡せば、全部やってくれる。
結論から言うと、設定後は制限にかなり引っかかりにくくなった。この記事では、私が実際に使ったプロンプトをそのまま紹介する。
—
結論:プロンプトを貼るだけで制限が大分減った
やることはシンプル。Claude Codeのチャット欄に、これから紹介するプロンプトをコピペして送るだけ。
設定の内容は大きく5つ。
1. デフォルトモデルをSonnetに変更
2. 思考予算と自動圧縮の上限を設定
3. CLAUDE.mdにコスト節約ルールを追加
4. モデルを使い分けるスキルを導入
5. 設定の確認スキルを導入
それぞれのプロンプトを順番に紹介していく。
—
なぜデフォルトのままだとClaude Codeの使用制限になりやすいのか
まず背景を少しだけ。
Claude Codeのデフォルト設定は、一番重いモデル(Opus)が選ばれている。Opusは賢い分、消費するリソースが多い。何も考えずに使い続けると、あっという間に使用制限に達してしまう。
さらに、デフォルトでは以下も未設定。
- **思考予算の上限**:ひとつの質問で大量のトークンを使うことがある
- **自動圧縮のタイミング**:会話が長くなってもなかなか圧縮が走らない
これらが重なって、「全部Opusで、深く考えさせて、長い会話をそのまま持ち続ける」という一番消費が激しい状態で使っていたわけだ。
—
実際に使ったプロンプト集
プロンプト1:デフォルトモデルと思考予算の設定
まずここから。Claude Codeのチャット欄に以下をそのまま貼る。
~/.claude/settings.json を以下の内容に更新して。
{
"model": "claude-sonnet-4-6",
"env": {
"MAX_THINKING_TOKENS": "10000",
"CLAUDE_AUTOCOMPACT_PCT_OVERRIDE": "50"
}
}
これだけで3つの設定が一気に変わる。
| 設定 | 変更内容 | 効果 |
|---|---|---|
| model | OpusからSonnetに変更 | 消費リソースを大幅削減 |
| MAX_THINKING_TOKENS | 10,000に制限(デフォルト約32,000) | 思考コストを約70%削減 |
| CLAUDE_AUTOCOMPACT_PCT_OVERRIDE | 50%で自動圧縮開始 | 会話の膨張を早めに防ぐ |
プロンプト2:CLAUDE.mdにコスト節約ルールを追加
次に、Claude自身への「行動指針」を設定する。
~/.claude/CLAUDE.md の末尾に以下のセクションを追加して。
## Cost Optimization
- 回答は必要最小限の長さにする。冗長な前置き・まとめ・繰り返しを避ける
- コード変更時は差分のみ説明し、変更していない部分を再掲しない
- 大きな出力はファイルに書き出し、回答トークンを節約する
- 長い会話では適宜 /compact の実行をユーザーに提案する
- デフォルトモデルはSonnet。Opusは複雑なタスクにのみ使用する
これはClaude自身への指示。「無駄に長く答えなくていい」「差分だけ教えて」と事前に伝えておくことで、出力量が抑えられる。
プロンプト3:model-routeスキルを作成
タスクの複雑さに応じて最適なモデルを提案してくれるスキルを作る。
~/.claude/skills/model-route/SKILL.md を新規作成して。
内容は、タスクの説明を受け取り、以下の基準でモデルとeffortレベルを推奨するスキル。
- Haiku(低コスト):ファイル探索・コード読み取り・簡単な1ファイル修正・ドキュメント作成
- Sonnet(標準):複数ファイルの実装・PRレビュー・バグ修正・テスト作成
- Opus(高性能):アーキテクチャ設計・深層デバッグ・セキュリティ監査
使い方: /model-route [タスクの説明]
出力形式: 推奨モデル・effortレベル・理由を表で出力
作成後は `/model-route typoを1つ直したい` などと入力してみると、こんな感じで返ってくる。
推奨モデル: Haiku
effort: low
理由: 単一ファイルの軽微な修正。Haikuで十分対応できる。
作業前にこれを確認する習慣がつくだけで、消費量がかなり変わる。
プロンプト4:token-budget-advisorスキルを作成
回答の深さや長さを事前に調整してくれるスキルも追加する。
~/.claude/skills/token-budget-advisor/SKILL.md を新規作成して。
タスクを以下の4分類で判定し、最適なeffortを提案するスキル。
- A(即答型): はい/いいえ、事実確認 → effort low
- B(作業実行型): ファイル編集・コード生成 → effort medium
- C(分析・設計型): 設計判断・デバッグ → effort high
- D(大量処理型): プロジェクト全体分析 → 分割実行を推奨
使い方: /token-budget-advisor [タスクの説明]
プロンプト5:harness-auditスキルで設定を確認
最後に、設定が正しく反映されているか確認するスキルを作る。
~/.claude/skills/harness-audit/SKILL.md を新規作成して。
現在のClaude Codeのコスト最適化設定を100点満点でスコアリングするスキル。
チェック項目:
- settings.json: modelがSonnet、MAX_THINKING_TOKENS設定済み、CLAUDE_AUTOCOMPACT_PCT_OVERRIDE設定済み(30点)
- CLAUDE.md: Cost Optimizationセクション存在(20点)
- スキル: model-route・token-budget-advisor・harness-audit が存在(30点)
- 運用状態: 現在のモデル・環境変数の確認(20点)
使い方: /harness-audit
出力: スコアと改善提案
5つ全部設定できたら `/harness-audit` を実行してみよう。100点満点が出れば準備完了。
—
毎日の運用で使うコマンド
設定後は、以下のコマンドを日常的に使っていく。
# タスク前にモデルを選ぶ
/model-route [やりたいこと]
# 長い会話をまとめる(節目ごとに)
/compact
# 今のセッションコストを確認
/cost
特に `/compact` は意識的に使うようにしている。長い会話をそのまま続けるより、節目でまとめた方が消費を抑えられる。
—
正直な感想:精度は少し落ちた。でも制限の余裕は大分できた
ここは正直に書く。
SonnetはOpusより「察する力」が弱い。Opusなら指示しなくてもやってくれていたことが、Sonnetだと明示的に指示しないと動かない場面が増えた。
ただ、毎日制限を気にしながら使うストレスはかなり減った。
「今日あと何トークン残ってるかな」とヒヤヒヤしながら作業していたのが、だいぶ余裕を持って使えるようになった。
まだ使い始めて1週間ほどなので、もう少し使い込んでみてこの記事もリライトしたいと思っている。それまでの暫定レポートとして受け取ってほしい。
—
まとめ
- Claude Codeのデフォルトは**最も重いモデル(Opus)**が選ばれており、使用制限を消費しやすい
- **プロンプトをコピペするだけで**設定変更・スキル追加ができる
- `MAX_THINKING_TOKENS=10000` で思考コストを約70%削減できる
- `CLAUDE_AUTOCOMPACT_PCT_OVERRIDE=50` で会話の膨張を早めに防げる
- `/model-route` でタスクに合ったモデルを選ぶ習慣をつける
- **精度は少し落ちるが、制限の余裕はかなり改善される**
MAXプランへの移行を迷っている人は、まずこのプロンプトを試してみてほしい。「コピペするだけでここまで変わるの?」という感想を持ってもらえると思う。
—
*最終更新:2026-04-04(使い込んだらリライト予定)*