Claude Codeのコストを節約する実践テクニック|料金を抑える5つの方法
Claude Codeのコストや節約方法が気になっているけど、何から手をつければいいかわからない——そんなときのために、私が実際に試して効果を感じたテクニックをまとめます。
使い続けていると、ふと月末に請求額・使用量を確認してドキッとすることがありませんか?
私も「あれ、思ったより消費してるな…」と気づいた月がありました。何も工夫しないと、長い会話・複雑なタスク・何度もリトライする作業があっという間にトークンを消費していきます。
モデルの切り替え・`/compact`の活用・思考量の調整など、今日からすぐ使える方法を具体的なプロンプト付きで紹介します。
—
コスト節約の効果が大きかった3つの組み合わせ
先に結論を言ってしまうと、私がやって一番効果があったのはこの3つのセットです。
1. タスクに合わせてモデルを切り替える(シンプルな作業はHaikuへ)
2. `/compact`を早めにかける(私は70%前後を目安にしています)
3. CLAUDE.mdを短くする(不要な記述を削ぎ落とす)
これを意識するようになってから、`/cost`で確認した同種タスクの消費トークンが、以前と比べて40〜50%ほど減りました。作業の内容によっては差が出にくいこともありますが、継続して試す価値はあります。
それぞれ順番に説明していきます。
—
テクニック①:モデルをタスクで使い分ける
Claude Codeでは `/model` コマンドで使用するモデルをいつでも切り替えられます。
| モデル | 向いているタスク |
|---|---|
| Haiku | ファイルのリネーム・簡単な検索・単純な質問 |
| Sonnet | 日常のコーディング・記事執筆・構成の相談 |
| Opus | 複雑なアーキテクチャ設計・多段階推論が必要な作業 |
私がやらかした失敗は、「ちょっとファイル名を変えてほしいだけ」なのにOpusに頼んでいたこと。Opus・Sonnet・Haikuはそれぞれ単価・使用量カウントが異なります(API価格ベースではHaikuが最も安く、Opusが最も高い)。単純作業にOpusを使うのは、タクシーで500mの距離を移動するくらいもったいない。
実際に使っているプロンプト
まずコマンドでモデルを切り替えてから、タスクを伝えます。
/model haiku
その後に指示を入力します:
今日は単純なファイル整理・検索をお願いします。
複雑な判断が必要になったら、作業前に教えてください。
ただし、長い会話の途中で頻繁に切り替えると、履歴の再読込で一時的にトークンを使うことがあります。切り替えは作業の区切り目で行うのがおすすめです。
—
テクニック②:`/compact`は早めにかける
`/compact` は会話の履歴を要約・圧縮して、コンテキストの空き容量を回復するコマンドです。
「コンテキストが重くなってきたら使う」という認識の方が多いと思いますが、実はもっと早い段階でかけた方が効果的です。
公式の固定ルールではありませんが、私はコンテキスト使用率が 70%前後になったタイミング で `/compact` を実行することを目安にしています。
理由はシンプルで、コンテキストがいっぱいになると自動圧縮が走りますが(公式では95%超過で発動)、そのタイミングでは「何を残すか」の選択の余地が少なくなります。早めに自分で圧縮すると、「この情報は絶対に残してほしい」という指示を添えられます。
実際に使っているプロンプト
/compact 今まで決めた設計方針とファイル構成だけ必ず残してください
引数なしの `/compact` でもいいのですが、「何を優先して残すか」を一言添えると、圧縮後も作業の文脈が失われにくくなります。
—
テクニック③:CLAUDE.mdを整理する
CLAUDE.mdはClaude Codeが起動時に読み込むメモリファイルです(設定ファイルとは別物で、プロジェクトの方針や作業ルールをAIに伝えるための文脈です)。ここが長ければ長いほど、会話のたびにトークンを消費します。
最初は「あれもこれも書いておけばAIが賢くなるはず」と思って、どんどん追記していました。でも途中で気づいたんですよね。読み込ませているのに活かされていない記述が結構あることに。
私は便宜的に 200行以内 を目安にしていますが、重要なのは行数より「毎回必要な情報だけに絞る」ことです。それ以上になってきたら、「本当に毎回必要か?」を問い直して削る。
実際に使っているプロンプト
今のCLAUDE.mdを読んで、「毎回読み込む必要がない記述」を特定してください。
削除候補を箇条書きで教えてください。(削除はしないでください)
これをやると、思いの外「確かにこれいらないな」という記述が出てきます。
—
テクニック④:`/effort`で思考量を調整する
Claude Codeでは `/effort [level]` コマンドで思考量を調整できます。levelには `low` / `medium` / `high` / `xhigh` / `max` などが指定可能です(使えるレベルはモデルによって異なり、maxはセッション限定)。
複雑な問題には多くの思考を許可して、シンプルな作業には制限する。「全部フルパワーで考えて」は一番コストがかかる使い方です。
/effort low
ファイル名を一覧で確認してください
/effort high
このプロジェクトの設計方針を一緒に考えてください
ただし、これはまだ私も試行錯誤中です。「シンプルだと思って低く設定したら、実は複雑だった」ということもあるので、作業タイプに慣れてから調整するのが安全かと思っています。
なお、Pro/Maxなどのサブスクリプション利用では実費への直結度が異なります。API従量課金で使っている場合は特に効果が大きいです。
—
テクニック⑤:長い会話は「仕切り直す」
「前の文脈を維持したまま続けよう」と思って一つの会話セッションを延々と続けるのも、意外とコストがかかる原因です。
タスクの種類が変わったタイミングでは `/clear` を使って履歴をリセットするか、新しいセッションを始めてポイントだけ渡す方法が有効です。また、`/cost` コマンドで現在のセッションのトークン消費量を確認できます。節約施策を試す前後で比較すると、どの工夫が効いているかを客観的に把握できます。
実際に使っているプロンプト
この会話で決まったことを3行以内にまとめて。
次のセッションに引き継ぐ情報だけ教えて。
この要約を新しいセッションの冒頭に貼り付ければ、前の文脈を最小限のトークンで引き継げます。
—
まだわからないこと・試行中のこと
正直に言うと、「どのモデルをどのタイミングで切り替えるか」の最適解はまだ模索中です。
複雑そうに見えて実はシンプルなタスクもあれば、その逆もある。感覚で判断しているうちは、切り替えのタイミングが遅れてOpusで余計に処理することも。
自動でルーティングしてくれる非公式ツール(claude-code-routerなど)も存在するらしいですが、業務コードに使う場合はAPIキーや内容が第三者を経由するリスクがあるため慎重に扱う必要があります。設定の手間と節約額のバランスはまだ評価しきれていないので、引き続き試していきます。
—
まとめ
Claude Codeのコスト節約で効果があったテクニックをまとめます。
- **モデルの使い分け**:シンプルな作業はHaiku、日常作業はSonnet、複雑な設計だけOpus(切り替えは作業の区切りで)
- **`/compact`は早め**:70%前後(目安)で「残したい情報」を指示しながら圧縮
- **CLAUDE.mdを短く**:毎回読み込まれるメモリファイルは必要最低限に
- **`/effort`で思考量を調整**:シンプルな作業には`/effort low`を試す
- **会話を仕切り直す**:長いセッションは要約して新規スタート
- **`/cost`で使用量を確認**:節約施策の効果を前後比較で測定する
- **タスクが変わったら`/clear`**:不要な履歴をリセットして新鮮な状態で始める
全部一気にやろうとせず、まず「モデルの使い分け」と「早めの/compact」だけでも意識してみてください。それだけで体感は変わると思います。
Claude Codeは使えば使うほど上手くなるツールですが、節約テクニックも同じで「使いながら覚える」が一番です。失敗しながら自分に合ったペースを見つけていきましょう。
—
関連記事
- [/compactって何?長い会話を圧縮する方法](https://maahsachi.com/claude-code-compact/)
- [Haiku・Sonnet・Opus、どれを使えばいいか](https://maahsachi.com/claude-code-model-choice/)