Claude Code トークンコスト節約テク9選【2026年版】
Claude Code のトークンコストを最小化する実践テクニック9選を徹底解説。/compact・.claudeignore・モデル選択・Hooks 設計・API とサブスクリプションの損益分岐点まで、実装コード付きで2026年版として網羅します。
Claude Code を業務で使い続けると、ある日「今月のトークン消費が想定より多い」と気づくことがあります。特に API 従量課金で利用している場合は、コスト管理は最重要課題のひとつです。
本記事では、claude-code-media 編集部が実運用で検証したトークンコスト削減テクニック9選を、コピーして使える実装コード付きで解説します。まずコストが増える構造を理解し、次に即効性の高い削減策→上級設計の順で読み進めてください。
基本的な料金プランの比較は Claude Code 料金比較 を、全体的な活用方法は Claude Code 完全ガイド をご参照ください。
Claude Code のトークンコスト構造を理解する
節約テクニックを実践する前に、「どこでコストが発生しているか」を正確に把握することが重要です。
料金の基本:入力・出力・キャッシュの3要素
Claude Code が消費するトークンは大きく3種類に分類されます(Anthropic 公式モデル一覧 参照。価格は執筆時点のものです。最新情報は公式サイトで確認してください)。
| トークン種別 | 説明 | コスト傾向 |
|---|---|---|
| 入力トークン | プロンプト・コンテキスト・ファイル読み込み | 量が多くなりやすい |
| 出力トークン | Claude の応答・生成コード | 入力より単価が高い |
| キャッシュ読み込み | Prompt Caching で再利用した部分 | 入力の約10分の1 |
Claude Code はセッション中に会話履歴・読み込んだファイル・CLAUDE.md の内容をすべてコンテキストとして保持します。セッションが長くなるほど入力トークンが累積し、コストが加速的に増加します。
コストが膨らむ3大原因
実運用データから、コスト超過の主因は以下の3点に集約されます。
- コンテキスト肥大化: 長いセッションで会話履歴が膨れ上がり、毎ターンの入力トークンが増える
- 不要ファイルの読み込み:
node_modulesや.gitなどの大容量ディレクトリを Claude が参照してしまう - 高コストモデルの固定利用: 軽微なタスクでも Opus を使い続けることで単価が上がる
この3点を抑えるだけで、同じ作業量でコストを大幅に削減できます。
即効性の高いコスト削減テクニック5選
テクニック1: /compact でコンテキストを定期圧縮する
/compact コマンドは、会話履歴を AI が要約した短いサマリーに置き換えます。長いセッションの中盤で実行すると、それ以降の入力トークン量を大幅に削減できます。
# セッション中に手動で実行
/compact
# 特定の要約方針を指示して実行
/compact 「これまでの作業で変更したファイルと次のタスクだけ残して要約して」
使いどころ: 大きなリファクタリングが一段落したとき、新しいタスクに切り替えるとき、コンテキストが50%以上消費されたときに実行するのが効果的です。
あるいは、タスクの区切りごとに CTRL+C でセッションを終了し /clear で履歴をリセットする方法も有効です。新しいタスクに取り組むたびに新セッションを開始する習慣をつけると、コンテキスト肥大化を根本的に防げます。
テクニック2: .claudeignore で読み込みファイルを制限する
.gitignore と同じ記法で、Claude が読み込まないファイル・ディレクトリを指定できます。プロジェクトルートに .claudeignore を置くだけで機能します。
# .claudeignore(プロジェクトルートに配置)
node_modules/
.git/
dist/
build/
coverage/
*.log
*.lock
.next/
__pycache__/
*.pyc
*.min.js
*.min.css
# 大容量のデータファイルやバイナリも除外
*.csv
*.xlsx
*.png
*.jpg
*.pdf
node_modules だけで数十 MB になるプロジェクトも多く、これを除外するだけで Claude がファイルツリーを探索する際のトークン消費が激減します。
テクニック3: --model フラグでタスクに合ったモデルを選ぶ
すべての作業に最上位モデルを使う必要はありません。タスクの複雑さに応じてモデルを使い分けることで、コストを抑えながら品質を維持できます。
# 軽微なタスク(ファイル名変更・定型コメント追加)→ Haiku
claude --model claude-haiku-4-5 "このファイルにJSDocコメントを追加して"
# 標準的なコーディング → Sonnet(デフォルト)
claude --model claude-sonnet-4-6 "認証ロジックをリファクタして"
# 複雑なアーキテクチャ設計・難解なバグ調査 → Opus
claude --model claude-opus-4-5 "このパフォーマンス問題の根本原因を分析して"
実運用では「まず Sonnet でやってみて、どうしても解けなければ Opus にエスカレーション」という判断フローが、コストと品質のバランスとして機能しやすいです。
テクニック4: CLAUDE.md のサイズを適切に管理する
CLAUDE.md は毎ターンのコンテキストに自動で含まれます。ファイルサイズが大きいほど、セッション内の全コストに乗算で影響します。
# 悪い例:詳細すぎる CLAUDE.md(500行超)
## 詳しいアーキテクチャ説明
[100行の説明...]
## 過去の意思決定の経緯
[200行の議事録...]
# 良い例:エッセンスのみ・詳細は @import で分割(50行以内)
# Project Overview
ECサイト向け Next.js 15 モノレポ。詳細は @docs/architecture.md を参照。
# Tech Stack
TypeScript strict / Next.js 15 / Supabase / Tailwind CSS 4
# Critical Rules
- 関数 < 50行 / ファイル < 800行
- any 型禁止
- DB 操作は必ず Supabase RLS 経由
CLAUDE.md は「Claude に毎回読ませる指示書」と考えて、本当に毎回必要な情報だけを絞り込みます。詳細ドキュメントは @import で参照させ、必要なときだけ読み込む設計にしましょう。
テクニック5: Prompt Caching を意識した設計にする
Anthropic の API には Prompt Caching 機能があり、同じプレフィックスのプロンプトを再利用するとキャッシュ読み込みコスト(通常入力の約10分の1)になります。
Claude Code でも cache_control: { type: 'ephemeral' } を使うことで、大きなコンテキスト(システムプロンプト・ドキュメント等)をキャッシュできます。マルチエージェントシステムを構築している場合は、各エージェントのシステムプロンプトをキャッシュ対象に設定するとコスト効果が高くなります。
API vs サブスクリプション、コスパが高いのはどっち?
API 従量課金の特徴
API 課金はトークン量に応じた完全従量制です。使った分だけ払う透明性がある反面、使いすぎると月額が読めなくなります。個人開発や学習目的で利用量が少ない場合はメリットが大きいです。
Pro/Max サブスクリプションの特徴
Claude Code の Pro($20/月)・Max($100/$200/月)サブスクリプションは、月額固定で一定量のリクエストを利用できます(Anthropic 公式料金ページ 参照。最新情報は公式サイトで確認してください)。
使用量別の損益分岐点(モデルケース・試算)
以下は編集部が作成した参考試算です。実際のコストは利用パターンにより大きく異なります。最新の API 価格は Anthropic 公式 で確認し、ご自身の使用量で計算してください。
| 月間使用パターン | 推奨プラン | 判断ポイント |
|---|---|---|
| 週1-2回の軽い利用 | API 従量 | 固定費を避けたい場合 |
| 毎日2-3時間の開発 | Pro ($20) | コスト予測を立てやすくなる |
| フルタイム業務利用 | Max ($200) | 制限を意識せず使い切れる |
| チーム5人以上 | Team プラン | 管理・権限制御が必要 |
自分の利用量がどのゾーンにあるかは、API の場合は Anthropic Console で、サブスクリプションの場合は Claude.ai の使用状況ページで確認できます。
上級者向けコスト最適化設計
テクニック6: Hooks でコスト超過を物理ブロック
Claude Code の Hooks 機能を使うと、特定のコマンド実行前後にスクリプトを挟めます。コスト管理の自動化に応用できます。
# .claude/hooks/pre-tool-use/cost-guard.sh
#!/bin/bash
# 1日の消費トークンが閾値を超えたらアラートを出す
DAILY_TOKEN_FILE="$HOME/.claude/daily_tokens.txt"
TODAY=$(date +%Y-%m-%d)
LIMIT=500000 # 1日50万トークンを上限に設定
# 今日のトークン消費を記録ファイルから取得
CURRENT=$(grep "^$TODAY" "$DAILY_TOKEN_FILE" 2>/dev/null | awk '{print $2}' || echo "0")
if [ "$CURRENT" -gt "$LIMIT" ]; then
echo "⚠️ 本日のトークン消費が ${LIMIT} を超えました(現在: ${CURRENT})。続けますか? [y/N]"
read -r answer
if [ "$answer" != "y" ]; then
exit 1
fi
fi
Hooks の詳細な設定方法は Claude Code Hooks 完全ガイド を参照してください。
テクニック7: Skills でナレッジを再利用してトークンを節約
同じ作業を繰り返すたびにゼロから説明するのは、最もトークンを無駄にするパターンです。Skills にナレッジを蓄積しておくと、/skill-name で呼び出すだけで必要な文脈が展開されます。
# .claude/skills/code-review.md
---
name: code-review
description: Pull Request のコードレビューをするときに使うスキル
---
## レビュー手順
1. git diff main..HEAD でチェンジセットを確認
2. セキュリティ(XSS/SQLi/認証バイパス)を最初に確認
3. パフォーマンス(N+1/無限ループ)を次に確認
4. コーディング規約(関数50行/ファイル800行/any禁止)を確認
5. テストカバレッジ 80% 以上を確認
一度 Skills に書いておけば、「コードレビューのやり方」をプロンプトで毎回説明する数百トークンが節約できます。
テクニック8: Subagent でコンテキストを分割する
大規模な作業を1つのセッションで完結させようとすると、コンテキストが膨大になります。Claude Code の Subagent 機能を使って作業を分割すると、各エージェントのコンテキストを小さく保てます。
# オーケストレーター側の指示例
以下の作業をそれぞれ独立したサブエージェントで実行してください:
**サブエージェント1**: src/auth/ 以下のセキュリティレビューのみ実施
**サブエージェント2**: src/api/ 以下のパフォーマンス計測のみ実施
**サブエージェント3**: テストカバレッジレポートの生成のみ実施
各エージェントは担当外のディレクトリを読み込まないこと。
この分割設計により、3つのタスクを1つの長大なセッションで処理するより、各エージェントのコンテキストが小さくなり、トークン消費の合計を抑えられます(モデルケース。実際の削減量は作業内容と実装によります)。
テクニック9: 日次コストアラートを設定する
実運用では「気づいたらコストが積み上がっていた」という事態を防ぐため、Anthropic Console の使用量アラート機能を設定しておくことを強く推奨します。また、このメディアを運営しているような自律エージェント環境では、SQLite に日次コストを記録してアラートを Discord に飛ばす仕組みも有効です。
# scripts/check-daily-cost.sh
#!/bin/bash
THRESHOLD=30 # $30/日を超えたら警報
COST=$(sqlite3 db/agent_ops.sqlite "
SELECT COALESCE(SUM(total_cost_usd), 0)
FROM agent_costs
WHERE date(recorded_at)=date('now');
")
if (( $(echo "$COST > $THRESHOLD" | bc -l) )); then
curl -s -X POST "$DISCORD_WEBHOOK_URL" \
-H "Content-Type: application/json" \
-d "{\"content\": \"⚠️ 本日の API コスト \$${COST} が閾値 \$${THRESHOLD} を超えました。\"}"
fi
よくある質問(FAQ)
Q. /compact を使うとコードの文脈が失われませんか?
A. 要約の精度は高いですが、詳細なデバッグ中や複雑な依存関係を追っているときは情報が圧縮されすぎることがあります。重要なセッションでは /compact 前に現在の状況をテキストで保存しておくと安心です。
Q. .claudeignore と .gitignore は内容を統一すべきですか?
A. 基本的には .gitignore と同じ内容から始めて、Claude に読ませたい生成ファイル(dist/ 内の型定義など)は .claudeignore では除外しない、という調整が有効です。
Q. API から Pro に変えると使いすぎるようになりませんか?
A. 固定費化することで「元を取ろう」という心理が働き、Claude Code の活用頻度が上がる効果があります。業務効率化ツールとして捉えれば、月 $20-$200 で時間が節約できるなら十分なROIになることが多いです。
Q. トークン消費量はどこで確認できますか?
A. API 利用の場合は Anthropic Console のダッシュボードで確認できます。サブスクリプション利用の場合は Claude.ai の使用状況ページを参照してください。
トークンコストの最適化は、一度設定すると継続的に効果が出る「仕組み化」が鍵です。まず .claudeignore の整備と /compact の習慣化から始め、余裕ができたら Hooks によるアラート自動化→ Skills でナレッジ蓄積→ Subagent 分割設計と段階的に取り組むと、無理なくコスト構造を改善できます。
Claude Code のその他の活用テクニックは Claude Code ベストプラクティス15選 もあわせてご参照ください。
関連記事
- Claude Code ベストプラクティス15選 — コスト節約を含む最適化の全手法
- Claude Code 料金比較 — Pro / Max / Team の違いとコスト設計
- Claude Code チーム活用ガイド — チーム利用のコスト管理と権限設定
- Claude Code を 1 ヶ月運用するなら押さえたい 17 のポイント — 実運用のコスト実績
- Claude Code Skills × Subagents × Hooks 使い分け完全マップ — コスト効率を上げる設計
- Claude Code 完全ガイド — コスト節約以外の全機能を網羅したピラー記事
この記事の著者
claude-code-media 編集部/ Claude Code 専門編集チーム
Claude Code の非エンジニア向け業務効率化メディア『claude-code-lab.jp』を運営。フリーランス・中小企業・個人開発者向けに、実装テンプレ・業務自動化テクニック・Vibe Coding 入門を配信。
