Claude Code Media
104,296中級

Claude Code トークンコスト節約テク9選【2026年版】

Claude Code のトークンコストを最小化する実践テクニック9選を徹底解説。/compact・.claudeignore・モデル選択・Hooks 設計・API とサブスクリプションの損益分岐点まで、実装コード付きで2026年版として網羅します。

By Claude Code Media 編集部Reviewed by Claude Code Media 編集部

Claude Code を業務で使い続けると、ある日「今月のトークン消費が想定より多い」と気づくことがあります。特に API 従量課金で利用している場合は、コスト管理は最重要課題のひとつです。

本記事では、claude-code-media 編集部が実運用で検証したトークンコスト削減テクニック9選を、コピーして使える実装コード付きで解説します。まずコストが増える構造を理解し、次に即効性の高い削減策→上級設計の順で読み進めてください。

基本的な料金プランの比較は Claude Code 料金比較 を、全体的な活用方法は Claude Code 完全ガイド をご参照ください。

Claude Code のトークンコスト構造を理解する

節約テクニックを実践する前に、「どこでコストが発生しているか」を正確に把握することが重要です。

料金の基本:入力・出力・キャッシュの3要素

Claude Code が消費するトークンは大きく3種類に分類されます(Anthropic 公式モデル一覧 参照。価格は執筆時点のものです。最新情報は公式サイトで確認してください)。

トークン種別説明コスト傾向
入力トークンプロンプト・コンテキスト・ファイル読み込み量が多くなりやすい
出力トークンClaude の応答・生成コード入力より単価が高い
キャッシュ読み込みPrompt Caching で再利用した部分入力の約10分の1

Claude Code はセッション中に会話履歴・読み込んだファイル・CLAUDE.md の内容をすべてコンテキストとして保持します。セッションが長くなるほど入力トークンが累積し、コストが加速的に増加します。

コストが膨らむ3大原因

実運用データから、コスト超過の主因は以下の3点に集約されます。

  1. コンテキスト肥大化: 長いセッションで会話履歴が膨れ上がり、毎ターンの入力トークンが増える
  2. 不要ファイルの読み込み: node_modules.git などの大容量ディレクトリを Claude が参照してしまう
  3. 高コストモデルの固定利用: 軽微なタスクでも Opus を使い続けることで単価が上がる

この3点を抑えるだけで、同じ作業量でコストを大幅に削減できます。

即効性の高いコスト削減テクニック5選

テクニック1: /compact でコンテキストを定期圧縮する

/compact コマンドは、会話履歴を AI が要約した短いサマリーに置き換えます。長いセッションの中盤で実行すると、それ以降の入力トークン量を大幅に削減できます。

# セッション中に手動で実行
/compact

# 特定の要約方針を指示して実行
/compact 「これまでの作業で変更したファイルと次のタスクだけ残して要約して」

使いどころ: 大きなリファクタリングが一段落したとき、新しいタスクに切り替えるとき、コンテキストが50%以上消費されたときに実行するのが効果的です。

あるいは、タスクの区切りごとに CTRL+C でセッションを終了し /clear で履歴をリセットする方法も有効です。新しいタスクに取り組むたびに新セッションを開始する習慣をつけると、コンテキスト肥大化を根本的に防げます。

テクニック2: .claudeignore で読み込みファイルを制限する

.gitignore と同じ記法で、Claude が読み込まないファイル・ディレクトリを指定できます。プロジェクトルートに .claudeignore を置くだけで機能します。

# .claudeignore(プロジェクトルートに配置)
node_modules/
.git/
dist/
build/
coverage/
*.log
*.lock
.next/
__pycache__/
*.pyc
*.min.js
*.min.css

# 大容量のデータファイルやバイナリも除外
*.csv
*.xlsx
*.png
*.jpg
*.pdf

node_modules だけで数十 MB になるプロジェクトも多く、これを除外するだけで Claude がファイルツリーを探索する際のトークン消費が激減します。

テクニック3: --model フラグでタスクに合ったモデルを選ぶ

すべての作業に最上位モデルを使う必要はありません。タスクの複雑さに応じてモデルを使い分けることで、コストを抑えながら品質を維持できます。

# 軽微なタスク(ファイル名変更・定型コメント追加)→ Haiku
claude --model claude-haiku-4-5 "このファイルにJSDocコメントを追加して"

# 標準的なコーディング → Sonnet(デフォルト)
claude --model claude-sonnet-4-6 "認証ロジックをリファクタして"

# 複雑なアーキテクチャ設計・難解なバグ調査 → Opus
claude --model claude-opus-4-5 "このパフォーマンス問題の根本原因を分析して"

実運用では「まず Sonnet でやってみて、どうしても解けなければ Opus にエスカレーション」という判断フローが、コストと品質のバランスとして機能しやすいです。

テクニック4: CLAUDE.md のサイズを適切に管理する

CLAUDE.md は毎ターンのコンテキストに自動で含まれます。ファイルサイズが大きいほど、セッション内の全コストに乗算で影響します。

# 悪い例:詳細すぎる CLAUDE.md(500行超)
## 詳しいアーキテクチャ説明
[100行の説明...]

## 過去の意思決定の経緯
[200行の議事録...]
# 良い例:エッセンスのみ・詳細は @import で分割(50行以内)
# Project Overview
ECサイト向け Next.js 15 モノレポ。詳細は @docs/architecture.md を参照。

# Tech Stack  
TypeScript strict / Next.js 15 / Supabase / Tailwind CSS 4

# Critical Rules
- 関数 < 50行 / ファイル < 800行
- any 型禁止
- DB 操作は必ず Supabase RLS 経由

CLAUDE.md は「Claude に毎回読ませる指示書」と考えて、本当に毎回必要な情報だけを絞り込みます。詳細ドキュメントは @import で参照させ、必要なときだけ読み込む設計にしましょう。

テクニック5: Prompt Caching を意識した設計にする

Anthropic の API には Prompt Caching 機能があり、同じプレフィックスのプロンプトを再利用するとキャッシュ読み込みコスト(通常入力の約10分の1)になります。

Claude Code でも cache_control: { type: 'ephemeral' } を使うことで、大きなコンテキスト(システムプロンプト・ドキュメント等)をキャッシュできます。マルチエージェントシステムを構築している場合は、各エージェントのシステムプロンプトをキャッシュ対象に設定するとコスト効果が高くなります。

API vs サブスクリプション、コスパが高いのはどっち?

API 従量課金の特徴

API 課金はトークン量に応じた完全従量制です。使った分だけ払う透明性がある反面、使いすぎると月額が読めなくなります。個人開発や学習目的で利用量が少ない場合はメリットが大きいです。

Pro/Max サブスクリプションの特徴

Claude Code の Pro($20/月)・Max($100/$200/月)サブスクリプションは、月額固定で一定量のリクエストを利用できます(Anthropic 公式料金ページ 参照。最新情報は公式サイトで確認してください)。

使用量別の損益分岐点(モデルケース・試算)

以下は編集部が作成した参考試算です。実際のコストは利用パターンにより大きく異なります。最新の API 価格は Anthropic 公式 で確認し、ご自身の使用量で計算してください。

月間使用パターン推奨プラン判断ポイント
週1-2回の軽い利用API 従量固定費を避けたい場合
毎日2-3時間の開発Pro ($20)コスト予測を立てやすくなる
フルタイム業務利用Max ($200)制限を意識せず使い切れる
チーム5人以上Team プラン管理・権限制御が必要

自分の利用量がどのゾーンにあるかは、API の場合は Anthropic Console で、サブスクリプションの場合は Claude.ai の使用状況ページで確認できます。

上級者向けコスト最適化設計

テクニック6: Hooks でコスト超過を物理ブロック

Claude Code の Hooks 機能を使うと、特定のコマンド実行前後にスクリプトを挟めます。コスト管理の自動化に応用できます。

# .claude/hooks/pre-tool-use/cost-guard.sh
#!/bin/bash
# 1日の消費トークンが閾値を超えたらアラートを出す

DAILY_TOKEN_FILE="$HOME/.claude/daily_tokens.txt"
TODAY=$(date +%Y-%m-%d)
LIMIT=500000  # 1日50万トークンを上限に設定

# 今日のトークン消費を記録ファイルから取得
CURRENT=$(grep "^$TODAY" "$DAILY_TOKEN_FILE" 2>/dev/null | awk '{print $2}' || echo "0")

if [ "$CURRENT" -gt "$LIMIT" ]; then
  echo "⚠️  本日のトークン消費が ${LIMIT} を超えました(現在: ${CURRENT})。続けますか? [y/N]"
  read -r answer
  if [ "$answer" != "y" ]; then
    exit 1
  fi
fi

Hooks の詳細な設定方法は Claude Code Hooks 完全ガイド を参照してください。

テクニック7: Skills でナレッジを再利用してトークンを節約

同じ作業を繰り返すたびにゼロから説明するのは、最もトークンを無駄にするパターンです。Skills にナレッジを蓄積しておくと、/skill-name で呼び出すだけで必要な文脈が展開されます。

# .claude/skills/code-review.md
---
name: code-review
description: Pull Request のコードレビューをするときに使うスキル
---

## レビュー手順
1. git diff main..HEAD でチェンジセットを確認
2. セキュリティ(XSS/SQLi/認証バイパス)を最初に確認
3. パフォーマンス(N+1/無限ループ)を次に確認
4. コーディング規約(関数50行/ファイル800行/any禁止)を確認
5. テストカバレッジ 80% 以上を確認

一度 Skills に書いておけば、「コードレビューのやり方」をプロンプトで毎回説明する数百トークンが節約できます。

テクニック8: Subagent でコンテキストを分割する

大規模な作業を1つのセッションで完結させようとすると、コンテキストが膨大になります。Claude Code の Subagent 機能を使って作業を分割すると、各エージェントのコンテキストを小さく保てます。

# オーケストレーター側の指示例
以下の作業をそれぞれ独立したサブエージェントで実行してください:

**サブエージェント1**: src/auth/ 以下のセキュリティレビューのみ実施
**サブエージェント2**: src/api/ 以下のパフォーマンス計測のみ実施
**サブエージェント3**: テストカバレッジレポートの生成のみ実施

各エージェントは担当外のディレクトリを読み込まないこと。

この分割設計により、3つのタスクを1つの長大なセッションで処理するより、各エージェントのコンテキストが小さくなり、トークン消費の合計を抑えられます(モデルケース。実際の削減量は作業内容と実装によります)。

テクニック9: 日次コストアラートを設定する

実運用では「気づいたらコストが積み上がっていた」という事態を防ぐため、Anthropic Console の使用量アラート機能を設定しておくことを強く推奨します。また、このメディアを運営しているような自律エージェント環境では、SQLite に日次コストを記録してアラートを Discord に飛ばす仕組みも有効です。

# scripts/check-daily-cost.sh
#!/bin/bash
THRESHOLD=30  # $30/日を超えたら警報

COST=$(sqlite3 db/agent_ops.sqlite "
  SELECT COALESCE(SUM(total_cost_usd), 0) 
  FROM agent_costs 
  WHERE date(recorded_at)=date('now');
")

if (( $(echo "$COST > $THRESHOLD" | bc -l) )); then
  curl -s -X POST "$DISCORD_WEBHOOK_URL" \
    -H "Content-Type: application/json" \
    -d "{\"content\": \"⚠️ 本日の API コスト \$${COST} が閾値 \$${THRESHOLD} を超えました。\"}"
fi

よくある質問(FAQ)

Q. /compact を使うとコードの文脈が失われませんか?

A. 要約の精度は高いですが、詳細なデバッグ中や複雑な依存関係を追っているときは情報が圧縮されすぎることがあります。重要なセッションでは /compact 前に現在の状況をテキストで保存しておくと安心です。

Q. .claudeignore と .gitignore は内容を統一すべきですか?

A. 基本的には .gitignore と同じ内容から始めて、Claude に読ませたい生成ファイル(dist/ 内の型定義など)は .claudeignore では除外しない、という調整が有効です。

Q. API から Pro に変えると使いすぎるようになりませんか?

A. 固定費化することで「元を取ろう」という心理が働き、Claude Code の活用頻度が上がる効果があります。業務効率化ツールとして捉えれば、月 $20-$200 で時間が節約できるなら十分なROIになることが多いです。

Q. トークン消費量はどこで確認できますか?

A. API 利用の場合は Anthropic Console のダッシュボードで確認できます。サブスクリプション利用の場合は Claude.ai の使用状況ページを参照してください。


トークンコストの最適化は、一度設定すると継続的に効果が出る「仕組み化」が鍵です。まず .claudeignore の整備と /compact の習慣化から始め、余裕ができたら Hooks によるアラート自動化→ Skills でナレッジ蓄積→ Subagent 分割設計と段階的に取り組むと、無理なくコスト構造を改善できます。

Claude Code のその他の活用テクニックは Claude Code ベストプラクティス15選 もあわせてご参照ください。

関連記事

この記事の著者

claude-code-media 編集部Claude Code 専門編集チーム

Claude Code の非エンジニア向け業務効率化メディア『claude-code-lab.jp』を運営。フリーランス・中小企業・個人開発者向けに、実装テンプレ・業務自動化テクニック・Vibe Coding 入門を配信。

Claude Code 完全ガイドVibe CodingAI 業務効率化非エンジニア向け AI 教育MCP(Model Context Protocol)
ByClaude Code Media 編集部

AI支援で執筆 — 本記事は Claude Code エージェントによる執筆支援を受け、編集部が事実確認・編集を行っています。 数値・引用元は記事更新日時点で確認済みですが、最新情報は各公式サイトでご確認ください。