トークンとは何か?なぜClaudeはそれを制限するのか?
トークンとは、Claudeがテキストを処理する際の最小単位で、「単語の断片」に近い概念です。英語では1単語が約1トークン、日本語では1文字が約1〜2トークンに相当します。300字の日本語文章は、おおよそ400〜600トークンを消費します。
Claudeの基盤モデルには固定のメモリ予算があり、作業デスクに例えると、デスクの表面積は固定されており、書類を積み重ねるほど古いものがデスクの端から落ちていきます。トークン制限はハードウェアと計算コストの現実的な制約から生じており、意図的な機能制限ではありません。
現在のトークン上限はプランによって異なります。無料プランは32K〜100K程度、Proユーザーは最大200Kにアクセスできます。200Kトークンは日本語で約10万字に相当し、中編小説1冊分に匹敵します。職場での使用では、長文書と複数回のやり取りを組み合わせると、数時間でその上限に達することがあります。
職場ユーザーにとってトークンを理解することは、計算をするためではなく、「いつClaudeが忘れ始めるか」を予測し、事前に対策を取るためです。
トークン上限を超えると、Claudeはどう反応するのか?
トークン上限を超えても、Claudeはコンピュータのブルースクリーンのようにクラッシュするわけではありません。代わりに「選択的忘却」という混乱を招く動作をします。システムは会話の最も古いコンテンツ(通常は最初に貼り付けた文書や背景情報)を自動的に削除し、最近のやり取りを保持します。
そのため、次のような状況に遭遇することがあります:
悪いことに、Claudeは何を忘れたかを教えてくれないことが多いです。応答を続けますが、品質は静かに低下していきます。
実務では、以下の状況で積極的に新しい会話を始めることをお勧めします:
トークンを効果的に管理し、各会話の効果を最大化するには?
トークン管理の核心原則はシンプルです:限られたスペースを最も価値のあるコンテンツのために確保する。
戦略1:入力を絞る — 必要な段落だけを貼り付ける Wordファイル全体をコピーしないでください。質問に直接関連する段落だけを貼り付けます。例えば、メールの締めの段落を書き直してほしい場合、最後の2段落だけを貼れば十分です。
戦略2:Claude Projectsをナレッジベースとして使用する Claude Projectsを使うと、よく参照する文書(会社の規定、製品説明、個人の好み)をProjectに保存できます。これらはより効率的に読み込まれ、毎回ファイルを貼り付けるよりもトークンの消費を大幅に減らせます。
戦略3:長い会話は要約してから続ける 会話が長くなった場合、Claudeに重要ポイントのまとめを作ってもらい、そのまとめを新しい会話の先頭に貼り付けて作業を続けます。最小のトークンコストで重要な文脈を保持できます。
戦略4:大きなタスクを複数の会話に分割する 大きなプロジェクトを段階に分けます:「問題を分析する」→「解決策を出す」→「レポートを書く」。各会話を集中させることで、コンテキストウィンドウの拡大による品質低下を防げます。
トークンとContext Windowは同じものか?上級ユーザーが知るべきこと
トークンとContext Windowは関連していますが、完全に同じ概念ではありません。Context Window(コンテキストウィンドウ)とはClaudeがある時点で「見ることができるすべての内容」の範囲を指し、トークン上限はそのウィンドウの最大サイズを定義します。
上級ユーザーが知るべき追加事項:
入力と出力は合算される:トークン上限には、あなたが送信するものとClaudeが生成するものの両方が含まれます。長いレポートを書くよう依頼すると、その出力自体が大量のトークンを消費します。
システムプロンプトもスペースを占める:Claude ProjectsでCustom Instructionsを設定している場合、その説明文もトークン予算に計上されます。詳細なシステムプロンプトは2,000〜5,000トークンを消費することがあります。
モデルによって上限が異なる:Claude OpusとClaude Sonnetはトークン上限が異なる場合があり、API使用時の具体的な数値も変わることがあります。
画像もトークンを消費する:分析のために画像をアップロードすると、トークンに変換されて予算に計上されます。高解像度の画像は数千語のテキストに相当することがあります。
これらの詳細を理解することで、より効率的なワークフローを設計し、各会話でClaudeが最高のパフォーマンスを発揮できるようにできます。
実際の職場事例:マーケティングマネージャー・ミンの1日
ミンはテック企業のマーケティングマネージャーで、毎週データレポートの整理、SNS投稿の作成、顧客からの問い合わせメールへの返信、進行中のキャンペーンのトラッキングをこなしています。彼女はClaudeをこれらの作業の補助に使い始めました。
午前9時:ミンは先週の5つのデータレポート(各約2,000語)をすべて一つのClaude会話に貼り付け、一度に包括的な分析をしてもらおうとしました。5つの文書を合わせると約10,000語、約15,000〜20,000トークンになり、予算のかなりの部分を消費します。
午後2時:会話が30ラウンド以上に及んだ後、ミンが「以前話し合ったデータトレンドに基づいて、今月のSNS投稿では何を強調すべきか」と尋ねると、Claudeの回答が曖昧になり、朝のレポートをほとんど覚えていないようでした。
問題の根本原因:朝の5つのレポートはシステムによって削除されていました。Claudeは午後の会話部分しか「見えて」いません。
改善方法:
長い会話 vs. 複数の会話:トレードオフ
多くのユーザーは「より一貫性を感じる」という理由で、一つの会話ウィンドウで全作業を完了しようとします。しかし、これはトークン上限の境界に常に挑戦していることになります。
長い会話の利点は毎回コンテキストを再導入する必要がなく、Claudeが以前のやり取りから文脈を見つけられることです。欠点は会話が長くなるほど、古いコンテンツが削除されやすくなり、品質が静かに低下することです。
複数の短い会話は毎回クリーンなスタートでトークン効率が高いです。欠点は必要なコンテキストを手動で再導入する必要があり、思考の流れが途切れることがあります。
推奨する妥協案:Claude Projectsを使って「固定の背景資料」(会社の規定、標準テンプレート)を保存し、新しい会話が自動的に必要な定数情報を読み込めるようにしながら、会話ウィンドウを軽量に保ちます。