ChatGPTのトークンとは?日本語/英語別の数え方や上限も紹介

ChatGPTを利用している方の中には、「トークン」という単語を聞いたことがある方も多いのではないでしょうか。

 

トークンとは、ChatGPTが処理するテキストの基本単位のことで、英語であれば1単語あたり1トークン、日本語では1文字あたり1~3トークンとされています。

トークンは、ChatGPTに入力できる文字数の制限やChatGPTに支払う料金に大きく影響するため、ChatGPTを利用する上で理解すべき重要な概念です。

 

そこで本記事では、「トークンって聞いたことがあるけど何なのかよくわからない」という方に向けて、ChatGPTのトークンの基本や重要性、数え方・調べ方についてわかりやすくご紹介します。


またAI総研では、AI活用を検討する上で押さえておきたい、AI・ChatGPTの最新活用事例50選の狙いや取り組みをまとめたレポートを無料で配布しています。ご興味のある方は、以下リンクからダウンロードしてご活用ください。

AI・ChatGPT活用事例50選の資料ダウンロードはこちら(無料)

ChatGPTのトークンとは?

ChatGPTにおけるトークンとは、ChatGPTに入力するテキストの基本単位のことで、テキストを一つの意味のあるまとまりに分けたものです。

 

例えば、英語の場合は1単語≒1トークンとなります。日本語の場合のトークン数は、ひらがなか漢字かによっても異なるので一概には言えませんが、大体1文字≒1~3トークンとされています。

  

ChatGPTのトークンは、入力できる文字数の制限や利用料金にも影響するため、ChatGPTを理解する上で重要な概念と言えます。

 

※これさえ読めば、ChatGPTの機能・できること・活用方法まで全てわかる、最新情報をまとめた資料をダウンロード頂けます。
【5分でわかる】ChatGPT活用ガイドブックの資料ダウンロードはこちら(無料)

ChatGPTのトークンが重要である2つの理由

ChatGPTのトークンが重要である理由として、主に以下の2つが挙げられます。

 

  • ①文字数制限はトークン数に左右されるから
  • ②トークン数に応じてAPI利用料金が決まるから

 

それぞれについてわかりやすく紹介していきます。

①文字数制限はトークン数に左右されるから

ChatGPTには、一度に入力できる文字数に制限があります。

 

文字数の上限はトークン数によって定まるため、トークンの概念を理解しておくことは、ChatGPTに入力できる文字数を把握しておく上で重要となります。

②トークン数に応じてAPI利用料金が決まるから

ChatGPTのAPIを利用した場合には、トークン数に応じて課金されます。

 

API利用料金は、ChatGPTのモデルによっても異なりますが、GPT-3.5の場合、1000トークン当たり、大体0.002ドルとなっています。

 

したがって、使用するトークン数が多いとAPI利用料金も高くなるので、APIを利用する上では、トークン数の管理・節約が非常に重要になります。

ChatGPTのトークン数の上限とは?

ChatGPTのトークン数の上限とは?

ChatGPTのトークン数の上限はモデルごとに異なり、上の表の通りとなります。

 

無料版に搭載されているGPT-3.5のトークン数の上限は4,096トークンであり、日本語では約2000文字程度です。

 

GPT-4のトークン数の上限は32,768トークンであり、日本語では約2万5000文字です。また、最新版のGPT-4 Turboは、128,000トークンであり、日本語では約10万文字です。

 

※AI/ChatGPTを導入する前に必ず押さえておきたい、基礎知識や導入方法3パターンの比較、リスクと対策などをまとめた資料をダウンロード頂けます。
AI/ChatGPT導入マニュアルの資料ダウンロードはこちら(無料)

ChatGPTのトークン数の数え方

ChatGPTの英語と日本語のトークン数の数え方について、ご紹介します。

①英語のトークン数の数え方

英語の場合は、1単語あたり大体1トークンとシンプルです。ピリオドやカンマなどの句読点も1トークンとしてカウントされます。

②日本語のトークン数の数え方

日本語の場合は、英語と異なり1文字=1トークンとはなりません。目安としては、ひらがな1文字あたり1~2トークン漢字1文字あたり1~3トークンとなります。

ChatGPTのトークン数の調べ方

OpenAI社が提供する公式ツール「Tokenizer」
(画像:OpenAI)

ChatGPTに入力する文章のトークン数は、OpenAI社が提供する公式ツールである「Tokenizer」を用いることで調べることができます

 

Tokenizerを使って、英語と日本語の文字数を調べた結果をご紹介します。

①英語のトークン数を調べた結果

Tokenizer 英語のトークン数を調べた結果

上の画像は、「I have a pen.」という文章のトークン数を調べた結果です。ピリオドも1トークンにカウントされ、合計トークン数は5となりました。

②日本語のトークン数を調べた結果

Tokenizer 日本語のトークン数を調べた結果

上の画像は、「私は今夜、外食に行く予定があります。」という文章のトークン数を調べた結果です。

 

18文字の文章に対し、トークン数は19となっており、日本語の場合は必ずしも、文字数とトークン数が一致しないことがわかります。

ChatGPTのトークン数の上限への対処法3選

ChatGPTのトークン数の上限への対処法3選

ChatGPTのトークン数の上限への対処法として、以下の3つが挙げられます。

 

  • ①質問を短く簡潔にまとめる
  • ②質問を複数回に分けて送信する
  • ③直前の回答内容を引用して質問する

 

以上の3つの方法を上手く活用することにより、制限がある中でも、ChatGPTを最大限有効に活用することができます。

AI・ChatGPT活用の個別無料相談会実施中

AI総研では、AI・ChatGPT活用の個別無料相談会を実施しています。

各社様のご要望に合わせ、最新の市場動向や具体的な活用アイデアなどを、個別のオンライン個別のオンラインMTGにて、無料でご紹介させていただきます。

 

以下のようなお悩みをお持ちのご担当者様は、この機会にぜひお申込みください。

  • 興味はあるが、そもそも活用するかどうか迷っている
  • 自社に合った活用方法へのアドバイスが欲しい
  • 自社の企画の参考になる活用事例を知りたい
  • どのように活用を進めていけば良いか分からず困っている

AI・ChatGPT活用の個別無料相談会の詳細はこちら

お問い合わせ

お客様のAI・ChatGPT活用推進に向け、戦略策定から実行支援までサポートします。お気軽にお問い合わせください。

お問い合わせ

まずは問い合わせてみる >

個別無料相談

ご担当者様のお悩み解決に向けたアイデアや最新ノウハウを無料でご提供いたします。お気軽にご相談ください。

個別無料相談

無料で相談する >

資料ダウンロード

サービス紹介資料やお役立ち資料をダウンロードいただけます。AI・ChatGPT活用をご検討の方はぜひご一読ください。

資料ダウンロード 資料をダウンロードする >