はじめに
生成AIに「○○文字程度で出力して」という依頼をしても全然守ってくれない。といった経験はないでしょうか?
これは性能の良し悪しというより、生成AIが文章を理解する方法が人間と違うことが主な要因のひとつです。
ここで重要になるのが文章を分解して扱う「トークン」という仕組みです。
この記事ではトークンベースの特徴から、生成AIが得意なこと・苦手なことを整理します。
トークンとは何か
生成AIにおけるトークンとは、AIがテキストを処理・理解するための分割単位です。
日本語では特に区切り方が人間の感覚とズレることがあります。
そのため、文字数や単語数とトークン数は必ずしも一致するとは限りません。
例えば下の図のように「私はSky株式会社の社員です。」という文章をAIが理解する際、「私は」「Sky」「株式会社」「の」「社員」「です」「。」のように分割して解釈します。
AIモデルごとに詳細な分割の仕組みや分割単位は異なり、画像は一例です。
※実際のトークンは単語単位とは限らず、単語の一部や1文字になることもあります。

テキスト生成の仕組み
生成AIがテキストを生成するとき、今までの入力文から「次に来そうなトークン」を選ぶことを繰り返します。
文章の前後関係などから、次に来そうなトークンを予想して文章を出力しています。
例えば下の図のように「生成AIは」といった文章が途中まで出力されているとして、AIは次に来そうなトークンの候補である「便利」「高度」「独創的」から確率が高い候補を中心に選びます。

仕組みから分かる「得意」
トークンの並びから文脈をとらえるため、以下のような「文章の意図を汲み取る」作業が得意です。
- 言語処理タスク(要約、言い換え、構成、トーン調整、翻訳など)
- 分析/分類タスク(分類、トピック抽出など)
- 生成タスク(文章生成など)
仕組みから分かる「苦手」
一方で、生成AIは「厳密に数える」「完全一致させる」といった作業が苦手になりがちです。
文章を解釈する単位が文字ではなくトークンであり、動きとしても「手順を厳密に実行する」より「それらしい答えを生成する」に近いためです。
- 正確性の必要なタスク(完全一致検索、文字数カウントなど)
- 検証/確認タスク(事実確認、データ検証など)
- 決定性が求められるタスク(データ変換など)
近年のモデルにおいては、上記の苦手も改善傾向にはありますが、依然として性質的に得意なタスクではなく、誤ることがあります。
おわりに
生成AIは、文章をトークンという単位で扱い、文脈に合う続きを選ぶことを繰り返して文章を作ります。
だからこそ、要約や言い換えのように「文章の意味」を整える作業は得意な一方、文字数カウントのように「厳密さ」が必要な作業はズレが出やすくなります。
仕組みを知っておくと、生成AIの答えの見方や頼み方が少し楽になるはずです。

