SKYPCEを使用していると、人名、住所など様々な種類の文字や漢字を目にします。
その中で、東京都葛飾区などで使われている「葛」の字が「葛」(下が人)となっている場合と、(下の部分がヒ)となっている「葛」の字を見かけたりすることもあります。
こういった、文字としては同じ意味、読みを持つ漢字の異なる字体をUnicodeで表現するための仕組みを異体字セレクタ(Variation Selectors)と呼びます。
どのような仕組みか確認するために、前述の「葛」と「葛」についてUnicodeの文字コードを確認してみます(今回はWordで確認をしてみました)。
- Wordに文字コードを確認したい文字を入力
- 文字の後ろにカーソルを移動し、「Alt」+「X」キーを押下するとカーソルの前の文字のコードが表示されます。
845B
葛E0100
となりましたので、さらに下の「葛」にカーソルを合わせ、「Alt」+「X」キーを押下すると
845B
845BE0100
上記の文字コードが使用されていることがわかりました。
ここで使用されているE0100という文字コードが異体字セレクタとなり、基底文字+セレクタの組み合わせで文字を表現することが可能です。
前述のヒの方の「葛」の例では845B(葛)が基底文字で、E0100がセレクタとなります。
基底文字単体でも表現でき、その別の字体をセレクタで表現できるので、便利そうに見える一方、アプリケーションやフォントによってはサポートされておらず正しく表示されない場合があったり、2つの文字コードを組み合わせているので、見た目上は1文字に見えていてもアプリケーションによっては、2文字としてカウントされる場合があるなど注意が必要な仕組みでもあります。