文字セットについて

ここでは、リコーのフォントでご提供している文字セットについて、文字種、文字数などを掲載していますので、フォントをご検討の際に、参考にしてください。

  • 以下の説明、表に記載されている「CP」とは、Microsoft社が規定する「Code Page」を表しています。

日本語の文字セット

リコーの日本語フォントは、以下の文字セットでご提供しております。

ローカルコード数:   JIS/Shift_JISコードが割り当てられている文字数。
Unicode数:   Unicode(UTF-16)が割り当てられている文字数。
各文字セットの中で、同じ文字が複数の文字種に重複する場合、より上の段の文字種のほうでカウントしています。
例えばCP932セットにおいて、「√」記号は、「JIS X 0208 非漢字」と、「NEC特殊文字」の両方に含まれ、ローカルコードではそれぞれ違う文字コードが割り当てられています。
しかしUnicodeでは、一つの文字には一つの文字コードしか割り当てられませんので、この場合は、「JIS X 0208 非漢字」のほうのUnicode数としてカウントしており、「NEC特殊文字」のほうではカウントしていません。
このような文字が、「NEC特殊文字」には10文字存在するので、Unicode数がローカルコード数より10文字分少なくなっています。
縦書き文字数:   横書き字形と同じUnicodeで、縦書き字形が存在する文字数。
文字数:   Unicode数 + 縦書き文字数。
文字セット 文字種 ローカル
コード数
Unicode数 縦書き
文字数
文字数
CP932 JIS X 0201(半角) 158 158 0 158
JIS X 0208 非漢字 524 524 92 616
JIS X 0208 第1水準漢字 2965 2965 0 2965
JIS X 0208 第2水準漢字 3390 3390 0 3390
NEC特殊文字 83 73 16 89
IBM拡張文字 388 374 0 374
NEC選定IBM拡張文字 374 0 0 0
合計 7882 7484 108 7592
X0208-90 JIS X 0208 非漢字 524 524 53 577
JIS X 0208 第1水準漢字 2965 2965 0 2965
JIS X 0208 第2水準漢字 3390 3390 0 3390
合計 6879 6879 53 6932
文字セット 文字種 ローカル
コード数
Unicode数 縦書き
文字数
文字数
CP932
+ JIS X 0213 : 2004
JIS X 0201(半角) 158 158 0 158
JIS X 0208 非漢字 524 524 92 616
JIS X 0208 第1水準漢字 2965 2965 0 2965
JIS X 0208 第2水準漢字 3390 3390 0 3390
NEC特殊文字 83 73 16 89
IBM拡張文字 388 374 0 374
NEC選定IBM拡張文字 374 0 0 0
JIS X 0213 非漢字 0 575 0 575
JIS X 0213 第3水準漢字 0 1071 0 1071
JIS X 0213 第4水準漢字 0 2348 0 2348
合計 7882 11478 108 11586
ARIB
STD-B24
JIS X 0201(半角) 158 158 0 158
JIS X 0208 非漢字 524 524 92 616
JIS X 0208 第1水準漢字 2965 2965 0 2965
JIS X 0208 第2水準漢字 3390 3390 0 3390
追加記号 394 394 5 399
追加漢字 137 137 0 137
合計 7568 7568 97 7665
文字セット 文字種 ローカル
コード数
Unicode数 縦書き
文字数
文字数
CP932
+ Docomo
絵文字
JIS X 0201(半角) 158 158 0 158
JIS X 0208 非漢字 524 524 92 616
JIS X 0208 第1水準漢字 2965 2965 0 2965
JIS X 0208 第2水準漢字 3390 3390 0 3390
NEC特殊文字 83 73 16 89
IBM拡張文字 388 374 0 374
NEC選定IBM拡張文字 374 0 0 0
Docomo基本絵文字 176 176 0 176
Docomo拡張絵文字 76 76 0 76
合計 8134 7736 108 7844

中国語簡体字の文字セット

リコーの中国語簡体字フォントは、GB18030文字セットでご提供しております。

ローカルコード数:   GB18030のローカルコードが割り当てられている文字数。
Unicode数:   Unicode(UTF-16)が割り当てられている文字数。
GB18030の場合、ローカルコード数とUnicode数は同じです。
文字数:   Unicode数 = 文字数。
文字セット 文字種 ローカルコード数 Unicode数 文字数
GB18030
- 2000
単字節 半角ASCII 95 95 95
双字節1区 非漢字 728 728 728
双字節5区 非漢字 166 166 166
双字節2区 漢字  6763 6763 6763
双字節3区 漢字 6080 6080 6080
双字節4区 漢字 8160 8160 8160
四字節 漢字 6530 6530 6530
合計 28522 28522 28522

中国語繁体字の文字セット

リコーの中国語繁体字フォントは、Big5文字セットでご提供しております 。

ローカルコード数:   Big5のローカルコードが割り当てられている文字数。
Unicode数:   Unicode(UTF-16)が割り当てられている文字数。
各文字セットの中で、同じ文字が複数の文字種に重複する場合、より上の段の文字種のほうでカウントしています。
例えばBig5セットにおいて、「十」という文字は、「Big5 非漢字」と、「Big5 第1標準漢字集」の両方に含まれ、ローカルコードではそれぞれ違う文字コードが割り当てられています。
しかしUnicodeでは、一つの文字には一つの文字コードしか割り当てられませんので、この場合は、「Big5 非漢字」のほうのUnicode数としてカウントしており、「Big5 第1標準漢字集」のほうではカウントしていません。
このような文字が、「Big5 第1標準漢字集」には2文字存在するので、Unicode数がローカルコード数より2文字分少なくなっています。
文字数:   Unicode数 = 文字数。
文字セット 文字種 ローカルコード数 Unicode数 文字数
Big5 半角英数 95 95 95
Big5 非漢字 408 408 408
Big5 第1標準字集 5401 5399 5399
Big5 第2標準字集 7652 7652 7652
合計 13556 13554 13554

韓国語の文字セット

リコーの韓国語フォントは、KS X 1001文字セットでご提供しております。

ローカルコード数:   KS X 1001のローカルコードが割り当てられている文字数。
Unicode数:   Unicode(UTF-16)が割り当てられている文字数。
KS X 1001の場合、ローカルコード数とUnicode数は同じです。
文字数:   Unicode数 = 文字数。
文字セット 文字種 ローカルコード数 Unicode数 文字数
KS X 1001
- 2002
半角英数 95 95 95
字母 94 94 94
記号 895 895 895
ハングル文字 2350 2350 2350
合計 3434 3434 3434

欧文(Latin)文字セット

リコーの欧文フォントは、以下の文字セットでご提供しております。

欧文の各文字セットでは、ローカルコード数とUnicode数は同じです。
但し、以下の文字セットの中から、複数の文字セットを統合することが出来ますが、その際は、重複する文字がありますので、
統合セットの文字数 ≦ 各文字セット
の文字数の合計となり、基本的にはUnicode(UTF-16)が割り当てられます。
西欧圏:   英語、ドイツ語、フランス語、イタリア語、ポルトガル語、オランダ語、スウェーデン語、フィンランド語、デンマーク語、ノルウェー語、フェロー語、アイスランド語、アイルランド語、スペイン語、アルバニア語、インドネシア語、アフリカーンス語、スワヒリ語
中欧圏:   スロベニア語、ルーマニア語、チェコ語、ハンガリー語、クロアチア語、スロバキア語、ポーランド語、ボスニア語
南欧圏:   マルタ語、エスペラント語
北欧圏:   エストニア語、ラトビア語、リトアニア語、グリーンランド語、サーミ語
言語 文字セット 文字数
西欧圏 ISO 8859-1 191
ISO 8859-15 191
CP1252 218
中欧圏 ISO8859-2 191
CP1250 218
南欧圏 ISO8859-3 184
北欧圏 ISO8859-4 191
ロシア語 ISO8859-5 191
CP1251 223
ギリシャ語 ISO8859-7 188
CP1253 206
トルコ語 ISO8859-9 191
CP1254 216
北ゲルマン語群 ISO8859-10 191
バルト語 ISO8859-13 191
CP1257 211
ケルト語 ISO8859-14 191

アラビア語の文字セット

リコーのアラビア語フォントは、CP1256文字セットでご提供しております。

リコーのCP1256文字セットには、CP1256に規定されている文字の他に、基本文字+アクセント記号の合成文字などが含まれます。これらの文字を、下表では「CP1256規定外の文字」としています。

CP1256規定外の文字に対して、規定外ですので当然のことながら、CP1256としてのローカルコードは割り当てられていません。そこで、これらの文字に対しては、リコーが独自にローカルコードを割り当てています。

一方Unicode(UTF-16)では、CP1256規定外の文字である134文字に対して、全てUnicodeが割り当てられていますので、リコー独自のUnicodeはありません。

文字数:   Unicode数 = 文字数。
文字セット 文字種 ローカルコード数 Unicode数 文字数
CP1256 CP1256規定文字 223 223 223
CP1256規定外の文字 134 134 134
合計 357 357 357

尚、CP1256規定外の文字には、ペルシャ語に対応した文字も含まれています。

ヘブライ語の文字セット

リコーのヘブライ語フォントは、CP1255文字セットでご提供しております。

リコーのCP1255文字セットには、CP1255に規定されている文字の他に、基本文字+アクセント記号の合成文字などが含まれます。これらの文字を、下表では「CP1255規定外の文字」としています。

CP1255規定外の文字に対して、規定外ですので当然のことながら、CP1255としてのローカルコードは割り当てられていません。そこで、これらの文字に対しては、リコーが独自にローカルコードを割り当てています。

一方Unicode(UTF-16)では、CP1255規定外の文字の中でも、Unicodeが割り当てられている文字と、Unicodeが割り当てられてない文字、があります。
そこで、 Unicodeが割り当てられてない文字に対して、リコーが独自にUnicodeを割り当てています。
Unicodeでは、利用者が独自の文字を割り当てるための、PUA(Private Use Area)という領域があり、このリコー独自のUnicodeは、PUAを利用してます。
下表では、予めUnicodeが割り当てられている領域を「通常領域」としています。

文字数:   Unicode数 = 文字数。
文字セット 文字種 ローカル
コード数
Unicode数 文字数
CP1255 CP1255規定文字 200 200 200
CP1255規定外の文字 234 通常領域 82 82
PUA 152 152
合計 434 434 434

タイ語の文字セット

リコーのタイ語フォントは、CP874文字セットでご提供しております。

リコーのCP874文字セットには、CP874に規定されている文字の他に、基本文字+アクセント記号の合成文字などが含まれます。これらの文字を、下表では「CP874規定外の文字」としています。

CP874規定外の文字に対して、規定外ですので当然のことながら、CP874としてのローカルコードは割り当てられていません。そこで、これらの文字に対しては、リコーが独自にローカルコードを割り当てています。

一方Unicode(UTF-16)では、CP874規定外の文字である39文字に対して、全てUnicodeは割り当てられていません。そこで、 これらの文字に対して、リコーが独自にUnicodeを割り当てています。
Unicodeでは、利用者が独自の文字を割り当てるための、PUA(Private Use Area)という領域があり、このリコー独自のUnicodeは、PUAを利用してます。
下表では、予めUnicodeが割り当てられている領域を「通常領域」としています。

文字数:   Unicode数 = 文字数。
文字セット 文字種 ローカル
コード数
Unicode数 文字数
CP874 CP874規定文字 192 192 192
CP874規定外の文字 39 通常領域 0 0
PUA 39 39
合計 231 231 231

フォントに関するお問い合わせをメール、電話、FAXで
受け付けております。お気軽にお問い合わせください。

お問い合わせ

ページトップへ