文字セットについて
ここでは、リコーのフォントでご提供している文字セットについて、文字種、文字数などを掲載していますので、フォントをご検討の際に、参考にしてください。
- ※以下の説明、表に記載されている「CP」とは、Microsoft社が規定する「Code Page」を表しています。
日本語の文字セット
リコーの日本語フォントは、以下の文字セットでご提供しております。
| ローカルコード数: | JIS/Shift_JISコードが割り当てられている文字数。 | |
| Unicode数: | Unicode(UTF-16)が割り当てられている文字数。 各文字セットの中で、同じ文字が複数の文字種に重複する場合、より上の段の文字種のほうでカウントしています。 例えばCP932セットにおいて、「√」記号は、「JIS X 0208 非漢字」と、「NEC特殊文字」の両方に含まれ、ローカルコードではそれぞれ違う文字コードが割り当てられています。 しかしUnicodeでは、一つの文字には一つの文字コードしか割り当てられませんので、この場合は、「JIS X 0208 非漢字」のほうのUnicode数としてカウントしており、「NEC特殊文字」のほうではカウントしていません。 このような文字が、「NEC特殊文字」には10文字存在するので、Unicode数がローカルコード数より10文字分少なくなっています。 |
|
| 縦書き文字数: | 横書き字形と同じUnicodeで、縦書き字形が存在する文字数。 | |
| 文字数: | Unicode数 + 縦書き文字数。 |
| 文字セット | 文字種 | ローカル コード数 |
Unicode数 | 縦書き 文字数 |
文字数 |
|---|---|---|---|---|---|
| CP932 | JIS X 0201(半角) | 158 | 158 | 0 | 158 |
| JIS X 0208 非漢字 | 524 | 524 | 92 | 616 | |
| JIS X 0208 第1水準漢字 | 2965 | 2965 | 0 | 2965 | |
| JIS X 0208 第2水準漢字 | 3390 | 3390 | 0 | 3390 | |
| NEC特殊文字 | 83 | 73 | 16 | 89 | |
| IBM拡張文字 | 388 | 374 | 0 | 374 | |
| NEC選定IBM拡張文字 | 374 | 0 | 0 | 0 | |
| 合計 | 7882 | 7484 | 108 | 7592 | |
| X0208-90 | JIS X 0208 非漢字 | 524 | 524 | 53 | 577 |
| JIS X 0208 第1水準漢字 | 2965 | 2965 | 0 | 2965 | |
| JIS X 0208 第2水準漢字 | 3390 | 3390 | 0 | 3390 | |
| 合計 | 6879 | 6879 | 53 | 6932 | |
| 文字セット | 文字種 | ローカル コード数 |
Unicode数 | 縦書き 文字数 |
文字数 |
| CP932 + JIS X 0213 : 2004 |
JIS X 0201(半角) | 158 | 158 | 0 | 158 |
| JIS X 0208 非漢字 | 524 | 524 | 92 | 616 | |
| JIS X 0208 第1水準漢字 | 2965 | 2965 | 0 | 2965 | |
| JIS X 0208 第2水準漢字 | 3390 | 3390 | 0 | 3390 | |
| NEC特殊文字 | 83 | 73 | 16 | 89 | |
| IBM拡張文字 | 388 | 374 | 0 | 374 | |
| NEC選定IBM拡張文字 | 374 | 0 | 0 | 0 | |
| JIS X 0213 非漢字 | 0 | 575 | 0 | 575 | |
| JIS X 0213 第3水準漢字 | 0 | 1071 | 0 | 1071 | |
| JIS X 0213 第4水準漢字 | 0 | 2348 | 0 | 2348 | |
| 合計 | 7882 | 11478 | 108 | 11586 | |
| ARIB STD-B24 |
JIS X 0201(半角) | 158 | 158 | 0 | 158 |
| JIS X 0208 非漢字 | 524 | 524 | 92 | 616 | |
| JIS X 0208 第1水準漢字 | 2965 | 2965 | 0 | 2965 | |
| JIS X 0208 第2水準漢字 | 3390 | 3390 | 0 | 3390 | |
| 追加記号 | 394 | 394 | 5 | 399 | |
| 追加漢字 | 137 | 137 | 0 | 137 | |
| 合計 | 7568 | 7568 | 97 | 7665 | |
| 文字セット | 文字種 | ローカル コード数 |
Unicode数 | 縦書き 文字数 |
文字数 |
| CP932 + Docomo 絵文字 |
JIS X 0201(半角) | 158 | 158 | 0 | 158 |
| JIS X 0208 非漢字 | 524 | 524 | 92 | 616 | |
| JIS X 0208 第1水準漢字 | 2965 | 2965 | 0 | 2965 | |
| JIS X 0208 第2水準漢字 | 3390 | 3390 | 0 | 3390 | |
| NEC特殊文字 | 83 | 73 | 16 | 89 | |
| IBM拡張文字 | 388 | 374 | 0 | 374 | |
| NEC選定IBM拡張文字 | 374 | 0 | 0 | 0 | |
| Docomo基本絵文字 | 176 | 176 | 0 | 176 | |
| Docomo拡張絵文字 | 76 | 76 | 0 | 76 | |
| 合計 | 8134 | 7736 | 108 | 7844 |
中国語簡体字の文字セット
リコーの中国語簡体字フォントは、GB18030文字セットでご提供しております。
| ローカルコード数: | GB18030のローカルコードが割り当てられている文字数。 | |
| Unicode数: | Unicode(UTF-16)が割り当てられている文字数。
GB18030の場合、ローカルコード数とUnicode数は同じです。 |
|
| 文字数: | Unicode数 = 文字数。 |
| 文字セット | 文字種 | ローカルコード数 | Unicode数 | 文字数 |
|---|---|---|---|---|
| GB18030 - 2000 |
単字節 半角ASCII | 95 | 95 | 95 |
| 双字節1区 非漢字 | 728 | 728 | 728 | |
| 双字節5区 非漢字 | 166 | 166 | 166 | |
| 双字節2区 漢字 | 6763 | 6763 | 6763 | |
| 双字節3区 漢字 | 6080 | 6080 | 6080 | |
| 双字節4区 漢字 | 8160 | 8160 | 8160 | |
| 四字節 漢字 | 6530 | 6530 | 6530 | |
| 合計 | 28522 | 28522 | 28522 |
中国語繁体字の文字セット
リコーの中国語繁体字フォントは、Big5文字セットでご提供しております 。
| ローカルコード数: | Big5のローカルコードが割り当てられている文字数。 | |
| Unicode数: | Unicode(UTF-16)が割り当てられている文字数。
各文字セットの中で、同じ文字が複数の文字種に重複する場合、より上の段の文字種のほうでカウントしています。 例えばBig5セットにおいて、「十」という文字は、「Big5 非漢字」と、「Big5 第1標準漢字集」の両方に含まれ、ローカルコードではそれぞれ違う文字コードが割り当てられています。 しかしUnicodeでは、一つの文字には一つの文字コードしか割り当てられませんので、この場合は、「Big5 非漢字」のほうのUnicode数としてカウントしており、「Big5 第1標準漢字集」のほうではカウントしていません。 このような文字が、「Big5 第1標準漢字集」には2文字存在するので、Unicode数がローカルコード数より2文字分少なくなっています。 |
|
| 文字数: | Unicode数 = 文字数。 |
| 文字セット | 文字種 | ローカルコード数 | Unicode数 | 文字数 |
|---|---|---|---|---|
| Big5 | 半角英数 | 95 | 95 | 95 |
| Big5 非漢字 | 408 | 408 | 408 | |
| Big5 第1標準字集 | 5401 | 5399 | 5399 | |
| Big5 第2標準字集 | 7652 | 7652 | 7652 | |
| 合計 | 13556 | 13554 | 13554 |
韓国語の文字セット
リコーの韓国語フォントは、KS X 1001文字セットでご提供しております。
| ローカルコード数: | KS X 1001のローカルコードが割り当てられている文字数。 | |
| Unicode数: | Unicode(UTF-16)が割り当てられている文字数。
KS X 1001の場合、ローカルコード数とUnicode数は同じです。 |
|
| 文字数: | Unicode数 = 文字数。 |
| 文字セット | 文字種 | ローカルコード数 | Unicode数 | 文字数 |
|---|---|---|---|---|
| KS X 1001 - 2002 |
半角英数 | 95 | 95 | 95 |
| 字母 | 94 | 94 | 94 | |
| 記号 | 895 | 895 | 895 | |
| ハングル文字 | 2350 | 2350 | 2350 | |
| 合計 | 3434 | 3434 | 3434 |
欧文(Latin)文字セット
リコーの欧文フォントは、以下の文字セットでご提供しております。
欧文の各文字セットでは、ローカルコード数とUnicode数は同じです。
但し、以下の文字セットの中から、複数の文字セットを統合することが出来ますが、その際は、重複する文字がありますので、
統合セットの文字数 ≦ 各文字セット
の文字数の合計となり、基本的にはUnicode(UTF-16)が割り当てられます。
欧文の各文字セットでは、ローカルコード数とUnicode数は同じです。
但し、以下の文字セットの中から、複数の文字セットを統合することが出来ますが、その際は、重複する文字がありますので、
統合セットの文字数 ≦ 各文字セット
の文字数の合計となり、基本的にはUnicode(UTF-16)が割り当てられます。
| 西欧圏: | 英語、ドイツ語、フランス語、イタリア語、ポルトガル語、オランダ語、スウェーデン語、フィンランド語、デンマーク語、ノルウェー語、フェロー語、アイスランド語、アイルランド語、スペイン語、アルバニア語、インドネシア語、アフリカーンス語、スワヒリ語 | |
| 中欧圏: | スロベニア語、ルーマニア語、チェコ語、ハンガリー語、クロアチア語、スロバキア語、ポーランド語、ボスニア語 | |
| 南欧圏: | マルタ語、エスペラント語 | |
| 北欧圏: | エストニア語、ラトビア語、リトアニア語、グリーンランド語、サーミ語 |
| 言語 | 文字セット | 文字数 |
|---|---|---|
| 西欧圏 | ISO 8859-1 | 191 |
| ISO 8859-15 | 191 | |
| CP1252 | 218 | |
| 中欧圏 | ISO8859-2 | 191 |
| CP1250 | 218 | |
| 南欧圏 | ISO8859-3 | 184 |
| 北欧圏 | ISO8859-4 | 191 |
| ロシア語 | ISO8859-5 | 191 |
| CP1251 | 223 | |
| ギリシャ語 | ISO8859-7 | 188 |
| CP1253 | 206 | |
| トルコ語 | ISO8859-9 | 191 |
| CP1254 | 216 | |
| 北ゲルマン語群 | ISO8859-10 | 191 |
| バルト語 | ISO8859-13 | 191 |
| CP1257 | 211 | |
| ケルト語 | ISO8859-14 | 191 |
アラビア語の文字セット
リコーのアラビア語フォントは、CP1256文字セットでご提供しております。
リコーのCP1256文字セットには、CP1256に規定されている文字の他に、基本文字+アクセント記号の合成文字などが含まれます。これらの文字を、下表では「CP1256規定外の文字」としています。
CP1256規定外の文字に対して、規定外ですので当然のことながら、CP1256としてのローカルコードは割り当てられていません。そこで、これらの文字に対しては、リコーが独自にローカルコードを割り当てています。
一方Unicode(UTF-16)では、CP1256規定外の文字である134文字に対して、全てUnicodeが割り当てられていますので、リコー独自のUnicodeはありません。
尚、CP1256規定外の文字には、ペルシャ語に対応した文字も含まれています。
リコーのCP1256文字セットには、CP1256に規定されている文字の他に、基本文字+アクセント記号の合成文字などが含まれます。これらの文字を、下表では「CP1256規定外の文字」としています。
CP1256規定外の文字に対して、規定外ですので当然のことながら、CP1256としてのローカルコードは割り当てられていません。そこで、これらの文字に対しては、リコーが独自にローカルコードを割り当てています。
一方Unicode(UTF-16)では、CP1256規定外の文字である134文字に対して、全てUnicodeが割り当てられていますので、リコー独自のUnicodeはありません。
| 文字数: | Unicode数 = 文字数。 |
| 文字セット | 文字種 | ローカルコード数 | Unicode数 | 文字数 |
|---|---|---|---|---|
| CP1256 | CP1256規定文字 | 223 | 223 | 223 |
| CP1256規定外の文字 | 134 | 134 | 134 | |
| 合計 | 357 | 357 | 357 |
尚、CP1256規定外の文字には、ペルシャ語に対応した文字も含まれています。
ヘブライ語の文字セット
リコーのヘブライ語フォントは、CP1255文字セットでご提供しております。
リコーのCP1255文字セットには、CP1255に規定されている文字の他に、基本文字+アクセント記号の合成文字などが含まれます。これらの文字を、下表では「CP1255規定外の文字」としています。
CP1255規定外の文字に対して、規定外ですので当然のことながら、CP1255としてのローカルコードは割り当てられていません。そこで、これらの文字に対しては、リコーが独自にローカルコードを割り当てています。
一方Unicode(UTF-16)では、CP1255規定外の文字の中でも、Unicodeが割り当てられている文字と、Unicodeが割り当てられてない文字、があります。
そこで、 Unicodeが割り当てられてない文字に対して、リコーが独自にUnicodeを割り当てています。
Unicodeでは、利用者が独自の文字を割り当てるための、PUA(Private Use Area)という領域があり、このリコー独自のUnicodeは、PUAを利用してます。
下表では、予めUnicodeが割り当てられている領域を「通常領域」としています。
リコーのCP1255文字セットには、CP1255に規定されている文字の他に、基本文字+アクセント記号の合成文字などが含まれます。これらの文字を、下表では「CP1255規定外の文字」としています。
CP1255規定外の文字に対して、規定外ですので当然のことながら、CP1255としてのローカルコードは割り当てられていません。そこで、これらの文字に対しては、リコーが独自にローカルコードを割り当てています。
一方Unicode(UTF-16)では、CP1255規定外の文字の中でも、Unicodeが割り当てられている文字と、Unicodeが割り当てられてない文字、があります。
そこで、 Unicodeが割り当てられてない文字に対して、リコーが独自にUnicodeを割り当てています。
Unicodeでは、利用者が独自の文字を割り当てるための、PUA(Private Use Area)という領域があり、このリコー独自のUnicodeは、PUAを利用してます。
下表では、予めUnicodeが割り当てられている領域を「通常領域」としています。
| 文字数: | Unicode数 = 文字数。 |
| 文字セット | 文字種 | ローカル コード数 |
Unicode数 | 文字数 | |
|---|---|---|---|---|---|
| CP1255 | CP1255規定文字 | 200 | 200 | 200 | |
| CP1255規定外の文字 | 234 | 通常領域 | 82 | 82 | |
| PUA | 152 | 152 | |||
| 合計 | 434 | 434 | 434 | ||
タイ語の文字セット
リコーのタイ語フォントは、CP874文字セットでご提供しております。
リコーのCP874文字セットには、CP874に規定されている文字の他に、基本文字+アクセント記号の合成文字などが含まれます。これらの文字を、下表では「CP874規定外の文字」としています。
CP874規定外の文字に対して、規定外ですので当然のことながら、CP874としてのローカルコードは割り当てられていません。そこで、これらの文字に対しては、リコーが独自にローカルコードを割り当てています。
一方Unicode(UTF-16)では、CP874規定外の文字である39文字に対して、全てUnicodeは割り当てられていません。そこで、 これらの文字に対して、リコーが独自にUnicodeを割り当てています。
Unicodeでは、利用者が独自の文字を割り当てるための、PUA(Private Use Area)という領域があり、このリコー独自のUnicodeは、PUAを利用してます。
下表では、予めUnicodeが割り当てられている領域を「通常領域」としています。
リコーのCP874文字セットには、CP874に規定されている文字の他に、基本文字+アクセント記号の合成文字などが含まれます。これらの文字を、下表では「CP874規定外の文字」としています。
CP874規定外の文字に対して、規定外ですので当然のことながら、CP874としてのローカルコードは割り当てられていません。そこで、これらの文字に対しては、リコーが独自にローカルコードを割り当てています。
一方Unicode(UTF-16)では、CP874規定外の文字である39文字に対して、全てUnicodeは割り当てられていません。そこで、 これらの文字に対して、リコーが独自にUnicodeを割り当てています。
Unicodeでは、利用者が独自の文字を割り当てるための、PUA(Private Use Area)という領域があり、このリコー独自のUnicodeは、PUAを利用してます。
下表では、予めUnicodeが割り当てられている領域を「通常領域」としています。
| 文字数: | Unicode数 = 文字数。 |
| 文字セット | 文字種 | ローカル コード数 |
Unicode数 | 文字数 | |
|---|---|---|---|---|---|
| CP874 | CP874規定文字 | 192 | 192 | 192 | |
| CP874規定外の文字 | 39 | 通常領域 | 0 | 0 | |
| PUA | 39 | 39 | |||
| 合計 | 231 | 231 | 231 | ||