16 | 15 | 14 | 13 | 12 | 11 | 10 | 9 | 8 | 7 | 6 | 5 | 4 | 3 | 2 | 1 |
サロゲート #1 (110110) | プレーン番号(Unicodeの上位 5bit)-1 | Unicodeの上位6bit目から 6bit |
16 | 15 | 14 | 13 | 12 | 11 | 10 | 9 | 8 | 7 | 6 | 5 | 4 | 3 | 2 | 1 |
サロゲート #2 (110111) | Unicodeの下位10bit |
8 | 7 | 6 | 5 | 4 | 3 | 2 | 1 |
0 | U+0000~U+007F(BMP) |
8 | 7 | 6 | 5 | 4 | 3 | 2 | 1 |
1 | 1 |
0 | U+0080~U+07FF(BMP) の上位5ビット分 |
8 | 7 | 6 | 5 | 4 | 3 | 2 | 1 |
1 | 0 |
U+0080~U+07FF(BMP) の下位6ビット分 |
8 | 7 | 6 | 5 | 4 | 3 | 2 | 1 |
1 | 1 |
1 | 0 |
U+0800~U+FFFF(BMP) の上位4ビット分 |
8 | 7 | 6 | 5 | 4 | 3 | 2 | 1 |
1 | 0 |
U+0800~U+FFFF(BMP) の上位5ビットから6ビット分 |
8 | 7 | 6 | 5 | 4 | 3 | 2 | 1 |
1 | 0 |
U+0800~U+FFFF(BMP) の下位6ビット分 |
8 | 7 | 6 | 5 | 4 | 3 | 2 | 1 |
1 | 1 |
1 | 1 |
0 |
U+10000~U+10FFFFの上位3ビット分 |
8 | 7 | 6 | 5 | 4 | 3 | 2 | 1 |
1 | 0 |
U+10000~U+10FFFFの上位4ビット目から6ビット分 |
8 | 7 | 6 | 5 | 4 | 3 | 2 | 1 |
1 | 0 |
U+10000~U+10FFFFの上位10ビット目から6ビット分 |
8 | 7 | 6 | 5 | 4 | 3 | 2 | 1 |
1 | 0 |
U+10000~U+10FFFFの下位6ビット分 |
Charset/Encoding |
Range of 16bit (Legacy Unicode) | Range of 32bit | |
Unicode (21bit集合) | U+0000~U+FFFF (BMP/Plane #0) | U+10000~U+10FFFF (Plane #1~Plane #16) |
|
UCS-4 (31bit集合) | 0x00000000~0x0000FFFF (Group #0 Plane #0) |
0x00010000~0x7FFFFFFF (Group #0 Plane #1~Group #127 Plane #255) |
|
UCS-2 (16bit集合) | 0x0000~0xFFFF | N/A | |
UTF-32 (32bitを表現可能) |
Unicode | 1DWORD文字 |
1DWORD文字 |
UCS-4 | |||
UCS-2 | N/A | ||
UTF-16 (21bitを表現可能) |
Unicode | 1WORD文字 |
2WORD文字 (サロゲートペア) ※UCS-4のすべての範囲を表わす事はできない。 |
UCS-4 | |||
UCS-2 | N/A | ||
UTF-8 (31bitを表現可能) |
Unicode | 1byte文字~3byte文字 | 4byte文字 |
UCS-4 | 4byte文字~6byte文字 |
||
UCS-2 | N/A |
H | e | l | l | o | , | w | o | r | l | d | . | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
あ | い | う | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
BACK |