VSCII - VSCII
Псевдоним (а) | x-viet-tcvn5712 |
---|---|
Язык (и) | Вьетнамский , английский |
Сделано | TCVN / TC1 |
Стандарт | TCVN 5712: 1993 |
Классификация | 8-битный SBCS ; Расширенный ASCII (VSCII-2 / -3) |
VSCII ( вьетнамский стандартный код для обмена информацией ), также известный как TCVN 5712 , ISO-IR -180 , .VN , ABC или просто кодировки TCVN , представляет собой набор из трех тесно связанных вьетнамских национальных стандартных кодировок символов для использования вьетнамского языка с компьютеры , разработанные Техническим комитетом TCVN по информационным технологиям (TCVN / TC1) и впервые принятые в 1993 году (как TCVN 5712: 1993).
Его не следует путать с одноименной неофициальной кодировкой VISCII , которая иногда использовалась иностранцами, говорящими на вьетнамском языке. VISCII также должен был обозначать вьетнамский стандартный код для обмена информацией , но не имеет отношения к VSCII.
VSCII (TCVN) широко использовался на севере Вьетнама, в то время как VNI был популярен на юге. Юникод и кодовая страница Windows-1258 теперь используются практически для всех вьетнамских компьютерных данных, но устаревшие файлы или заархивированные сообщения могут нуждаться в преобразовании.
Кодировки
Во всех трех формах VSCII 95 печатаемых символов ASCII остаются неизменными.
VSCII-3 , также известный как TCVN 5712-3, VN3 или просто TCVN3, включает наименьшее количество назначений. Это расширенный ASCII , потому что он сохраняет все 128 кодов ASCII неизменными. Он не переназначает управляющие коды C0 и C1 . По сравнению с ASCII он добавляет 75 символов:
- 67 символов в нижнем регистре, что обеспечивает полную поддержку нижнего регистра.
- 7 заглавных букв, что позволяет использовать прописные буквы для 29 базовых букв без тональных знаков.
- Неразрывный пробел .
Тональные отметки на гласных в верхнем регистре выполняются в TCVN3 путем переключения на шрифт, состоящий только из заглавных букв.
VSCII-2 , также известный как TCVN 5712-2 и VN2, является расширенным набором VSCII-3. Это расширенный ASCII , потому что он сохраняет все 128 кодов ASCII неизменными. Он не переназначает ни один из управляющих кодов C0 и C1 , что делает его совместимым с ISO 2022 как 96-набор. По сравнению с VSCII-3 он добавляет (всего 96 символов, отличных от ASCII):
- Еще 16 прописных символов с заранее составленными тональными знаками (всего 23 прописных символа, отличных от ASCII)
- 5, объединяющая диакритические знаки для тоновых знаков , позволяя представлять другие комбинации прописных букв и тоновых знаков. Комбинированные знаки следуют за базовой буквой, как в VNI (а не перед ними, как в ANSEL ).
VSCII-1 , также известный как TCVN 5712-1 и VN1, является расширением VSCII-2 и является модифицированным ASCII, поскольку заменяет 12 из 33 управляющих символов заранее составленными символами. По сравнению с VSCII-2 он (всего 140 символов, отличных от ASCII):
- Добавляет еще 44 заранее составленных заглавных буквы, доводя их до того же количества, что и строчных
- Делается это путем замены 12 управляющих символов ASCII и выделения 32 графических символов в область управления C1, нарушая совместимость ISO 2022.
Преобразование из VSCII-3 в VSCII-2 или VSCII-1 и преобразование из VSCII-2 в VSCII-1 не требуется, но может привести к уменьшению размера файлов.
Преобразование из VSCII-1 в VSCII-2 или VSCII-3 и преобразование из VSCII-2 в VSCII-3 требует расширения некоторых предварительно составленных символов.
Набор символов
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _A | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 |
NUL 0000 |
Ú 00DA |
Ụ 1EE4 |
ETX 0003 |
Ừ 1EEA |
Ử 1EEC |
Ữ 1EEE |
BEL 0007 |
BS 0008 |
HT 0009 |
LF 000A |
ВТ 000Б |
FF 000C |
CR 000D |
SO 000E |
SI 000F |
1_ 16 |
DLE 0010 |
Ứ 1EE8 |
Ự 1EF0 |
Ỳ 1EF2 |
Ỷ 1EF6 |
Ỹ 1EF8 |
Ý 00DD |
Ỵ 1EF4 |
CAN 0018 |
EM 0019 |
SUB 001A |
ESC 001B |
FS 001C |
GS 001D |
RS 001E |
США 001F |
2_ 32 |
SP 0020 |
! 0021 |
« 0022 |
# 0023 |
0024 долл. США |
% 0025 |
& 0026 |
' 0027 |
( 0028 |
) 0029 |
* 002A |
+ 002B |
, 002C |
- 002D |
. 002E |
/ 002F |
3_ 48 |
0 0030 |
1 0031 |
2 0032 |
3 0033 |
4 0034 |
5 0035 |
6 0036 |
7 0037 |
8 0038 |
9 0039 |
: 003A |
; 003B |
< 003C |
= 003D |
> 003E |
? 003F |
4_ 64 |
@ 0040 |
A 0041 |
B 0042 |
C 0043 |
D 0044 |
E 0045 |
F 0046 |
G 0047 |
H 0048 |
I 0049 |
J 004A |
K 004B |
L 004C |
M 004D |
№ 004E |
O 004F |
5_ 80 |
P 0050 |
Q 0051 |
R 0052 |
S 0053 |
Т 0054 |
U 0055 |
V 0056 |
W 0057 |
X 0058 |
Y 0059 |
Z 005A |
[ 005B |
\ 005C |
] 005D |
^ 005E |
_ 005F |
6_ 96 |
` 0060 |
0061 |
b 0062 |
c 0063 |
d 0064 |
e 0065 |
f 0066 |
г 0067 |
h 0068 |
я 0069 |
j 006A |
k 006B |
l 006C |
м 006D |
№ 006E |
o 006F |
7_ 112 |
p 0070 |
q 0071 |
r 0072 |
с 0073 |
t 0074 |
u 0075 |
v 0076 |
w 0077 |
х 0078 |
y 0079 |
z 007A |
{ 007B |
| 007C |
} 007D |
~ 007E |
DEL 007F |
8_ 128 |
À 00C0 |
Ả 1EA2 |
à 00C3 |
Á 00C1 |
Ạ 1EA0 |
Ặ 1EB6 |
Ậ 1EAC |
È 00C8 |
Ẻ 1EBA |
Ẽ 1EBC |
É 00C9 |
Ẹ 1EB8 |
Ệ 1EC6 |
Ì 00CC |
Ỉ 1EC8 |
Ĩ 0128 |
9_ 144 |
Í 00CD |
Ị 1ECA |
Ò 00D2 |
Ỏ 1ECE |
Õ 00D5 |
Ó 00D3 |
ö 1ECC |
Ộ 1ED8 |
Ờ 1EDC |
Ở 1EDE |
Ỡ 1EE0 |
Ớ 1EDA |
Ợ 1EE2 |
Ù 00D9 |
Ủ 1EE6 |
˙U 0168 |
A_ 160 |
NBSP 00A0 |
Ă 0102 |
 00C2 |
Ê 00CA |
Ô 00D4 |
Ơ 01A0 |
Ư 01AF |
Đ 0110 |
ă 0103 |
â 00E2 |
ê 00EA |
ô 00F4 |
ơ 01A1 |
˙U 01B0 |
đ 0111 |
Ằ 1EB0 |
B_ 176 |
0300 |
̉ 0309 |
0303 |
0301 |
̣ 0323 |
à 00E0 |
1EA3 |
ã 00E3 |
á 00E1 |
ạ 1EA1 |
Ẳ 1EB2 |
ằ 1EB1 |
ẳ 1EB3 |
ẵ 1EB5 |
ắ 1EAF |
Ẵ 1EB4 |
C_ 192 |
Ắ 1EAE |
Ầ 1EA6 |
Ẩ 1EA8 |
Ẫ 1EAA |
Ấ 1EA4 |
Ề 1EC0 |
ặ 1EB7 |
ầ 1EA7 |
ẩ 1EA9 |
ẫ 1EAB |
ấ 1EA5 |
ậ 1EAD |
è 00E8 |
Ể 1EC2 |
ẻ 1EBB |
ẽ 1EBD |
D_ 208 |
é 00E9 |
ẹ 1EB9 |
é 1EC1 |
ể 1EC3 |
ễ 1EC5 |
é 1EBF |
ệ 1EC7 |
ì 00EC |
ỉ 1EC9 |
Ễ 1EC4 |
Ế 1EBE |
Ồ 1ED2 |
ĩ 0129 |
í 00ED |
я 1ECB |
ò 00F2 |
E_ 224 |
Ổ 1ED4 |
ỏ 1ECF |
х 00F5 |
ó 00F3 |
ọ 1ECD |
ồ 1ED3 |
ổ 1ED5 |
ỗ 1ED7 |
ố 1ED1 |
ö 1ED9 |
ờ 1EDD |
ở 1EDF |
ỡ 1EE1 |
ớ 1EDB |
ợ 1EE3 |
ù 00F9 |
F_ 240 |
Ỗ 1ED6 |
ủ 1EE7 |
ũ 0169 |
ú 00FA |
ụ 1EE5 |
ừ 1EEB |
ử 1EED |
ữ 1EEF |
ứ 1EE9 |
ự 1EF1 |
ỳ 1EF3 |
ỷ 1EF7 |
ỹ 1EF9 |
ý 00FD |
ỵ 1EF5 |
Ố 1ED0 |
Письмо Номер Пунктуация Символ Другой Неопределенный
Затенение шахматной доски указывает на символы, которых нет в VSCII-3. Закрашенные символы в строках 0_, 1_, 8_ и 9_ не входят в VSCII-2 или VSCII-3.