VSCII - VSCII

VSCII
Псевдоним (а) x-viet-tcvn5712
Язык (и) Вьетнамский , английский
Сделано TCVN / TC1
Стандарт TCVN 5712: 1993
Классификация 8-битный SBCS ;
Расширенный ASCII (VSCII-2 / -3)

VSCII ( вьетнамский стандартный код для обмена информацией ), также известный как TCVN 5712 , ISO-IR -180 , .VN , ABC или просто кодировки TCVN , представляет собой набор из трех тесно связанных вьетнамских национальных стандартных кодировок символов для использования вьетнамского языка с компьютеры , разработанные Техническим комитетом TCVN по информационным технологиям (TCVN / TC1) и впервые принятые в 1993 году (как TCVN 5712: 1993).

Его не следует путать с одноименной неофициальной кодировкой VISCII , которая иногда использовалась иностранцами, говорящими на вьетнамском языке. VISCII также должен был обозначать вьетнамский стандартный код для обмена информацией , но не имеет отношения к VSCII.

VSCII (TCVN) широко использовался на севере Вьетнама, в то время как VNI был популярен на юге. Юникод и кодовая страница Windows-1258 теперь используются практически для всех вьетнамских компьютерных данных, но устаревшие файлы или заархивированные сообщения могут нуждаться в преобразовании.

Кодировки

Во всех трех формах VSCII 95 печатаемых символов ASCII остаются неизменными.

VSCII-3 , также известный как TCVN 5712-3, VN3 или просто TCVN3, включает наименьшее количество назначений. Это расширенный ASCII , потому что он сохраняет все 128 кодов ASCII неизменными. Он не переназначает управляющие коды C0 и C1 . По сравнению с ASCII он добавляет 75 символов:

  • 67 символов в нижнем регистре, что обеспечивает полную поддержку нижнего регистра.
  • 7 заглавных букв, что позволяет использовать прописные буквы для 29 базовых букв без тональных знаков.
  • Неразрывный пробел .

Тональные отметки на гласных в верхнем регистре выполняются в TCVN3 путем переключения на шрифт, состоящий только из заглавных букв.

VSCII-2 , также известный как TCVN 5712-2 и VN2, является расширенным набором VSCII-3. Это расширенный ASCII , потому что он сохраняет все 128 кодов ASCII неизменными. Он не переназначает ни один из управляющих кодов C0 и C1 , что делает его совместимым с ISO 2022 как 96-набор. По сравнению с VSCII-3 он добавляет (всего 96 символов, отличных от ASCII):

  • Еще 16 прописных символов с заранее составленными тональными знаками (всего 23 прописных символа, отличных от ASCII)
  • 5, объединяющая диакритические знаки для тоновых знаков , позволяя представлять другие комбинации прописных букв и тоновых знаков. Комбинированные знаки следуют за базовой буквой, как в VNI (а не перед ними, как в ANSEL ).

VSCII-1 , также известный как TCVN 5712-1 и VN1, является расширением VSCII-2 и является модифицированным ASCII, поскольку заменяет 12 из 33 управляющих символов заранее составленными символами. По сравнению с VSCII-2 он (всего 140 символов, отличных от ASCII):

  • Добавляет еще 44 заранее составленных заглавных буквы, доводя их до того же количества, что и строчных
  • Делается это путем замены 12 управляющих символов ASCII и выделения 32 графических символов в область управления C1, нарушая совместимость ISO 2022.

Преобразование из VSCII-3 в VSCII-2 или VSCII-1 и преобразование из VSCII-2 в VSCII-1 не требуется, но может привести к уменьшению размера файлов.

Преобразование из VSCII-1 в VSCII-2 или VSCII-3 и преобразование из VSCII-2 в VSCII-3 требует расширения некоторых предварительно составленных символов.

Набор символов

ВСКИИ-1
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _A _B _C _D _E _F
0_
0
NUL
0000
Ú
00DA

1EE4
ETX
0003

1EEA

1EEC

1EEE
BEL
0007
BS
0008
HT
0009
LF
000A
ВТ
000Б
FF
000C
CR
000D
SO
000E
SI
000F
1_
16
DLE
0010

1EE8

1EF0

1EF2

1EF6

1EF8
Ý
00DD

1EF4
CAN
0018
EM
0019
SUB
001A
ESC
001B
FS
001C
GS
001D
RS
001E
США
001F
2_
32
SP
0020
!
0021
«
0022
#
0023
0024 долл. США
%
0025
&
0026
'
0027
(
0028
)
0029
*
002A
+
002B
,
002C
-
002D
.
002E
/
002F
3_
48
0
0030
1
0031
2
0032
3
0033
4
0034
5
0035
6
0036
7
0037
8
0038
9
0039
:
003A
;
003B
<
003C
=
003D
>
003E
?
003F
4_
64
@
0040
A
0041
B
0042
C
0043
D
0044
E
0045
F
0046
G
0047
H
0048
I
0049
J
004A
K
004B
L
004C
M
004D

004E
O
004F
5_
80
P
0050
Q
0051
R
0052
S
0053
Т
0054
U
0055
V
0056
W
0057
X
0058
Y
0059
Z
005A
[
005B
\
005C
]
005D
^
005E
_
005F
6_
96
`
0060

0061
b
0062
c
0063
d
0064
e
0065
f
0066
г
0067
h
0068
я
0069
j
006A
k
006B
l
006C
м
006D

006E
o
006F
7_
112
p
0070
q
0071
r
0072
с
0073
t
0074
u
0075
v
0076
w
0077
х
0078
y
0079
z
007A
{
007B
|
007C
}
007D
~
007E
DEL
007F
8_
128
À
00C0

1EA2
Ã
00C3
Á
00C1

1EA0

1EB6

1EAC
È
00C8

1EBA

1EBC
É
00C9

1EB8

1EC6
Ì
00CC

1EC8
Ĩ
0128
9_
144
Í
00CD

1ECA
Ò
00D2

1ECE
Õ
00D5
Ó
00D3
ö
1ECC

1ED8

1EDC

1EDE

1EE0

1EDA

1EE2
Ù
00D9

1EE6
˙U
0168
A_
160
NBSP
00A0
Ă
0102
Â
00C2
Ê
00CA
Ô
00D4
Ơ
01A0
Ư
01AF
Đ
0110
ă
0103
â
00E2
ê
00EA
ô
00F4
ơ
01A1
˙U
01B0
đ
0111

1EB0
B_
176
0300
̉
0309
0303
0301
̣
0323
à
00E0

1EA3
ã
00E3
á
00E1

1EA1

1EB2

1EB1

1EB3

1EB5

1EAF

1EB4
C_
192

1EAE

1EA6

1EA8

1EAA

1EA4

1EC0

1EB7

1EA7

1EA9

1EAB

1EA5

1EAD
è
00E8

1EC2

1EBB

1EBD
D_
208
é
00E9

1EB9
é
1EC1

1EC3

1EC5
é
1EBF

1EC7
ì
00EC

1EC9

1EC4

1EBE

1ED2
ĩ
0129
í
00ED
я
1ECB
ò
00F2
E_
224

1ED4

1ECF
х
00F5
ó
00F3

1ECD

1ED3

1ED5

1ED7

1ED1
ö
1ED9

1EDD

1EDF

1EE1

1EDB

1EE3
ù
00F9
F_
240

1ED6

1EE7
ũ
0169
ú
00FA

1EE5

1EEB

1EED

1EEF

1EE9

1EF1

1EF3

1EF7

1EF9
ý
00FD

1EF5

1ED0

  Письмо  Номер  Пунктуация  Символ  Другой  Неопределенный

Затенение шахматной доски указывает на символы, которых нет в VSCII-3. Закрашенные символы в строках 0_, 1_, 8_ и 9_ не входят в VSCII-2 или VSCII-3.

использованная литература

внешние ссылки