VSCII - VSCII

VSCII
Apelido) x-viet-tcvn5712
Línguas) Vietnamita , inglês
Criado por TCVN / TC1
Padrão TCVN 5712: 1993
Classificação SBCS de 8 bits ;
ASCII estendido (VSCII-2 / -3)

VSCII ( código padrão vietnamita para intercâmbio de informações ), também conhecido como TCVN 5712 , ISO-IR -180 , .VN , ABC ou simplesmente as codificações TCVN , é um conjunto de três codificações de caracteres vietnamitas de padrão nacional estreitamente relacionadas para usar o idioma vietnamita com computadores , desenvolvido pelo Comitê Técnico de Tecnologia da Informação TCVN (TCVN / TC1) e adotado pela primeira vez em 1993 (como TCVN 5712: 1993).

Não deve ser confundida com a codificação VISCII não oficial de nome semelhante , que às vezes era usada por falantes vietnamitas no exterior. VISCII também foi concebido para representar o Código Padrão Vietnamita para Intercâmbio de Informações , mas não está relacionado ao VSCII.

VSCII (TCVN) foi usado extensivamente no norte do Vietnã, enquanto VNI era popular no sul. Unicode e a página de código do Windows-1258 agora são usados ​​para praticamente todos os dados de computador vietnamita, mas arquivos legados ou mensagens arquivadas podem precisar de conversão.

Codificações

Todas as três formas de VSCII mantêm os 95 caracteres ASCII imprimíveis inalterados.

VSCII-3 , também conhecido como TCVN 5712-3, VN3 ou simplesmente TCVN3, inclui o menor número de atribuições. É um ASCII estendido , porque mantém todos os 128 códigos ASCII inalterados. Ele não reatribui nenhum dos códigos de controle C0 e C1 . Comparado ao ASCII , adiciona 75 caracteres:

  • 67 caracteres minúsculos, permitindo suporte total a minúsculas.
  • 7 caracteres maiúsculos, permitindo suporte de maiúsculas para as 29 letras básicas sem marcas de tom.
  • O espaço ininterrupto .

As marcas de tom em vogais maiúsculas são realizadas no TCVN3 ao alternar para uma fonte totalmente em maiúsculas.

VSCII-2 , também conhecido como TCVN 5712-2 e VN2, é um superconjunto de VSCII-3. É um ASCII estendido , pois mantém todos os 128 códigos ASCII inalterados. Ele não reatribui nenhum dos códigos de controle C0 e C1 , tornando-o compatível com a ISO 2022 como um conjunto de 96. Comparado com VSCII-3, adiciona (para um total de 96 caracteres não ASCII):

  • Mais 16 caracteres maiúsculos com marcas de tom pré-compostas (para um total de 23 caracteres maiúsculos não ASCII)
  • 5 combinando diacríticos para marcas de tons , permitindo que outras combinações de letras maiúsculas e marcas de tons sejam representadas. As marcas de combinação seguem a letra base como no VNI (em vez de precedê-las como no ANSEL ).

VSCII-1 , também conhecido como TCVN 5712-1 e VN1, é uma extensão de VSCII-2 e é um ASCII modificado, pois substitui 12 dos 33 caracteres de controle por caracteres pré-compostos. Em comparação com VSCII-2, (para um total de 140 caracteres não ASCII):

  • Adiciona mais 44 letras maiúsculas pré-compostas, levando-as à mesma contagem que as minúsculas
  • Faz isso substituindo 12 caracteres de controle ASCII e alocando 32 caracteres gráficos para a área de controle C1, quebrando a compatibilidade ISO 2022

A conversão de VSCII-3 em VSCII-2 ou VSCII-1 e a conversão de VSCII-2 em VSCII-1 não são necessárias, mas podem resultar em arquivos menores.

A conversão de VSCII-1 em VSCII-2 ou VSCII-3 e a conversão de VSCII-2 em VSCII-3 requerem a expansão de alguns caracteres pré-compostos.

Conjunto de caracteres

VSCII-1
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _UMA _B _C _D _E _F
0_
0
NUL
0000
Ú
00DA

1EE4
ETX
0003

1EEA

1EEC

1EEE
BEL
0007
BS
0008
HT
0009
LF
000A
VT
000B
FF
000C
CR
000D
SO
000E
SI
000F
1_
16
DLE
0010

1EE8

1EF0

1EF2

1EF6

1EF8
Ý
00DD

1EF4
CAN
0018
EM
0019
SUB
001A
ESC
001B
FS
001C
GS
001D
RS
001E
US
001F
2_
32
SP
0020
!
0021
"
0022
#
0023
$
0024
%
0025
&
0026
'
0027
(
0028
)
0029
*
002A
+
002B
,
002C
-
002D
.
002E
/
002F
3_
48
0
0030
1
0031
2
0032
3
0033
4
0034
5
0035
6
0036
7
0037
8
0038
9
0039
:
003A
;
003B
<
003C
=
003D
>
003E
?
003F
4_
64
@
0040
A
0041
B
0042
C
0043
D
0044
E
0045
F
0046
G
0047
H
0048
I
0049
J
004A
K
004B
L
004C
M
004D
N
004E
O
004F
5_
80
P
0050
Q
0051
R
0052
S
0053
T
0054
U
0055
V
0056
W
0057
X
0058
Y
0059
Z
005A
[
005B
\
005C
]
005D
^
005E
_
005F
6_
96
`
0060
a
0061
b
0062
c
0063
d
0064
e
0065
f
0066
g
0067
h
0068
eu
0069
j
006A
k
006B
l
006C
m
006D
n
006E
o
006F
7_
112
p
0070
q
0071
r
0072
s
0073
t
0074
u
0075
v
0076
w
0077
x
0078
y
0079
z
007A
{
007B
|
007C
}
007D
~
007E
DEL
007F
8_
128
À
00C0

1EA2
Ã
00C3
Á
00C1

1EA0

1EB6

1EAC
È
00C8

1EBA

1EBC
É
00C9

1EB8

1EC6
Ì
00CC

1EC8
Ĩ
0128
9_
144
Í
00CD

1ECA
Ò
00D2

1ECE
Õ
00D5
Ó
00D3

1ECC

1ED8

1EDC

1EDE

1EE0

1EDA

1EE2
Ù
00D9

1EE6
Ũ
0168
A_
160
NBSP
00A0
Ă
0102
Â
00C2
Ê
00CA
Ô
00D4
Ơ
01A0
Ư
01AF
Đ
0110
ă
0103
â
00E2
ê
00EA
ô
00F4
ơ
01A1
ư
01B0
đ
0111

1EB0
B_
176
0300
̉
0309
0303
0301
̣
0323
à
00E0

1EA3
ã
00E3
á
00E1

1EA1

1EB2

1EB1

1EB3

1EB5

1EAF

1EB4
C_
192

1EAE

1EA6

1EA8

1EAA

1EA4

1EC0

1EB7

1EA7

1EA9

1EAB

1EA5

1EAD
è
00E8

1EC2

1EBB

1EBD
D_
208
é
00E9

1EB9

1EC1

1EC3

1EC5
ế
1EBF

1EC7
ì
00EC

1EC9

1EC4

1EBE

1ED2
ĩ
0129
í
00ED

1ECB
ò
00F2
E_
224

1ED4

1ECF
õ
00F5
ó
00F3

1ECD

1ED3

1ED5

1ED7

1ED1

1ED9

1EDD
Ø
1EDF

1EE1

1EDB

1EE3
ù
00F9
F_
240

1ED6

1EE7
ũ
0169
ú
00FA

1EE5

1EEB

1EED

1EEF

1EE9

1EF1

1EF3

1EF7

1EF9
ý
00FD

1EF5

1ED0

  Carta  Número  Pontuação  Símbolo  Outro  Indefinido

O sombreamento quadriculado indica caracteres que não estão em VSCII-3. Os caracteres sombreados nas linhas 0_, 1_, 8_ e 9_ não estão em VSCII-2 ou VSCII-3.

Referências

links externos