VSCII - VSCII
Apelido) | x-viet-tcvn5712 |
---|---|
Línguas) | Vietnamita , inglês |
Criado por | TCVN / TC1 |
Padrão | TCVN 5712: 1993 |
Classificação | SBCS de 8 bits ; ASCII estendido (VSCII-2 / -3) |
VSCII ( código padrão vietnamita para intercâmbio de informações ), também conhecido como TCVN 5712 , ISO-IR -180 , .VN , ABC ou simplesmente as codificações TCVN , é um conjunto de três codificações de caracteres vietnamitas de padrão nacional estreitamente relacionadas para usar o idioma vietnamita com computadores , desenvolvido pelo Comitê Técnico de Tecnologia da Informação TCVN (TCVN / TC1) e adotado pela primeira vez em 1993 (como TCVN 5712: 1993).
Não deve ser confundida com a codificação VISCII não oficial de nome semelhante , que às vezes era usada por falantes vietnamitas no exterior. VISCII também foi concebido para representar o Código Padrão Vietnamita para Intercâmbio de Informações , mas não está relacionado ao VSCII.
VSCII (TCVN) foi usado extensivamente no norte do Vietnã, enquanto VNI era popular no sul. Unicode e a página de código do Windows-1258 agora são usados para praticamente todos os dados de computador vietnamita, mas arquivos legados ou mensagens arquivadas podem precisar de conversão.
Codificações
Todas as três formas de VSCII mantêm os 95 caracteres ASCII imprimíveis inalterados.
VSCII-3 , também conhecido como TCVN 5712-3, VN3 ou simplesmente TCVN3, inclui o menor número de atribuições. É um ASCII estendido , porque mantém todos os 128 códigos ASCII inalterados. Ele não reatribui nenhum dos códigos de controle C0 e C1 . Comparado ao ASCII , adiciona 75 caracteres:
- 67 caracteres minúsculos, permitindo suporte total a minúsculas.
- 7 caracteres maiúsculos, permitindo suporte de maiúsculas para as 29 letras básicas sem marcas de tom.
- O espaço ininterrupto .
As marcas de tom em vogais maiúsculas são realizadas no TCVN3 ao alternar para uma fonte totalmente em maiúsculas.
VSCII-2 , também conhecido como TCVN 5712-2 e VN2, é um superconjunto de VSCII-3. É um ASCII estendido , pois mantém todos os 128 códigos ASCII inalterados. Ele não reatribui nenhum dos códigos de controle C0 e C1 , tornando-o compatível com a ISO 2022 como um conjunto de 96. Comparado com VSCII-3, adiciona (para um total de 96 caracteres não ASCII):
- Mais 16 caracteres maiúsculos com marcas de tom pré-compostas (para um total de 23 caracteres maiúsculos não ASCII)
- 5 combinando diacríticos para marcas de tons , permitindo que outras combinações de letras maiúsculas e marcas de tons sejam representadas. As marcas de combinação seguem a letra base como no VNI (em vez de precedê-las como no ANSEL ).
VSCII-1 , também conhecido como TCVN 5712-1 e VN1, é uma extensão de VSCII-2 e é um ASCII modificado, pois substitui 12 dos 33 caracteres de controle por caracteres pré-compostos. Em comparação com VSCII-2, (para um total de 140 caracteres não ASCII):
- Adiciona mais 44 letras maiúsculas pré-compostas, levando-as à mesma contagem que as minúsculas
- Faz isso substituindo 12 caracteres de controle ASCII e alocando 32 caracteres gráficos para a área de controle C1, quebrando a compatibilidade ISO 2022
A conversão de VSCII-3 em VSCII-2 ou VSCII-1 e a conversão de VSCII-2 em VSCII-1 não são necessárias, mas podem resultar em arquivos menores.
A conversão de VSCII-1 em VSCII-2 ou VSCII-3 e a conversão de VSCII-2 em VSCII-3 requerem a expansão de alguns caracteres pré-compostos.
Conjunto de caracteres
_0 | _1 | _2 | _3 | _4 | _5 | _6 | _7 | _8 | _9 | _UMA | _B | _C | _D | _E | _F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0_ 0 |
NUL 0000 |
Ú 00DA |
Ụ 1EE4 |
ETX 0003 |
Ừ 1EEA |
Ử 1EEC |
Ữ 1EEE |
BEL 0007 |
BS 0008 |
HT 0009 |
LF 000A |
VT 000B |
FF 000C |
CR 000D |
SO 000E |
SI 000F |
1_ 16 |
DLE 0010 |
Ứ 1EE8 |
Ự 1EF0 |
Ỳ 1EF2 |
Ỷ 1EF6 |
Ỹ 1EF8 |
Ý 00DD |
Ỵ 1EF4 |
CAN 0018 |
EM 0019 |
SUB 001A |
ESC 001B |
FS 001C |
GS 001D |
RS 001E |
US 001F |
2_ 32 |
SP 0020 |
! 0021 |
" 0022 |
# 0023 |
$ 0024 |
% 0025 |
& 0026 |
' 0027 |
( 0028 |
) 0029 |
* 002A |
+ 002B |
, 002C |
- 002D |
. 002E |
/ 002F |
3_ 48 |
0 0030 |
1 0031 |
2 0032 |
3 0033 |
4 0034 |
5 0035 |
6 0036 |
7 0037 |
8 0038 |
9 0039 |
: 003A |
; 003B |
< 003C |
= 003D |
> 003E |
? 003F |
4_ 64 |
@ 0040 |
A 0041 |
B 0042 |
C 0043 |
D 0044 |
E 0045 |
F 0046 |
G 0047 |
H 0048 |
I 0049 |
J 004A |
K 004B |
L 004C |
M 004D |
N 004E |
O 004F |
5_ 80 |
P 0050 |
Q 0051 |
R 0052 |
S 0053 |
T 0054 |
U 0055 |
V 0056 |
W 0057 |
X 0058 |
Y 0059 |
Z 005A |
[ 005B |
\ 005C |
] 005D |
^ 005E |
_ 005F |
6_ 96 |
` 0060 |
a 0061 |
b 0062 |
c 0063 |
d 0064 |
e 0065 |
f 0066 |
g 0067 |
h 0068 |
eu 0069 |
j 006A |
k 006B |
l 006C |
m 006D |
n 006E |
o 006F |
7_ 112 |
p 0070 |
q 0071 |
r 0072 |
s 0073 |
t 0074 |
u 0075 |
v 0076 |
w 0077 |
x 0078 |
y 0079 |
z 007A |
{ 007B |
| 007C |
} 007D |
~ 007E |
DEL 007F |
8_ 128 |
À 00C0 |
Ả 1EA2 |
à 00C3 |
Á 00C1 |
Ạ 1EA0 |
Ặ 1EB6 |
Ậ 1EAC |
È 00C8 |
Ẻ 1EBA |
Ẽ 1EBC |
É 00C9 |
Ẹ 1EB8 |
Ệ 1EC6 |
Ì 00CC |
Ỉ 1EC8 |
Ĩ 0128 |
9_ 144 |
Í 00CD |
Ị 1ECA |
Ò 00D2 |
Ỏ 1ECE |
Õ 00D5 |
Ó 00D3 |
Ọ 1ECC |
Ộ 1ED8 |
Ờ 1EDC |
Ở 1EDE |
Ỡ 1EE0 |
Ớ 1EDA |
Ợ 1EE2 |
Ù 00D9 |
Ủ 1EE6 |
Ũ 0168 |
A_ 160 |
NBSP 00A0 |
Ă 0102 |
 00C2 |
Ê 00CA |
Ô 00D4 |
Ơ 01A0 |
Ư 01AF |
Đ 0110 |
ă 0103 |
â 00E2 |
ê 00EA |
ô 00F4 |
ơ 01A1 |
ư 01B0 |
đ 0111 |
Ằ 1EB0 |
B_ 176 |
0300 |
̉ 0309 |
0303 |
0301 |
̣ 0323 |
à 00E0 |
ả 1EA3 |
ã 00E3 |
á 00E1 |
ạ 1EA1 |
Ẳ 1EB2 |
ằ 1EB1 |
ẳ 1EB3 |
ẵ 1EB5 |
ắ 1EAF |
Ẵ 1EB4 |
C_ 192 |
Ắ 1EAE |
Ầ 1EA6 |
Ẩ 1EA8 |
Ẫ 1EAA |
Ấ 1EA4 |
Ề 1EC0 |
ặ 1EB7 |
ầ 1EA7 |
ẩ 1EA9 |
ẫ 1EAB |
ấ 1EA5 |
ậ 1EAD |
è 00E8 |
Ể 1EC2 |
ẻ 1EBB |
ẽ 1EBD |
D_ 208 |
é 00E9 |
ẹ 1EB9 |
ề 1EC1 |
ể 1EC3 |
ễ 1EC5 |
ế 1EBF |
ệ 1EC7 |
ì 00EC |
ỉ 1EC9 |
Ễ 1EC4 |
Ế 1EBE |
Ồ 1ED2 |
ĩ 0129 |
í 00ED |
ị 1ECB |
ò 00F2 |
E_ 224 |
Ổ 1ED4 |
ỏ 1ECF |
õ 00F5 |
ó 00F3 |
ọ 1ECD |
ồ 1ED3 |
ổ 1ED5 |
ỗ 1ED7 |
ố 1ED1 |
ộ 1ED9 |
ờ 1EDD |
Ø 1EDF |
ỡ 1EE1 |
ớ 1EDB |
ợ 1EE3 |
ù 00F9 |
F_ 240 |
Ỗ 1ED6 |
ủ 1EE7 |
ũ 0169 |
ú 00FA |
ụ 1EE5 |
ừ 1EEB |
ử 1EED |
ữ 1EEF |
ứ 1EE9 |
ự 1EF1 |
ỳ 1EF3 |
ỷ 1EF7 |
ỹ 1EF9 |
ý 00FD |
ỵ 1EF5 |
Ố 1ED0 |
Carta Número Pontuação Símbolo Outro Indefinido
O sombreamento quadriculado indica caracteres que não estão em VSCII-3. Os caracteres sombreados nas linhas 0_, 1_, 8_ e 9_ não estão em VSCII-2 ou VSCII-3.