Notação WX - WX notation

Layout de teclado do Ubuntu Hindi (WX)
Layout de teclado do Ubuntu Hindi (WX)

A notação WX é um esquema de transliteração para representar idiomas indianos em ASCII . Este esquema se originou no IIT Kanpur para processamento computacional de línguas indianas e é amplamente usado entre a comunidade de processamento de linguagem natural (PNL) na Índia. A notação (embora não identificada) é usada, por exemplo, em um livro sobre PNL do IIT Kanpur. As características salientes desse esquema de transliteração são: Cada consoante e cada vogal tem um único mapeamento em romano. Portanto, é um código de prefixo, vantajoso do ponto de vista de computação. Normalmente, as letras minúsculas são usadas para consoantes não aspiradas e vogais curtas, enquanto as letras maiúsculas são usadas para consoantes aspiradas e vogais longas. Enquanto as consoantes surdas e sonoras retroflexionadas são mapeadas para 't, T, d e D', as dentais são mapeadas para 'w, W, x e X'. Daí o nome do esquema "WX", referindo-se ao mapeamento idiossincrático. Ubuntu Linux oferece suporte de teclado para notação WX.

Vogais

uma UMA eu eu você você e E o O

Sonorantes

q Q eu

Anusvāra e visarga

M H

O Anunasika é representado por 'z'. Por exemplo, अँ = az. Em sânscrito, o Avagraha é representado por 'Z'. Por exemplo, वमतोऽन्तः = vamawoZnwaH. Isso pode causar confusão, pois 'Z' também é usado para outro propósito no caso de outras línguas índicas (ver abaixo, último parágrafo).

Consoantes

क् ख् ग् घ् ङ् Velar
k K g G f
च् छ् ज् झ् ञ् Palatal
c C j J F
ट् ठ् ड् ढ् ण् Retroflex
t T d D N
त् थ् द् ध् न् Dental
C C x X n
प् फ् ब् भ् म् Labial
p P b B m
य् र् ल् व् Semivogal
y r eu v
श् ष् स् ह् Fricativa
S R s h

Este esquema foi estendido para representar todas as escritas indianas derivadas de Brahmi. Para explicar os caracteres de outras línguas indianas que estão faltando no Devanagari, três operadores são usados: 'Y' para obter o próximo caractere ISCII , 'V' para obter o caractere ISCII anterior e 'Z' para adicionar o nukta . Assim, por exemplo, 'l' representa ल (U0932) de Devanágari, e 'lY' representa ळ (U0933) em Marathi. 'e' representa ए (U090F) de Devanágari ou ఏ (U0C0F) de Telugu e eV representa ऎ (U090E) ou ఎ (U0C0E) de Telugu. Da mesma forma, 'ka' representa क de Devanagari e 'kZa' representa क़.

Veja também

Referências

links externos