Mojikyō -Mojikyō

Mojikyō
Konjaku Mojikyō
今昔 文字 鏡
今昔 文字 鏡 .gif
文字 鏡 : 台湾 語 仮 名 .png
O mapa de personagens Mojikyō destacando o kana taiwanês 
Desenvolvedor (s) Tadahisa Ishikawa
(石川忠 久)
Tokio Furuya
(古 家 時 雄)
Instituto Mojikyō
(文字 鏡 研究 会)
lançamento inicial 1.0 / julho de 1997 ; 24 anos atras ( 1997-07 )
Último lançamento
4.0 / 15 de dezembro de 2018 ; 2 anos atrás ( 15/12/2018 )
Sistema operacional Microsoft Windows
Tamanho 51 MB
Disponível em japonês
Modelo Conjunto de caracteres empacotado com fontes e um mapa de caracteres
Licença Proprietário
Local na rede Internet mojikyo .org

Mojikyō ( japonês :文字 鏡), também conhecido por seu nome completo Konjaku Mojikyō (今昔 文字 鏡, literalmente '(o) espelho de caracteres do passado e do presente') , é umesquema de codificação de caracteres . O Mojikyō Institute (文字 鏡 研究 会, Mojikyō Kenkyūkai ) , que publica o conjunto de caracteres, também publicou software de computador e fontes TrueTypepara acompanhá-lo. O Instituto Mojikyō, presidido por Tadahisa Ishikawa (石川忠 久) , originalmente teve seu conjunto de caracteres e software e dados relacionados redistribuídos em CD-ROM por Kinokuniya . Conceitualizado em 1996, a primeira versão do CD-ROM foi lançada em julho de 1997. Por um tempo, ele ofereceu uma assinatura da web, " Mojikyō WEB" (文字 鏡 WEB ), que tinha caracteres mais atualizados.

Em setembro de 2006, codificava 174.975 caracteres. Entre eles, 150.366 caracteres pertenciam à família CJKV estendida . Muitos dos caracteres codificados são considerados obsoletos ou obscuros e não são codificados por nenhum outro conjunto de caracteres, incluindo o padrão internacional, Unicode .

Originalmente um produto pago, a partir de 2015, o Mojikyō Institute começou a enviar seus últimos lançamentos para o Internet Archive como freeware , como um memorial para homenagear um de seus desenvolvedores, Tokio Furuya (古 家 時 雄) , que morreu naquele ano. Em 15 de dezembro de 2018, a versão 4.0 foi lançada. No dia seguinte, Ishikawa anunciou que este seria o lançamento final de Mojikyō .

Premissa

A codificação Mojikyō foi criada para fornecer um índice completo de caracteres chineses, coreanos e japoneses. Ele também codifica um grande número de caracteres em escritas antigas, como a escrita oracle bone , a escrita do selo e sânscrito ( Siddhaṃ ). Para muitos caracteres, é a única codificação de caracteres que os codifica, e seus dados costumam ser usados ​​como ponto de partida para propostas Unicode . No entanto, Mojikyō tem padrões muito mais flexíveis do que Unicode para codificação, o que leva Mojikyō a ter muitos glifos codificados de origem duvidosa ou mesmo fictícia. Como tal, embora muitos caracteres Mojikyō não codificados sejam adequados para codificação em Unicode, nem todos podem se tornar caracteres Unicode, devido aos diferentes padrões de evidência exigidos por cada um.

Composição

As fontes Mojikyō (文字 鏡 フ ォ ン ト) são fontes TrueType que vêm em um arquivo ZIP e cada uma tem de 2 a 5 megabytes ; as diferentes fontes contêm diferentes números de caracteres. Também está incluído um executável do Windows que implementa um mapa de caracteres , o " Mapa de caracteres Mojikyō " (文字 鏡 MAP ), MOCHRMAP.EXE . Isso permite aos usuários navegar pelas fontes Mojikyō e copiar e colar caracteres em vez de digitá-los no teclado. Ao contrário do mapa de caracteres regular do Windows, ou KCharSelect , que oferecem suporte a fontes TrueType, MOCHRMAP.EXE exibe a codificação Mojikyō do caractere solicitado. Para que o MOCHRMAP.EXE funcione, todas as fontes Mojikyō devem ser instaladas para todos os usuários (em C: \ Windows \ Fonts ).

Codificação

Ao se referir a um caractere codificado em Mojikyō , o formato MJXXXXXX é frequentemente usado, semelhante ao formato U + XXXX usado para Unicode. Por exemplo, hentaigana U + 1B008 𛀈 tem Mojikyō que codifica MJ090007 e Unicode codificando L + 1B008. Uma diferença, no entanto, é que as codificações Mojikyō exibidas dessa forma são decimais , enquanto a codificação U + do Unicode é hexadecimal .

Desde os primeiros dias do Unicode, Mojikyō influenciou e foi influenciado pelo padrão - seus glifos aparecem pela primeira vez em uma proposta para o Grupo de Relator Ideográfico (IRG), que é responsável por todos os blocos CJK em Unicode, em 18 de abril de 2002. Em Maio de 2007, Mojikyō desempenhou um papel menor em uma série de propostas de sucesso para codificar o script Tangut em Unicode; Mojikyō já tinha em sua codificação 6.000 caracteres Tangut em outubro de 2002.

O Banco de Dados Unihan do Padrão Unicode refere-se a Mojikyō como a " Coleção KOKUJI japonesa " (日本国 字 集), abreviado como "JK". Por exemplo, U + 2B679 𫙹 , um ideograma lido em japonês como burizādo (ブ リ ザ ー ド, lit. ' nevasca ') , tem uma fonte J igual a JK-66038. Todos os caracteres Unicode com um J-Source com o prefixo JK se originam de Mojikyō . De acordo com Ken Lunde , um especialista no assunto em codificação de caracteres e idiomas do Leste Asiático , a partir do Unicode 13.0, 782 ideogramas em Unicode se originam de Mojikyō , divididos de forma um tanto uniforme entre dois blocos : CJK Unified Ideographs Extension C , com 367, e CJK Unified Ideographs Extensão E , com 415. Nem todos os caracteres Unicode com origens Mojikyō (fontes J com prefixo JK) têm o mesmo glifo representativo no gráfico de código que na fonte Mojikyō ; alguns caracteres tiveram suas formas alteradas antes da codificação final, pois a investigação mostrou que as formas atribuídas pelo Instituto Mojikyō estavam erradas.

Blocos

Em setembro de 2006, codificava 174.975 caracteres. Entre eles, 150.366 caracteres pertenciam à família estendida CJKV . Muitos dos caracteres codificados são considerados obsoletos ou obscuros e não são codificados por nenhum outro conjunto de caracteres, incluindo o padrão internacional, Unicode. Cada personagem Mojikyō possui um número único e os personagens são organizados em blocos.

Mojikyō coloca personagens CJKV em blocos diferentes de acordo com seu radical Kangxi tradicional . Radicais comuns contendo um número especialmente alto de caracteres, como Radicais 9 () e 162 ( ), são divididos ainda mais por ordem de traço.

Sem unificação

Ao contrário do Unicode, Mojikyō evita propositalmente a unificação Han ; nenhuma tentativa de compactação da codificação é feita, nem há uma tentativa de manter todos os caracteres comuns abaixo de U + FFFF como no Unicode.

O Unicode, por outro lado, classifica seu CJK em blocos com base em quão comuns eles são: os mais comuns geralmente são colocados no Plano Multilíngue Básico , enquanto aqueles que são raros ou obscuros são colocados nos Planos Astrais .

Por exemplo, Radical 9 tem dois caracteres onde Unicode tem um: MJ054435 () e MJ059031 (), ambos representados em Unicode como U + 4EE4 .

Licença

Mojikyō é um software proprietário sob uma licença restritiva. Originalmente, o Instituto Mojikyō tentou evitar que seus dados de caractere fossem usados ​​e ameaçou aqueles que publicaram tabelas de conversão de e para seu conjunto de caracteres. Em julho de 2010, o Instituto Mojikyō abandonou seus esforços para impedir os usuários de publicar tabelas de conversão ou converter caracteres codificados em Mojikyō para Unicode ou outros conjuntos de caracteres. Essas reivindicações legais provavelmente nunca foram executáveis, pois são meros dados e o formato de letras, que são considerados propriedade comum e, como tal, não atendem ao limite da originalidade .

Devido a esse legado, no entanto, GlyphWiki  [ ja ] proibiu os dados Mojikyō em 2020.

Sistemas de escrita coletados

Vivendo

Morto ou obsoleto

Veja também

Referências

Notas

links externos