Dicionário legível por máquina - Machine-readable dictionary

Dicionário legível por máquina ( MRD ) é um dicionário armazenado como dados de máquina (computador) em vez de ser impresso em papel. É um dicionário eletrônico e banco de dados lexical .

Um dicionário legível por máquina é um dicionário em formato eletrônico que pode ser carregado em um banco de dados e consultado por meio de um software aplicativo. Pode ser um dicionário explicativo de um único idioma ou um dicionário multilíngue para oferecer suporte a traduções entre dois ou mais idiomas ou uma combinação de ambos. O software de tradução entre vários idiomas geralmente aplica dicionários bidirecionais. Um MRD pode ser um dicionário com uma estrutura proprietária que é consultado por um software dedicado (por exemplo, online via internet) ou pode ser um dicionário que tem uma estrutura aberta e está disponível para carregamento em bancos de dados de computador e, portanto, pode ser usado por meio de vários softwares formulários. Os dicionários convencionais contêm um lema com várias descrições. Um dicionário legível por máquina pode ter recursos adicionais e, portanto, às vezes é chamado de dicionário inteligente. Um exemplo de dicionário inteligente é o dicionário Open Source Gellish English .
O termo dicionário também é usado para se referir a um vocabulário ou léxico eletrônico usado, por exemplo, em corretores ortográficos . Se os dicionários são organizados em uma hierarquia subtipo-supertipo de conceitos (ou termos), isso é chamado de taxonomia . Se ele também contém outras relações entre os conceitos, é chamado de ontologia . Os mecanismos de pesquisa podem usar um vocabulário, uma taxonomia ou uma ontologia para otimizar os resultados da pesquisa. Dicionários eletrônicos especializados são dicionários morfológicos ou dicionários sintáticos.

O termo MRD é freqüentemente contrastado com dicionário de PNL , no sentido de que um MRD é a forma eletrônica de um dicionário que foi impresso anteriormente em papel. Embora ambos sejam usados ​​por programas, em contraste, o termo dicionário de PNL é preferido quando o dicionário foi construído do zero com a PNL em mente. Um padrão ISO para MRD e PNL é capaz de representar ambas as estruturas e é chamado Lexical Markup Framework .

História

Os primeiros MRDs amplamente distribuídos foram o Merriam-Webster Seventh Collegiate (W7) e o Merriam-Webster New Pocket Dictionary (MPD). Ambos foram produzidos por um projeto financiado pelo governo na System Development Corporation sob a direção de John Olney. Eles foram digitados manualmente, já que nenhuma fita de composição de nenhum dos livros estava disponível. Originalmente, cada um foi distribuído em várias bobinas de fita magnética como imagens de cartão com cada palavra separada de cada definição em um cartão perfurado separado com vários códigos especiais indicando os detalhes de seu uso no dicionário impresso. Olney traçou um grande plano para a análise das definições do dicionário, mas seu projeto expirou antes que a análise pudesse ser realizada. Robert Amsler, da Universidade do Texas em Austin, retomou a análise e completou uma descrição taxonômica do Dicionário de Bolso com financiamento da National Science Foundation ; no entanto, seu projeto expirou antes que os dados taxonômicos pudessem ser distribuídos. Roy Byrd et al. na IBM Yorktown Heights retomou a análise do Webster's Seventh Collegiate após o trabalho de Amsler. Finalmente, na década de 1980, começando com o apoio inicial da Bellcore e mais tarde financiado por várias agências federais dos EUA, incluindo NSF, ARDA , DARPA , DTO e REFLEX , George Armitage Miller e Christiane Fellbaum da Universidade de Princeton concluíram a criação e ampla distribuição de um dicionário e sua taxonomia no projeto WordNet , que hoje se destaca como o recurso de lexicologia computacional mais amplamente distribuído.

Referências