SAMPA - SAMPA
O Alfabeto Fonético de Métodos de Avaliação da Fala ( SAMPA ) é um script fonético legível por computador usando caracteres ASCII imprimíveis de 7 bits , baseado no Alfabeto Fonético Internacional (IPA).
Foi originalmente desenvolvido no final da década de 1980 para seis línguas europeias pelo programa de pesquisa e desenvolvimento de tecnologia da informação do EEC ESPRIT . O maior número possível de símbolos foi adquirido do IPA; onde isso não for possível, outros sinais disponíveis são usados, por exemplo, [ @
] para schwa (IPA [ə] ), [ 2
] para o som vocálico encontrado em francês deux (IPA [ø] ) e [ 9
] para o som vocálico encontrado em francês neuf (IPA [œ] ).
Hoje, oficialmente, o SAMPA foi desenvolvido para todos os sons dos seguintes idiomas:
Os caracteres [ "s{mp@
] representam a pronúncia do nome SAMPA em inglês, com o símbolo inicial ["] indicando acento primário. Como o IPA, SAMPA geralmente está entre colchetes ou barras , que não fazem parte do alfabeto próprio e apenas significam que é fonético em oposição ao texto normal.
Recursos
SAMPA foi desenvolvido no final de 1980 na Comissão Europeia -funded ESPRIT projeto 2589 -para "SAM alfabeto fonético" "Métodos de Avaliação da Fala" (SAM) -hence para facilitar a troca de dados de e-mail e processamento computacional de transcrições em fonética e tecnologia de fala.
SAMPA é uma codificação parcial do IPA . A primeira versão do SAMPA foi a união dos conjuntos de códigos de fonemas para dinamarquês, holandês, inglês, francês, alemão e italiano; versões posteriores estenderam o SAMPA para cobrir outros idiomas europeus. Como o SAMPA é baseado em inventários de fonemas, cada tabela SAMPA é válida apenas no idioma para o qual foi criada. Para tornar essa técnica de codificação IPA universalmente aplicável, foi criado o X-SAMPA , que fornece uma única tabela sem diferenças específicas de idioma.
O SAMPA foi concebido como um hack para contornar a incapacidade das codificações de texto para representar os símbolos do IPA. Consequentemente, à medida que o suporte Unicode para símbolos IPA se torna mais difundido, diminui a necessidade de um sistema separado e legível por computador para representar o IPA em ASCII. No entanto, a entrada de texto depende de codificações de teclado específicas ou dispositivos de entrada. Por esse motivo, o SAMPA e o X-SAMPA ainda são amplamente utilizados na fonética computacional e na tecnologia da fala.
Veja também
- Comparação de codificações ASCII do Alfabeto Fonético Internacional
- Gráfico SAMPA
- Gráfico SAMPA para inglês , uma versão concisa
- X-SAMPA , uma notação independente de linguagem semelhante ao SAMPA, mas cobrindo todo o repertório IPA
- BABEL Speech Corpus
Referências
- Ranchhod, Elisabeth & J. Mamede, Nuno (2002). Advances in Natural Language Processing: Third International Conference, PorTAL 2002, Faro, Portugal, June 23-26, 2002. Proceedings ( Lecture Notes in Computer Science ) . (1ª ed.). Springer. ISBN 3-540-43829-7 .
- L. DeMiller, Anna & Rettig, James (2000). Linguística: Um Guia para a Literatura de Referência (2ª ed.). Bibliotecas ilimitadas. ISBN 1-56308-619-0 .
- Lamberts, Koen & Goldstone, Rob (2004). Manual de Cognição . Sage Publications Ltd. ISBN 0-7619-7277-3 .
links externos
- Alfabeto fonético legível por computador SAMPA
- Notação fonêmica do inglês em SAMPA
- SAMPA para escoceses
- Conversor de texto escrito (alemão) para SAMPA e IPA (aplicativo Ajax)
- IPA-SAMPA conversor e gráfico IPA-SAMPA