Gramática estocástica - Stochastic grammar

Uma gramática estocástica ( gramática estatística ) é uma estrutura gramatical com uma noção probabilística de gramaticalidade :

A gramática é realizada como um modelo de linguagem . As frases permitidas são armazenadas em um banco de dados junto com a frequência com que uma frase é comum. O processamento estatístico de linguagem natural usa métodos estocásticos , probabilísticos e estatísticos , especialmente para resolver dificuldades que surgem porque frases mais longas são altamente ambíguas quando processadas com gramáticas realistas, resultando em milhares ou milhões de análises possíveis. Os métodos de desambiguação geralmente envolvem o uso de corpora e modelos de Markov . "Um modelo probabilístico consiste em um modelo não probabilístico mais algumas quantidades numéricas; não é verdade que os modelos probabilísticos são inerentemente mais simples ou menos estruturais do que os modelos não probabilísticos."

Exemplos

Um método probabilístico para detecção de rimas é implementado por Hirjee & Brown em seu estudo em 2013 para encontrar pares de rimas internas e imperfeitas em letras de rap. O conceito é adaptado de uma técnica de alinhamento de sequência usando BLOSUM ( BLO cks SU bstitution M atrix). Eles foram capazes de detectar rimas indetectáveis ​​por modelos não probabilísticos.

Veja também

Referências

  1. ^ Steve Young; Gerrit Bloothooft (14 de março de 2013). Métodos Baseados em Corpus em Processamento de Linguagem e Fala . Springer Science & Business Media. pp. 140–. ISBN   978-94-017-1183-8 .
  2. ^ John Goldsmith. 2002. " Modelos Probabilísticos de Gramática: Fonologia como Minimização da Informação ." Phonological Studies # 5: 21–46.
  3. ^ Hirjee, Hussein; Brown, Daniel (2013). "Usando a detecção automatizada de rimas para caracterizar o estilo de rima na música rap" (PDF) . Revisão de Musicologia Empírica .

Leitura adicional

  • Christopher D. Manning, Hinrich Schütze: Foundations of Statistical Natural Language Processing , MIT Press (1999), ISBN   978-0-262-13360-9 .
  • Stefan Wermter, Ellen Riloff, Gabriele Scheler (eds.): Connectionist, Statistical and Symbolic Approaches to Learning for Natural Language Processing , Springer (1996), ISBN   978-3-540-60925-4 .
  • Pirani, Giancarlo, ed. Algoritmos e arquiteturas avançadas para compreensão da fala. Vol. 1. Springer Science & Business Media, 2013.