Kenneth N. Stevens - Kenneth N. Stevens

Kenneth Noble Stevens
Ken Stevens.jpg
Nascer ( 1924-03-24 )24 de março de 1924
Faleceu 19 de agosto de 2013 (19/08/2013)(89 anos)
Nacionalidade Canadá
Cidadania nós
Alma mater MIT , Universidade de Toronto
Prêmios Medalha Nacional de Ciência (1999)
Carreira científica
Campos Engenharia elétrica , fonética acústica
Instituições MIT
Orientador de doutorado Leo Beranek
Outros conselheiros acadêmicos JCR Licklider , Walter A. Rosenblith
Alunos de doutorado James L. Flanagan
Carol Espy-Wilson
Lawrence R. Rabiner
Victor Zue

Kenneth Noble Stevens (24 de março de 1924 - 19 de agosto de 2013) foi o Clarence J. LeBel Professor de Engenharia Elétrica e Ciência da Computação e Professor de Ciências da Saúde e Tecnologia no Laboratório de Pesquisa de Eletrônica do MIT . Stevens foi chefe do Grupo de Comunicação da Fala no Laboratório de Pesquisa de Eletrônica (RLE) do MIT, e foi um dos cientistas líderes mundiais em fonética acústica .

Ele recebeu a Medalha Nacional de Ciência do presidente Bill Clinton em 1999, e o Prêmio IEEE James L. Flanagan de Processamento de Fala e Áudio em 2004.

Ele morreu em 2013 de complicações da doença de Alzheimer .

Educação

Educação precoce

Ken Stevens nasceu em Toronto em 23 de março de 1924. Seu irmão mais velho, Pete, nasceu na Inglaterra; Ken nasceu quatro anos depois, logo após a família emigrar para o Canadá. A sua ambição de infância era ser médico, porque admirava um tio que era médico. Ele cursou o ensino médio em uma escola ligada ao Departamento de Educação da Universidade de Toronto .

Stevens cursou a faculdade de Engenharia da Universidade de Toronto com bolsa integral. Ele viveu em casa durante seus anos de graduação. Embora o próprio Stevens não pudesse lutar na Segunda Guerra Mundial por causa de sua deficiência visual, seu irmão esteve ausente durante toda a guerra; seus pais sintonizavam todas as noites na BBC para atualizações. Stevens formou-se em física de engenharia na universidade, cobrindo tópicos desde o projeto de máquinas motorizadas até a física básica, que era ensinada pelo departamento de física. Durante os verões, ele trabalhou na indústria de defesa, incluindo um verão em uma empresa que estava desenvolvendo radar. Ele recebeu seus diplomas SB e SM em 1945.

Stevens era professor desde os anos de graduação, quando dava aulas sobre economia doméstica que envolviam alguns aspectos da física. Depois de receber seu diploma de mestre, ele ficou na Universidade de Toronto como instrutor, dando cursos para jovens que retornavam da guerra, incluindo seu próprio irmão mais velho. Ele foi membro da Ontario Foundation de 1945 a 1946, depois trabalhou como instrutor na University of Toronto até 1948.

Durante sua pesquisa de mestrado, Stevens se interessou pela teoria do controle e fez cursos no departamento de matemática aplicada, onde um de seus professores recomendou que ele se inscrevesse no MIT para estudos de doutorado.

Estudos de doutorado

Pouco depois de Stevens ser admitido no MIT, um novo professor chamado Leo Beranek percebeu que Stevens havia estudado acústica. Beranek contatou Stevens em Toronto, para perguntar se ele seria um assistente de ensino para o novo curso de acústica de Beranek, e Stevens concordou. Pouco depois disso, Beranek contatou Stevens novamente para oferecer-lhe uma posição de pesquisa em um novo projeto de discurso, que Stevens também aceitou. O Laboratório de Radiação do MIT (prédio 20) foi convertido, após a guerra, no Laboratório de Pesquisa de Eletrônica (RLE); entre outros laboratórios, o RLE hospedou o novo Laboratório de Acústica de Beranek.

Em novembro de 1949, o escritório ao lado do de Ken foi cedido a um estudante de doutorado visitante da Suécia chamado Gunnar Fant , com quem formou uma amizade e colaboração que duraria mais de meio século. Stevens se concentrou no estudo das vogais durante sua pesquisa de doutorado; em 1950, ele publicou um pequeno artigo argumentando que a autocorrelação poderia ser usada para discriminar vogais, enquanto sua tese de doutorado de 1952 relatou resultados perceptivos para vogais sintetizadas usando um conjunto de ressonadores eletrônicos. Fant convenceu Stevens de que um modelo de linha de transmissão do trato vocal era mais flexível do que um modelo de ressonador e os dois publicaram esse trabalho juntos em 1953.

Ken atribui a Fant a associação entre o Departamento de Linguística e o Laboratório de Pesquisa para Eletrônica do MIT. Roman Jakobson , um fonologista em Harvard , tinha um escritório no MIT em 1957, enquanto Morris Halle ingressou no Departamento de Linguística do MIT e mudou-se para RLE em 1951. As colaborações de Stevens com Halle começaram com a acústica, mas passaram a se concentrar na maneira como a acústica e a articulação organiza os sistemas sonoros da linguagem.

Stevens defendeu sua tese de doutorado em 1952; seu comitê de doutorado incluiu seu conselheiro Leo Beranek , bem como JCR Licklider e Walter A. Rosenblith . Depois de receber seu doutorado, Stevens foi trabalhar na Bolt, Beranek e Newman (agora BBN Technologies ) em Harvard Square. No início dos anos 1950, Beranek decidiu se aposentar do corpo docente do MIT para trabalhar em tempo integral na BBN. Ele sabia que Stevens adorava ensinar, então encorajou Stevens a se candidatar a um cargo no corpo docente do MIT. Stevens fez isso e ingressou no corpo docente em 1954.

Pesquisa, ensino e serviço

Contribuições científicas

Stevens é mais conhecido por suas contribuições aos campos da Fonologia , percepção da fala e produção da fala . O livro mais conhecido de Stevens, Acoustic Phonetics, é organizado de acordo com as características distintivas do sistema fonológico de Stevens.

Contribuições para a fonologia

Stevens talvez seja mais conhecido por sua proposta de teoria que responde à pergunta: por que os sons das línguas do mundo (seus fonemas ou segmentos) são tão semelhantes entre si? Ao aprender uma língua estrangeira pela primeira vez, ficamos impressionados com as diferenças notáveis ​​que podem existir entre o sistema de som de uma língua e o de qualquer outra. Stevens virou a percepção do aluno de cabeça para baixo: em vez de perguntar por que as línguas são diferentes, ele perguntou, se o sistema de som de cada língua é completamente arbitrário, por que as línguas são tão semelhantes? Sua resposta é a teoria quântica da fala . A teoria quântica é apoiada por uma teoria da mudança de linguagem, desenvolvida em colaboração com Samuel Jay Keyser , que postula a existência de recursos redundantes ou de aprimoramento.

A metodologia de Stevens na investigação dos sons da fala está organizada em três etapas. O primeiro passo é usar a física (principalmente modelos de tubos) para modelar a forma dos articuladores (por exemplo, as formas da cavidade frontal e traseira, arredondamento ou não arredondamento dos lábios, etc.). Com base nos modelos de tubo articulatório, podem ser calculadas as frequências ressonantes, que são as frequências dos formantes. Uma vez que as frequências ressonantes são calculadas, os dados da fala são coletados e analisados ​​para comparar com os cálculos teóricos. Este segundo estágio é principalmente experimental, onde tokens de interesse são geralmente registrados isoladamente e / ou incorporados em uma frase portadora controlada, geralmente falada por vários falantes nativos do sexo feminino / masculino. A chave para a coleta de dados é controlar o máximo possível de fatores para que a evidência acústica de interesse possa ser investigada com o mínimo de artefatos. A última etapa da investigação é comparar os resultados dos dados com as previsões teóricas e dar conta das diferenças que ocorrem. As diferenças às vezes podem ser explicadas pelo fato de que os modelos de tubo geralmente são simplificados para não contabilizar as perdas devido à suavidade das paredes vocais (embora resistores possam ser adicionados ao modelo teórico). O sistema subglótico também pode afetar o sistema produtivo do trato vocal quando a abertura glótica é grande (consulte a pesquisa sobre ressonância subglótica nos efeitos da fala). As previsões do modelo terapêutico podem fornecer previsões gerais sobre o que se pode esperar encontrar na fala real, e as evidências da fala real também podem ajudar a refinar o modelo original e fornecer uma visão melhor para a produção dos sons da fala.

A teoria quântica visa descrever (usando a física) de forma elegante e organizar todas as características acústicas de todos os sons possíveis em um matix. (Veja o capítulo cinco em Fonética Acústica) A restrição final em todos os sons da fala é o próprio sistema articulatório físico, apoiando assim a afirmação de que só pode haver um conjunto finito de sons entre as línguas. A razão de o conjunto de sons da fala ser finito é que enquanto o movimento dos articuladores é contínuo, apenas certas configurações tendem a ser articulatória e / ou acusticamente estáveis, dando origem a frequências fixas para formantes que formam sons relativamente universais para todos línguas (ou seja, vogais e consoantes). Cada som acústico pode, portanto, ser descrito por um punhado de características definidoras (geralmente binárias). Por exemplo, arredondamento labial (ativado ou desativado) é um recurso. A altura da língua (alta ou baixa) é outra característica. Além dessas características definidoras que servem como a descrição essencial dos sons acústicos, há também recursos de aprimoramento que ajudam a tornar os sons mais reconhecíveis. Para cada um desses recursos, pode-se aplicar a metodologia de Stevens para primeiro usar um modelo de tubo para modelar os articuladores e prever as frequências de ressonância, em seguida, coletar dados para examinar as propriedades acústicas desse recurso e, finalmente, reconciliar com o modelo teórico e resumir as propriedades acústicas desse recurso.

Para obter uma introdução ao mundo da ciência da fala, pode-se primeiro ler o livro "The Speech Chain", de Denes P. e Pinson E., onde se dá uma ampla visão geral da produção e transmissão da fala. Um é apresentado aos espectrogramas e frequências de formantes , que são a principal descrição acústica dos segmentos de som.

a glote

À medida que as pregas vocais vibram, sopros de ar são empurrados (filtrados) pelo trato vocal, produzindo som. Esta fonte de som é modelada como uma fonte de corrente em um circuito que modela a produção de som. Mudanças no trato vocal podem causar mudanças no som que é produzido. A frequência de vibração para as pregas vocais femininas tende a ser mais alta do que a dos homens, dando às vozes femininas um tom mais alto do que as masculinas.

Pesquisas (Hanson, HM 1997) mostraram que há uma diferença entre como mulheres e homens vibram suas pregas vocais; há uma propagação maior da glote feminina, o que dá às vozes femininas uma qualidade mais soprosa do que as masculinas.

o sistema subglotal

O sistema subglótico se refere ao sistema que está abaixo da glote no corpo humano. Inclui a traqueia , os brônquios e os pulmões . É essencialmente um sistema fixo, portanto, não muda para cada alto-falante individual. Resultados de pesquisas mostraram que durante a fase aberta do ciclo glótico (quando a glote está aberta), o acoplamento é introduzido devido ao sistema subglótico, manifestando-se acusticamente como pares pólo / zero no domínio da frequência. Esses pares pólo / zero introduzidos pelo serviço de acoplamento são hipotetizados para servir como regiões proibidas ou instáveis ​​no espectro, servindo como limites naturais para características vocálicas como + frente ou + atrás.

Para homens adultos, as frequências ressonantes de seu sistema subglotal foram observadas como 600, 1550 e 2200 Hz. (Acoustic Phoentics, pág. 197). Uma forma não invasiva de medir esses picos é usar um acelerômetro colocado acima da fúrcula esternal (Henke) para registrar a aceleração da pele durante a fonação. A vibração capturaria as frequências de ressonância abaixo da glote (do sistema subglótico).

o trato vocal

O trato vocal se refere à via de passagem que fica acima da glote, até a abertura dos lábios. Um modelo de dois tubos é geralmente usado para modelar o trato vocal, um capturando a dimensão (área da seção transversal e comprimento) da cavidade posterior, o outro modelando a cavidade frontal. As frequências ressonantes calculadas a partir do modelo de tubo são as frequências dos formantes. Para produzir a vogal schwa / ə /, o trato vocal é relativamente aberto desde a glote até a boca, portanto, o modelo de tubo pode ser pensado como um tubo aberto relativamente uniforme, tornando as frequências ressonantes (ou formantes) uniformemente separadas . A radiação na boca faria com que essas frequências de ressonância fossem cerca de cinco por cento mais baixas. (Fonética Acústica, pág. 139) Os tratos vocais femininos (média de 14,1cm) são em média mais curtos que os masculinos (média de 17,7cm), fazendo com que tenham frequências de formantes mais altas do que os masculinos.

Como as paredes do trato vocal são moles, a energia é perdida no trato vocal, o que aumenta a largura de banda dos formantes.

a cavidade nasal

Quando a porta velofaríngea se abre durante a produção de determinados sons, como / n / e / m /, ocorre o acoplamento devido à cavidade naval, o que confere à saída uma qualidade nasal.

Contribuições para a percepção da fala

A teoria quântica sugere que o inventário fonológico de uma língua é definido principalmente pelas características acústicas de cada segmento, com limites especificados pelo mapeamento acústico-articulatório. A implicação é que os segmentos fonológicos devem ter algum tipo de invariância acústica. Blumstein e Stevens demonstraram o que parecia ser uma relação invariável entre o espectro acústico e o som percebido: adicionando energia ao espectro de burst de "pa" em uma determinada frequência, é possível transformá-lo em "ta" ou "ka" respectivamente, dependendo da frequência. A presença de energia extra causa a percepção da consoante lingual; sua ausência causa percepção do labial.

O trabalho recente de Stevens reestruturou a teoria da invariância acústica em um modelo perceptivo hierárquico raso, o modelo de marcos acústicos e características distintivas .

Contribuições para a produção da fala

Enquanto estava em licença sabática no KTH na Suécia em 1962, Stevens foi voluntário como participante em experimentos de cineradiografia conduzidos por Sven Öhman. Os filmes cineradiográficos de Stevens estão entre os mais amplamente distribuídos; existem cópias em disco laser e algumas estão disponíveis online.

Depois de retornar ao MIT, Stevens concordou em supervisionar a pesquisa de um estudante de odontologia chamado Joseph S. Perkell. O conhecimento de Perkell de anatomia oral permitiu-lhe traçar os filmes de raios-X de Stevens no papel e publicar os resultados.

Outras contribuições ao estudo da produção da fala incluem um modelo pelo qual se pode predizer a forma espectral da excitação turbulenta da fala (dependendo das dimensões do jato turbulento) e trabalhos relacionados às configurações das pregas vocais que levam a diferentes modos de fonação.

Stevens como mentor

Stevens ingressou no MIT como professor assistente em 1954. Ele se tornou professor associado em 1957, professor titular em 1963 e foi nomeado professor presidido do Clarence J. Lebel em 1977. Um de seus colaboradores de longa data, Dennis Klatt (que (escreveu DECtalk enquanto trabalhava no laboratório de Stevens), disse que "Como líder, Ken é conhecido por sua devoção aos alunos e sua capacidade milagrosa de dirigir um laboratório movimentado enquanto aparenta administrar por um princípio de anarquia benevolente."

A primeira tese de doutorado que Stevens assinou no MIT foi a de seu colega, James L. Flanagan , em 1955. Flanagan começou a pós-graduação no MIT no mesmo ano que Stevens, mas sem um mestrado anterior; ele obteve seu mestrado em 1950 sob a supervisão de Beranek e, em seguida, concluiu sua tese de doutorado sob a supervisão de Stevens em 1955.

Stevens estimou em 2001 que ele havia orientado aproximadamente quarenta Ph.D. candidatos.

Por ocasião do recebimento da Medalha de Ouro da Acoustical Society of America, em 1995, colegas escreveram do Stevens 'Speech Group que "durante sua existência de quase quatro décadas" se destacou no apoio que prestou a mulheres pesquisadoras, muitas das quais passaram a ocupar os escalões superiores dos laboratórios de pesquisa em todo o mundo. " O laboratório de Stevens foi referido pelos colegas como um "tesouro nacional"

Serviço profissional

Stevens foi ativo na Acoustical Society of America desde seu tempo como estudante de graduação. Ele foi membro do conselho executivo de 1963 a 1966, vice-presidente de 1971–2 e presidente da sociedade de 1976–7. Ele é um Fellow da ASA. Em 1983 recebeu a Medalha de Prata em Comunicação da Fala e, em 1995, recebeu a Medalha de Ouro da sociedade.

Stevens também foi ativo no IEEE , onde ocupou o posto de IEEE Life Fellow. Em 2004, Ken Stevens e Gunnar Fant foram os primeiros vencedores do Prêmio IEEE James L. Flanagan de Processamento de Fala e Áudio .

Stevens foi membro da Academia Americana de Artes e Ciências , membro da Academia Nacional de Engenharia , membro da Academia Nacional de Ciências e recebeu em 1999 a Medalha Nacional de Ciência dos Estados Unidos .

Referências

links externos