Artefatos de toque - Ringing artifacts

Imagem mostrando artefatos de toque. 3 níveis em cada lado da transição: ultrapassagem, primeiro anel e segundo anel (fraco).
Mesma imagem sem artefatos de toque.

No processamento de sinal , particularmente no processamento de imagem digital , artefatos de toque são artefatos que aparecem como sinais espúrios perto de transições nítidas em um sinal. Visualmente, eles aparecem como faixas ou "fantasmas" perto das bordas; audivelmente, eles aparecem como "ecos" próximos a transientes , particularmente sons de instrumentos de percussão ; mais perceptíveis são os pré-ecos . O termo "toque" ocorre porque o sinal de saída oscila a uma taxa de desvanecimento em torno de uma transição abrupta na entrada, semelhante a um sino após ser tocado. Tal como acontece com outros artefatos, sua minimização é um critério no design do filtro .

Introdução

A principal causa dos artefatos de toque é o overshoot e as oscilações na resposta ao degrau de um filtro.

A principal causa de artefatos de toque é devido a um sinal ser limitado em banda (especificamente, não ter altas frequências) ou passar por um filtro passa-baixa ; esta é a descrição do domínio da frequência . Em termos de domínio do tempo , a causa desse tipo de toque são as ondulações na função sinc , que é a resposta ao impulso (representação no domínio do tempo) de um filtro passa-baixo perfeito. Matematicamente, isso é chamado de fenômeno de Gibbs .

Pode-se distinguir overshoot (e undershoot), que ocorre quando as transições são acentuadas - a saída é mais alta do que a entrada - de toque, onde após um overshoot, o sinal é corrigido e agora está abaixo do valor alvo; esses fenômenos freqüentemente ocorrem juntos e, portanto, são freqüentemente combinados e chamados em conjunto de "toque".

O termo "toque" é mais frequentemente usado para ondulações no domínio do tempo , embora às vezes também seja usado para efeitos no domínio da frequência : colocar um filtro em janelas no domínio do tempo por uma função retangular causa ondulações no domínio da frequência pela mesma razão que um filtro passa-baixo de parede de tijolo (função retangular no domínio da frequência ) causa ondulações no domínio do tempo , em cada caso a transformada de Fourier da função retangular sendo a função sinc.

Existem artefatos relacionados causados ​​por outros efeitos no domínio da frequência e artefatos semelhantes devido a causas não relacionadas.

Causas

Descrição

A função sinc , a resposta ao impulso para um filtro passa-baixa ideal , ilustrando o toque de um impulso.
O fenômeno de Gibbs , ilustrando o toque de uma função de degrau .

Por definição, o ringing ocorre quando uma entrada não oscilante produz uma saída oscilante: formalmente, quando um sinal de entrada que é monotônico em um intervalo tem uma resposta de saída que não é monotônica. Isso ocorre mais severamente quando a resposta ao impulso ou resposta ao degrau de um filtro tem oscilações - menos formalmente, se para uma entrada de pico, respectivamente uma entrada de degrau (uma transição abrupta), a saída tem saliências. O toque mais comumente se refere ao toque gradual, e esse será o foco.

Tocando está intimamente relacionado com ultrapassagem e Undershoot, que é quando a saída assume valores mais elevado do que o valor máximo (respectivamente, inferiores ao mínimo) valor de entrada: um pode ter um sem o outro, mas em casos importantes, tais como uma baixa filtro passa , um primeiro ultrapassou, então a resposta salta para trás abaixo do nível de estado estacionário, causando o primeiro anel, e então oscila para frente e para trás acima e abaixo do nível de estado estacionário. Assim, o overshoot é a primeira etapa do fenômeno, enquanto o toque é a segunda e as etapas subsequentes. Devido a essa conexão estreita, os termos são freqüentemente confundidos, com "toque" se referindo tanto ao overshoot inicial quanto aos anéis subsequentes.

Se alguém tem um filtro linear invariante no tempo (LTI), então pode-se entender o filtro e toque em termos de resposta ao impulso (a visão no domínio do tempo), ou em termos de sua transformada de Fourier, a resposta de frequência (a visão no domínio da frequência) . O toque é um artefato no domínio do tempo e, no projeto do filtro, é trocado pelas características desejadas do domínio da frequência: a resposta de frequência desejada pode causar toque, enquanto a redução ou eliminação do toque pode piorar a resposta da frequência.

filtro sinc

A integral senoidal para valores positivos, exibindo oscilação.

O exemplo central, e muitas vezes o que se entende por "artefatos de toque", é o filtro passa-baixa ideal ( parede de tijolos ) , o filtro sinc . Isso tem uma função de resposta de impulso oscilatório, conforme ilustrado acima, e a resposta ao degrau - sua integral, a integral de seno - também apresenta oscilações, conforme ilustrado à direita.

Esses artefatos de toque não são resultados de implementação imperfeita ou de janelas: o filtro passa-baixo ideal, embora possua a resposta de frequência desejada, necessariamente causa artefatos de toque no domínio do tempo .

Domínio do tempo

Em termos de resposta ao impulso, a correspondência entre esses artefatos e o comportamento da função é a seguinte:

  • impulso inferior é equivalente à resposta ao impulso com valores negativos,
  • o toque de impulso (toque perto de um ponto) é precisamente equivalente à resposta ao impulso com oscilações, que é equivalente à derivada da resposta ao impulso alternando entre valores negativos e positivos,
  • e não há noção de ultrapassagem de impulso, pois o impulso unitário é assumido como tendo altura infinita (e integral 1 - uma função delta de Dirac ) e, portanto, não pode ser ultrapassada.

Passando para a resposta ao degrau, a resposta ao degrau é a parte integrante da resposta ao impulso ; formalmente, o valor da resposta ao degrau no tempo a é a integral da resposta ao impulso. Assim, os valores da resposta ao degrau podem ser entendidos em termos de integrais de cauda da resposta ao impulso.

Suponha que a integral geral da resposta ao impulso seja 1, portanto, ele envia uma entrada constante para a mesma constante que a saída - caso contrário, o filtro tem ganho e a escala por ganho fornece uma integral de 1.

  • A etapa inferior é equivalente a uma integral de cauda sendo negativa, caso em que a magnitude da subestimação é o valor da integral de cauda.
  • A ultrapassagem da etapa é equivalente a uma integral da cauda sendo maior que 1, caso em que a magnitude da ultrapassagem é a quantidade pela qual a integral da cauda excede 1 - ou equivalentemente o valor da cauda na outra direção, uma vez que estes somam 1 .
  • O toque de degrau é equivalente a integrais de cauda alternando entre crescentes e decrescentes - tomando derivadas, isso é equivalente à resposta ao impulso alternando entre valores positivos e negativos. Regiões onde uma resposta de impulso está abaixo ou acima do eixo x (formalmente, regiões entre zeros) são chamadas de lóbulos, e a magnitude de uma oscilação (do pico ao vale) é igual à integral do lóbulo correspondente.

A resposta ao impulso pode ter muitos lóbulos negativos e, portanto, muitas oscilações, cada um produzindo um anel, embora esses diminuam para filtros práticos e, portanto, geralmente só se vê alguns anéis, com o primeiro geralmente sendo mais pronunciado.

Observe que se a resposta ao impulso tiver lobos negativos pequenos e lobos positivos maiores, ela exibirá zumbido, mas não underhoot ou overshoot: a integral de cauda sempre estará entre 0 e 1, mas irá oscilar para baixo em cada lóbulo negativo. No entanto, no filtro sinc, os lóbulos diminuem monotonicamente em magnitude e alternam em sinal, como na série harmônica alternada e, portanto, integrais de cauda alternam em sinal também, de modo que exibe overshoot, bem como ringing.

Por outro lado, se a resposta ao impulso é sempre não negativa, então ela não tem lobos negativos - a função é uma distribuição de probabilidade - então a resposta ao degrau não exibirá nem toque, nem overshoot ou undershoot - será uma função monotônica crescendo de 0 a 1, como uma função de distribuição cumulativa . Assim, a solução básica da perspectiva do domínio do tempo é usar filtros com resposta ao impulso não negativa.

Domínio de frequência

A perspectiva do domínio da frequência é que o zumbido é causado pelo corte acentuado na banda passante retangular no domínio da frequência e, portanto, é reduzido por um roll-off mais suave , como discutido abaixo.

Soluções

As soluções dependem dos parâmetros do problema: se a causa for um filtro passa-baixa, pode-se escolher um projeto de filtro diferente, o que reduz os artefatos às custas de um pior desempenho no domínio da frequência. Por outro lado, se a causa for um sinal de banda limitada, como no JPEG, não se pode simplesmente substituir um filtro, e os artefatos de toque podem ser difíceis de corrigir - eles estão presentes no JPEG 2000 e em muitos codecs de compressão de áudio (na forma de pré-eco ), conforme discutido nos exemplos .

Filtro passa-baixo

A função gaussiana é não negativa e não oscilante, portanto, não causa overshoot ou ringing.

Se a causa for o uso de um filtro passa-baixa de parede de tijolo, pode-se substituir o filtro por um que reduza os artefatos no domínio do tempo, às custas do desempenho no domínio da frequência. Isso pode ser analisado do domínio do tempo ou da perspectiva do domínio da frequência.

No domínio do tempo, a causa é uma resposta ao impulso que oscila, assumindo valores negativos. Isso pode ser resolvido usando um filtro cuja resposta ao impulso é não negativa e não oscila, mas compartilha as características desejadas. Por exemplo, para um filtro passa-baixa, o filtro Gaussiano é não negativo e não oscilatório, portanto, não causa toque. No entanto, não é tão bom quanto um filtro passa-baixa: ele rola na faixa de passagem e vaza na faixa de parada : em termos de imagem, um filtro gaussiano "desfoca" o sinal, o que reflete a atenuação dos sinais de frequência mais alta desejados em a banda passante.

Uma solução geral é usar uma função de janela no filtro sinc, que corta ou reduz os lobos negativos: estes eliminam e reduzem respectivamente o overshoot e ringing. Observe que truncar alguns, mas não todos os lóbulos, elimina o zumbido além desse ponto, mas não reduz a amplitude do zumbido que não é truncado (porque isso é determinado pelo tamanho do lóbulo) e aumenta a magnitude do overshoot se o último lóbulo não cortado for negativo, uma vez que a magnitude do overshoot é a integral da cauda, que não é mais cancelada por lóbulos positivos.

Além disso, em implementações práticas, pelo menos trunca sinc, caso contrário, deve-se usar infinitamente muitos pontos de dados (ou melhor, todos os pontos do sinal) para calcular cada ponto da saída - o truncamento corresponde a uma janela retangular e torna o filtro praticamente implementável , mas a resposta de frequência não é mais perfeita. Na verdade, se alguém pega um filtro passa-baixa de parede de tijolos (sinc no domínio do tempo, retangular no domínio da frequência) e o trunca (multiplica com uma função retangular no domínio do tempo), isso convolve o domínio da frequência com sinc (transformada de Fourier de a função retangular) e causa zumbido no domínio da frequência , que é conhecido como ondulação . Em símbolos, o toque de frequência na faixa de parada também é conhecido como lóbulos laterais . Uma resposta plana na banda passante é desejável, então uma janela com funções cuja transformada de Fourier tem menos oscilações, então o comportamento no domínio da frequência é melhor.

A multiplicação no domínio do tempo corresponde à convolução no domínio da frequência, portanto, multiplicar um filtro por uma função de janela corresponde à convolução da transformada de Fourier do filtro original pela transformada de Fourier da janela, que tem um efeito de suavização - portanto, janela no tempo domínio corresponde à suavização no domínio da frequência e reduz ou elimina overshoot e ringing.

No domínio da frequência , a causa pode ser interpretada como devido ao corte acentuado (parede de tijolos) e ao toque reduzido pelo uso de um filtro com roll-off mais suave. Este é o caso do filtro Gaussiano, cujo gráfico de Bode de magnitude é uma parábola de abertura para baixo (roll-off quadrático), já que sua transformada de Fourier é novamente Gaussiana, portanto (em escala) - tomando rendimentos de logaritmos

Imagem externa
ícone de imagem Resposta ao impulso do filtro Butterworth e gráficos de resposta de frequência

Em filtros eletrônicos , a compensação entre a resposta no domínio da frequência e os artefatos de toque no domínio do tempo é bem ilustrada pelo filtro Butterworth : a resposta de frequência de um filtro Butterworth desce linearmente na escala logarítmica, com um filtro de primeira ordem tendo uma inclinação de -6 dB por oitava , um filtro de segunda ordem -12 dB por oitava, e um n ° de filtro a fim de ter declive dB por oitava - no limite, este aproxima-se de um filtro de parede de tijolos. Assim, entre esses, o filtro de primeira ordem rola mais lentamente e, portanto, exibe o menor número de artefatos no domínio do tempo, mas vaza mais na banda de interrupção, enquanto à medida que a ordem aumenta, o vazamento diminui, mas os artefatos aumentam.

Benefícios

O overshoot adicionado artificialmente ao redor da barra esquerda aumenta a acutância .

Embora os artefatos de toque sejam geralmente considerados indesejáveis, o overshoot inicial (halo) nas transições aumenta a acutância (nitidez aparente), aumentando a derivada ao longo da transição e, portanto, pode ser considerado como um aprimoramento.

Fenômenos relacionados

Overshoot

A função sinc tem integrais de cauda negativas, portanto, tem overshoot.
O filtro Lanczos de 2 lóbulos exibe apenas overshoot, enquanto o filtro de 3 lóbulos exibe overshoot e ringing.

Outro artefato é o overshoot (e undershoot), que se manifesta não como anéis, mas como um salto aumentado na transição. Está relacionado ao toque e freqüentemente ocorre em combinação com ele.

Overshoot e o undershoot são causados ​​por uma cauda negativa - no sinc, a integral do primeiro zero ao infinito, incluindo o primeiro lobo negativo. Enquanto o toque é causado por uma cauda positiva seguinte - em sinc, a integral do segundo zero ao infinito, incluindo o primeiro lobo positivo não central. Assim, o overshoot é necessário para o zumbido, mas pode ocorrer separadamente: por exemplo, o filtro Lanczos de 2 lóbulos tem apenas um único lóbulo negativo em cada lado, sem o seguinte lóbulo positivo e, portanto, exibe o overshoot, mas nenhum zumbido, enquanto o filtro de 3 lóbulos O filtro Lanczos exibe overshoot e ringing, embora o janelamento reduza isso em comparação com o filtro sinc ou o filtro sinc truncado.

Da mesma forma, o kernel de convolução usado na interpolação bicúbica é semelhante a um sinc de janela de 2 lóbulos, assumindo valores negativos e, portanto, produz artefatos de ultrapassagem, que aparecem como halos nas transições.

Clipping

Após o overshoot e undershoot está o recorte . Se o sinal for limitado, por exemplo, um número inteiro de 8 ou 16 bits, esse overshoot e undershoot podem exceder a faixa de valores permitidos, causando, assim, o corte.

Estritamente falando, o corte é causado pela combinação de overshoot e precisão numérica limitada, mas está intimamente associado ao toque e geralmente ocorre em combinação com ele.

O corte também pode ocorrer por razões não relacionadas, de um sinal simplesmente excedendo o alcance de um canal.

Por outro lado, o recorte pode ser explorado para ocultar o zumbido nas imagens. Alguns codecs JPEG modernos, como mozjpeg e ISO libjpeg , usam esse truque para reduzir o toque, causando deliberadamente overshoots nos resultados do IDCT. Essa ideia se originou em um patch mozjpeg.

Toque e ondulação

Resposta de frequência de um filtro Chebyshev de 5ª ordem , exibindo ondulação .

No processamento de sinais e campos relacionados, o fenômeno geral da oscilação no domínio do tempo é chamado de toque , enquanto as oscilações no domínio da frequência são geralmente chamadas de ondulação , embora geralmente não "ondulação".

Uma fonte chave de ondulação no processamento de sinal digital é o uso de funções de janela : se alguém pega um filtro de resposta ao impulso infinito (IIR), como o filtro sinc, e o Windows para fazer com que tenha resposta ao impulso finito , como no design da janela método , então a resposta de frequência do filtro resultante é a convolução da resposta de frequência do filtro IIR com a resposta de frequência da função de janela. Notavelmente, a resposta de frequência do filtro retangular é a função sinc (a função retangular e a função sinc são Fourier dual entre si) e, portanto, o truncamento de um filtro no domínio do tempo corresponde à multiplicação pelo filtro retangular, portanto, convolução por o filtro sinc no domínio da frequência, causando ondulação. Em símbolos, a resposta de frequência de é. Em particular, truncar a própria função sinc resulta no domínio do tempo e no domínio da frequência, assim como a filtragem passa-baixa (truncando no domínio da frequência) causa zumbido no domínio do tempo, truncando no domínio do tempo (janela por um filtro retangular) causa ondulação no domínio da frequência.

Exemplos

JPEG

Exemplo extremo de artefatos JPEG, incluindo toque: anéis ciano (= branco menos vermelho) ao redor de uma estrela vermelha.
Funções de base da transformação discreta do cosseno .

A compactação JPEG pode apresentar artefatos de toque em transições nítidas, que são particularmente visíveis no texto.

Isso ocorre devido à perda de componentes de alta frequência, como no toque de resposta ao degrau. JPEG usa blocos de 8 × 8 , nos quais a transformada discreta de cosseno (DCT) é executada. O DCT é uma transformação relacionada a Fourier , e o zumbido ocorre devido à perda de componentes de alta frequência ou perda de precisão em componentes de alta frequência.

Eles também podem ocorrer na borda de uma imagem: uma vez que o JPEG divide imagens em blocos de 8 × 8, se uma imagem não for um número inteiro de blocos, a borda não pode ser facilmente codificada e soluções como preencher com uma borda preta criam um transição nítida na origem, portanto, artefatos de toque na imagem codificada.

O toque também ocorre no JPEG 2000 baseado em wavelet .

JPEG e JPEG 2000 têm outros artefatos, conforme ilustrado acima, como bloqueio (" jaggies ") e ocupação de borda (" ruído de mosquito "), embora isso se deva a especificações dos formatos e não toque conforme discutido aqui.

Algumas ilustrações:

Imagem Compressão sem perdas Compressão com perda
Original Lossless-circle.png Lossy-circle.jpg
Processado pelo
detector de bordas Canny ,
destacando artefatos.
Lossless-circle-canny.png Lossy-circle-canny.png

Pré-eco

O pré-eco ocorre em percussões como pratos.

No processamento de sinal de áudio , o toque pode fazer com que ocorram ecos antes e depois de transientes , como o som impulsivo de instrumentos de percussão , como pratos (é o toque de impulso ). O eco ( causal ) após o transiente não é ouvido, porque é mascarado pelo transiente, um efeito denominado mascaramento temporal . Assim, apenas o eco ( anti-causal ) antes do transiente é ouvido, e o fenômeno é chamado de pré-eco .

Esse fenômeno ocorre como um artefato de compactação em algoritmos de compactação de áudio que usam transformações relacionadas a Fourier , como MP3 , AAC e Vorbis .

Fenômenos semelhantes

Outros fenômenos têm sintomas semelhantes ao zumbido, mas são distintos em suas causas. Nos casos em que causam artefatos circulares em torno de fontes pontuais, eles podem ser referidos como "anéis" devido à forma redonda (formalmente, um anel ), que não está relacionado ao fenômeno de frequência de "zumbido" (decaimento oscilatório) discutido nesta página .

Aprimoramento de borda

O aprimoramento das bordas , que visa aumentar as bordas, pode causar fenômenos de zumbido, especialmente sob aplicação repetida, como por um DVD player seguido por uma televisão. Isso pode ser feito pela filtragem passa- alta , em vez da filtragem passa-baixa.

Funções especiais

Muitas funções especiais exibem decaimento oscilatório e, portanto, convoluindo com tal função produz zumbidos na saída; pode-se considerar esses toques ou restringir o termo a artefatos não intencionais no processamento do sinal de domínio da frequência.

A difração de Fraunhofer produz o disco de Airy como função de propagação de pontos , que tem um padrão de toque.

Algumas funções de Bessel do primeiro tipo, mostrando decadência oscilatória.

A função de Bessel do primeiro tipo, que está relacionada à função de Airy , exibe tal decadência.

Combinações de desfocagem e aberração esférica exibem artefatos em anel.

Em câmeras, uma combinação de desfoque e aberração esférica pode produzir artefatos circulares (padrões de "anel"). No entanto, o padrão desses artefatos não precisa ser semelhante ao toque (conforme discutido nesta página) - eles podem exibir decadência oscilatória (círculos de intensidade decrescente) ou outros padrões de intensidade, como uma única banda brilhante.

Interferência

Ghosting é uma forma de interferência na televisão em que uma imagem é repetida. Embora isso não seja um zumbido, pode ser interpretado como convolução com uma função, que é 1 na origem e ε (a intensidade do fantasma) a alguma distância, que é formalmente semelhante às funções acima (um único pico discreto, em vez do que a oscilação contínua).

Reflexo de lente

Na fotografia, o reflexo da lente é um defeito em que vários círculos podem aparecer ao redor dos realces e com fantasmas ao longo de uma foto, devido à luz indesejada, como reflexo e dispersão de elementos na lente.

Ilusões visuais

Ilusões visuais podem ocorrer em transições, como em bandas de Mach , que perceptivamente exibem um undershoot / overshoot semelhante ao fenômeno de Gibbs.

Veja também

Referências