Contraste (estatísticas) - Contrast (statistics)

Em estatística , particularmente em análise de variância e regressão linear , um contraste é uma combinação linear de variáveis ​​( parâmetros ou estatísticas ) cujos coeficientes somam zero, permitindo a comparação de diferentes tratamentos.

Definições

Let Ser um conjunto de variáveis, sejam parâmetros ou estatísticas , e ser constantes conhecidas. A quantidade é uma combinação linear. É chamado de contraste se . Além disso, dois contrastes, e , são ortogonais se .

Exemplos

Vamos imaginar que estamos comparando quatro meios ,. A tabela a seguir descreve três contrastes possíveis:

1 -1 0 0
0 0 1 -1
1 1 -1 -1

O primeiro contraste permite a comparação da primeira média com a segunda, o segundo contraste permite a comparação da terceira média com a quarta e o terceiro contraste permite a comparação da média das duas primeiras com a média das duas últimas.

Em uma análise de variância unilateral balanceada , o uso de contrastes ortogonais tem a vantagem de particionar completamente a soma dos quadrados do tratamento em componentes aditivos não sobrepostos que representam a variação devido a cada contraste. Considere os números acima: cada uma das linhas soma zero (portanto, eles são contrastes). Se multiplicarmos cada elemento da primeira e segunda linha e somarmos, isso novamente resultará em zero, portanto, o primeiro e o segundo contraste são ortogonais e assim por diante.

Conjuntos de contraste

  • Contrastes ortogonais são um conjunto de contrastes em que, para qualquer par distinto, a soma dos produtos cruzados dos coeficientes é zero (suponha que os tamanhos das amostras sejam iguais). Embora existam conjuntos potencialmente infinitos de contrastes ortogonais, dentro de qualquer conjunto sempre haverá um máximo de exatamente k  - 1 contrastes ortogonais possíveis (onde k é o número de médias de grupo disponíveis).
  • Contrastes polinomiais são um conjunto especial de contrastes ortogonais que testam padrões polinomiais em dados com mais de duas médias (por exemplo, linear, quadrático, cúbico, quártico, etc.).
  • Contrastes ortonormais são contrastes ortogonais que satisfazem a condição adicional de que, para cada contraste, a soma dos quadrados dos coeficientes é um.

Fundo

Um contraste é definido como a soma da média de cada grupo multiplicada por um coeficiente para cada grupo (ou seja, um número com sinal, c j ). Na forma de equação , onde L é a soma ponderada das médias do grupo, os coeficientes c j representam os pesos atribuídos das médias (estes devem somar 0 para contrastes ortogonais) e j representa as médias do grupo. Os coeficientes podem ser positivos ou negativos e frações ou números inteiros, dependendo da comparação de interesse. Contrastes lineares são muito úteis e podem ser usados ​​para testar hipóteses complexas quando usados ​​em conjunto com ANOVA ou regressão múltipla. Em essência, cada contraste define e testa um padrão particular de diferenças entre os meios.

Os contrastes devem ser construídos "para responder a questões específicas de pesquisa" e não precisam ser necessariamente ortogonais.

Um contraste simples (não necessariamente ortogonal) é a diferença entre dois meios. Um contraste mais complexo pode testar diferenças entre várias médias (por exemplo, com quatro médias, atribuindo coeficientes de –3, –1, +1 e +3) ou testar a diferença entre uma única média e a média combinada de vários grupos ( por exemplo, se você tiver quatro médias, atribua coeficientes de –3, +1, +1 e +1) ou teste a diferença entre a média combinada de vários grupos e a média combinada de vários outros grupos (ou seja, com quatro médias, atribua coeficientes de -1, -1, +1 e +1). Os coeficientes para as médias a serem combinadas (ou médias) devem ser os mesmos em magnitude e direção, ou seja, igualmente ponderados. Quando as médias são atribuídas a coeficientes diferentes (em magnitude ou direção, ou ambos), o contraste está testando a diferença entre essas médias. Um contraste pode ser qualquer um dos seguintes: o conjunto de coeficientes usados ​​para especificar uma comparação; o valor específico da combinação linear obtida para um determinado estudo ou experimento; a quantidade aleatória definida pela aplicação da combinação linear aos efeitos do tratamento quando estes são considerados como variáveis ​​aleatórias. No último contexto, o termo variável de contraste é algumas vezes usado.

Os contrastes às vezes são usados ​​para comparar efeitos mistos . Um exemplo comum é a diferença entre duas pontuações em testes - uma no início do semestre e outra no final. Observe que não estamos interessados ​​em uma dessas pontuações por si só, mas apenas no contraste (neste caso - a diferença). Como esta é uma combinação linear de variáveis ​​independentes, sua variância é igual à soma ponderada das variâncias da soma; neste caso, os dois pesos são um. Essa "combinação" de duas variáveis ​​em uma pode ser útil em muitos casos, como ANOVA , regressão ou mesmo como estatística descritiva por si só.

Um exemplo de contraste complexo seria comparar 5 tratamentos padrão a um novo tratamento, portanto, dar a cada tratamento antigo uma média de peso de 1/5, e o novo sexto tratamento significa um peso de -1 (usando a equação acima). Se esta nova combinação linear tiver uma média zero, isso significará que não há evidências de que os tratamentos antigos sejam diferentes do novo tratamento em média. Se a soma da nova combinação linear for positiva, há alguma evidência (a força da evidência é frequentemente associada ao valor p calculado nessa combinação linear) de que a média combinada dos 5 tratamentos padrão é maior do que o novo tratamento mau. Conclusões análogas são obtidas quando a combinação linear é negativa. No entanto, a soma da combinação linear não é um teste de significância, consulte a significância do teste (abaixo) para saber como determinar se o contraste calculado a partir da amostra é significativo.

Os resultados usuais para combinações lineares de variáveis ​​aleatórias independentes significam que a variância de um contraste é igual à soma ponderada das variâncias. Se dois contrastes forem ortogonais , as estimativas criadas usando esses contrastes não serão correlacionadas . Se contrastes ortogonais estiverem disponíveis, é possível resumir os resultados de uma análise estatística na forma de uma tabela de análise de variância simples, de forma que contenha os resultados de diferentes estatísticas de teste relacionadas a contrastes diferentes, cada um dos quais é estatisticamente independente. Os contrastes lineares podem ser facilmente convertidos em somas de quadrados . Contraste SS = , com 1 grau de liberdade , onde n representa o número de observações por grupo. Se os contrastes forem ortogonais, a soma dos contrastes SS = tratamento SS . Testar a significância de um contraste requer o cálculo do contraste SS .

Significância do teste

O contraste SS também é um quadrado médio porque todos os contrastes têm 1 grau de liberdade. A divisão por produz uma estatística F com um e graus de liberdade, a significância estatística do contraste F pode ser determinada comparando a estatística F obtida com um valor crítico de F com os mesmos graus de liberdade.

Referências

  • Casella, George; Berger, Roger L (2001). Inferência estatística . Cengage Learning. ISBN 9780534243128.
  • George Casella (2008). Desenho estatístico . Springer . ISBN 978-0-387-75965-4.
  • Everitt, BS; Skrondal, A (2010). Dicionário de estatísticas de Cambridge (4ª ed.). Cambridge University Press . ISBN 9780521766999.
  • Dean, Angela M .; Voss, Daniel (1999). Projeto e análise de experimentos . Springer . ISBN 9780387985619.

links externos

Notas