Contraste (estatísticas) - Contrast (statistics)
Em estatística , particularmente em análise de variância e regressão linear , um contraste é uma combinação linear de variáveis ( parâmetros ou estatísticas ) cujos coeficientes somam zero, permitindo a comparação de diferentes tratamentos.
Definições
Let Ser um conjunto de variáveis, sejam parâmetros ou estatísticas , e ser constantes conhecidas. A quantidade é uma combinação linear. É chamado de contraste se . Além disso, dois contrastes, e , são ortogonais se .
Exemplos
Vamos imaginar que estamos comparando quatro meios ,. A tabela a seguir descreve três contrastes possíveis:
1 | -1 | 0 | 0 |
0 | 0 | 1 | -1 |
1 | 1 | -1 | -1 |
O primeiro contraste permite a comparação da primeira média com a segunda, o segundo contraste permite a comparação da terceira média com a quarta e o terceiro contraste permite a comparação da média das duas primeiras com a média das duas últimas.
Em uma análise de variância unilateral balanceada , o uso de contrastes ortogonais tem a vantagem de particionar completamente a soma dos quadrados do tratamento em componentes aditivos não sobrepostos que representam a variação devido a cada contraste. Considere os números acima: cada uma das linhas soma zero (portanto, eles são contrastes). Se multiplicarmos cada elemento da primeira e segunda linha e somarmos, isso novamente resultará em zero, portanto, o primeiro e o segundo contraste são ortogonais e assim por diante.
Conjuntos de contraste
- Contrastes ortogonais são um conjunto de contrastes em que, para qualquer par distinto, a soma dos produtos cruzados dos coeficientes é zero (suponha que os tamanhos das amostras sejam iguais). Embora existam conjuntos potencialmente infinitos de contrastes ortogonais, dentro de qualquer conjunto sempre haverá um máximo de exatamente k - 1 contrastes ortogonais possíveis (onde k é o número de médias de grupo disponíveis).
- Contrastes polinomiais são um conjunto especial de contrastes ortogonais que testam padrões polinomiais em dados com mais de duas médias (por exemplo, linear, quadrático, cúbico, quártico, etc.).
- Contrastes ortonormais são contrastes ortogonais que satisfazem a condição adicional de que, para cada contraste, a soma dos quadrados dos coeficientes é um.
Fundo
Um contraste é definido como a soma da média de cada grupo multiplicada por um coeficiente para cada grupo (ou seja, um número com sinal, c j ). Na forma de equação , onde L é a soma ponderada das médias do grupo, os coeficientes c j representam os pesos atribuídos das médias (estes devem somar 0 para contrastes ortogonais) e j representa as médias do grupo. Os coeficientes podem ser positivos ou negativos e frações ou números inteiros, dependendo da comparação de interesse. Contrastes lineares são muito úteis e podem ser usados para testar hipóteses complexas quando usados em conjunto com ANOVA ou regressão múltipla. Em essência, cada contraste define e testa um padrão particular de diferenças entre os meios.
Os contrastes devem ser construídos "para responder a questões específicas de pesquisa" e não precisam ser necessariamente ortogonais.
Um contraste simples (não necessariamente ortogonal) é a diferença entre dois meios. Um contraste mais complexo pode testar diferenças entre várias médias (por exemplo, com quatro médias, atribuindo coeficientes de –3, –1, +1 e +3) ou testar a diferença entre uma única média e a média combinada de vários grupos ( por exemplo, se você tiver quatro médias, atribua coeficientes de –3, +1, +1 e +1) ou teste a diferença entre a média combinada de vários grupos e a média combinada de vários outros grupos (ou seja, com quatro médias, atribua coeficientes de -1, -1, +1 e +1). Os coeficientes para as médias a serem combinadas (ou médias) devem ser os mesmos em magnitude e direção, ou seja, igualmente ponderados. Quando as médias são atribuídas a coeficientes diferentes (em magnitude ou direção, ou ambos), o contraste está testando a diferença entre essas médias. Um contraste pode ser qualquer um dos seguintes: o conjunto de coeficientes usados para especificar uma comparação; o valor específico da combinação linear obtida para um determinado estudo ou experimento; a quantidade aleatória definida pela aplicação da combinação linear aos efeitos do tratamento quando estes são considerados como variáveis aleatórias. No último contexto, o termo variável de contraste é algumas vezes usado.
Os contrastes às vezes são usados para comparar efeitos mistos . Um exemplo comum é a diferença entre duas pontuações em testes - uma no início do semestre e outra no final. Observe que não estamos interessados em uma dessas pontuações por si só, mas apenas no contraste (neste caso - a diferença). Como esta é uma combinação linear de variáveis independentes, sua variância é igual à soma ponderada das variâncias da soma; neste caso, os dois pesos são um. Essa "combinação" de duas variáveis em uma pode ser útil em muitos casos, como ANOVA , regressão ou mesmo como estatística descritiva por si só.
Um exemplo de contraste complexo seria comparar 5 tratamentos padrão a um novo tratamento, portanto, dar a cada tratamento antigo uma média de peso de 1/5, e o novo sexto tratamento significa um peso de -1 (usando a equação acima). Se esta nova combinação linear tiver uma média zero, isso significará que não há evidências de que os tratamentos antigos sejam diferentes do novo tratamento em média. Se a soma da nova combinação linear for positiva, há alguma evidência (a força da evidência é frequentemente associada ao valor p calculado nessa combinação linear) de que a média combinada dos 5 tratamentos padrão é maior do que o novo tratamento mau. Conclusões análogas são obtidas quando a combinação linear é negativa. No entanto, a soma da combinação linear não é um teste de significância, consulte a significância do teste (abaixo) para saber como determinar se o contraste calculado a partir da amostra é significativo.
Os resultados usuais para combinações lineares de variáveis aleatórias independentes significam que a variância de um contraste é igual à soma ponderada das variâncias. Se dois contrastes forem ortogonais , as estimativas criadas usando esses contrastes não serão correlacionadas . Se contrastes ortogonais estiverem disponíveis, é possível resumir os resultados de uma análise estatística na forma de uma tabela de análise de variância simples, de forma que contenha os resultados de diferentes estatísticas de teste relacionadas a contrastes diferentes, cada um dos quais é estatisticamente independente. Os contrastes lineares podem ser facilmente convertidos em somas de quadrados . Contraste SS = , com 1 grau de liberdade , onde n representa o número de observações por grupo. Se os contrastes forem ortogonais, a soma dos contrastes SS = tratamento SS . Testar a significância de um contraste requer o cálculo do contraste SS .
Significância do teste
O contraste SS também é um quadrado médio porque todos os contrastes têm 1 grau de liberdade. A divisão por produz uma estatística F com um e graus de liberdade, a significância estatística do contraste F pode ser determinada comparando a estatística F obtida com um valor crítico de F com os mesmos graus de liberdade.
Referências
- Casella, George; Berger, Roger L (2001). Inferência estatística . Cengage Learning. ISBN 9780534243128.
- George Casella (2008). Desenho estatístico . Springer . ISBN 978-0-387-75965-4.
- Everitt, BS; Skrondal, A (2010). Dicionário de estatísticas de Cambridge (4ª ed.). Cambridge University Press . ISBN 9780521766999.
- Dean, Angela M .; Voss, Daniel (1999). Projeto e análise de experimentos . Springer . ISBN 9780387985619.
links externos
- Exemplos de contrastes ortogonais para análise de variância
- Análise de contraste (Abdi & Williams, 2010)