Confundindo - Confounding

Ilustração de um fator de confusão simples. Em outras palavras, Z é a causa de X e Y .

Em estatística, um fator de confusão (também variável de confusão , fator de confusão , determinante estranho ou variável oculta ) é uma variável que influencia tanto a variável dependente quanto a variável independente , causando uma associação espúria . Confundir é um conceito causal e, como tal, não pode ser descrito em termos de correlações ou associações.

Definição

Enquanto um mediador é um fator na cadeia causal (1), um fator de confusão é um fator espúrio que implica incorretamente causalidade (2)

A confusão é definida em termos do modelo de geração de dados (como na figura acima). Seja X alguma variável independente e Y alguma variável dependente . Para estimar o efeito de X em Y , o estatístico deve suprimir os efeitos de variáveis externas que influenciam ambos X e Y . Dizemos que X e Y são confundidos por alguma outra variável Z sempre que Z influencia causalmente ambos X e Y .

Seja a probabilidade do evento Y = y sob a intervenção hipotética X = x . X e Y não são confundidos se e somente se o seguinte for válido:

 

 

 

 

( 1 )

para todos os valores X = x e Y = y , onde é a probabilidade condicional ao ver X = x . Intuitivamente, essa igualdade afirma que X e Y não são confundidos sempre que a associação testemunhada por observação entre eles é a mesma que a associação que seria medida em um experimento controlado , com x randomizado .

Em princípio, a igualdade de definição pode ser verificada a partir do modelo de geração de dados, assumindo que temos todas as equações e probabilidades associadas ao modelo. Isso é feito simulando uma intervenção (consulte a rede bayesiana ) e verificando se a probabilidade resultante de Y é igual à probabilidade condicional . Acontece, entretanto, que a estrutura do gráfico por si só é suficiente para verificar a igualdade .

Ao controle

Considere um pesquisador tentando avaliar a eficácia do medicamento X , a partir de dados populacionais em que o uso do medicamento foi a escolha do paciente. Os dados mostram que o gênero ( Z ) influencia a escolha do medicamento pelo paciente, bem como suas chances de recuperação ( Y ). Nesse cenário, o gênero Z confunde a relação entre X e Y, uma vez que Z é uma causa de X e Y :

Diagrama causal de gênero como causa comum de uso e recuperação de drogas

Nós temos isso

 

 

 

 

( 2 )

porque a quantidade observacional contém informações sobre a correlação entre X e Z , e a quantidade de intervenção não (uma vez que X não está correlacionado com Z em um experimento aleatório). O estatístico deseja a estimativa não enviesada , mas nos casos em que apenas dados observacionais estão disponíveis, uma estimativa não enviesada só pode ser obtida "ajustando" para todos os fatores de confusão, ou seja, condicionando seus vários valores e calculando a média do resultado. No caso de um único confundidor Z , isso leva à "fórmula de ajuste":

 

 

 

 

( 3 )

o que dá uma estimativa imparcial para o efeito causal de X em Y . A mesma fórmula de ajuste funciona quando há múltiplos confundidores, exceto, neste caso, a escolha de um conjunto Z de variáveis ​​que garantam estimativas imparciais deve ser feita com cautela. O critério para uma escolha adequada de variáveis ​​é chamado de Back-Door e requer que o conjunto Z escolhido "bloqueie" (ou intercepte) todo caminho de X a Y que termina com uma seta em X. Esses conjuntos são chamados de "Back-Door admissível "e pode incluir variáveis ​​que não são causas comuns de X e Y , mas apenas suas representações.

Voltando ao exemplo do uso de drogas, uma vez que Z cumpre o requisito da porta traseira (ou seja, intercepta o caminho da porta traseira ), a fórmula de ajuste da porta traseira é válida:

 

 

 

 

( 4 )

Dessa forma, o médico pode prever o efeito provável da administração do medicamento a partir de estudos observacionais nos quais as probabilidades condicionais que aparecem no lado direito da equação podem ser estimadas por regressão.

Ao contrário das crenças comuns, adicionar covariáveis ​​ao conjunto de ajuste Z pode introduzir viés. Um contra-exemplo típico ocorre quando Z é um efeito comum de X e Y , um caso em que Z não é um fator de confusão (ou seja, o conjunto nulo é admissível por trás) e o ajuste para Z criaria um viés conhecido como " viés de colisor " ou " Paradoxo de Berkson ."

Em geral, a confusão pode ser controlada por ajuste se, e somente se, houver um conjunto de covariáveis ​​observadas que satisfaça a condição Back-Door. Além disso, se Z for esse conjunto, a fórmula de ajuste da Eq. (3) é válido <4,5>. O do-calculus de Pearl fornece condições adicionais sob as quais P ( y  | do ( x )) pode ser estimado, não necessariamente por ajuste.

História

Segundo Morabia (2011), a palavra deriva do verbo latino medieval "confudere", que significava "misturar", e provavelmente foi escolhida para representar a confusão (do latim: con = com + fusus = misturar ou fundir) entre os a causa que se deseja avaliar e outras causas que podem afetar o resultado e, portanto, confundir ou atrapalhar a avaliação desejada. Fisher usou a palavra "confundindo" em seu livro de 1935 "The Design of Experiments" para denotar qualquer fonte de erro em seu ideal de experimento aleatório. De acordo com Vandenbroucke (2004), foi Kish quem usou a palavra "confundindo" no sentido moderno da palavra, para significar "incomparabilidade" de dois ou mais grupos (por exemplo, exposto e não exposto) em um estudo observacional.

As condições formais que definem o que torna certos grupos "comparáveis" e outros "incomparáveis" foram posteriormente desenvolvidas em epidemiologia por Groenlândia e Robins (1986), usando a linguagem contrafactual de Neyman (1935) e Rubin (1974). Estes foram posteriormente complementados por critérios gráficos, como a condição Back-Door ( Pearl 1993; Greenland, Pearl e Robins, 1999).

Os critérios gráficos mostraram-se formalmente equivalentes à definição contrafactual, mas mais transparentes para pesquisadores que dependem de modelos de processo.

Tipos

No caso de avaliações de risco que avaliam a magnitude e a natureza do risco à saúde humana , é importante controlar a confusão para isolar o efeito de um perigo específico, como um aditivo alimentar, pesticida ou novo medicamento. Para estudos prospectivos, é difícil recrutar e selecionar voluntários com a mesma formação (idade, dieta, educação, geografia, etc.) e, em estudos históricos, pode haver variabilidade semelhante. Devido à incapacidade de controlar a variabilidade de voluntários e estudos em humanos, a confusão é um desafio particular. Por essas razões, os experimentos oferecem uma maneira de evitar a maioria das formas de confusão.

Em algumas disciplinas, a confusão é categorizada em diferentes tipos. Em epidemiologia , um tipo é "confusão por indicação", que se relaciona a confusão de estudos observacionais . Como os fatores prognósticos podem influenciar as decisões de tratamento (e estimativas de viés dos efeitos do tratamento), controlar os fatores prognósticos conhecidos pode reduzir esse problema, mas é sempre possível que um fator esquecido ou desconhecido não tenha sido incluído ou que os fatores interajam de maneira complexa. A confusão por indicação foi descrita como a limitação mais importante dos estudos observacionais. Os ensaios randomizados não são afetados por confusão por indicação devido à atribuição aleatória .

Variáveis ​​de confusão também podem ser categorizadas de acordo com sua fonte. A escolha do instrumento de medição (confusão operacional), características situacionais (confusão de procedimento) ou diferenças interindividuais (confusão de pessoa).

  • Uma confusão operacional pode ocorrer em projetos de pesquisa experimentais e não experimentais. Esse tipo de confusão ocorre quando uma medida projetada para avaliar um construto específico mede inadvertidamente outra coisa também.
  • Uma confusão de procedimento pode ocorrer em um experimento de laboratório ou quase-experimento . Esse tipo de confusão ocorre quando o pesquisador permite, por engano, que outra variável mude junto com a variável independente manipulada.
  • Uma pessoa que confunde ocorre quando dois ou mais grupos de unidades são analisados ​​em conjunto (por exemplo, trabalhadores de diferentes ocupações), embora variem de acordo com uma ou mais outras características (observadas ou não) (por exemplo, gênero).

Exemplos

Digamos que se esteja estudando a relação entre a ordem de nascimento (1º filho, 2º filho, etc.) e a presença da Síndrome de Down na criança. Nesse cenário, a idade materna seria uma variável de confusão:

  1. Maior idade materna está diretamente associada à Síndrome de Down na criança
  2. A idade materna mais elevada está diretamente associada à Síndrome de Down, independentemente da ordem de nascimento (uma mãe tendo seu primeiro ou terceiro filho aos 50 anos apresenta o mesmo risco)
  3. A idade materna está diretamente associada à ordem de nascimento (o 2º filho, exceto no caso de gêmeos, nasce quando a mãe é mais velha do que no nascimento do 1º filho)
  4. A idade materna não é consequência da ordem de nascimento (ter um 2º filho não altera a idade da mãe)

Nas avaliações de risco , fatores como idade, sexo e níveis educacionais geralmente afetam o estado de saúde e, portanto, devem ser controlados. Além desses fatores, os pesquisadores podem não considerar ou não ter acesso a dados sobre outros fatores causais. Um exemplo está no estudo do tabagismo na saúde humana. Fumar, beber álcool e fazer dieta são atividades relacionadas ao estilo de vida. Uma avaliação de risco que analisa os efeitos do tabagismo, mas não controla o consumo de álcool ou dieta, pode superestimar o risco do tabagismo. Fumar e causar confusão são analisados ​​nas avaliações de risco ocupacional, como a segurança da mineração de carvão. Quando não há uma grande amostra da população de não fumantes ou que não bebem em uma determinada ocupação, a avaliação de risco pode ser tendenciosa no sentido de encontrar um efeito negativo sobre a saúde.

Diminuindo o potencial de confusão

Uma redução no potencial de ocorrência e efeito de fatores de confusão pode ser obtida aumentando os tipos e números de comparações realizadas em uma análise. Se as medidas ou manipulações de construções centrais forem confundidas (ou seja, existem confusões operacionais ou procedimentais), a análise de subgrupo pode não revelar problemas na análise. Além disso, aumentar o número de comparações pode criar outros problemas (consulte as comparações múltiplas ).

A revisão por pares é um processo que pode ajudar a reduzir os casos de confusão, antes da implementação do estudo ou após a análise ter ocorrido. A revisão por pares se baseia na experiência coletiva dentro de uma disciplina para identificar potenciais fraquezas no desenho e na análise do estudo, incluindo maneiras pelas quais os resultados podem depender de confusão. Da mesma forma, a replicação pode testar a robustez dos resultados de um estudo sob condições de estudo alternativas ou análises alternativas (por exemplo, controlando para potenciais confusos não identificados no estudo inicial).

Os efeitos de confusão podem ser menos prováveis ​​de ocorrer e agir de forma semelhante em vários momentos e locais. Na seleção dos locais de estudo, o ambiente pode ser caracterizado em detalhes nos locais de estudo para garantir que os locais sejam ecologicamente semelhantes e, portanto, menos propensos a ter variáveis ​​de confusão. Por fim, pode-se estudar a relação entre as variáveis ​​ambientais que possivelmente confundem a análise e os parâmetros medidos. As informações relativas às variáveis ​​ambientais podem então ser usadas em modelos específicos do local para identificar a variância residual que pode ser devida a efeitos reais.

Dependendo do tipo de projeto de estudo em vigor, existem várias maneiras de modificar esse projeto para excluir ou controlar ativamente as variáveis ​​de confusão:

  • Os estudos de caso-controle atribuem fatores de confusão a ambos os grupos, casos e controles, igualmente. Por exemplo, se alguém deseja estudar a causa do infarto do miocárdio e pensa que a idade é uma provável variável de confusão, cada paciente com infarto de 67 anos será combinado com uma pessoa "controle" de 67 anos saudável. Em estudos de caso-controle, as variáveis ​​combinadas na maioria das vezes são a idade e o sexo. Desvantagem: Os estudos de caso-controle são viáveis ​​apenas quando é fácil encontrar controles, ou seja , pessoas cujo status em relação a todos os fatores de confusão potenciais conhecidos é o mesmo do paciente do caso: Suponha que um estudo de caso-controle tente encontrar a causa de uma determinada doença em uma pessoa que tem 1) 45 anos, 2) Afro-americano, 3) do Alasca , 4) um ávido jogador de futebol, 5) vegetariano e 6) que trabalha com educação. Um controle teoricamente perfeito seria uma pessoa que, além de não ter a doença que está sendo investigada, tem todas essas características e não tem doenças que o paciente também não tem - mas encontrar esse controle seria uma tarefa enorme.
  • Estudos de coorte : um grau de pareamento também é possível e muitas vezes é feito admitindo apenas certas faixas etárias ou um determinado sexo na população de estudo, criando uma coorte de pessoas que compartilham características semelhantes e, portanto, todas as coortes são comparáveis ​​no que diz respeito ao possível variável de confusão. Por exemplo, se idade e sexo são considerados fatores de confusão, apenas homens de 40 a 50 anos estariam envolvidos em um estudo de coorte que avaliaria o risco de infarto do miocárdio em coortes fisicamente ativas ou inativas. Desvantagem: Em estudos de coorte, a superexclusão de dados de entrada pode levar os pesquisadores a definirem de forma muito restrita o conjunto de pessoas em situação semelhante para as quais eles afirmam que o estudo é útil, de modo que outras pessoas a quem a relação causal de fato se aplica podem perder o oportunidade de se beneficiar das recomendações do estudo. Da mesma forma, a "superestratificação" dos dados de entrada em um estudo pode reduzir o tamanho da amostra em um determinado estrato a ponto de generalizações obtidas pela observação dos membros desse estrato isoladamente não serem estatisticamente significativas .
  • Cegamento duplo : oculta da população experimental e dos observadores a associação dos participantes ao grupo experimental. Ao evitar que os participantes saibam se estão recebendo tratamento ou não, o efeito placebo deve ser o mesmo para os grupos de controle e de tratamento. Ao evitar que os observadores saibam de sua filiação, não deve haver preconceito de pesquisadores tratando os grupos de forma diferente ou interpretando os resultados de forma diferente.
  • Ensaio controlado randomizado : Um método em que a população do estudo é dividida aleatoriamente a fim de mitigar as chances de auto-seleção dos participantes ou preconceito dos planejadores do estudo. Antes do início do experimento, os testadores designarão os membros do pool de participantes aos seus grupos (controle, intervenção, paralelo), usando um processo de randomização, como o uso de um gerador de números aleatórios. Por exemplo, em um estudo sobre os efeitos do exercício, as conclusões seriam menos válidas se os participantes pudessem escolher se queriam pertencer ao grupo de controle que não se exercitaria ou ao grupo de intervenção que estaria disposto a participar de um programa de exercícios. O estudo, então, capturaria outras variáveis ​​além do exercício, como níveis de saúde pré-experimento e motivação para adotar atividades saudáveis. Do lado do observador, o experimentador pode escolher candidatos com maior probabilidade de mostrar os resultados que o estudo deseja ver ou pode interpretar resultados subjetivos (mais enérgico, atitude positiva) de uma forma favorável aos seus desejos.
  • Estratificação : Como no exemplo acima, a atividade física é considerada um comportamento que protege contra o infarto do miocárdio; e a idade é considerada um possível fator de confusão. Os dados amostrados são então estratificados por faixa etária - isso significa que a associação entre atividade e infarto seria analisada por faixa etária. Se os diferentes grupos de idade (ou estratos de idade) geram razões de risco muito diferentes , a idade deve ser vista como uma variável de confusão. Existem ferramentas estatísticas, entre elas os métodos de Mantel-Haenszel, que explicam a estratificação dos conjuntos de dados.
  • O controle de confusão medindo os fatores de confusão conhecidos e incluindo-os como covariáveis é a análise multivariável , como a análise de regressão . As análises multivariadas revelam muito menos informações sobre a força ou polaridade da variável de confusão do que os métodos de estratificação. Por exemplo, se a análise multivariada controla o antidepressivo e não estratifica os antidepressivos para TCA e SSRI , então ignora que essas duas classes de antidepressivos têm efeitos opostos sobre o infarto do miocárdio e uma é muito mais forte que a outra.

Todos esses métodos têm suas desvantagens:

  1. A melhor defesa disponível contra a possibilidade de resultados espúrios devido à confusão é frequentemente dispensar os esforços de estratificação e, em vez disso, conduzir um estudo randomizado de uma amostra suficientemente grande tomada como um todo, de modo que todas as variáveis ​​de confusão potenciais (conhecidas e desconhecidas) serão distribuídos por acaso em todos os grupos de estudo e, portanto, não serão correlacionados com a variável binária para inclusão / exclusão em qualquer grupo.
  2. Considerações éticas: Em ensaios clínicos duplo-cegos e randomizados, os participantes não estão cientes de que recebem tratamentos falsos e podem ter negados tratamentos eficazes. Existe a possibilidade de que os pacientes apenas concordem com a cirurgia invasiva (que trazem riscos médicos reais) sob o entendimento de que estão recebendo tratamento. Embora seja uma preocupação ética, não é um relato completo da situação. Para cirurgias que estão sendo realizadas regularmente, mas para as quais não há evidências concretas de um efeito genuíno, pode haver questões éticas para continuar tais cirurgias. Em tais circunstâncias, muitas pessoas estão expostas aos riscos reais da cirurgia, mas esses tratamentos podem não oferecer nenhum benefício perceptível. O controle da cirurgia simulada é um método que pode permitir à ciência médica determinar se um procedimento cirúrgico é eficaz ou não. Dado que existem riscos conhecidos associados às operações médicas, é questionávelmente ético permitir que cirurgias não verificadas sejam conduzidas ad infinitum no futuro.

Veja também

Referências

Leitura adicional

links externos

Esses sites contêm descrições ou exemplos de variáveis ​​de confusão: