Falácia da taxa básica - Base rate fallacy

A falácia da taxa básica , também chamada de negligência da taxa básica ou viés da taxa básica , é um tipo de falácia . Se apresentado com informações de taxa de base relacionadas (ou seja, informações gerais sobre prevalência) e informações específicas (ou seja, informações pertencentes apenas a um caso específico), as pessoas tendem a ignorar a taxa de base em favor das informações individuantes, em vez de integrar corretamente os dois .

A negligência da taxa básica é uma forma específica da negligência de extensão mais geral .

Paradoxo falso positivo

Um exemplo da falácia da taxa básica é o paradoxo do falso positivo . Este paradoxo descreve situações em que há mais resultados de teste falsos positivos do que verdadeiros positivos. Por exemplo, 50 em cada 1.000 pessoas testam positivo para uma infecção, mas apenas 10 têm a infecção, o que significa que 40 testes foram falsos positivos. A probabilidade de um resultado de teste positivo é determinada não apenas pela precisão do teste, mas também pelas características da população amostrada. Quando a prevalência, a proporção de pessoas que têm uma determinada condição, é menor do que a taxa de falsos positivos do teste , mesmo os testes que têm uma chance muito baixa de dar um falso positivo em um caso individual darão mais falsos positivos do que verdadeiros positivos em geral . O paradoxo surpreende a maioria das pessoas.

É especialmente contra-intuitivo interpretar um resultado positivo em um teste em uma população de baixa prevalência, após ter lidado com resultados positivos extraídos de uma população de alta prevalência. Se a taxa de falsos positivos do teste for maior do que a proporção da nova população com a doença, um aplicador de teste cuja experiência foi obtida em testes em uma população de alta prevalência pode concluir por experiência que um resultado de teste positivo geralmente indica um sujeito positivo, quando na verdade é muito mais provável que tenha ocorrido um falso positivo.

Exemplos

Exemplo 1: doença

População de alta incidência

Numero
de pessoas
Infetado Não infectado Total
Teste
positivo
400
(verdadeiro positivo)
30
(falso positivo)
430
Teste
negativo
0
(falso negativo)
570
(verdadeiro negativo)
570
Total 400 600 1000

Imagine fazer um teste de doenças infecciosas em uma população A de 1000 pessoas, na qual 40% estão infectados. O teste tem uma taxa de falsos positivos de 5% (0,05) e nenhuma taxa de falsos negativos. O resultado esperado dos 1000 testes na população A seria:

Infectado e o teste indica doença ( verdadeiro positivo )
1000 × 40/100 = 400 pessoas receberiam um verdadeiro positivo
Não infectado e o teste indica doença (falso positivo)
1000 × 100 - 40/100 × 0,05 = 30 pessoas receberiam um falso positivo
Os 570 testes restantes são corretamente negativos.

Portanto, na população A , uma pessoa que recebe um teste positivo pode ter mais de 93% de confiança (400/30 + 400) que indica corretamente a infecção.

População de baixa incidência

Numero
de pessoas
Infetado Não infectado Total
Teste
positivo
20
(verdadeiro positivo)
49
(falso positivo)
69
Teste
negativo
0
(falso negativo)
931
(verdadeiro negativo)
931
Total 20 980 1000

Agora considere o mesmo teste aplicado à população B , na qual apenas 2% estão infectados. O resultado esperado de 1000 testes na população B seria:

Infectado e o teste indica doença ( verdadeiro positivo )
1000 × 2/100 = 20 pessoas receberiam um verdadeiro positivo
Não infectado e o teste indica doença (falso positivo)
1000 × 100 - 2/100 × 0,05 = 49 pessoas receberiam um falso positivo
Os 931 testes restantes (= 1000 - (49 + 20)) são corretamente negativos.

Na população B , apenas 20 do total de 69 pessoas com um resultado de teste positivo estão realmente infectados. Portanto, a probabilidade de realmente estar infectado depois que alguém é informado de que está infectado é de apenas 29% (20/20 + 49) para um teste que, de outra forma, parece ter "95% de precisão".

Um testador com experiência no grupo A pode achar um paradoxo que, no grupo B , um resultado que normalmente indicava infecção corretamente agora é geralmente um falso positivo . A confusão da probabilidade posterior de infecção com a probabilidade anterior de receber um falso positivo é um erro natural após receber um resultado de teste prejudicial à saúde.

Exemplo 2: Motoristas bêbados

Um grupo de policiais usa bafômetro com falsa embriaguez em 5% dos casos em que o motorista está sóbrio. No entanto, os bafômetros nunca deixam de detectar uma pessoa realmente bêbada. Um em cada mil motoristas está dirigindo bêbado. Suponha que os policiais parem um motorista ao acaso para administrar um teste do bafômetro. Indica que o motorista está bêbado. Presumimos que você não saiba mais nada sobre eles. Qual é a probabilidade de que eles estejam realmente bêbados?

Muitos responderiam até 95%, mas a probabilidade correta é de cerca de 2%.

Uma explicação para isso é a seguinte: em média, para cada 1.000 motoristas testados,

  • 1 motorista está bêbado e é 100% certo que para esse motorista há um resultado de teste verdadeiramente positivo, portanto, há 1 resultado de teste verdadeiramente positivo
  • 999 motoristas não estão bêbados, e entre esses motoristas há 5% de resultados de teste falso- positivos, portanto, há 49,95 resultados de teste falso- positivos

Portanto, a probabilidade de que um dos motoristas entre os resultados positivos do teste 1 + 49,95 = 50,95 esteja realmente bêbado é .

A validade desse resultado, no entanto, depende da validade da suposição inicial de que o policial parou o motorista realmente ao acaso, e não por causa da má direção. Se essa ou outra razão não arbitrária para parar o motorista estava presente, então o cálculo também envolve a probabilidade de um motorista embriagado dirigir com competência e um motorista não embriagado dirigir (in) competentemente.

Mais formalmente, a mesma probabilidade de aproximadamente 0,02 pode ser estabelecida usando o teorema de Bayes . O objetivo é encontrar a probabilidade de o motorista estar bêbado visto que o bafômetro indicou que ele está bêbado, o que pode ser representado como

onde D significa que o bafômetro indica que o motorista está bêbado. O teorema de Bayes nos diz que

Foi-nos dito o seguinte no primeiro parágrafo:

e

Como você pode ver pela fórmula, é necessário p ( D ) para o teorema de Bayes, que pode ser calculado a partir dos valores anteriores usando a lei da probabilidade total :

que dá

Conectando esses números ao teorema de Bayes, descobre-se que

Exemplo 3: Identificação de terrorista

Em uma cidade de 1 milhão de habitantes, haja 100 terroristas e 999.900 não terroristas. Para simplificar o exemplo, assume-se que todas as pessoas presentes na cidade são habitantes. Assim, a probabilidade da taxa básica de um habitante da cidade selecionado aleatoriamente ser um terrorista é 0,0001, e a probabilidade da taxa básica desse mesmo habitante ser um não terrorista é 0,9999. Na tentativa de capturar os terroristas, a cidade instala um sistema de alarme com câmera de vigilância e software de reconhecimento facial automático .

O software tem duas taxas de falha de 1%:

  • A taxa de falsos negativos: se a câmera rastrear um terrorista, um sino tocará 99% das vezes e deixará de tocar 1% das vezes.
  • A taxa de falsos positivos: se a câmera rastrear um não terrorista, um sino não tocará 99% das vezes, mas tocará 1% das vezes.

Suponha agora que um habitante dispare o alarme. Qual é a chance de a pessoa ser terrorista? Em outras palavras, o que é P (T | B), a probabilidade de que um terrorista tenha sido detectado devido ao toque da campainha? Alguém fazendo a 'falácia da taxa básica' inferiria que há 99% de chance de que a pessoa detectada seja um terrorista. Embora a inferência pareça fazer sentido, na verdade é um raciocínio ruim, e um cálculo abaixo mostrará que as chances de que eles sejam terroristas estão na verdade perto de 1%, não perto de 99%.

A falácia surge de confundir a natureza de duas taxas de falha diferentes. O 'número de não-sinos por 100 terroristas' e o 'número de não-terroristas por 100 sinos' são quantidades não relacionadas. Um não é necessariamente igual ao outro, e eles nem mesmo precisam ser quase iguais. Para mostrar isso, considere o que aconteceria se um sistema de alarme idêntico fosse instalado em uma segunda cidade sem nenhum terrorista. Como na primeira cidade, o alarme soa para 1 em cada 100 habitantes não terroristas detectados, mas ao contrário da primeira cidade, o alarme nunca soa para um terrorista. Portanto, 100% de todas as ocasiões em que o alarme soa é para não terroristas, mas uma taxa de falsos negativos nem pode ser calculada. O 'número de não terroristas por 100 sinos' naquela cidade é 100, mas P (T | B) = 0%. A chance de um terrorista ser detectado é zero devido ao toque da campainha.

Imagine que toda a população da primeira cidade de um milhão de pessoas passe na frente da câmera. Cerca de 99 dos 100 terroristas irão disparar o alarme - assim como cerca de 9.999 dos 999.900 não terroristas. Portanto, cerca de 10.098 pessoas irão disparar o alarme, entre as quais cerca de 99 serão terroristas. Portanto, a probabilidade de que uma pessoa que dispara o alarme seja realmente um terrorista é de apenas 99 em 10.098, o que é menos de 1%, e muito, muito abaixo de nossa estimativa inicial de 99%.

A falácia da taxa básica é muito enganosa neste exemplo porque há muito mais não terroristas do que terroristas, e o número de falsos positivos (não terroristas examinados como terroristas) é muito maior do que os verdadeiros positivos (terroristas examinados como terroristas).

Achados em psicologia

Em experimentos, descobriu-se que as pessoas preferem informações individualizadas em vez de informações gerais, quando as primeiras estão disponíveis.

Em alguns experimentos, os alunos foram solicitados a estimar as médias de notas (GPAs) de alunos hipotéticos. Quando recebem estatísticas relevantes sobre a distribuição do GPA, os alunos tendem a ignorá-las se recebem informações descritivas sobre o aluno em particular, mesmo que as novas informações descritivas sejam obviamente de pouca ou nenhuma relevância para o desempenho escolar. Essa descoberta tem sido usada para argumentar que as entrevistas são uma parte desnecessária do processo de admissão na faculdade porque os entrevistadores são incapazes de escolher os candidatos aprovados melhor do que as estatísticas básicas.

Os psicólogos Daniel Kahneman e Amos Tversky tentaram explicar essa descoberta em termos de uma regra simples ou "heurística" chamada representatividade . Eles argumentaram que muitos julgamentos relativos à probabilidade, ou à causa e efeito, são baseados em quão representativa uma coisa é de outra ou de uma categoria. Kahneman considera a negligência da taxa básica uma forma específica de negligência de extensão . Richard Nisbett argumentou que alguns vieses de atribuição, como o erro de atribuição fundamental, são instâncias da falácia da taxa básica: as pessoas não usam as "informações de consenso" (a "taxa básica") sobre como os outros se comportaram em situações semelhantes e preferem atribuições disposicionais mais simples .

Há um debate considerável em psicologia sobre as condições sob as quais as pessoas apreciam ou não as informações sobre a taxa básica. Os pesquisadores do programa de heurísticas e vieses enfatizaram as descobertas empíricas que mostram que as pessoas tendem a ignorar as taxas básicas e fazer inferências que violam certas normas de raciocínio probabilístico, como o teorema de Bayes . A conclusão extraída dessa linha de pesquisa foi que o pensamento probabilístico humano é fundamentalmente falho e sujeito a erros. Outros pesquisadores enfatizaram a ligação entre processos cognitivos e formatos de informação, argumentando que tais conclusões geralmente não são garantidas.

Considere novamente o Exemplo 2 acima. A inferência necessária é estimar a probabilidade (posterior) de que um motorista (escolhido aleatoriamente) esteja bêbado, visto que o teste do bafômetro é positivo. Formalmente, essa probabilidade pode ser calculada usando o teorema de Bayes , conforme mostrado acima. No entanto, existem diferentes maneiras de apresentar as informações relevantes. Considere a seguinte variante formalmente equivalente do problema:

 1 em cada 1000 motoristas está dirigindo bêbado. Os bafômetros nunca deixam de detectar uma pessoa verdadeiramente bêbada. Para 50 dos 999 motoristas que não estão bêbados, o bafômetro exibe falsamente a embriaguez. Suponha que os policiais parem um motorista aleatoriamente e o obriguem a fazer um teste do bafômetro. Isso indica que eles estão bêbados. Presumimos que você não saiba mais nada sobre eles. Qual é a probabilidade de que eles estejam realmente bêbados?

Nesse caso, a informação numérica relevante - p (bêbado), p ( D | bêbado), p ( D | sóbrio) - é apresentada em termos de frequências naturais com respeito a uma certa classe de referência (ver problema da classe de referência ). Estudos empíricos mostram que as inferências das pessoas correspondem mais de perto à regra de Bayes quando as informações são apresentadas dessa forma, ajudando a superar a negligência da taxa básica em leigos e especialistas. Como consequência, organizações como a Colaboração Cochrane recomendam o uso desse tipo de formato para comunicar estatísticas de saúde. Ensinar as pessoas a traduzir esses tipos de problemas de raciocínio bayesiano em formatos de frequência natural é mais eficaz do que simplesmente ensiná-las a inserir probabilidades (ou porcentagens) no teorema de Bayes. Também foi demonstrado que as representações gráficas de frequências naturais (por exemplo, arranjos de ícones) ajudam as pessoas a fazer melhores inferências.

Por que os formatos de frequência natural são úteis? Um motivo importante é que este formato de informação facilita a inferência necessária porque simplifica os cálculos necessários. Isso pode ser visto ao usar uma forma alternativa de calcular a probabilidade necessária p (bêbado | D ):

onde N (bêbado ∩ D ) denota o número de motoristas que estão bêbados e obtêm um resultado positivo do bafômetro, e N ( D ) denota o número total de casos com um resultado positivo do bafômetro. A equivalência desta equação com a anterior decorre dos axiomas da teoria das probabilidades, segundo os quais N (bêbado ∩ D ) = N × p ( D | bêbado) × p (bêbado). É importante ressaltar que, embora essa equação seja formalmente equivalente à regra de Bayes, ela não é psicologicamente equivalente. O uso de frequências naturais simplifica a inferência porque a operação matemática necessária pode ser realizada em números naturais, em vez de frações normalizadas (ou seja, probabilidades), porque torna o alto número de falsos positivos mais transparente e porque as frequências naturais exibem um "conjunto aninhado estrutura".

Nem todo formato de frequência facilita o raciocínio bayesiano. As frequências naturais referem-se às informações de frequência que resultam da amostragem natural , que preserva as informações da taxa básica (por exemplo, número de motoristas bêbados ao coletar uma amostra aleatória de motoristas). Isso é diferente da amostragem sistemática , na qual as taxas básicas são fixadas a priori (por exemplo, em experimentos científicos). Neste último caso, não é possível inferir a probabilidade posterior p (bêbado | teste positivo) comparando o número de motoristas que estão bêbados e com teste positivo em relação ao número total de pessoas que obtiveram um resultado positivo do bafômetro, porque a informação da taxa básica não é preservado e deve ser explicitamente reintroduzido usando o teorema de Bayes.

Veja também

Referências

links externos