Fator Z - Z-factor

O fator Z é uma medida do tamanho do efeito estatístico . Foi proposto para uso em triagem de alto rendimento (onde também é conhecido como Z-prime) e comumente escrito como Z 'para julgar se a resposta em um ensaio específico é grande o suficiente para justificar mais atenção.

Fundo

Em telas de alto rendimento, os experimentadores costumam comparar um grande número (centenas de milhares a dezenas de milhões) de medições únicas de amostras desconhecidas com amostras de controle positivas e negativas . A escolha particular de condições experimentais e medições é chamada de ensaio. Telas grandes são caras em tempo e recursos. Portanto, antes de iniciar uma tela grande, telas de teste (ou piloto) menores são usadas para avaliar a qualidade de um ensaio, na tentativa de prever se ele seria útil em um ambiente de alto rendimento. O fator Z é uma tentativa de quantificar a adequação de um ensaio específico para uso em uma tela de alto rendimento em escala real.

Definição

O factor-Z é definido em termos de quatro parâmetros: os meios ( ) e os desvios padrão ( ) de ambas as positiva (P) e controlos negativos (n) ( , , e , ). Dados esses valores, o fator Z é definido como:

Na prática, o fator Z é estimado a partir das médias e desvios padrão da amostra

Interpretação

As seguintes interpretações para o fator Z são retiradas de:

Fator Z Interpretação
1.0 Ideal. Os fatores Z nunca podem exceder 1.
entre 0,5 e 1,0 Um excelente ensaio. Observe que se , 0,5 é equivalente a uma separação de 12 desvios padrão entre e .
entre 0 e 0,5 Um ensaio marginal.
menos que 0 Há muita sobreposição entre os controles positivo e negativo para que o ensaio seja útil.

Observe que, pelos padrões de muitos tipos de experimentos, um fator Z zero sugere um tamanho de efeito grande, em vez de um resultado inútil limítrofe, como sugerido acima. Por exemplo, se σ p = σ n = 1, então μ p = 6 e μ n = 0 dá um fator Z zero. Mas, para dados normalmente distribuídos com esses parâmetros, a probabilidade de que o valor de controle positivo seja menor que o valor de controle negativo é menor que 1 em 10 5 . O conservadorismo extremo é usado na triagem de alto rendimento devido ao grande número de testes realizados.

Limitações

O fator constante 3 na definição do fator Z é motivado pela distribuição normal , para a qual mais de 99% dos valores ocorrem dentro de 3 desvios padrão da média. Se os dados seguirem uma distribuição fortemente não normal, os pontos de referência (por exemplo, o significado de um valor negativo) podem ser enganosos. Outro problema é que as estimativas usuais da média e do desvio padrão não são robustas ; consequentemente, muitos usuários na comunidade de triagem de alto rendimento preferem o "Robust Z-prime", que substitui a mediana pela média e o desvio absoluto mediano pelo desvio padrão. Valores extremos (outliers) nos controles positivo ou negativo podem afetar adversamente o fator Z, potencialmente levando a um fator Z aparentemente desfavorável, mesmo quando o ensaio teria um bom desempenho na triagem real. Além disso, a aplicação do critério baseado no fator Z único a dois ou mais controles positivos com diferentes dosagens no mesmo ensaio levará a resultados enganosos. O sinal absoluto no fator Z torna inconveniente derivar a inferência estatística do fator Z matematicamente. Um parâmetro estatístico proposto recentemente, diferença média estritamente padronizada ( SSMD ), pode resolver esses problemas. Uma estimativa de SSMD é robusta para outliers.

Veja também

Referências

Leitura adicional