Diferença média estritamente padronizada - Strictly standardized mean difference

Em estatística , a diferença média estritamente padronizada (SSMD) é uma medida do tamanho do efeito . É a média dividida pelo desvio padrão de uma diferença entre dois valores aleatórios cada um de um dos dois grupos. Foi inicialmente proposto para controle de qualidade e seleção de acertos em triagem de alto rendimento (HTS) e tornou-se um parâmetro estatístico que mede tamanhos de efeito para a comparação de quaisquer dois grupos com valores aleatórios.

Fundo

Na triagem de alto rendimento (HTS), o controle de qualidade (QC) é fundamental. Uma característica importante do CQ em um ensaio HTS é o quanto os controles positivos, compostos de teste e controles negativos diferem uns dos outros. Esta característica QC pode ser avaliada usando a comparação de dois tipos de poços em ensaios HTS . A relação sinal / ruído (S / R), relação sinal / fundo (S / B) e o fator Z foram adotados para avaliar a qualidade dos ensaios de HTS por meio da comparação dos dois tipos de poços investigados. No entanto, o S / B não leva em consideração nenhuma informação sobre variabilidade; e o S / N pode capturar a variabilidade apenas em um grupo e, portanto, não pode avaliar a qualidade do ensaio quando os dois grupos têm variabilidades diferentes. Zhang JH et al. proposto o factor-Z . A vantagem do fator Z sobre o S / N e S / B é que ele leva em consideração as variabilidades em ambos os grupos comparados. Como resultado, o fator Z tem sido amplamente usado como uma métrica de CQ em ensaios HTS. O sinal absoluto no fator Z torna inconveniente derivar matematicamente sua inferência estatística.

Para derivar um parâmetro melhor interpretável para medir a diferenciação entre dois grupos, Zhang XHD propôs SSMD para avaliar a diferenciação entre um controle positivo e um controle negativo em ensaios HTS. SSMD tem uma base probabilística devido à sua forte ligação com a probabilidade d + (ou seja, a probabilidade de que a diferença entre dois grupos seja positiva). Até certo ponto, a probabilidade d + é equivalente ao índice probabilístico bem estabelecido P ( X  >  Y ) que tem sido estudado e aplicado em muitas áreas. Com suporte em sua base probabilística, o SSMD tem sido usado para controle de qualidade e seleção de acertos em triagem de alto rendimento.

Conceito

Parâmetro estatístico

Como um parâmetro estatístico, SSMD (denotado como ) é definido como a razão entre a média e o desvio padrão da diferença de dois valores aleatórios, respectivamente, de dois grupos. Suponha que um grupo com valores aleatórios tenha média e variância e outro grupo tenha média e variância . A covariância entre os dois grupos é Então, o SSMD para a comparação desses dois grupos é definido como

Se os dois grupos forem independentes,

Se os dois grupos independentes tiverem variâncias iguais ,

Na situação em que os dois grupos estão correlacionados, uma estratégia comumente usada para evitar o cálculo de é primeiro obter observações emparelhadas dos dois grupos e, em seguida, estimar SSMD com base nas observações emparelhadas. Com base em uma diferença emparelhada com a média da população e , SSMD é

Estimativa estatística

Na situação em que os dois grupos são independentes, Zhang XHD derivou a estimativa de máxima verossimilhança (MLE) e a estimativa do método do momento (MM) de SSMD. Suponha que os grupos 1 e 2 tenham média de amostra e variâncias de amostra . A estimativa de MM de SSMD é então

Quando os dois grupos têm distribuições normais com variância igual , a estimativa imparcial de variância mínima uniforme (UMVUE) de SSMD é,

onde estão os tamanhos das amostras nos dois grupos e .

Na situação em que os dois grupos estão correlacionados, com base em uma diferença emparelhada com um tamanho de amostra, média de amostra e variância de amostra , a estimativa de MM de SSMD é

A estimativa UMVUE de SSMD é

SSMD é semelhante à estatística t e ao d de Cohen, mas são diferentes entre si, conforme ilustrado em.

Aplicação em ensaios de triagem de alto rendimento

SSMD é a razão entre a média e o desvio padrão da diferença entre dois grupos. Quando os dados são pré-processados ​​usando a transformação logarítmica, como normalmente fazemos em experimentos HTS, SSMD é a média da alteração da dobra logarítmica dividida pelo desvio padrão da alteração da dobra logarítmica em relação a uma referência negativa. Em outras palavras, SSMD é a mudança de dobra média (na escala logarítmica) penalizada pela variabilidade da mudança de dobra (na escala logarítmica). Para controle de qualidade, um índice para a qualidade de um ensaio HTS é a magnitude da diferença entre um controle positivo e uma referência negativa em uma placa de ensaio . Para a seleção de acertos, o tamanho dos efeitos de um composto (ou seja, uma pequena molécula ou um siRNA ) é representado pela magnitude da diferença entre o composto e uma referência negativa. SSMD mede diretamente a magnitude da diferença entre dois grupos. Portanto, o SSMD pode ser usado para controle de qualidade e seleção de acertos em experimentos de HTS.

Controle de qualidade

O número de poços para os controles positivo e negativo em uma placa na plataforma de 384 poços ou 1536 poços é normalmente projetado para ser razoavelmente grande. Suponha que os controles positivo e negativo em uma placa tenham média de amostra , variações de amostra e tamanhos de amostra . Normalmente, a suposição de que os controles têm variância igual em uma placa se mantém. Nesse caso, o SSMD para avaliar a qualidade dessa placa é estimado como

onde . Quando a suposição de variância igual não é válida, o SSMD para avaliar a qualidade dessa placa é estimado como

Se houver claramente outliers nos controles, o SSMD pode ser estimado como

onde estão as medianas e os desvios absolutos medianos nos controles positivo e negativo, respectivamente.

O critério de QC baseado no fator Z é popularmente usado em ensaios HTS. No entanto, foi demonstrado que este critério de CQ é mais adequado para um ensaio com controles positivos muito ou extremamente fortes. Em um ensaio de RNAi HTS, um controle positivo forte ou moderado é geralmente mais instrutivo do que um controle positivo muito ou extremamente forte porque a eficácia desse controle é mais semelhante aos resultados de interesse. Além disso, os controles positivos nos dois experimentos de HTS teoricamente têm tamanhos diferentes de efeitos. Consequentemente, os limiares de CQ para o controle moderado devem ser diferentes daqueles para o controle forte nesses dois experimentos. Além disso, é comum que dois ou mais controles positivos sejam adotados em um único experimento. Aplicar os mesmos critérios de CQ com base no fator Z a ambos os controles leva a resultados inconsistentes, conforme ilustrado na literatura.

Os critérios de QC baseados em SSMD listados na tabela a seguir levam em consideração o tamanho do efeito de um controle positivo em um ensaio HTS onde o controle positivo (como um controle de inibição) teoricamente tem valores menores do que a referência negativa.

Tipo de Qualidade R: Controle moderado B: Controle Forte C: Controle Muito Forte D: Controle extremamente forte
Excelente
Boa
Inferior
Pobre

Na aplicação, se o tamanho do efeito de um controle positivo for conhecido biologicamente, adote o critério correspondente com base nesta tabela. Caso contrário, a seguinte estratégia deve ajudar a determinar qual critério de QC deve ser aplicado: (i) em muitos ensaios HTS de moléculas pequenas com um controle positivo, geralmente o critério D (e ocasionalmente o critério C) deve ser adotado porque este controle geralmente tem muito ou extremamente efeitos fortes; (ii) para os ensaios de RNAi HTS em que a viabilidade celular é a resposta medida, o critério D deve ser adotado para os controles sem células (ou seja, os poços sem células adicionadas) ou controles de fundo; (iii) em um ensaio viral em que a quantidade de vírus nas células hospedeiras é de interesse, o critério C é geralmente usado, e o critério D é ocasionalmente usado para o controle positivo que consiste em siRNA do vírus.

Critérios de CQ baseados em SSMD semelhantes podem ser construídos para um ensaio HTS onde o controle positivo (como um controle de ativação) teoricamente tem valores maiores do que a referência negativa. Mais detalhes sobre como aplicar os critérios de QC baseados em SSMD em experimentos de HTS podem ser encontrados em um livro.

Seleção de acerto

Em um ensaio HTS, um objetivo principal é selecionar compostos com um tamanho desejado de inibição ou efeito de ativação. O tamanho do efeito do composto é representado pela magnitude da diferença entre um composto de teste e um grupo de referência negativo sem efeitos de inibição / ativação específicos. Um composto com um tamanho desejado de efeitos em uma tela HTS é chamado de acerto. O processo de seleção de ocorrências é chamado de seleção de ocorrências. Existem duas estratégias principais para selecionar sucessos com grandes efeitos. Uma é usar determinada (s) métrica (s) para classificar e / ou classificar os compostos por seus efeitos e, em seguida, selecionar o maior número de compostos potentes que sejam práticos para os ensaios de validação . A outra estratégia é testar se um composto tem efeitos fortes o suficiente para atingir um nível predefinido. Nessa estratégia, as taxas de falso-negativo (FNRs) e / ou taxas de falso-positivo (FPRs) devem ser controladas.

O SSMD pode não apenas classificar o tamanho dos efeitos, mas também classificar os efeitos conforme mostrado na tabela a seguir com base no valor da população ( ) de SSMD.

Subtipo de efeito Limites para SSMD negativo Limiares para SSMD positivo
Extremamente forte
Muito forte
Forte
Razoavelmente forte
Moderado
Razoavelmente moderado
Razoavelmente fraco
Fraco
Muito fraco
Extremamente fraco
Sem efeito

A estimativa de SSMD para telas sem réplicas difere daquela para telas com réplicas.

Num ecrã primário sem repetições, assumindo que o valor medido (normalmente na escala logarítmica) em um poço para um testado composto é e a referência negativa em que a placa tem tamanho da amostra , a amostra média , mediana , desvio padr e desvio absoluto mediano , o SSMD para este composto é estimado como

onde . Quando há outliers em um ensaio que geralmente é comum em experimentos HTS, uma versão robusta de SSMD pode ser obtida usando

Em uma triagem confirmatória ou primária com réplicas, para o i-ésimo composto de teste com réplicas, calculamos a diferença emparelhada entre o valor medido (geralmente na escala logarítmica) do composto e o valor médio de um controle negativo em uma placa, em seguida, obtenha a média e a variância da diferença emparelhada entre as repetições. O SSMD para este composto é estimado como

Em muitos casos, os cientistas podem usar SSMD e alteração de dobra média para seleção de acerto em experimentos de HTS. O gráfico de lanterna dupla pode exibir a alteração média de dobra e SSMD para todos os compostos de teste em um ensaio e ajudar a integrar ambos para selecionar acertos em experimentos de HTS. O uso de SSMD para seleção de hit em experimentos HTS é ilustrado passo a passo em

Veja também

Leitura adicional

Referências