Faixa (estatísticas) - Range (statistics)
Em estatística , o intervalo de um conjunto de dados é a diferença entre o maior e o menor valor. A diferença aqui é específica, o intervalo de um conjunto de dados é o resultado da subtração do máximo e do mínimo da amostra .
No entanto, na estatística descritiva , esse conceito de intervalo tem um significado mais complexo. O intervalo é o tamanho do menor intervalo (estatísticas) que contém todos os dados e fornece uma indicação da dispersão estatística . É medido nas mesmas unidades dos dados. Uma vez que depende apenas de duas das observações, é mais útil para representar a dispersão de pequenos conjuntos de dados.
Para variáveis aleatórias IID contínuas
Para n variáveis aleatórias contínuas independentes e distribuídas de forma idêntica X 1 , X 2 , ..., X n com função de distribuição cumulativa G ( x ) e função de densidade de probabilidade g ( x ). Seja T o intervalo de uma amostra de tamanho n de uma população com função de distribuição G ( x ).
Distribuição
O intervalo tem função de distribuição cumulativa
Gumbel observa que "a beleza dessa fórmula é completamente prejudicada pelos fatos de que, em geral, não podemos expressar G ( x + t ) por G ( x ), e que a integração numérica é longa e cansativa".
Se a distribuição de cada X i é limitada à direita (ou esquerda), então a distribuição assintótica da faixa é igual à distribuição assintótica do maior (menor) valor. Para distribuições mais gerais, a distribuição assintótica pode ser expressa como uma função de Bessel .
Momentos
O intervalo médio é dado por
onde x ( G ) é a função inversa. No caso em que cada um dos X i tem uma distribuição normal padrão , o intervalo médio é dado por
Para variáveis aleatórias não-IID contínuas
Para n variáveis aleatórias contínuas independentes não identicamente distribuídas X 1 , X 2 , ..., X n com funções de distribuição cumulativa G 1 ( x ), G 2 ( x ), ..., G n ( x ) e funções de densidade de probabilidade g 1 ( x ), g 2 ( x ), ..., g n ( x ), o intervalo tem função de distribuição cumulativa
Para variáveis aleatórias discretas IID
Para n variáveis aleatórias discretas independentes e distribuídas de forma idêntica X 1 , X 2 , ..., X n com função de distribuição cumulativa G ( x ) e função de massa de probabilidade g ( x ) o intervalo de X i é o intervalo de uma amostra de tamanho n de uma população com função de distribuição G ( x ). Podemos assumir sem perda de generalidade que o suporte de cada X i é {1,2,3, ..., N } onde N é um número inteiro positivo ou infinito.
Distribuição
O intervalo tem função de massa de probabilidade
Exemplo
Se supormos que g ( x ) = 1 / N , a distribuição uniforme discreta para todo x , então encontramos
Derivação
A probabilidade de ter um valor de intervalo específico, t , pode ser determinada adicionando as probabilidades de ter duas amostras diferindo por t , e cada outra amostra tendo um valor entre os dois extremos. A probabilidade de uma amostra ter um valor de x é . A probabilidade de outro ter um valor t maior que x é:
A probabilidade de todos os outros valores situarem-se entre esses dois extremos é:
Combinar os três resulta em:
Quantidades relacionadas
O intervalo é um exemplo específico de estatísticas de pedidos . Em particular, a gama é uma função linear de estatísticas de ordem, que conduz para o âmbito de L-estimativa .