Faixa (estatísticas) - Range (statistics)

Em estatística , o intervalo de um conjunto de dados é a diferença entre o maior e o menor valor. A diferença aqui é específica, o intervalo de um conjunto de dados é o resultado da subtração do máximo e do mínimo da amostra .

No entanto, na estatística descritiva , esse conceito de intervalo tem um significado mais complexo. O intervalo é o tamanho do menor intervalo (estatísticas) que contém todos os dados e fornece uma indicação da dispersão estatística . É medido nas mesmas unidades dos dados. Uma vez que depende apenas de duas das observações, é mais útil para representar a dispersão de pequenos conjuntos de dados.

Para variáveis ​​aleatórias IID contínuas

Para n variáveis ​​aleatórias contínuas independentes e distribuídas de forma idêntica X 1 , X 2 , ..., X n com função de distribuição cumulativa G ( x ) e função de densidade de probabilidade g ( x ). Seja T o intervalo de uma amostra de tamanho n de uma população com função de distribuição G ( x ).

Distribuição

O intervalo tem função de distribuição cumulativa

Gumbel observa que "a beleza dessa fórmula é completamente prejudicada pelos fatos de que, em geral, não podemos expressar G ( x  +  t ) por G ( x ), e que a integração numérica é longa e cansativa".

Se a distribuição de cada X i é limitada à direita (ou esquerda), então a distribuição assintótica da faixa é igual à distribuição assintótica do maior (menor) valor. Para distribuições mais gerais, a distribuição assintótica pode ser expressa como uma função de Bessel .

Momentos

O intervalo médio é dado por

onde x ( G ) é a função inversa. No caso em que cada um dos X i tem uma distribuição normal padrão , o intervalo médio é dado por

Para variáveis ​​aleatórias não-IID contínuas

Para n variáveis ​​aleatórias contínuas independentes não identicamente distribuídas X 1 , X 2 , ..., X n com funções de distribuição cumulativa G 1 ( x ), G 2 ( x ), ..., G n ( x ) e funções de densidade de probabilidade g 1 ( x ), g 2 ( x ), ..., g n ( x ), o intervalo tem função de distribuição cumulativa

Para variáveis ​​aleatórias discretas IID

Para n variáveis ​​aleatórias discretas independentes e distribuídas de forma idêntica X 1 , X 2 , ..., X n com função de distribuição cumulativa G ( x ) e função de massa de probabilidade g ( x ) o intervalo de X i é o intervalo de uma amostra de tamanho n de uma população com função de distribuição G ( x ). Podemos assumir sem perda de generalidade que o suporte de cada X i é {1,2,3, ..., N } onde N é um número inteiro positivo ou infinito.

Distribuição

O intervalo tem função de massa de probabilidade

Exemplo

Se supormos que g ( x ) = 1 / N , a distribuição uniforme discreta para todo x , então encontramos

Derivação

A probabilidade de ter um valor de intervalo específico, t , pode ser determinada adicionando as probabilidades de ter duas amostras diferindo por t , e cada outra amostra tendo um valor entre os dois extremos. A probabilidade de uma amostra ter um valor de x é . A probabilidade de outro ter um valor t maior que x é:

A probabilidade de todos os outros valores situarem-se entre esses dois extremos é:

Combinar os três resulta em:

Quantidades relacionadas

O intervalo é um exemplo específico de estatísticas de pedidos . Em particular, a gama é uma função linear de estatísticas de ordem, que conduz para o âmbito de L-estimativa .

Veja também

Referências