Modelo Tobit - Tobit model

Em estatística, um modelo tobit é qualquer um de uma classe de modelos de regressão em que o intervalo observado da variável dependente é censurado de alguma forma. O termo foi cunhado por Arthur Goldberger em referência a James Tobin , que desenvolveu o modelo em 1958 para mitigar o problema de dados inflacionados a zero para observações de gastos familiares em bens duráveis . Como o método de Tobin pode ser facilmente estendido para lidar com amostras truncadas e outras selecionadas não aleatoriamente, alguns autores adotam uma definição mais ampla do modelo tobit que inclui esses casos.

A ideia de Tobin era modificar a função de verossimilhança de modo que reflita a probabilidade de amostragem desigual para cada observação dependendo se a variável dependente latente caiu acima ou abaixo do limite determinado. Para uma amostra que, como no caso original de Tobin, foi censurada de baixo para cima em zero, a probabilidade de amostragem para cada observação não-limite é simplesmente a altura da função de densidade apropriada . Para qualquer observação de limite, é a distribuição cumulativa, ou seja, a integral abaixo de zero da função de densidade apropriada. A função de verossimilhança tobit é, portanto, uma mistura de densidades e funções de distribuição cumulativa.

A função de verossimilhança

Abaixo estão as funções de verossimilhança e log de verossimilhança para um tobit tipo I. Este é um tobit que é censurado por baixo no momento da variável latente . Ao escrever a função de verossimilhança, primeiro definimos uma função de indicador :

Em seguida, seja a função de distribuição cumulativa normal padrão e a função de densidade de probabilidade normal padrão . Para um conjunto de dados com N observações, a função de verossimilhança para um tobit tipo I é

e a probabilidade de log é dada por

Reparametrização

A probabilidade logarítmica declarada acima não é globalmente côncava, o que complica a estimativa de probabilidade máxima . Olsen sugeriu a reparametrização simples e , resultando em uma probabilidade logarítmica transformada,

que é globalmente côncavo em termos dos parâmetros transformados.

Para o modelo truncado (tobit II), Orme mostrou que, embora a log-verossimilhança não seja globalmente côncava, ela é côncava em qualquer ponto estacionário sob a transformação acima.

Consistência

Se o parâmetro de relacionamento for estimado pela regressão do observado em , o estimador de regressão de mínimos quadrados ordinários resultante é inconsistente . Isso produzirá uma estimativa com tendência para baixo do coeficiente de inclinação e uma estimativa com tendência para cima da interceptação. Takeshi Amemiya (1973) provou que o estimador de máxima verossimilhança sugerido por Tobin para este modelo é consistente.

Interpretação

O coeficiente não deve ser interpretado como o efeito de on , como faria com um modelo de regressão linear ; este é um erro comum. Em vez disso, deve ser interpretado como a combinação de (1) a mudança daqueles acima do limite, ponderada pela probabilidade de estar acima do limite; e (2) a mudança na probabilidade de estar acima do limite, ponderada pelo valor esperado de se acima.

Variações do modelo tobit

Variações do modelo tobit podem ser produzidas alterando onde e quando ocorre a censura . Amemiya (1985 , p. 384) classifica essas variações em cinco categorias (tobit tipo I - tobit tipo V), onde tobit tipo I representa o primeiro modelo descrito acima. Schnedler (2005) fornece uma fórmula geral para obter estimadores de verossimilhança consistentes para essas e outras variações do modelo tobit.

Tipo I

O modelo tobit é um caso especial de um modelo de regressão censurado , porque a variável latente nem sempre pode ser observada enquanto a variável independente é observável. Uma variação comum do modelo tobit é a censura em um valor diferente de zero:

Outro exemplo é a censura dos valores acima .

Ainda outro modelo resulta quando é censurado de cima e de baixo ao mesmo tempo.

O resto dos modelos serão apresentados como sendo limitados a partir de baixo em 0, embora isso possa ser generalizado como feito para o Tipo I.

Tipo II

Os modelos de tobit do tipo II apresentam uma segunda variável latente.

No tobit Tipo I, a variável latente absorve tanto o processo de participação quanto o resultado de interesse. O tobit do tipo II permite que o processo de participação (seleção) e o resultado de interesse sejam independentes, condicionados a dados observáveis.

O modelo de seleção de Heckman cai no tobit Tipo II, que às vezes é chamado de Heckit em homenagem a James Heckman .

Tipo III

O tipo III introduz uma segunda variável dependente observada.

O modelo de Heckman se encaixa nesse tipo.

Tipo IV

O tipo IV introduz uma terceira variável dependente observada e uma terceira variável latente.

Tipo V

Semelhante ao Tipo II, no Tipo V apenas o sinal de é observado.

Versão não paramétrica

Se a variável latente subjacente não é normalmente distribuída, deve-se usar quantis em vez de momentos para analisar a variável observável . O estimador CLAD de Powell oferece uma maneira possível de conseguir isso.

Formulários

Os modelos Tobit, por exemplo, foram aplicados para estimar os fatores que afetam o recebimento de subsídios, incluindo transferências financeiras distribuídas a governos subnacionais que podem solicitar esses subsídios. Nestes casos, os beneficiários das bolsas não podem receber valores negativos e, portanto, os dados são censurados à esquerda. Por exemplo, Dahlberg e Johansson (2002) analisam uma amostra de 115 municípios (42 dos quais receberam uma bolsa). Dubois e Fattore (2011) usam um modelo tobit para investigar o papel de vários fatores no recebimento de fundos da União Europeia aplicando governos subnacionais poloneses. Os dados podem, no entanto, ser censurados à esquerda em um ponto superior a zero, com o risco de especificações incorretas. Ambos os estudos aplicam Probit e outros modelos para verificar a robustez. Os modelos Tobit também foram aplicados na análise de demanda para acomodar observações com gastos zero em alguns bens. Em uma aplicação relacionada de modelos tobit, um sistema de modelos de regressão tobit não linear foi usado para estimar em conjunto um sistema de demanda de marca com variantes homocedásticas, heterocedásticas e heterocedásticas generalizadas.

Veja também

Notas

Referências

Leitura adicional