El modelo Tobit es un modelo estadístico propuesto por James Tobin (1958) para describir la relación entre una variable dependiente no negativa y una variable independiente (o vector ) . El término Tobit fue derivado del nombre truncando de Tobin y añadiendo, por analogía, el it como en el modelo probit o en el modelo logit.[1]

El modelo supone que existe una variable latente (no observable por ejemplo) . Esta variable depende linealmente de a través de un parámetro(vector) que determina la relación entre la variable independiente (o vector) y la variable latente (Tal como en un modelo lineal). Además, hay un término de error con una distribución normal para captar las influencias aleatorias en esta relación. La variable observable se define como igual a la variable latente cuando la variable latente es superior a cero y cero en caso contrario.

donde es una variable latente:

La consistencia

editar

Si el parámetro de relación   se estima mediante una regresión de lo observado   en  , el resultado obtenido usando el estimador de mínimos cuadrados ordinarios es inconsistente. Esto dará lugar a una estimación a la baja de polarización del coeficiente de la pendiente hacia arriba y una estimación sesgada de la intersección. Takeshi Amemiya (1973) ha demostrado que el estimador de máxima verosimilitud propuesto por Tobin para este modelo es consistente.

Interpretación

editar

La   del coeficiente no debe interpretarse como el efecto de los   en  , como uno haría con un modelo de regresión lineal , lo que es un error común. En su lugar, debe interpretarse como la combinación de (1) el cambio en   de aquellos por encima del límite, ponderados por la probabilidad de estar por encima del límite, y (2) el cambio en la probabilidad de estar por encima del límite, ponderado por el valor esperado de   si es superior.[2]

Variaciones del modelo Tobit

editar

Las variaciones del modelo Tobit pueden ser producidas mediante el cambio de dónde y cuándo se produce la censura. Amemiya (1985) clasifica estas variaciones en cinco categorías (Tobit tipo I - Tobit tipo V), donde Tobit tipo I representa el primer modelo descrito anteriormente. Schnedler (2005) proporciona una fórmula general para obtener estimadores consistentes de probabilidad para estas y otras variaciones del modelo Tobit.

Tipo I

editar

El modelo Tobit es un caso especial de un modelo de regresión censurada , ya que la variable latente   no puede siempre ser observada mientras que la variable independiente   es observable. Una variante común del modelo Tobit está censurando a un valor   diferente de cero:

 

Otro ejemplo es la censura de los valores anteriores  .

 

Sin embargo, otro modelo resulta cuando   se censura desde arriba y abajo al mismo tiempo.

 

El resto de los modelos se presenta como estando limitada desde abajo a 0, aunque esto se puede generalizar como lo hemos hecho en Tipo I.

Tipo II

editar

Tipo II modelos Tobit introducir una variable latente segundo.

 

Heckman (1987) cae en el tipo II Tobit. En el tipo Tobit I, la variable latente absorbe tanto el proceso de participación y los "resultados" de interés. En el Tipo Tobit II permite que el proceso de participación / selección y el proceso de "resultado" sean independientes, condicionado a x.

Tipo III

editar

Tipo III introduce una segunda variable dependiente observada

 
 

El modelo Heckman cae en este tipo.

Tipo IV

editar

Tipo IV introduce tercera variable observada dependiente y una variable latente tercero.

 
 
 

Tipo V

editar

Semejante al II, Tipo V, solo observar el signo de  .

 
 

La función de verosimilitud

editar

A continuación se presentan la Función de verosimilitud y las funciones de registro de probabilidad para un tipo que Tobit. Este es un Tobit censurado desde abajo en   cuando la variable latente  . Al escribir la función de verosimilitud, primero definimos una función indicadora   donde:

 

A continuación, nos referimos   a ser el normal estándar función de distribución acumulativa y   a ser el normal estándar función de densidad de probabilidad . Para un conjunto de datos con n observaciones de la función de verosimilitud para un tipo que Tobit es:

 

y la probabilidad de registro está dada por

 

Tenga en cuenta que esto es diferente de la función de verosimilitud del modelo de regresión truncada.[3]

Versión no paramétrica

editar

Si la variable subyacente latente   no se distribuye normalmente, se deben usar cuantiles en lugar de momentos para analizar la variable observable  . El estimador CLAD de Powell ofrece una forma posible de lograr esto.[4]

Referencias

editar

Bibliografía adicional

editar