Ponderador de probabilidad inversa

La ponderación de probabilidad inversa es una técnica para calcular estadísticas estandarizadas en una población diferente de aquella en que se obtuvo el dato. Los estudios realizados con una  población dispar de la del muestreo y con poblaciones de inferencia de objetivo (población de objetivo) son de aplicación común. Puede haber factores que le prohíban a los investigadores utilizar directamente un muestreo de la población de objetivo como costos, tiempo, o preocupaciones éticas. Una solución a este problema es utilizar una estrategia de diseño alternativa, por ejemplo un muestreo estratificado. La ponderación, cuando es correctamente aplicada, puede mejorar potencialmente la eficacia y reducir las tendencias a las estimaciones.[1]

Uno de los primeros estimadores es el estimador Horvitz–Thompson .[2]​ Cuándo la probabilidad del muestreo es conocida, es decir cuando la población de muestreo y la población de objetivo coinciden, se utiliza el inverso de esta probabilidad para ponderar las observaciones. Esta aproximación ha sido generalizada a muchos aspectos de estadísticas bajo varios marcos. Existen ponderaciones probables, ponderaciones con ecuaciones estimadas y ponderaciones con densidades estimadas de las que se derivan una gran mayoría de estadísticas. Estas aplicaciones codifican la teoría de otras estadísticas y estimadores como modelos estructurales insignificantes, la proporción de mortalidad estandarizada, y el algoritmo EM para mucha información o agregada.

La ponderación de probabilidad inversa es también utilizada para contar con datos que desaparecen cuándo temas con poca información no pueden ser incluidos en el análisis primario. Así, la ponderación de probabilidad inversa puede aumentar los datos para temas que son mal representados debido a una gran escasez de datos

Ponderador  de probabilidad inverso (PPI)

editar

El estimador de ponderación de probabilidad inversa puede ser utilizado para demostrar causalidad cuándo el investigador no puede conducir un experimento controlado pero ha observado los datos obtenidos. Como está asumido que el tratamiento no es aleatoriamente asignado, el objetivo es estimar la hipótesis o el resultado potencial si todos los sujetos en la población fueran asignados cualquier tratamiento.

Suponiendo que el dato observado es   obtenido i.i. de distribución desconocida P, dónde

  •   covaría
  •  
  •  
  • No suponemos que el tratamiento asignado aleatoriamente es completamente al azar

El objetivo es estimar el resultado potencial,  , aquello sería observado si el sujeto fuera asignado el tratamiento A. Luego compare la media de los resultados obtenidos si todos los pacientes en la población fueran asignados a cualquier tratamiento:  . Queremos estimar   usando datos previamente observados  .

Fórmula del estimador

editar

 

Construcción del PPI

editar
  1.   donde    
  2. Construye   de  utilizando cualquier modelo de propensión (a menudo un modelo de regresión logístico).
  3.  

Con el cálculo de la media de cada grupo de tratamiento, se puede utilizar una prueba estadística llamada t-test o ANOVA para analizar las diferencias entre las medias de los  grupos y determinar la importancia estadística de efecto de tratamiento.

Suposiciones

editar
  1. Consistencia: 
  2. Ningún factor de confusión no medidos:  
    • La asignación del tratamiento está basada sólo en datos covariables y resultados potenciales independientes.
  3. Positivo:  for all   and  

Limitaciones

editar

El ponderador de probabilidad inverso (PPI) puede ser inestable si las propensiones estimadas son pequeñas. Si la probabilidad de cualquier asignación de tratamiento es pequeña, entonces el modelo de regresión logístico puede devenir inestable alrededor de las colas que causan que el PPI sea también ser menos estable.

Ponderador de probabilidad inverso aumentado (PPIA)

editar

Un estimador alternativo es el ponderador de probabilidad inverso aumentado (PPIA) que combina ambas, las propiedades del estimador y el ponderador de probabilidad inverso. Es por  lo tanto un método  "doblemente resistente" en el que sólo se requiere o la propensión o el modelo de resultado para ser correctamente especificado pero no ambos. Este método aumenta el PPIA para reducir variabilidad y mejorar la eficacia de estimación. Además este modelo contiene las mismas suposiciones que el ponderador de probabilidad inverso (PPI).[3]

Fórmula del estimador

editar

 


Construcción  del PPIA

editar
  1. Construye el estimador de regresión   para pronosticar un resultado   basado en covariantes   y tratamientos  
  2. Construye el estimador de propensión  
  3. Combina PPIA para obtener  

Referencias

editar
  1. Coscia Requena, Claudia. «Métodos estadísticos para evaluar la causalidad en estudios observacionales». Tesis de Maestria. Universidad Complutense de Madrid. Consultado el 11 de mayo de 2018. 
  2. Horvitz, D. G.; Thompson, D. J. (1952). «A generalization of sampling without replacement from a finite universe». Journal of the American Statistical Association 47: 663-685. doi:10.1080/01621459.1952.10483446. 
  3. Cao, Weihua; Tsiatis, Anastasios A.; Davidian, Marie (2009). «Improving efficiency and robustness of the doubly robust estimator for a population mean with incomplete data». Biometrika 96 (3): 723-734. ISSN 0006-3444. PMC 2798744. PMID 20161511. doi:10.1093/biomet/asp033.