Backtesting

término utilizado en el modelado para referirse a probar un modelo predictivo en datos históricos

Backtesting es un término que se usa en modelado para referirse a probar un modelo predictivo utilizando datos históricos. El backtesting es un tipo de retrodicción y un tipo especial de validación cruzada aplicada a períodos de tiempo anteriores.

Análisis financiero

editar

En una estrategia comercial, una estrategia de inversión o un modelo de riesgo, el backtesting busca estimar el desempeño de una estrategia o modelo si se hubiera empleado durante un período anterior. Esto requiere simular condiciones pasadas con suficiente detalle, lo que hace que una limitación del backtesting sea la necesidad de disponer de datos históricos detallados. Una segunda limitación es la incapacidad de modelar estrategias que afectarían los precios históricos. Finalmente, el backtesting, al igual que otros modelos, está limitado por un posible sobreajuste. Es decir, a menudo es posible encontrar una estrategia que hubiera funcionado bien en el pasado, pero que no necesariamente funcionará bien en el futuro.[1]​ A pesar de estas limitaciones, el backtesting proporciona información que no está disponible cuando los modelos y estrategias se prueban con datos sintéticos.

Históricamente, el backtesting solo ha sido realizado por grandes instituciones y administradores de dinero profesionales debido al costo de obtener y usar conjuntos de datos detallados. Sin embargo, el backtrading se utiliza cada vez más de manera amplia y han surgido plataformas independientes de backtesting basadas en la web. Aunque la técnica se usa ampliamente, es propensa a debilidades. Las regulaciones financieras de Basilea requieren que las grandes instituciones financieras realicen backtesting de ciertos modelos de riesgo.

Para un valor en riesgo de 1 día al 99% comprobado 250 días seguidos, la prueba se considera verde (0-95%), naranja (95-99.99%) o roja (99,99-100%), según la siguiente tabla:[2]

 
excepciones de backtesting 10Dx250
VaR de 1 día al 99% probado 250 días
Zona Excepciones numéricas Probabilidad Cumul
Verde 0 8.11% 8.11%
1 20.47% 28.58%
2 25.74% 54.32%
3 21.49% 75.81%
4 13.41% 89.22%
Naranja 5 6.66% 95.88%
6 2.75% 98.63%
7 0.97% 99.60%
8 0.30% 99.89%
9 0.08% 99.97%
Rojo 10 0.02% 99.99%
11 0.00% 100.00%
... ... ...

Para un valor en riesgo de 10 días al 99% comprobado 250 días seguidos, la prueba se considera verde (0-95%), naranja (95-99.99%) o roja (99.99-100%) según la siguiente tabla:

 
Excepciones de backtesting 10Dx250
VaR a 10 días con 99% prueba bachtest de 250 días
Zona Excepciones numéricas Probabilidad Cumul
Verde 0 36.02% 36.02%
1 15.99% 52.01%
2 11.58% 63.59%
3 8.90% 72.49%
4 6.96% 79.44%
5 5.33% 84.78%
6 4.07% 88.85%
7 3.05% 79.44%
8 2.28% 94.17%
Naranja 9 1.74% 95.91%
... ... ...
24 0.01% 99.99%
Rojo 25 0.00% 99.99%
... ... ...

Hindcast

editar
 
Representación temporal de la retroacción.[3]

En oceanografía[4]​ y meteorología,[5]​ el backtesting también se conoce como hindcasting: un hindcast es una forma de probar un modelo matemático; los investigadores ingresan en el modelo entradas conocidas o estimadas para eventos pasados y así analizar qué tan bien la salida coincide con los resultados conocidos.

El hindcasting generalmente se refiere a la integración de un modelo numérico de un período histórico del cual no existe registro de observaciones. Esto distingue una ejecución retrospectiva de un reanálisis. Las observaciones oceanográficas de salinidad y temperatura, así como las observaciones de los parámetros de las olas, como la altura significativa de las olas, son mucho más escasas que las observaciones meteorológicas, lo que hace que la predicción posterior sea más común en la oceanografía que en la meteorología. Además, dado que las ola superficiales representan un sistema forzado en el que el viento es la única fuerza generadora, el pronóstico de las olas se considera a menudo adecuado para generar una representación razonable del clima de las olas con poca necesidad de un nuevo análisis completo. Los hidrólogos utilizan la predicción retrospectiva para los flujos de modelos de arroyos.[6]

Un ejemplo de análisis retrospectivo sería introducir forzamientos climáticos (eventos que fuerzan el cambio) en un modelo climático. Si la retrospectiva mostrara una respuesta climática razonablemente precisa, el modelo se consideraría exitoso.

El reanálisis del ECMWF es un ejemplo de un reanálisis atmosférico combinado junto con una integración de modelo de ola donde no se asimilaron parámetros de ola, lo que hace que la parte de ola sea una ejecución retrospectiva.

Resultados inesperados de la aplicación

editar

En 2003, Dake Chen y sus colegas "entrenaron" inicialmente una computadora, utilizando los datos de la temperatura de la superficie de los océanos de los últimos 20 años.[7]

Luego, después de haber "entrenado" la computadora, realizaron un ejercicio de predicción retrospectiva utilizando datos que se habían recopilado sobre la temperatura de la superficie de los océanos durante el período de 1857 a 2003. No solo descubrieron que su simulación predijo con precisión todos los eventos de El Niño durante los últimos 148 años, sino que también descubrieron, como una "consecuencia no buscada" de ese ejercicio, que su simulación también identificó el presagio que se avecina (hasta 2 años) de cada uno de esos eventos de El Niño.[8]

Véase también

editar

Referencias

editar
  1. BacktestBroker. «Does Backtesting Really Work?». Archivado desde el original el 23 de octubre de 2020. Consultado el 31 de octubre de 2020. 
  2. «Supervisory framework for the use of "backtesting" in conjunction with the internal models approach to market risk capital requirements». Basle Committee on Banking Supervision. January 1996. p. 14. 
  3. Taken from p.145 of Yeates, L.B., Thought Experimentation: A Cognitive Approach, Graduate Diploma in Arts (By Research) dissertation, University of New South Wales, 2004.
  4. «Hindcast approach». OceanWeather Inc. Consultado el 22 de enero de 2013. 
  5. Huijnen, V.; J. Flemming; J. W. Kaiser; A. Inness; J. Leitão; A. Heil; H. J. Eskes; M. G. Schultz; A. Benedetti; J. Hadji-Lazaro; G. Dufour; M. Eremenko (2012). «Hindcast experiments of tropospheric composition during the summer 2010 fires over western Russia». Atmos. Chem. Phys. 12 (9): 4341-4364. Bibcode:2012ACP....12.4341H. doi:10.5194/acp-12-4341-2012. Consultado el 22 de enero de 2013. 
  6. «Guidance on Conducting Streamflow Hindcasting in CHPS». NOAA. Consultado el 22 de enero de 2013. 
  7. Chen, D., Cane, M.A., Kaplan, A., Zebiak, S.E. & Huang, D., "Predictability of El Niño Over the Past 148 Years", Nature, Vol.428, No.6984, (15 April 2004), pp.733-736; Anderson, D., "Testing Time for El Niño", Nature, Vol.428, No.6984, (15 April 2004), pp.709, 711.
  8. Not only did hindcasting demonstrate that the computerized simulation models could predict the onset of El Niño climatic events from changes in the temperature of the ocean's surface temperature that occur up to two years earlier — meaning that there was now, potentially, at least 2 years' lead time — but the results also implied that El Niño events seemed to be the effects of some causal regularity; and, therefore, were not due to simple chance, or to some other "chaotic" event.