Pearson, t-Student, Hodrick-Prescott y ARIMA en la práctica

1 de diciembre, 2012 5

Un sábado más y la serie NUMB3RS me inspira a escribir métodos cuantitativos de finanzas en mi blog. Quien lo diría, con lo malo que era en matemáticas y lo poco que me gustaban cuando era pequeño. En este artículo vamos a hablar de algunos conceptos matemáticos que un lector mio (gracias Álvaro Romeo, te invito de nuevo a que me corrijas si hay errores para que todos podamos disfrutar de las matemáticas y el razonamiento logico/cuantitativo :P).

El coeficiente de correlación de Pearson nos permite determinar la relación lineal entre dos series de datos. El valor de dicho coeficiente varía entre -1 y 1. -1 si la correlación es inversa (cuando uno sube el otro baja), 1 si es directa y perfecta. Para más información tenéis la Wikipedia http://es.wikipedia.org/wiki/Coeficiente_de_correlaci%C3%B3n_de_Pearson en el apartado interpretación. Hay una formula de Excel que nos lo calcula. 

Después tenemos  el test de Student para determinar que nuestra hipotesis nula es cierta. En nuestro caso utilizariamos la formula de la wikipedia referente a diferentes tamaños muestrales, diferentes varianzas (http://es.wikipedia.org/wiki/Prueba_t_de_Student). Cuando habla del estimador sin sesgo de la varianza de las dos muestras, imagino que como nuestra muestra no es completa únicamente podemos tomar la varianza de la serie de datos que tenemos. Se realizaría con la función de varianza de Excel y se calcularía todo lo demás.

Para que os hagáis a la idea, la prueba de T-Student se utilizaría, por ejemplo, en el caso de que tengamos dos tratamientos, uno es una pastilla placebo y el otro es una pastilla con medicamentos buenos, entonces utilizamos un conjunto de pacientes y a uno de ellos le subministramos el placebo y a otros cuantos el medicamento bueno. Acto seguido miramos como mejoran (tomandoles la temperatura por ejemplo) para verificar si realmente hay diferencia entre los dos tratamientos. El problema es que no es necesario que el tamaño de los dos grupos sean iguales, ni que su varianza sea la misma.

Mi plan inicial era, en primer lugar, determinar la relación que hay en todas las combinaciones de todos los instrumentos financieros con un programa de ordenador y posteriormente verificar mediante el test de Student la significación estadística de dichas correlaciones detectadas anteriormente, para finalmente especular con ello.

Acto seguido me di cuenta de que, aunque hubiera una relación y fuera cuantificable y comprobable, solo podríamos utilizarla en el momento actual/presente, realmente lo que necesitamos es ver si la serie de datos va adelantada una respecto de la otra. El problema es que estas formulas no nos sirve (o eso creo, corregidme si no es cierto), porque no tratan los precios de cierre que les pasemos como si fueran una serie temporal, sino como si fueran una muestra de datos. Es como cuando estáis en una fábrica, haciendo tornillos y queréis calcular cual es su resistencia, es independiente del tiempo las muestras que tomáis, cosa que en nuestro caso no es así. Necesitamos que la formula tome el factor tiempo, como algo a tener en cuenta en la ecuación, debido a que nosotros si que nos importa que precio va primero y que precio después.

Entonces, pensando, me di cuenta que podríamos verificar las series de datos verificando la correlación estadística y mirar si una serie está adelantada o retrasada respecto a la anterior. Basicamente cogemos un gráfico y lo ponemos debajo otro con el que queramos compararlo (no se si lo visualazáis) y cogemos el gráfico de abajo y lo movemos a la izquierda o a la derecha para verificar si va adelantado o retrasado. Luego, utilizamos un ordenador y realizamos todas las posibles combinaciones entre todos los valores de las bolsas del mundo para verificar por ejemplo, si el Euro Dollar, está adelantado respecto a los indices, 1 sesión por ejemplo. Si es así, miramos que hoy baje el Euro Dollar y nos ponemos a corto a final de la sesión sabiendo que muy probablemente (con un cierto porcentaje de acierto) bajará.

Bueno, pues dándole vueltas a estas ideas, necesitaba una fórmula para detectar si una serie de datos iba adelantada o retrasada respecto a la siguiente y buscando en Google llegué al siguiente artículo donde aparece una fórmula utilizada en series temporales:

http://www.seh-lelha.org/tseries.htm

Esta aventura en búsqueda de teoremas matemáticos y conocimiento me ha llevado a encontrar cosas tan útiles como el filtro de Hodrick-Prescott utilizado para determinar la tendencia de series temporales y muy ámpliamente utilizado por actuarios para predecir el PIB:

83df8835b294c06be8ca2d8b6deeebc4.jpg

Como véis en la imagen es una media móvil pero muy fina y precisa (linea roja), tal vez pueda serles útil a los analistas técnicos si quieren investigar con ella, me parece fascinante.

Además leyendo la página www.seh-lelha.org me introdujo la función de autocorrelación, utilizada en series temporales para verificar la correlación entre dos series temporales distanciados un lapso de tiempo k. Eso era precisamente lo que buscaba, pero leyendo más abajo la propia página me introdujo en los métodos ARIMA para el análisis de series temporales. Las funciones ARIMA se pueden utilizar para predecir cual será el próximo valor de la serie de temporal. Os dejo un gráfico:

ac068bd1ea73019cc1aa244bf1934b95.jpg

y una anotación para que se os haga la boca agua:

02ba4c94552149055ca042a5ecd91181.jpg

En ese caso, el valor que ha predecido es de la serie de pruebas, solo es necesario modificar la hoja de Excel y meterle los precios de la cotización de nuestros valores/indices favoritos, y verificar la precisión de esta herramienta. Si queréis, podéis hacerlo por mi y ya me contáis los resultados, mi tiempo es tan escaso útlimamente, podéis descargaros dichas hojas de calculo en la página www.web-reg.de. La idea es hacerlo 100 veces, con los 100 últimos precios, por ejemplo con una serie de datos semanal para verificar si acierta un porcentaje considerable de veces, si no en el puntuaje exacto, en la tendencia por lo menos para poder abrir largos/cortos según nos convenga.

Saludos y espero que paséis un buen fin de semana, yo voy a comerme mi pizza, que está a punto de salir del horno ¿os he dicho que es mi plato favorito?. ;)


Usuarios a los que les gusta este artículo:

Este artículo tiene 5 comentarios
Hola Mario,

La verdad es que se agradece leer artículos valientes e interesantes, como el tuyo, que traten los mercados desde la óptica cuantitativa a pesar de su complejidad. Es raro encontrarlos.

Respecto al tema que tratas hoy mi opinión es que, para determinar si un valor se adelanta a otro, se podrían calcular correlaciones "móviles" de un periodo dado (como las medias móviles) y observar si cuando disminuye temporalmente la correlación, es indicativo de que un valor le está marcando el camino al otro. Por ejemplo, se puede hacer dicho análisis analizando la correlación temporal entre Bund-Dax. o EurUsd-Dax, etc.

Tienes una buena intuición matemática, te animo a que sigas con tus pesquisas y a que comentes tus hallazgos e impresiones.

Un saludo,


Alvaro
02/12/2012 10:51
Llevo unos días leyendo y buscando información acerca de Series Temporales y Predicción y me topo con esto.

Tu artículo es de gran valía y abre la puerta a investigar el mercado por este camino. Estoy convencido que las matemáticas pueden ser una herramienta interesante para entender el Mercado. Para no gustarte de joven, hablas de conceptos avanzados de Procesos Estocásticos y Series Temporales.

Además, me gustaría añadirte un detalle, y es que los modelos ARIMA no se pueden utilizar para cualquier serie de datos temporales. Es decir, deberíamos comprobar previamente si el proceso estocástico estudiado es estacionario, y si no lo es, hacer una pequeña transformación del mismo para que lo sea.

Hay una amplia (y compleja) teoría matemática detrás de todo esto.

Enhorabuena por tu artículo
02/12/2012 13:07
Hola se me había olvidado postear el link de donde saqué la función de autocorrelación de series temporales. http://www.seh-lelha.org/tseries.htm

Álvaro, supongo que para verificar si un valor se adelanta a otro podemos utilizar t-Student imagino, una vez calculada la correlación.

Hola Carlos, gracias por tu comentario. Si, para hacer el test de arima siempre se toman rendimientos de la serie y se aplican logaritmos neperianos. ln (Cierre(0) - Cierre(1)) y de esa serie se aplican los teoremas/razonamientos matemáticos que queramos.De esta forma imagino que se transforma el proceso a estacionario.

Saludos,
02/12/2012 15:07
Mario: t-Student sirve para contrastar hipótesis y determinar la signifcación estadística de la correlación. No veo cómo emplearla para determinar si una serie está "adelantada" a otra... pero igual tú lo consigues!
Como bien señalas en tu artículo, el órden de los elementos no importa en el cálculo de la correlación (ni en el test de Student, ya que éste analiza la "distribución")
02/12/2012 15:46
Muy interesante Mario. Si me hubieran enfocado la estadística y econometría que dí en la carrera hacia este tipo de fin hubieran sido muuuucho mas entretenidas :)

Ánimo y sigue sacando tiempo para estos post que aportan un enorme valor añadido a inBestia. Enhorabuena!
02/12/2012 15:39
Escriba un nuevo comentario

Identifíquese ó regístrese para comentar el artículo.