La figura 1 fue elaborada con datos de anomalías mensuales de temperatura mínima media (respecto al período 1991-2020) de las estaciones Ceres Aero y Sauce Viejo Aero. Por un lado, tenemos el "gráfico de escalones" con el coeficiente de correlación de Kendall (τ) para cada período móvil de 25 años entre 1958 y 2020 (es decir, desde el τ de las anomalías mensuales de los años 1958-1982 hasta el τ de las anomalías mensuales de los años 1996-2020). Por el otro lado, en el diagrama de puntos, tenemos la cantidad de pares de datos utilizados en cada período, lo llamamos "n". Puede verse que n se mantiene prácticamente constante.
| Figura 1. |
La estación meteorológica Ceres Aero tuvo un traslado de su ubicación en el año 1978, desde el centro de la ciudad hacia la periferia (a menos de 1 km, la localidad no es grande). ¿Podría esta mudanza ser "descubierta" en sus datos si se los comparara con otra serie cercana y altamente correlacionada? Este gráfico de "correlación móvil" parece sugerirlo. Se observa un aumento en τ cuando las anomalías pre-1978 comienzan a tener cada vez menos presencia en los períodos móviles (o viéndolo de otra manera, cuando las anomalías post-1978 empiezan a estar cada vez menos mezcladas con las anomalías pre-1978). ¿Podría ser este un primer intento express para la detección de inhomogeneidades?
Vayamos a otro caso. La Figura 2 muestra la correlación móvil entre Buenos Aires Observatorio Central y Azul, esta vez los períodos tienen una longitud de 20 años.
| Figura 2. |
El coeficiente τ es una alternativa robusta (no es susceptible a la suposiciones particulares sobre la naturaleza de los datos -por ejemplo hay métodos que asumen que los datos siguen una distribución gaussiana-) y resistente (no es fuertemente influenciada por valores outliers) al coeficiente de Pearson. Su cálculo considera la relación entre el par de datos (Xi, Yi) con todos los demás pares de datos (Xj, Yj), en total hay n*(n-1)/2 comparaciones en una muestra de tamaño n. Para i<j (en una serie temporal, la observación (Xi,Yi) ocurrió antes que la observación (Xj,Yj)), tenemos una concordancia si Xi>Yi y Xj>Yj, o si Xi<Yi y Xj<Yj. En todo otro caso, tenemos una discordancia. A modo de ejemplo, contamos con el par de anomalías de marzo de 1991, (-2.2, -1.1), y el par de anomalías de abril de 1991, (-1.8, -0.5), donde el primer elemento es la anomalía de Azul, y el segundo la de Buenos Aires. En este caso estamos ante una relación de pares concordante, pues -2.2 < -1.8 a la vez que -1.1 < -0.5. El coeficiente τ tiene en cuenta la diferencia entre la cantidad de concordancias y discordancias. Si todos los agrupamientos de pares posibles son concordantes, el coeficiente adopta un valor de 1. Si todos los agrupamientos de pares posibles son discordantes, el coeficiente adopta un valor de 0.
Volviendo a la Figura 2, y recordando que el eje de abscisas indica el año de inicio del período móvil de 25 años, si nos centramos en los años que van desde 1960 hasta 1980 lo que vemos es una disminución de τ, es decir un aumento en los agrupaciones de pares discordantes, a la vez que disminuyen las concordancias. Con respecto a 1960, en 1980 es mayor la cantidad de casos donde:
(1) Xi<Xj a la vez que Yi>Yj;
(2) Xi>Xj a la vez que Yi<Yj.
Definimos Dif1 como la diferencia entre la anomalía Xj y la anomalía Xi, es decir Dif1 = Xj - Xi. La Figura 3 muestra el porcentaje de pares concordantes con respecto a la suma de pares concordantes y discordantes (Rel_C), para diferentes intervalos de Dif1. Se comparan los resultados obtenidos con el período 1960-1984 y 1980-2004.
| Figura 3. |
En 1980 respecto a 1960 vemos un corrimiento del Rel_C hacia la derecha y un acentuamiento del mínimo. Que para valores de Dif1 entre 0°C y 2°C se haya producido una disminución en el porcentaje relativo de pares concordantes sugiere que, si se comparan las anomalías de dos meses en Buenos Aires, y la anomalía del mes más reciente resulta ser mayor, si se realizara la misma comparación con los mismos meses en Azul, es más probable que no haya una correspondencia al usar los datos 1980-2004 con respecto a utilizar el período 1960-1984. Esto parece ser el resultado de una disminución en las temperaturas mínimas en Azul tras el traslado. Esto mismo es lo que estaría causando el aumento de Rel_C para Dif1 entre -1°C y 0°C. [Nota aparte, es interesante ver la prácticamente nula existencia de discordancias en los extremos de Dif1, y es que un mes claramente más anómalo con respecto a otro en Buenos Aires, también es un mes claramente más anómalo en Azul.]
No hay comentarios:
Publicar un comentario