El Nilo, Internet, y los fractales
Y el precio del algodón, claro, aunque no me cabía en el título. Pero vayamos por partes.Harold Edwin Hurst nació en 1880, cerca de Leicester. De origen humilde, muy pronto destacó en sus estudios, obteniendo una beca que le permitió estudiar en Oxford. Allí se graduó con méritos en Física, sin apenas formación matemática previa. En 1906 le surgió la oportunidad de viajar al aún británico Egipto y Hurst aceptó. En ese país se dedicaría a la investigación durante más de 60 años, por encima de los cambios políticos que sucedieron a la descolonización.
Aunque se ocupó de diversas tareas en sus primeros años (relacionadas con la astronomía o geología), pronto perseveró en el estudio de la meteorología e hidrología. En 1915 Hurst se convirtió en el director del Departamento Físico de Obras Públicas. Y a este departamento le correspondió el problema de domesticar el poderoso río Nilo a los intereses de las industrias y campos a sus orillas. El sistema utilizado para ello, era, claro está, a través de embalses.
Analicemos el problema (simplificado): supongamos que lo que queremos es determinar cuál debe ser la altura mínima de una presa o paredes de los embalses (Figura 1). Para ello, idealmente, sólo necesitamos conocer cuál es la capacidad y forma del embalse, la tasa a la que se puede desalojar el agua del mismo y el caudal máximo que llega a aportar el río a su entrada. Y claro, de las tres cosas, lo único impredecible es esto último. ¿O no?. Determinar ese nivel fue la tarea a la que se enfrentó Hurst.
Por suerte el Nilo es un río histórico, y sus niveles han sido estudiados a lo largo de los siglos por diferentes civilizaciones. Hurst no solo se aplicó en obtener detalladas mediciones del volumen del Nilo en distintos instantes de su época (correlacionados con muchas otras variables), sino que recopiló con tesón los registros históricos que le darían una visión de conjunto.
Hurst se dio cuenta, que, a pesar de la apariencia irregular de las mediciones, seguían cierto patrón agrupado en épocas de sequía e inundaciones. Y lo que es aún más raro, ese patrón irregular se repetía a distintos niveles. Dicho de otra manera: la serie de datos observada a corta distancia -intervalos de días- "se parece" a la serie observada a lo largo de años.
El problema es que entonces no existía ningún modelo matemático que expresase esta idea, así que Hurst creó el suyo. Sin entrar en detalles (ya no tengo mucha soltura matemática), descubrió que la relación entre las medidas podía ajustarse mediante un parámetro de una ecuación, que relaciona la varianza de las muestras agrupada. Si el valor de este coeficiente -coeficiente de Hurst- es 0.5, se considera que el proceso es completamente aleatorio. Si en cambio el valor de éste se encuentra entre 0.5 y 1, se dice que que el proceso sigue el mismo patrón a distintas escalas: se convierte en un proceso autosimilar. En concreto, para el Nilo, este valor era de 0.72.
Los científicos acogieron con escepticismo esta idea. Más que nada porque Hurst había dado con un ajuste, pero no había ofrecido lo más interesante: el por qué sucede de este modo y no de otro cualquiera. Pero tras divulgarse en los años 50 sus resultados, muchos científicos (y de muchos otros campos) midieron valores de 0.7 para fenómenos completamente distintos de los hidrológicos.
Uno de estos científicos era matemático y se llama Benoît Mandelbrot. Estudiaba la economía. Tras publicar un estudio sobre las fluctuaciones del precio del algodón, un amigo le advirtió de las similaridades con los resultados de Hurst. Mandelbrot estudió entonces en profundidad el trabajo de Hurst y concluyó que podía aplicarse a las finanzas, donde las fluctuaciones a largo plazo podían ser previstas gracias al análisis de Hurst. Mandelbrot, de origen judío, acuño dos términos para describir las variaciones en un proceso a larga escala:
El efecto José nos dice que las fluctuaciones de los valores de un proceso a lo largo del tiempo tienden a ser parte de un patrón más amplio. Se denomina de este modo a causa de la predicción que José lanzó sobre Egipto a través de los sueños del Faraón: que a siete años de abundancia seguirían siete de hambruna.Aconteció que pasados dos años tuvo Faraón un sueño. Le parecía que estaba junto al río; y que del río subían siete vacas, hermosas a la vista, y muy gordas, y pacían en el prado. Y que tras ellas subían del río otras siete vacas de feo aspecto y enjutas de carne, y se pararon cerca de las vacas hermosas a la orilla del río; y que las vacas de feo aspecto y enjutas de carne devoraban a las siete vacas hermosas y muy gordas. Y despertó Faraón.
Genesis 41.1-4
El efecto Noé nos dice que, además, cuando se producen los cambios o fluctuaciones, éstas tienden a ser abruptas. Vamos, que de normal llueve poco y con regularidad, pero, de vez en cuando, cae la de Dios.
Los procesos autosimilares se han estudiado con tesón desde entonces. El propio Mandelbrot se convirtió años más tarde en el famoso padre de los fractales, donde la relación entre estos y los primeros es evidente. Hurst siguió estudiando el Nilo hasta sus últimos días y murió en 1978. Pero, ¿qué tiene que ver Internet con todo esto?.Supongamos que un dispositivo de red debe encaminar flujos de información de muchos orígenes a través de una linea (Figura 2). Este dispositivo debe poseer los suficientes recursos para que no se pierda información, esto es, no se desborde. Claro, que siendo ingenieros nos interesa poner lo mínimo posible para que funcione bien. Por tanto, tenemos que calcular con precisión el tamaño de la memoria (llamada buffer) a a la entrada del dispositivo... ¿Les suena este problema?.
Hasta la década de los 90 se creía que las llegadas a un sistema o dispositivo en Internet (tales como un servidor o un router) seguían una distribución de Poisson. Pero entonces varios artículos y estudios empíricos (Leland et al) demostraron que el tráfico de red seguía un patrón autosimilar (o fractal). Por tanto, se podían aplicar todos los análisis realizados en otros campos al diseño de bufferes y asignación de recursos en la red.
La imagen muestra la carga real soportada por un servidor web de tamaño mediano y varios detalles de la misma. El parámetro Hurst estimado para ella es de...
Pero, y pasemos ahora de ingenieros a científicos, ¿por qué el tráfico de la red sigue un patrón autosimilar?. Bien, para eso también hay explicaciones propuestas. Se ha demostrado que la agregación de tráficos ON/OFF genera un patrón autosimilar. Tráfico ON/OFF significa, por ejemplo, que pido una página y me paro un poco. Al poco pido otra página y paro. Agregado significa que si mi hermano está navegando, y mi vecino y sus primos y todas esas peticiones van al mismo servidor, ese tráfico ON/OFF se suma en el destinatario. Pues bien, si el tráfico ON/OFF sigue cierta distribución (secuencia de paradas y peticiones), entonces el agregado resulta autosimilar.
La gracia es que el tamaño de los objetos que residen en la web (paginas, imágenes, archivos...) actúa sobre el tráfico de un modo parecido al descrito. En la web hay una gran cantidad de objetos muy pequeños que actúan como zonas OFF (poco tráfico) cuando los solicitamos. Pero también hay unos pocos objetos muy pesados que generan mucho tráfico (zonas ON) al transferirse. Si sumamos el tráfico de 10 personas con patrones de tráfico ON/OFF obtenemos un patrón de tráfico autosimilar, esto es: su coeficiente Hurst es sensiblemente mayor a 0.5.
No me dirán que no es interesante, ¿no?
Safe Heaven Sobre el estudo de Hurst y Mandelbrot.
Hurst obituary. Vida de Hurst.
El análisis de carga se ha realizado a través del análisis de logs de un servidor mediano. El cálculo estimado del coeficiente de Hurst se ha realizado mediante el programa Selfis.
Posts relacionados