Autor: Dr. José Martín Méndez González
– Todos recuerdan dónde estaban durante el Apagón. ¿Y usted?
– Fue un poco antes de mi época. Yo estaba en casa con mis padres, y tuvimos diez días de oscuridad. Todas las máquinas pararon. Cuando volvió la luz, se había borrado todo. Fotos, archivos, toda la información. Hasta los registros bancarios. Eso no me molestó. Es curioso que solo el papel duró. Teníamos todo en discos duros. Todo en absoluto. Mi mamá todavía llora por nuestras fotos perdidas.
Blade Runner 2049
Muy probablemente la fecha del lunes 4 de octubre de 2021 no quede registrada en los anales de la historia de la tecnología. Sólo fue relevante un día o dos en los medios de comunicación. Después de aproximadamente seis horas sin que funcionara Facebook, WhatsApp e Instagram, el continuum del espacio-tiempo (esa especie de realidad alterna) que crean las redes sociales se restituyó. Por fin, tras refrescar casi patológicamente nuestras pantallas de nuestros teléfonos celulares cada minuto o segundo, bit tras bit, el nuevo contenido comenzaba a inundar los time lines de las redes sociales.
Para algunos, este apagón tecnológico significó un oasis de calma e introspección, más conscientes del presente y la realidad circundante. En una palabra, conectados. Para otros, se tradujo en una fuente de ansiedad, casi una pérdida de su brújula diaria. Para un estrato específico de usuarios, la caída de esa tríada tecnológica significó la pérdida de dinero en sus negocios soportados por la infraestructura de esas redes sociales (influencers, por mencionar los de mayor visibilidad, por ejemplo).
Se estima que tan sólo Facebook perdió un aproximado de $100 millones de dólares por el apagón de 7 horas. Para la inmensa mayoría de los negocios que usan alguna de las redes sociales mencionadas, una pérdida de capital de este orden de magnitud significaría la quiebra seguramente. Para Facebook, esa cifra es cerca de un tercio de lo gana por día.
Hablar de Facebook, WhatsApp e Instagram es hablar de una red de millones de páginas y personas que tejen una miríada de conexiones que envuelven a todo el planeta. Entre las tres, acumulan aproximadamente 6.2 billones de usuarios activos, según datos actualizados a julio de 2021. Esa cifra sobrepasa probablemente a la población que tuvo el Imperio Romano. Y así como los imperios aparecen y desaparecen a lo largo de la historia, uno siempre está tentado a pensar que algo que es “grande” es difícil que “desaparezca” fácilmente. Tendemos a creer que lo “grande” está mejor preparado para soportar los embates de algún ataque u otra amenaza; es decir, que es más robusto.
En las primeras horas del apagón de Facebook se creyó que se había tratado de un ataque directo. Inclusive, se especuló que el supuesto ataque hubiera estado motivado por una explosiva entrevista emitida el domingo anterior a ese fatídico lunes en el programa 60 Minutos. Frances Haugen, exingeniera de Facebook encargada de un grupo destinado a combatir la desinformación, reveló a detalle en 60 Minutos cómo se sesgan los algoritmos para ofrecer contenido que incite al odio en la red social ya que de esa manera se incrementa el número de interacciones que luego se capitalizan en dinero.
Sin embargo, la causa del apagón fue algo menos paranoico y mundano. De acuerdo con el comunicado de Facebook, “la interrupción fue provocada por el sistema que administra la capacidad de nuestra columna vertebral global. La columna vertebral es la red que Facebook ha construido para conectar todas nuestras instalaciones informáticas, que consta de decenas de miles de kilómetros de cables de fibra óptica que cruzan el mundo y conectan todos nuestros centros de datos.”
Más adelante, en el mismo comunicado, se puntualiza lo siguiente: “[…] Durante uno de estos trabajos de mantenimiento de rutina, se emitió un comando con la intención de evaluar la disponibilidad de la capacidad de la [red que conforma la] columna vertebral, que accidentalmente cortó todas las conexiones en nuestra [red que conforma la] columna vertebral, desconectando efectivamente los centros de datos de Facebook a nivel mundial. Nuestros sistemas están diseñados para auditar comandos como estos para evitar errores como este, pero un error en esa herramienta de auditoría le impidió detener correctamente el comando.”
Toda una economía global a merced de unas cuantas palabras de código informático. Lo que me lleva a pensar: ¿qué tan robusta es la red de Facebook realmente? ¿Es este un ejemplo más de ciega arrogancia tecnológica? O simplemente, ¿mientras más compleja, entramada o sofisticada sea una tecnología más frágil se vuelve?
La falla en Facebook me recordó un artículo científico de hace más de 20 años pero que es muy apropiado para entender cómo ciertas redes (hablando en un sentido amplio y no exclusivamente redes sociales) son robustas—es decir, pueden seguir funcionando cualquiera que sea la función que realicen—ante ataques directos o fallas al azar. El artículo al que me refiero se titula Error and attack tolerance of complex networks (Tolerancia a errores y ataques en redes complejas), y fue escrito por uno de los investigadores más connotados del campo de redes complejas: Albert Lászlo Barabási.
Básicamente, las redes complejas se pueden clasificar en dos grandes tipos dependiendo de la distribución de la conectividad de la red, es decir, la probabilidad de que un nodo cualquiera de la red esté conectado a un número “k” de otros nodos. La primera clase de estas redes se caracteriza por ser homogéneas en el sentido de que cada nodo de la red tendrá aproximadamente el mismo número de enlaces que conectan a otros nodos; tienen redundancia. Este tipo de redes se encuentran ejemplificadas en aquellas denominadas de mundo pequeño (small world networks), Erdös-Rényi, o redes al azar. En contraste, la segunda gran clase de redes complejas son aquellas ejemplificadas por el Internet y la World Wide Web-WWW (cosas distintas como mencioné en otra columna), entre otras. En estas, existen algunos pocos nodos (hubs) que poseen o aglutinan muchas conexiones a otros nodos, mientras que el resto de los nodos que componen la red tienen pocas conexiones a otros nodos. A este tipo de redes se les conoce como redes de escala libre (scale-free networks). Las diferencias en las conectividades entre estos dos tipos de redes juegan un papel muy importante cuando se trata de hacer frente a fallas.
La investigación de Barabási y colaborades contempló dos tipos de ataques: remoción al azar de una fracción de nodos (fallas al azar) y dirigida (remover aquellos nodos más conectados). Hallaron que las redes homogéneas no toleran muy bien las fallas al azar: se vuelve cada vez más difícil que la información se mantenga conectada a cada incremento en la fracción de nodos removidos. Esto se debe a que en las redes homogéneas casi todos los nodos tienen el mismo número de conexiones en promedio por lo que remover un nodo causa más daño estructural. Caso contrario fue lo que se observó para las redes de escala libre (heterogéneas): el funcionamiento de la red se mantuvo sin importar el incremento en la fracción de nodos removidos. Esta robustez se explica porque la mayoría de los nodos en la red de escala libre tiene pocas conexiones a otros nodos; remover al azar alguno de ellos se traduce en la remoción de pocos enlaces realmente (poco daño estructural). Más aún, los autores del estudio señalan que esta propiedad podría explicar por qué, a pesar de fallos frecuentes en los routers, no se experimentan apagones en la red global.
Ahora bien, los papeles se invierten cuando las redes son sometidas a ataques dirigidos, es decir, la remoción de los nodos con mayor conectividad. Como en las redes homogéneas la gran mayoría tiene el mismo número de conexiones, esta remoción dirigida no afecta mucho al funcionamiento de la red. Sin embargo, con las redes del tipo escala libre, eliminar menos del 5 % de sus nodos más conectados conlleva daños estructurales (y de funcionamiento) drásticos. Para la Internet y la WWW (o cualquier red de comunicación en general) esto es su talón de Aquiles.
Nótese que los ataques dirigidos requieren de información acerca de la estructura de la red para saber qué nodos deben removerse para causar el máximo daño posible (e. g. ciberespionaje). Si la red de comunicación que soporta a Facebook, WhatsApp e Instagram tiene una estructura del tipo escala libre, entonces, pareciera que su más reciente apagón no se debió a una falla al azar, imprevista. O bien, quizá, sólo se trató de un cisne negro tal como lo concibe Nassim Nicholas Taleb.
Los recientes acontecimientos que afectaron a Facebook me llevan a pensar en otro libro de Nicholas Taleb, muy ad hoc al tema de robustez antes fallas, titulado “Antifrágil”. Taleb define a los sistemas antifrágiles en los siguientes términos: “lo resiliente resiste los choques y se mantiene igual; lo antifrágil mejora”. De primera instancia, es difícil pensar en una red o tecnología creada por la humanidad que cumpla esa definición. Pero creo que existen ejemplos que proporcionan una fuerte motivación para emularlos en ámbitos tecnológicos como el de las redes sociales.
Un ejemplo de antifrágil que se expone en el libro de Taleb pertenece al ámbito de la mitología, con el monstruo acuático Hidra de Lerna que, por cada cabeza que le era amputada regeneraba dos. Por otro lado, los Romanos fueron capaces de crear un concreto que se volvía cada día más fuerte ante el embate salino de las olas que, en lugar de debilitar la estructura la mejoraban. Algunas de esas estructuras siguen en pie en la actualidad. Otro ejemplo de sistema antifrágil lo ofrece Susan Orlean en su libro “El ladrón de orquídeas”. Allí, menciona a las Melaleucas, las cuales fueron introducidas en Florida para drenar zonas pantanosas y proliferaron tanto que se buscó erradicarlas. Lo que no sabían era que, al querer deshacerse de ellas (ya sea quemándolas o cortándolas), las Melaleucas liberan cerca de 20 millones de semillas antes de morir, por lo que acaban “más vivas que muertas”.
Estoy seguro de que estos ejemplos pueden inspirar sistemas tecnológicos que poseen algunas características de antifragilidad. ¿Imaginan redes que, al detectar un ataque, se autogestionen cambiando sus conexiones para disminuir el impacto del ataque? No dudo de que en estos momentos Facebook esté pensando e invirtiendo en nuevas formas de evitar “apagones” como el del lunes pasado.