Plus moyen de poster ses selfies sur Instagram, de partager ses états d'âme sur Facebook, de jouer sur Oculus mais aussi de communiquer via WhatsApp. Comment Facebook a-t-il pu tomber en panne dans son intégralité hier pendant près de six heures ?
Santosh Janardhan, le responsable de l'infrastructure de la plateforme, explique dans un billet de blog que ce sont des changements de configuration sur les routeurs coordonnant le trafic entre les différents centres de données qui sont à la base du problème. « La perturbation du trafic a eu un effet cascade sur la façon dont nos centres de données communiquent, entraînant l'interruption de nos services », ajoute-t-il.
La panne ayant affecté jusqu'aux outils internes de Facebook, cela a compliqué significativement sa réparation. Des employés ne pouvaient même pas regagner leur bureau car le système d'accès par badge ne fonctionnait plus.
Santosh Janardhan n'entre pas dans les détails techniques, mais il tient à souligner que la cause de cette panne était bel et bien une erreur de configuration et que les données des utilisateurs n'ont été nullement compromises. D'après plusieurs analyses concordantes, dont celles du spécialiste Stéphane Bortzmeyer et de Cloudflare, les serveurs DNS de Facebook, qui font la correspondance entre les noms de domaine et les adresses IP, étaient inaccessibles. C'est plus spécifiquement une erreur liée à Border Gateway Protocol, un mécanisme de routage d'information entre serveurs, qui a empêché les serveurs DNS de répondre.