Korben, roi d’internet, logo bébé avec des lunettes en mode thug life Korben, roi d’internet, logo bébé avec des lunettes en mode thug life

Korben Upgrade your mind

OVH est down – Pas de paniiiiiiique !

Vous connaissez sans doute tous la fameuse loi de Murphy, qui s’arrange toujours pour ajouter des problèmes sur les problèmes existants. Et en général quand une cascade débute ça s’enchaîne et tout ce qu’on peut faire c’est écoper en attendant que ça aille mieux le lendemain.

C’est ce qui arrive à OVH aujourd’hui, qui rencontre de gros soucis sur son infrastructure. Octave Klaba, son fondateur vient de poster un tweet expliquant le problème :

Nous avons un souci d’alimentation de SBG1/SBG4. Les 2 arrivées électriques EDF sont down (!!) et les 2 chaines de groupes électrogènes se sont mises en défaut (!!!). L’ensemble de 4 arrivées électriques n’alimente plus la salle de routage. Nous sommes tous sur le problème. En plus de souci sur SBG, nous avons le souci sur le réseau optique en Europe qui interconnecte RBX et GRA avec les POP. Il est down (!!).

Je publie cet article, histoire de vous tenir au courant, afin que vous ne paniquiez pas. Il n’y a pas vraiment de soucis avec votre serveur, il est juste débranché. C’est clairement exceptionnel comme situation, et j’espère qu’ils vont résoudre tout ça très vite. En attendant, inspirez et expirez profondément et profitez en pour aller respirer un peu d’air frais ou vous mettre à la méditation.

Bon courage aux équipes d’OVH et bon courage à tous ceux qui ont comme moi des serveurs, des connexions ADSL ou leur boite mail chez eux (cool, enfin un peu de calme pour bosser).

Clé HDMI avec Miracast et DLNA pour streaming TV MMS-1080 TVPeCee | Pearl.fr

Transformez votre téléviseur en lecteur streaming ! Il vous suffit de brancher la clé sur un port HDMI et le tour est joué. Appariez-la à votre appareil mobile pour transférer le contenu de ce dernier vers votre appareil de lecture. L’idéal pour profiter de vos photos, vidéos et mêmes applications en grand !


Réponses notables

  1. tioker says:

    Bonsoir,
    Pour une fois je trouve ton commentaire un peu léger. Avoir un site physique entier dans le noir alors qu’on se dit professionnel de l’hébergement, le mot “bon courage” n’est pas celui qui me vient en premier à l’esprit mais plutôt “comment ça se fait?”.
    Je pense que les tests de bascule n’ont pas été soigneusement menés, ou pas assez réguliers. Et la loi de Murphy a bon dos. J’espère simplement qu’OVH va communiquer sur les vraies raisons de cette panne majeure et qu’ils vont proposer un plan correctif qui devra être en accord avec les normes ISO qu’ils se vantent de respecter; la 20000 pour la gestion des process ITIL, la 27001 pour la sécurité et 9001 bien sûr.
    Les sites marchands privés de commerce pendant une demi-journée ont bien le droit à quelques explications - voir dédommagements si c’est dans leur contrat.
    Cordialement

  2. tioker says:

    @tontonballo bonjour,
    La communication est essentielle dans ces cas de figure. Je ne vois pas en quoi elle était exemplaire quand:

    • panne à 7h23. A 8h00, seuls les réseaux sociaux en parlent.
    • je ne trouve pas trace de communication rapide par OVH dans les premières heures de la matinée
    • 3h30 minimum dans le noir; même le site OVH était inaccessible

    Maintenant, si la communication à posteriori semble transparente, il est tout de même à noter que “le réseau électrique de Strasbourg a hérité des imperfections électriques liées à la faible ambition initiale prévue pour le site”. Et pour faire encore plus court, ils ont déployé des serveurs sensibles sur un site qui n’était pas prévu pour ça à l’origine.
    Enfin, je ne pense pas que les sites sensibles (outils de salariés - sites de e-commerce) ont oublié si vite cette panne. Le taux de disponibilité a été descendu à 99,5% pour le mois sur ce seul incident, ce qui dans un contrat de haute disponibilité est vraiment faible.
    Enfin, le site d’OVH.com ne fait aucune référence à cet incident, et il faut naviguer sur le net pour trouver des explications du fournisseur de services.
    Ils ne faut effectivement pas les descendre mais ils doivent assurer leurs clients qu’ils ont pris toutes les mesures pour que ça ne se reproduise plus … et le prouver.
    Cordialement.

  3. tioker says:

    @tontonballo
    Si les mêmes tuyaux on a; et pour preuve la phrase que j’ai citée qui vient directement du tweet du directeur d’OVH:
    _“le réseau électrique de Strasbourg a hérité des imperfections électriques liées à la faible ambition initiale prévue pour le site”.
    Mais on ne doit pas en avoir la même lecture.
    Sinon, pour le débat… Je suis à la retraite mais j’ai fini ma carrière dans une grande entreprise française d’infogérance. Ainsi je me permets d’avoir un œil critique sur cette gestion de crise et peut-être sur l’analyse des causes de cet incident. Comme certifié Itil et surtout pour avoir activement participé aux certifications sécurité de l’entreprise, il est très important de montrer comment on prévient nos risques et surtout quels sont les processus qui nous assurent que notre prévention est efficace. Dans une architecture tiers trois ou plus, un des meilleurs scénarios est d’avoir une procédure de réelle bascule régulière, dans le genre “un mois je tourne d’un côté, un mois de l’autre”. Rien que pour le tiers trois, je crois me souvenir que la séparation des sources devait aller jusqu’à l’alimentation en eau des salles.
    Maintenant je dois le reconnaître; même si j’ai été touché par cet incident (site), je n’ai pas de contrat de haute disponibilité avec OVH. Et surtout je ne sais pas quel type de client est hébergé sur le site de Strasbourg. Sont-ce de clients comme moi, sites de PME ou activités annexes, ou des sociétés majeures qui perdent du chiffre d’affaire dès qu’une interruption, même mineure, touche leur système d’information.
    Moi, dans les faits, je n’ai pas eu d’information sur l’incident en dehors des réseaux sociaux (mais je n’ai pas téléphone non plus) et il serait intéressant qu’OVH (et les autres) puissent avoir un canal de communication qui soit complètement séparé de leur propre infrastructure pour éviter que “le double des clés soit sur le trousseau qu’on a perdu…(vécu)”.

    PS: dans la série de tweet que j’ai mise en lien, je n’arrive pas à savoir sur celui qui compte le nombre de serveurs encore en panne date de 9:01 ou 17:53.

  4. tioker says:

    @tontonballo
    Voilà, on est presque d’accord … en tous les cas la discussion semble vous paraître (comme pour moi) constructive.
    Pour anecdote et ayant été confronté à une crise liée à ce sujet, je vous transmets un lien Korben sur un article de 2013 que nous avons pu (à nos dépends) vérifier. Et ayant travaillé sur un site dont les contraintes d’origine avaient du mal à suivre les évolutions technologiques (c’est vrai, la haute disponibilité sur les premiers serveurs Unix, à part le Raid 5, c’était pas prévu…), les gestions de crise étaient malheureusement trop fréquentes à mon goût (bien que les taux de disponibilité étaient toujours respectés).
    Voilà, bonne continuation.
    Cordialement.

  5. Bon, ce que je vais dire est hors sujet mais, en lisant l’article, notamment ces passages :

    C’est ce qui arrive à OVH aujourd’hui, qui rencontre de gros soucis sur son infrastructure.
    Nous avons un souci d’alimentation de SBG1/SBG4
    En plus de souci sur SBG, nous avons le souci sur le rése
    Il n’y a pas vraiment de soucis avec votre serveur

    Je ne peux m’empêcher de regretter la disparition du terme problème au profit de souci… On dirait qu’aujourd’hui, désigner un problème comme problème est un problème pour beaucoup.

  6. Ah merci ça fait du bien :slight_smile:

Continuer la discussion sur Korben Communauté

6 commentaires supplémentaires dans les réponses

Participants