Accueil Actualité du site

Casinews - L'Actualité du site Casimages.com

Vous trouverez ci-dessous les informations concernant le site en général

Améliorations, travaux, perturbations réseaux ou nouveautés, cette page vous permettra de rester informé en permanence.

Casinews - L'Actualité de Casimages

13-10-2014 - [Fini]Incident chez OVH
14-09-2014 - [Fini]Filer #2
16-12-2013 - [Fini]Incident NSM01 NSM04 NSM05
22-10-2013 - [Planifié]Maintenance NSM03 NSM07
07-09-2013 - [Fini]Incident NSA34
07-09-2013 - [Fini]Maintenance NSM03 et NSM07
27-08-2013 - [Fini]Incident NSM01 et NSM05
30-01-2011 - [Fini]Transfert NSM01
25-09-2010 - [Fini]Forte perturbation du serveur principal
14-08-2010 - [Fini]Transfert Nsa02 Nsa04

27-08-2013 - [Fini]Incident NSM01 et NSM05

Bonjour,

Un incident est en cours sur le serveur dédié qui héberge les domaines nsm01 et nsm05. La panne devait être réparer ce mardi matin aux environs de 10h00, toutefois, après avoir réussi à réassembler le Raid5 en mode 'secours', le redemarrage du serveur en mode 'productif' fait perdre à nouveau 2 disques sur les 4.
De ce fait, nous allons transférer dès que possible les données vers un nouveau serveur. Nous souhaitions relancé le serveur et réaliser le transfert en parallèle afin de réduire le temps d'indisponibilité, mais ceci n'est pas réalisable.


Edit : D'ici 19h15, nous devrions être fixé sur l'opération que nous avons entrepris suite à l'échec de ce matin.

Edit : 19h35 : L'opération de la dernière chance semble avoir porté ses fruits !!
Cela va nous permettre de procéder à un transfert de serveur en parallèle.
Nous attendons la livraison du nouveau serveur d'ici 24/48h et commencerons le transfert.
Tout devrait être transparent, esperons que le serveur actuel tiendra encore 48/72h le temps que tout rentre dans l'ordre.

Edit 29/08/2013 - 23h45 : La livraison du serveur est toujours en attente, toutefois, le serveur étant de nouveau stable, nous pouvons patienter plus "sereinement" après ces 3 jours stressants.

Edit 02/09/2013 - 18h00 : La commande vient d'être passée ! Le serveur devrait nous être livré d'ici 20h00, à en croire les informations fournies sur le site de notre prestataire. Si c'est le cas, cette nuit nous pourrons commencer le paramétrage du nouveau serveur et le transfert des images des NSM01 et NSM05.

Edit 05/10/2013 - Du fait du blocage sans précédent concernant la livraison des serveurs chez notre prestataire de service OVH, nous ne pouvons pas entreprendre le transfert que nous avions planifié précedemment. En effet, en cas de soucis technique, aucun serveur ne nous serait livré, par conséquent, nous préférons conserver les serveurs actuels dans la mesure où ces derniers ne présentent plus de problème. Dès que nous le pourrons, nous mettrons en oeuvre le transfert pour pouvoir ainsi cloturer l'ainsi en cours. L'accès aux images n'est pas impacté pendant cette période d'attente.

Edit 21/10/2013 - 15h00 : Le serveur a de nouveau fait des siennes. Comme indiqué ci-dessus, nous ne pouvons malheureusement pas réaliser l'opération que nous souhaiterions. Par conséquent, lorsque la resynchronisation sera terminée, c'est à dire d'ici 12h00, nous réaliserons alors une opération de maintenance la nuit ( entre 1h00 et 6h00 ) afin d'isoler les 2 disques posant problèmes dans le but de les faire remplacer par OVH. Pendant cette période, les images seront inaccessibles par conséquent nous vous prions de bien vouloir nous excuser pour la gêne passée et à venir.
Comme certains l'ont sans doute remarqué, les personnes dont l'offre arrive ou est arrivée a expiration ne sont pas obligées de renouveler pour le moment.
En effet, dans la mesure où le service n'est pas pleinement fonctionnel, il est normal de ne pas vous demander le renouvellement. Vous pouvez alors continuer d'utiliser votre offre. Dès que la période de turbulences que nous traversons sera derrière nous, nous relancerons les renouvellements.

Edit 22/10/2013 - 6h15 : Le serveur vient de planter lors de la reconstruction du RAID. Nous devons réussir à remonter 1 des 2 disques manquants afin de demander le remplacement d'un des 2 disques. En effet, pour changer un disque dans un RAID5, il faut minimum 3 disques actifs et nous n'en n'avons que 2 pour l'instant. Nous faisons le maximum pour récuperer le 3e disque.
Avoir 1 disque qui tombe en panne, c'est tout de même assez rare, alors 2 disques exactement en même temps, ca l'est encore plus.
Bien que nous prenions des précautions quand a la sécurité de nos serveurs, parfois cela ne suffit pas. Ajouter à cela, l'impossibilité d'être livrer par notre fournisseur OVH, cela fait beaucoup.
Sachez que nous faisons le maximum pour rétablir le service de manière définitive.

Edit 22/10/2013 - 10h30 : Après une nuit entière à faire le maximum pour rétablir l'accès au serveur, nous avons enfin réussi à récuperer un disque sur les 2. L'incident est maintenant dans les mains de notre fournisseur, nous attendons donc le changement du disque SDA qui devrait intervenir d'ici peu de temps.

Edit 23/10/2013 - 10h00 : Le disque SDA a été changé hier avec succès. Le disque SDB a été également changé mais ce matin, cependant, le serveur ne boot plus sur le disque en local. Nous sommes entrain d'intervenir dessus afin de corriger le problème qui n'a pas lieu d'être.

Edit 23/10/2013 - 22h45 : La resynchronisation est toujours en cours depuis ce matin et sera achevée dans 1h15. Après cela, nous devrions retrouver le plein fonctionnement du serveur dans la mesure où les 2 disques déféctueux identifiés ont été changés.

Edit 24/10/2013 - 1h00 : Ca y est ! Le serveur est reparti avec ses 4 disques pleinement fonctionnel. L'affichage des images est restauré. Après 2 jours de travail acharné, le service est à nouveau opérationnel. Il ne reste plus qu'à surveiller de près le serveur pendant quelques semaines et on pourra clôturer l'incident. Comme vous pouvez sans doute le remarquer, lorsqu'il y a de la maintenance ou des interventions obligatoires, nous faisons le maximum pour que cela se fasse la nuit, toutefois, lorsque le problème est critique, il nous faut également intervenir le jour, comme ca a été le cas pour ce serveur. Le principal étant, je pense, de ne pas perdre les données quit à ce que le service soit interrompu temporairement. Fort heureusement, les pannes de ce genre sont rares sur Casimages, toutefois, depuis quelques années, j'ai comme l'impression que le matériel en général est moins fiable/stable, ce qui se ressent dans le service, malheureusement, nous n'y pouvons rien.

Veuillez nous excuser pour la gêne occasionnée.

Cordialement,

---
Le Support Casimages