Si de plus en plus d’entreprises sont conscientes de la nécessité d’investir dans des systèmes performants de sauvegarde de leurs données, peu d’entre elles sont sensibilisées à la problématique du Plan de Reprise d’Activité (PRA).
Pourquoi sauvegarder quotidiennement votre système d’information, si ce n’est pour pouvoir continuer à travailler, même quand le pire est arrivé?
Pour illustrer notre propos, voici la solution concrète que nous avons déployée pour l’un de nos clients.
Un PRA de 4 heures seulement.
L’entreprise P. est un cabinet d’expertise qui produit des rapports quotidiennement. L’activité se déploie sur deux sites distants d’une trentaine de kilomètres, la maison mère, site A et une filiale, site B.
L’entreprise P. crée, de par la nature même de son activité, un flux continu de données qu’elle doit nécessairement archiver. Chaque dossier client ouvert comprend différents documents et pèse dans les 10 à 15 Mo. L’ensemble des données de l’entreprise représente une masse de 3 To en expansion constante.
Nous sommes intervenus dans un premier temps pour mettre à jour le système informatique (SI) et plus particulièrement sa composante matérielle. Nous avons commencé par remplacer les 3 serveurs physiques de l’entreprise par une seule machine que nous avons consolidé tant du point de vue matériel que logiciel et sur laquelle nous avons virtualisé les 3 anciens serveurs, grâce à la solution de virtualisation VMWare vSphere. Cette consolidation est très avantageuse pour notre client : une seule machine physique = un seul contrat de maintenance. En concentrant les ressources financières sur une seule machine, on peut pousser la puissance et les capacités de stockage du système.
La question du PRA s’est très vite posée lors de ce nouveau déploiement : l’entreprise P. sauvegarde chaque soir ses données sur un NAS local, mais en cas de destruction physique du site de la maison mère, les données sont irrémédiablement perdues et l’entreprise ne peut maintenir son activité, ce qui est un risque majeur. En fonction des contraintes et des ressources disponibles, nous avons proposé à entreprise P. un PRA de seulement 4 heures. Autrement dit, en cas de sinistre sur le site A., nous garantissons la reprise de l’activité de l’entreprise sous 4 heures pour un investissement tout à fait modeste au regard des enjeux économiques d’une suspension d’activité. La reprise utilise les données sauvegardées lors de la dernière réplication valide, soit les enregistrement validés 12 à 36 heures avant le sinistre.
Nous avons proposé à l’entreprise P. de dupliquer son serveur de virtualisation sur le site B. Ainsi, il nous a suffi de déployer une deuxième machine identique à la première dans le second établissement de l’entreprise et d’y programmer à l’aide de la technologie VEEAM un système automatique de réplication différentielle sur la machine clone via une simple ligne haut débit et qui s’exécute durant la nuit.
En cas de destruction du site A, il nous suffit de démarrer le serveur de secours du site B et d’effectuer un reroutage réseau. Ainsi les utilisateurs du réseau informatique de l’entreprise P. pourront de manière totalement transparente et à partir de n’importe quelle machine, se connecter sur leur bureau à distance via le protocole RDP. Ils retrouveront leur environnement de travail habituel, tel qu’ils l’avaient laissé la veille au soir. Grâce à la solution de sauvegarde intégrale GrizzlyDev, l’entreprise P. n’a pas de perte d’activité à déplorer ni de destruction de données.
Cette solution, à fois efficace et économique, ne nécessite que deux serveurs de virtualisation distants, une sauvegarde locale type NAS et un protocole de sauvegarde différentiel via une simple ligne haut débit.
Évaluer la perte d’exploitation maximum supportable
Toute perte d’exploitation est une perte sèche pour l’entreprise. Certaines peuvent même lui être fatales.
Notre second cas d’école porte sur une entreprise qui avait déjà une solution de sauvegarde de ses données sur un serveur Microsoft Hyper-V. Dans ce cas, l’entreprise Y. sauvegarde ses données en local et n’a prévu aucun PRA en cas de sinistre. La seule sauvegarde externalisée des données se fait manuellement et une fois par semaine. Notre diagnostic PRA a démontré que dans le meilleur des cas, l’entreprise perdrait entre 24 et 48 heures d’activité et qu’elle pouvait perdre jusqu’à 8 jours de données de travail.
La révision de la politique de sauvegarde nous a permis d’optimiser les performances du système, mais dans une certaine limite, puisqu’il s’agissait d’une intervention sans investissement matériel.
Avant notre intervention | Après notre intervention | |
Âge maximal des données | 8 jours | de 12 à 36 heures |
Délai de reprise | 24 à 48 heures (hors restauration matérielle) |
20 à 40 heures (hors restauration matérielle) |
Nous sommes parvenus à limiter la perte de données de 8 jours comme précédemment à seulement 12 à 36 heures avant le sinistre, ce qui est tout de même un gain important. Pour le PRA, le gain est relatif au temps mis pour rééquiper l’entreprise en matériel. Cette étape n’est pas maîtrisable par nos services puisqu’elle dépend du contrat de maintenance souscrit pour le matériel informatique. Cela peut varier de 4 heures pour une simple panne matérielle avec un contrat de support de haut niveau jusqu’à une semaine en cas de rééquipement à neuf. Une fois le matériel nécessaire redéployé, GrizzlyDev intervient pour la restauration des données sauvegardées, ce qui prend de 20 heures, généralement, jusqu’à 40 heures en prenant en compte les aléas informatiques.
Ces deux cas d’école montrent l’importance d’un diagnostic PRA du système d’information de l’entreprise, quels que soient sa taille et son secteur d’activité.