Question Niveau de réserve sur HP EVA 4000


Un des disques de notre EVA4000 est mort aujourd'hui. Ce groupe de disques (tous les volumes vraid5 avec niveau de réserve 1 et presque aucun espace pour des volumes supplémentaires, lecteurs 1TiB) est en cours de reconstruction avec "espace disponible", et il faudra au moins 15 heures pour effectuer la mise à niveau / reconstruction.

Nous ne pouvons pas obtenir un nouveau disque avant vendredi. La question est donc de savoir ce qui se passerait si un autre disque venait à mourir avant la fin du nivellement. Perdrions-nous des données? Et après cela, combien de disques supplémentaires pourraient-ils mourir avant de perdre des données? 1 ou 2?

Dans un RAID "habituel", nous serions vulnérables à la perte de données pendant la reconstruction, mais dans ce cas, l'espace réservé à la sauvegarde est réduit. Deux fois la taille du plus gros disque, donc au moins l'effet devrait être le même d'avoir deux disques de rechange.

Merci d'avance.

Mettre à jour: J'ai trouvé des sujets intéressants à propos de cette question, mais je ne peux toujours pas répondre à cette question, alors je commence une prime.

http://blog.thestoragearchitect.com/2008/10/27/understanding-eva/

http://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&url=http%3A%2F%2Fwww.experts-exchange.com%2FStorage%2FStorage_Technology%2FQ_25548177.html (Question d'échange d'experts de Google).


5
2017-10-31 18:28


origine


Vous avez un soutien, correct? - ewwhite
Pas de HP. Les réductions de budget nécessaires ont été accordées à un partenaire par incident de HP. - Samuel
Bummer ... Il y a quelques experts EVA ici. Je porterai ceci à leur attention. - ewwhite


Réponses:


Version courte

Le nivellement est le processus après la reconstruction. Si votre tableau se nivelle, vous êtes aussi en sécurité qu'avant la panne du disque.

Version longue

Lorsque vous perdez un disque, EVA essayera automatiquement d’utiliser tout l’espace disponible. les disques sains restants pour créer une copie redondante des données qui ont utilisé être sur ce disque. Si vous avez un groupe de volumes avec un grand disque virtuel avec Vraid5 et que vous avez perdu un seul disque, l'EVA régénérera les données qui se trouvait sur le disque en panne sur l’espace libre du premier disque. Si il n'y a pas assez d'espace, il utilisera 2, 3 disques ou plus, mais vous obtiendrez un copie redondante de vos données dans les plus brefs délais. Combien de temps ça prend, je ne peux pas vous dire. Mais vous serez de retour à la "vous pouvez perdre un disque et ne perdez pas vos données "dans un temps très court. C’est bien sûr, si vous avoir suffisamment d’espace libre sur vos disques.

Vous avez mentionné épargner. Je ne connais pas ce terme mais j'espère que vous l'êtes parler de "niveau de protection d'échec" qui est l'espace que l'EVA sera réserve pour une urgence comme celle que vous décrivez. Unique niveau de protection signifie qu'il réservera la taille de deux de vos plus grands disques, et double - la taille de quatre disques. EVA ne signalera pas cet espace comme libre. Donc, si vous avez un seul niveau de protection et utilisez 95% avec 16 1 To disques, vous aurez 2To réservés, et utilisez seulement 95% du reste 14 To. Cela représente 13,3 To utilisés et 2,7 To gratuitement. Et si vous prenez le Vraid5 en compte, c’est-à-dire 10,64 To d’espace utilisable et 2,66 To gaspillés pour la parité.

Une fois que l’EVA a effectué une copie redondante sur le moins de disques possible, elle commencez à niveler (je préfère personnellement l'appeler "équilibrage") les données. Ce processus implique de déplacer les données autour de sorte que tous vos disques finissent avec à peu près la même quantité de données à la fin. Ce processus prend terriblement long temps, surtout si votre utilisation est assez élevée, mais vous êtes en sécurité si vous avoir un autre échec en ce moment.

Passez en mode Commande et vérifiez l’état du groupe de volumes. Si ça dit ça c'est nivellement - vous êtes tout aussi en sécurité qu'avant la panne.

Vous disposez maintenant de 15 To d'espace disque brut et vous utilisez 13,3 To. L'EVA souhaite maintenir un niveau de protection unique mais ne peut pas réserver 2 To (vous n’avez que 1,7 To d’utilisé), il est donc probablement en train de demandé niveau de protection unique, et le réel niveau de protection aucun. Il se peut également que votre utilisation dépasse 100%, car vous utilisez 13,3 To et pour satisfaire à l'exigence de protection unique, vous devriez être inférieur à 13 To (total de 15 To - 2 To réservés à la protection simple).

Cela signifie toujours que vous pouvez toujours perdre un autre disque, et vous aurez toujours un stockage en bonne santé. Vous pouvez perdre un deuxième disque et ce sera le Vraid5. redondance qui va protéger vos données (bien que vous puissiez voir un dégradation des performances). Et bien sûr, si vous avez de la chance, vous pouvez survivre à un troisième et quatrième défaillance de disque, tant qu’ils ne sont pas dans le même Vraid bande (le Vraid5 d’EVA ressemble davantage à RAID5 + 0, avec des bandes couvrant plus de 5 disques).

Mettre à jour: Sans rapport avec votre question, mais la dernière Firmware FATA mettre à jour a "un correctif pour les réinitialisations auto-initiées qui peuvent se produire dans de rares cas circonstances ". Croyez-moi, il n’est pas agréable de voir les disques être éjectés d'un groupe de volume sans raison.

Mise à jour 2: Mis à jour car un seul niveau de protection signifie l’espace pour deux disques.


8
2017-11-05 13:00



Les chiffres exacts sont 16 disques (maintenant 15), niveau de protection unique, 95% de l'espace utilisé pour les disques virtuels. Lorsque j'ai posté la question, je pensais que le tableau était en train de faire le nivellement, mais je pense que cela a réellement commencé après la reconstruction que vous décrivez. Merci. - Samuel
Comme l’a souligné fireto, le niveau de protection "unique" réserve la place deux disques. J'ai mis à jour ma réponse après vérification. - chutz


J'ai eu une expérience similaire avec mon MSA 4400. Nous l'avons maintenu à une capacité de 95%, mais il commençait à avoir 9 pannes de disque par mois, donc je connais un peu le désastre des pertes de données.

Vous disposez de plusieurs niveaux d’espace de travail qui peuvent vous empêcher de perdre des données, et il est difficile de savoir lequel vous êtes actuellement. L'espace disponible est un gros, évidemment. En outre, le niveau de vraid que vous utilisez jouera un rôle. En outre, même lorsque vous échangez ce lecteur, il devra être reconstruit à nouveau.

La principale chose à surveiller est le niveau de protection contre les défaillances de votre piscine. Vous pouvez définir un niveau demandé (comme double), puis le comparer au niveau réel (unique ou nul). Cela dit, même si vous passez de double à zéro en une seule panne de disque (une des choses que je déteste le plus à propos de cette case est qu’elle le permet), vous pouvez toujours empêcher le tableau d’empêcher la perte de données à parité. vraid ou autre magie noire.


4
2017-11-05 12:37



J'ai utilisé à peu près tous les EVA depuis le premier jour et ils sont généralement excellents mais je n'ira pas près leurs disques FATA de 1 To après que nous ayons rencontré d’énormes difficultés avec eux. Ils ne sont pas conçus pour un travail 24 heures sur 24, 365 jours par an, avec un cycle de travail de seulement 30%, et ils sont plus difficiles à travailler que cela ne les tue. Le problème, c’est que la mise à niveau est un processus qui dure 24 heures par jour. Vous avez donc l’effet domino de l’échec d’un disque FATA, un démarrage de mise à niveau qui tue d’autres disques, ce qui signifie un redémarrage de mise à niveau - c’est une farce et HP ne s’est jamais correctement tenu la main à cela, alors j'évite ces disques. - Chopper3
Je voyais 9 échecs par mois sur mes disques de 450 Go. Je pense que j'ai un citron. - Basil


Pour HP EVA:
Niveau 1 = la capacité de deux des plus gros disques configurés est réservée à la réserve

Ce qui signifie que si vous perdez 2 de vos disques, vous n’avez plus de disque de secours et ne comptez que sur la parité RAID5. Dans votre situation actuelle, vous pouvez perdre 1 disque supplémentaire sans dégradation de matrice et 2 autres disques sans perte de données, mais avec des performances dégradées. Dans nos organisations, nous avons TOUJOURS 2 disques de réserve à l'extérieur de l'enceinte et maintenus à la même température (aucun tempérage ne sera nécessaire avant l'insertion).


1
2017-11-06 16:56



Vous avez raison. Un seul niveau signifie un espace pour deux disques. J'ai mis à jour ma réponse avec le bon numéro. - chutz