Question Mise à niveau / conception du système SAN


Salutations, je suis un lurker de longue date, une première affiche. Par souci de brièveté, permettez-moi de poser ma question à l’avance, puis de vous donner le récit le plus long, afin que vous puissiez choisir combien de fois vous voulez lire.

Version courte...

Nous avons besoin d’une mise à niveau du réseau de stockage, d’une capacité supplémentaire et de meilleures performances. Notre charge de travail principale sera d'environ 20 machines virtuelles assorties et de deux bases de données SQL. Outre quelques contrôleurs de domaine, Exchange et divers services d'entreprise standard, la charge de travail principale consiste à héberger une application sur Citrix à laquelle environ 300 utilisateurs auront accès tout au long de la journée. Nous disposons actuellement d'un contrôleur SAN HP MSA1500cs avec 2 boîtiers MSA30, presque entièrement rempli avec environ 3,7 To d'espace disque brut. La capacité pure n'est pas vraiment la préoccupation majeure, mais la performance et la fiabilité. Je ne vois pas que nos besoins en capacité dépassent les 10 To dans un avenir proche. La question est, devrions-nous simplement ajouter une enceinte ou 2 à notre contrôleur existant? Devrions-nous mettre à niveau les produits MSA de la génération actuelle, la série MSA2000? Devrions-nous passer à la famille EVA4400? Devrions-nous nous intéresser aux solutions SAN de gauche récemment acquises? Si nous finissons par faire quelque chose en plus d’ajouter de l’espace à notre contrôleur actuel, devrions-nous nous en tenir à fibrechannel ou regarder iSCSI? Le budget n'est pas vraiment défini car il fait partie d'un projet plus vaste avec un parapluie de gros budget, mais je dirais que nous voulons être inférieurs à 50 000 $ et moins chers, c'est toujours mieux.

Version longue...

Nous sommes sur le point d'étendre les services fournis par notre batterie de serveurs. Si vous voulez plus de détails, nous sommes une société de maisons de retraite avec environ 45 maisons de repos. Nous allons implémenter une cartographie entièrement électronique, ce qui signifie que notre utilisation de bases de données et de citrix en particulier augmentera considérablement. À l'heure actuelle, il y a probablement environ deux infirmières dans chaque établissement qui interagissent réellement avec notre logiciel de gestion des dossiers médicaux chaque jour. Cela changera probablement à environ 6 infirmières dans chaque établissement utilisant le logiciel beaucoup plus souvent que l'utilisation actuelle.

En plus du système de dossiers médicaux, nous fournissons un répertoire actif et un échange pour environ 600 utilisateurs, un système de traitement de la paie et la gamme habituelle de services divers. La base de données actuelle (MS SQL 2005) pour le système de dossiers médicaux est d’environ 30 Go et elle augmentera un peu avec le nouveau modèle d’utilisation, mais la fréquence d’accès augmentera plus que la taille brute.

Avant d’obtenir des informations plus précises sur le matériel, permettez-moi de dire que nous sommes une maison HP et que mon patron, le directeur des systèmes d’information, a la tête dure en ce qui concerne la collaboration avec n’importe quel autre fournisseur. Vous et moi ne serons peut-être pas d’accord avec le choix de HP, mais c’est plutôt bien fait.

Nous mettons à niveau notre batterie de serveurs à partir de 16 serveurs lames HP BL20p dotés d'anciens CPU Xeon (machines à double socket mais la plupart ne disposent actuellement que d'un seul processeur) et pas beaucoup de mémoire par rapport aux normes actuelles (capacité maximale de 8 Go prise en charge, beaucoup moins cela) vers des serveurs autonomes probablement modernes, tels que le HP DL580 G5 avec 4 sockets, chacun avec un Xeon ou Opteron 4/6 cœur moderne et 128 Go de mémoire chacun. Nous utilisons actuellement VMWare ESX 3 et prévoyons de passer à une version actuelle de VMWare. J'apprécierais aussi les commentaires sur les serveurs, mais ma question principale concerne notre réseau de stockage, continuez à lire.

J'ai été chargé de rechercher une mise à niveau de notre solution SAN actuelle. Nous disposons actuellement d’un contrôleur HP MSA1500cs et de 2 boîtiers de disques entièrement remplis, avec environ 3,7 To d’espace disque brut. Ces unités et les boîtiers SCSI Ultra320 utilisateur communiquent avec le contrôleur via des connexions u320. Le contrôleur se connecte à la batterie de serveurs à l'aide d'un commutateur SAN fibrechannel à 4 ports et 32 ​​ports. Nous devrons ajouter un peu d’espace pour mettre en œuvre le changement, mais je me préoccupe surtout des performances et de la fiabilité. Je ne vois pas notre capacité de stockage totale dépasser le seuil approximatif de 10 To.

Je suis assez nouveau dans le monde des SAN, et c'est un peu accablant pour le moment. À mon avis, nous avons 3 options principales. Nous pouvons ajouter plus de boîtiers à notre système actuel. Il prend en charge jusqu'à 8 boîtiers et nous n'en avons que 2 pour le moment. Ce serait donc un chemin de mise à niveau très simple. Nous pourrions également passer à la génération actuelle de la famille MSA de HP, la série MSA2000. À mon avis, notre troisième option serait de passer à la prochaine classe de SAN, la série HP EVA. HP affirme que la famille MSA est considérée comme un SAN d'entrée de gamme, ce qui me fait penser que nous aurions peut-être besoin de quelque chose de plus substantiel, mais je réalise que c'est le département marketing qui parle.

Si nous ajoutons simplement quelques pièces jointes à notre contrôleur actuel, nous disposons de suffisamment de ports Fibre Channel pour connecter les nouveaux serveurs, d’autant plus que nous allons retirer plusieurs anciens serveurs. Si nous mettons à niveau un nouveau système SAN, cela soulèvera la question de savoir s'il convient de continuer à utiliser le mode Fibrechannel ou d'utiliser une technologie plus récente (et généralement moins chère) telle que iSCSI ou FCoE.

J'apprécie vos commentaires et vos réponses. Si vous avez des questions à clarifier, n'hésitez pas à demander conseil et j'essaierai de vous donner le plus d'informations possible. Merci d'avance!


6
2017-10-28 16:23


origine


Cela aiderait certainement si vous aviez votre question beaucoup plus tôt. Il est un peu agaçant de devoir lire 5 paragraphes de backstory. Vous obtiendrez peut-être de meilleures réponses si vous le mettez à jour, ce qui en fait une pyramide inversée (en.wikipedia.org/wiki/Pyramid Inverted). Vous voudrez peut-être également poser des questions concrètes dans votre message. À l'heure actuelle, il n'y a qu'une seule question implicite: «Quel est votre conseil? - Zoredache
Merci pour les commentaires. J'ai ajouté une version abrégée au début. - Matt


Réponses:


Le HP MSA1500CS est un périphérique plutôt génial. J'en ai un et je le déteste. Je suis un peu surpris qu'il ait suivi votre charge de travail. Ce n'est probablement pas une surprise si je recommande la mise à niveau vers le MSA2000. Son architecture de stockage est bien meilleure que celle du 1500CS et sa capacité d'évolution est meilleure.

Sans plus de données, je ne peux pas recommander de passer à un EVA4400 (le «groupe d'entrée de gamme d'entreprise» de HP) par rapport au MSA2000. Le 4400 vous mènera beaucoup plus loin que le MSA2000 en termes d’extension, mais je ne sais pas quel type de croissance vous attendez.

RE: LeftHand vs MSA2000

Tant que vous disposez du réseau Ethernet, l’unité LeftHand doit considérablement redimensionner le MSA2000. Le contrôleur de stockage distribué qu’il utilise facilite ce type de travail. Vous paierez plus par étagère de rangement, mais vous pourrez en faire autant. Une fois que vous commencez à atteindre les plafonds d'E / S sur un MSA2000 (ce qui dépend de la technologie de disque que vous utilisez ainsi que de toutes les configurations actives / actives que vous pouvez utiliser), vous avez pratiquement terminé. Pour les produits LeftHand, ce plafond est beaucoup plus épais.

L’approche LeftHand vous sauve vraiment avec la parité RAID. Faire des reconstructions après une panne est la chose la plus intensive en CPU, et c'est là que mon MSA1500cs tombe à plat. Sur mes 1 500 ans, la reconstruction d’une matrice RAID6 sur 6,5 To de disque a pris environ une semaine, période au cours de laquelle elle était profondément intolérante aux écritures d’entrée / sortie à grande échelle sur tout élément de la matrice. Étant donné que LeftHand a un contrôleur dans chaque armoire, replacer un LUN sur une étagère n'affectera pas les performances des LUN sur les autres étagères. C'est très gentil!

En résumé, si vous avez le budget prévu, les appareils LeftHand devraient vous servir beaucoup plus longtemps que le MSA2000.


4
2017-10-28 16:58



J'aime ton blog! Je suis très honoré que vous ayez pris le temps de noter et de répondre à ma question. Je vous remercie. Que pensez-vous des solutions MSA2000 vs. LeftHand? - Matt


En supposant que vous deviez vous en tenir à HP (et que rien n’est horriblement faux), jetez un coup d’œil à la récente acquisition. Solutions HP LeftHand SAN, c’est à peu près tout ce qu’il y a de plus moderne en matière de stockage SAN sur les produits HP ou quiconque Ils vendent une version groupée appelée «Solution SAN pour démarreur HP LeftHand P4300 4,8 To» qui conviendrait assez bien pour les détails généraux que vous avez donnés ci-dessus.

Toutefois, si les performances et les fonctionnalités de votre MSA1500cs vous conviennent, il n’ya aucune raison sérieuse de le remplacer et de le remplacer, à moins que la garantie ne prenne fin et que le contrat de support prolongé coûte trop cher.


2
2017-10-28 16:47



+1 HP a acheté Lefthand pour une raison. - ITGuy24
La fin de la garantie est définitivement un problème. Merci d'avoir signalé les solutions de LeftHand, elles sont très intrigantes! - Matt


Je n'ai aucune expérience particulière des produits de stockage HP, il ne s'agit donc que d'un conseil général. Vous devez prendre du recul et effectuer une analyse approfondie des exigences de performances des systèmes qui doivent \ veulent utiliser votre stockage SAN. La capacité est une métrique, mais vous devez surtout maîtriser les modèles d'E / S - charges IOPS moyennes et maximales par serveur \ service au fil du temps. Découpez-les par volume, examinez ce qui peut être fractionné pour déterminer le type de performances et le profil de capacité requis par ces volumes. Ensuite, examinez le type de combinaisons de disques (capacité, IO par disque, types RAID) pouvant répondre à vos besoins.

En règle générale (très approximative) pour vos estimations initiales de capacité: Disques SAS - IOPS aléatoires maintenus est d’environ 70-90 pour les disques à 7 200 tr / min, 100-120 pour les disques 10k et 150-170 pour les disques 15k. Certains disques seront meilleurs, certaines charges de travail autoriseront des IOPS plus élevées mais les utiliseront dans le cas le plus défavorable.

Les IOPS à lecture aléatoire seront proches de N * IOPS par lecteur pour un ensemble de lecteurs N de tout type RAID normal (10,5,6,50). Les performances en écriture aléatoire entraînent une pénalité (50% pour RAID 10, 75% pour RAID 5 \ 50,> 75% pour RAID6 \ 60). Les performances d'E / S en lecture séquentielle sont RAID 10> 50> 60> 5 mais les différences ne sont pas énormes. les écritures séquentielles sont similaires mais les différences sont plus significatives. Les RAID 6 et 60 ont une excellente résilience, mais les temps de reconstruction sont très longs et les performances se dégradent dans l’ensemble.

N'ignorez pas les performances séquentielles en bloc - vous aurez besoin de nombreuses performances séquentielles pour les sauvegardes.

Si vous souhaitez utiliser des instantanés matériels \ réplication, indiquez à la fois la capacité et la surcharge de performances qui leur sont associées. Une bonne technologie d’instantané ajoute une surcharge d’IO en soi, mais si vous commencez à monter des instantanés sur plusieurs systèmes, la charge d’IO supplémentaire s’ajoutera. Du point de vue de la capacité, les instantanés peuvent utiliser jusqu'à 10% de la taille du volume de base jusqu'à> 100%.

N'oubliez pas que les numéros IOPS de base mentionnés ci-dessus sont les pires scénarios étendus dans lesquels le cache en écriture du contrôleur de la matrice de stockage est surchargé. Idéalement, vous souhaitez éviter cela, mais vous devez savoir si les disques sous-jacents peuvent gérer la charge.

N'oubliez pas que vous devez penser à la manière dont les différentes charges associées à vos volumes de stockage seront découpées à partir des combinaisons de disques et que vous souhaitez vous assurer que les charges IO lourdes sont séparées et placées sur des groupes de disques avec suffisamment de piles et un RAID. tapez 10 ou 50 pour obtenir des performances (relativement) élevées. Le stockage en masse peu performant doit être placé sur des disques moins chers (plus lents) et configuré pour RAID 5.

Une fois que vous avez une bonne idée de l’apparence des combinaisons, vérifiez si les solutions de stockage disponibles vous offrent ces caractéristiques et à quoi ressemblent les configurations. Ensuite, cherchez les prix.

Remarque: j'ai totalement ignoré la partie réseau de cette opération. Vous devez également l'examiner, mais pour la plupart 2G \ 4G FC \, quelques ports iSCSI GigE vous permettront de saturer des E / S aléatoires sur tous les réseaux SAN d'entrée de gamme. Une seule interface GigE doit pouvoir gérer plus de 10000 petites E / S aléatoires (<4K), par exemple. Si vos charges sont fortement axées sur les E / S séquentielles, vous souhaitez disposer de nombreux tuyaux lourds: à peine 2 disques de 10 000 disques peuvent transmettre des données plus rapidement qu'un seul lien réseau GigE (> 125 Mo / s) et une matrice RAID 10 à 8 disques (> 500 Mo) / sec) donnerait un temps difficile à la 4G FC.


2
2017-10-28 23:28





Question intéressante - merci. Moi aussi, je suis un gars de HP et je connais bien tous les produits que vous avez mentionnés.

Évidemment, nous pourrions passer beaucoup de temps à faire le tour de la maison à ce sujet, mais je vous suggérerais de passer à ce qui suit si les budgets sont disponibles;

Les lames HP BL490c G6 dans un châssis C7000, chacune pouvant accueillir deux Xeon quad-core (je préférerais les E5540 comme une belle performance par watt), elles ont 18 emplacements de mémoire, prenez donc 72 Go avec le "sweet-spot" Modules de mémoire de 4 Go et un seul disque SSD de 64 Go à partir duquel démarrer. Si vous avez le budget requis, optez pour une paire d'interconnexions 'Flex-10 Virtual Connect' pour relier vos commutateurs et une paire d'interconnexions '4Gbps FC Virtual Connect' pour vous connecter à votre stockage.

Je choisirais ensuite un EVA 4400 avec le commutateur FC 4 Gbps intégré à 20 ports - il s'agit d'un jobbie à deux contrôleurs assez puissant et TRÈS facile à configurer et à gérer. Il peut également être étendu à un niveau assez important (96 disques sur 1). Je serais tenté d'acheter une seule étagère de disque avec des disques SAS de 12 x 450 Go à 15 000 tr / min, puis d'ajouter d'autres étagères si nécessaire.

Vous pouvez ensuite exécuter ESX 3.5 ou 4 sur ces machines, cela fonctionnera plutôt bien et si vous le souhaitez, vous pouvez ajouter un boîtier supplémentaire au mixage, en séparant les serveurs entre les boîtiers pour fournir un niveau supplémentaire de résilience.

La raison pour laquelle je recommande ces produits est que nous utilisons ce mélange à grande échelle - nous avons littéralement des centaines de boîtiers configurés de la sorte et des milliers de serveurs (bien que vous souhaitiez peut-être envisager le BL460c G6 qui ne possède que 12 emplacements de mémoire (48 Go) mais prend 2 x disques magnétiques si vous voulez la résilience sur le SSD unique). Nous utilisons également de nombreuses EVA (principalement 8100 et 8400, mais beaucoup de 4400 dans nos suites de tests) et toutes fonctionnent parfaitement sous ESX 3.5. Je dors bien la nuit avec ce combo et si cela correspond à votre budget, alors je pense que vous aussi.


1
2017-10-28 17:09



N'obtiendrait-il pas plus pour son argent avec les HP DL580 G5 au lieu de lames? - ITGuy24
Les niveaux de remise varient bien d’un client à l’autre, mais je peux obtenir plus de 2 x BL490c plus et un huitième des coûts de boîtier pour le prix d’une puce DL580 à une puce - les deux fonctionneraient de la même manière et auraient les mêmes coûts de licence, mais les lames partagent 6 unités d'alimentation et ont la performance et la résilience de VC - ses réductions seront bien sûr différentes, mais ce serait un bon exercice - peut-être aussi contre un DL795? - Chopper3
Nous pensons que lorsque nous ne recevons que quelques serveurs, la complexité supplémentaire d'un système lame ne vaut pas la peine, est-ce incorrect? Les lecteurs locaux dans les serveurs n'ont pas beaucoup de sens car tous les ordinateurs virtuels vivront dans le réseau SAN. Quelle est la pratique courante de nos jours pour le lecteur d’amorçage de chaque serveur ESX, un seul disque dur en rotation, un seul disque SSD, 2 disques en rotation en RAID 1, 3 disques en rotation ou plus en RAID 5? - Matt
Convenu, pour un C7000, le «seuil de rentabilité» entre l’achat de lames au lieu de pizzas, mais le serveur est le 6ème serveur - c’est-à-dire si vous avez besoin de 6 lames. Oh, et en ce qui concerne les disques, il est logique d’utiliser une paire de disques bas de gamme matérielle / R1 pour le démarrage afin que vous puissiez survivre à une panne de disque, rien de plus gros / plus rapide / plus résilient n’est requis, mais ce serveur particulier a beaucoup Les fentes de mémoire ne peuvent donc pas être insérées dans les disques magnétiques, ce qui vous oblige à utiliser un disque SSD (il ne possède pas de matériel RAID ni ESX, donc il ne sert à rien dans un second), et bien sûr, il est à peine écrit, donc ne le fait pas tuer le SSD de quelque façon que ce soit. - Chopper3