Question Structure de serveur tolérant aux pannes pour les plus petites entreprises


J'essaie de comprendre ce qu'il faut faire pour une petite entreprise en proie à des problèmes matériels ridicules. À l'heure actuelle, cette entreprise fonctionne sur cinq ou six ordinateurs de bureau; aucune infrastructure de serveur n'est en place. En plus de cela, et je n'embellis pas cela, ils ont vu quatre pannes matérielles cette année depuis le début, ce qui les a amenés à la limite de la folie.

J'ai déjà discuté avec eux de la possibilité de mettre en place un serveur Small Business Server (un microsoft shop), et ils sont réceptifs à cette idée. Je prévois également de me mouiller les pieds avec System Center Essentials afin de rester vigilant. L'objectif est alors de s'assurer que ce serveur reste disponible.

En outre, je viens de lire cet autre fil de haute disponibilité. Tout comme le gars dans ce fil, je suis très nouveau pour l'informatique, venant d'un fond de programmation.

Quelques idées me viennent à l’esprit:

  • Raid-5 simple avec remplacement à chaud modifier: et hot-spare
  • Procurez-vous deux machines serveur moins chères, configurez-le pour exécuter un serveur virtualisé avec migration à chaud (j'ai lu un texte, mais malheureusement, je ne peux pas dire si SBS Standard et SCE le prendront en charge)
  • Regroupement par basculement? J'ai eu ce terme de l'autre fil mais je n'y ai pas été exposé par le passé.

Existe-t-il une meilleure pratique en la matière? Le propriétaire de l'entreprise est prêt à fouiller un peu dans ses poches car il commence à avoir peur des temps d'arrêt, mais je n'ai aucune expérience en la matière qui me conduise dans une direction plutôt que dans l'autre.

J'apprécierais votre sagesse!

modifier: Pour fournir quelques détails supplémentaires sur les problèmes qu’ils ont rencontrés, il s’agissait d’un étrange mélange d’échecs inexplicables.

  • switch on chassis ne parvient pas à mettre le système sous tension: la carte mère disposait d'un commutateur intégré, ce qui permettait de résoudre le problème, mais le fait de débrancher le boîtier ne réglait pas le problème. Plus tard, éteindre la carte mère n'a pas résolu le problème non plus.
  • Deux machines identiques ont toutes les deux subi des pannes de disque dans leurs baies RAID 1, et les deux machines ont été assemblées il y a moins de 5 mois.
  • Problèmes d'échec de démarrage: un système de raid-1 ne parvient pas à démarrer. Malheureusement, je n'ai pas écrit le message d'erreur d'origine, mais dans mes notes, il est écrit que "Echec de l'enregistrement des options de démarrage" dans Windows Repair & Recovery m'a conduit à ce fil qui a soutenu mes soupçons qu'il s'agissait d'un problème lié au matériel.

modifier: En outre, les machines fonctionnent dans une série de bureaux à domicile, ce qui fait que l'électricité de niveau résidentiel est en jeu. Je suppose que cela peut être un facteur contributif plus important que celui que je lui avais attribué. Cependant, les machines fonctionnent toutes sur des bureaux (littéralement des ordinateurs de bureau!) Et non sur le sol; Je ne crois pas qu'il y ait de la poussière.


6
2017-08-17 14:16


origine


Donc, c'étaient des machines construites à la maison et non d'un fournisseur (c'est-à-dire: dell, hp)? - GregD
Oui, les machines ont toutes été fabriquées sur mesure et de très jolies pièces (c’est-à-dire trop usé). Le propriétaire a de fortes prédispositions à l’égard de HP, de Dell et d’IBM, malgré les pressions que j’ai adressées à Dell (avec qui j’ai personnellement eu une grande expérience). - bwerks
Existe-t-il vraiment un besoin commercial pour les types de configuration pour lesquels vous vous interrogez (par exemple: SBS virtualisé en hyper-v, HA, etc.) ?? Je veux dire, ces gens travaillent-ils sur un logiciel vie / mort ici? Je suis juste curieux parce que vous parlez de 5-6 utilisateurs. Bien que le propriétaire puisse être frustré par le temps d'immobilisation qu'il a vu, toutes les HA dont vous parlez sont en train de mettre en place, cela ressemble à une réaction instinctive à cette frustration. Les environnements les plus stables que j'ai configurés et gérés sont les plus simples. - GregD
Je n'essaie vraiment pas de paraître curmudgenly (sp?). Lorsque vous commencez à entrer dans le domaine des coûts et de la complexité de la haute disponibilité, il peut exploser. Une partie de mon travail d’administrateur système consiste à traduire les besoins de l’entreprise en besoins technologiques. Bien que le propriétaire puisse être disposé à injecter de l'argent à son problème actuel (temps d'arrêt), il existe des moyens beaucoup plus simples d'accomplir cela sans compliquer inutilement la gestion du domaine. - GregD
Je ferais de mon mieux pour l'amener à abandonner le matériel "sur mesure" et à faire appel à un fournisseur comme Dell. J'ai eu le plaisir de soutenir Dell dans un environnement d'entreprise au cours des 12 dernières années. Leurs serveurs et leurs postes de travail sont extrêmement solides. La seule exception à cette règle est un Optiplex de petite taille (280?) Fabriqué il y a environ 6 ans. Ceux-ci avaient des problèmes de refroidissement et il était connu que les blocs d'alimentation donnaient tôt. Leur support technique est remarquable, surtout si vous avez la chance d'être certifié Dell. - GregD


Réponses:


Tout d'abord, SCE est excessif pour 5-6 ordinateurs de bureau. WSUS est probablement une meilleure option et est gratuit.

Vous n'avez pas beaucoup parlé de ce qui a échoué. Était-ce une partie de la machine? Est-ce un environnement poussiéreux? Mon environnement de support principal est composé d'environ 40 utilisateurs et d'environ 10 serveurs (virtualisés non compris). Nous achetons des machines Dell (Optiplex) et nous avons eu peut être 4 pannes matérielles au cours des 5 dernières années sur TOUS ces problèmes. Donc, ce que vous voyez sur les postes de travail n'est pas normal.

Ont-ils une salle / emplacement de serveur appropriée pour le serveur (avec refroidissement et peu de poussière, au moins?)

Raid-5 avec échange à chaud est un moyen peu coûteux d’aller sur ce serveur et offre une certaine protection contre les pannes de disque dur. J'ajouterais également des blocs d'alimentation redondants (peu coûteux) et un onduleur.

  • Matériel de classe serveur
  • Raid sur les disques durs  (modifié pour ajouter) Avoir un disque de rechange disponible est probablement une surcharge, dans la mesure où la plupart des disques sous garantie peuvent être suspendus du jour au lendemain. Avec 3 lecteurs dans un raid-5 par exemple, vous pouvez perdre un lecteur et rester en ordre jusqu'à ce que le nouveau arrive. Perdez> 1 disque cependant, vous êtes foutu, peu importe comment vous le regardez.
  • alimentations redondantes
  • Bonne garantie (Avec Dell par exemple, nous obtenons le prochain jour ouvrable et conservons votre disque dur car nous pouvons vivre avec une journée d'indisponibilité sur l'un de nos serveurs.)
  • Solution de sauvegarde

Regroupement par basculement? Vous commencez à entrer dans un domaine à la fois coûteux et complexe pour un environnement aussi petit. Rappelez-vous que dans un si petit environnement, même si la disponibilité est importante, il est également important de vous rappeler que vous souhaitez garder les choses aussi simples que possible.

En ce qui concerne les postes de travail, corrigez le problème (pour lequel vous n’avez pas été très clair). Peut-être pourriez-vous acheter un poste de travail "supplémentaire" contenant votre image de base, prenant toutes vos mises à jour de WSUS et pouvant être utilisé comme machine d'échange si l'un de leurs postes de travail venait à mourir (ce que nous faisons) . Nous avons également un tas de pièces que nous pouvons échanger pour remplacer les pièces les plus courantes qui meurent (blocs d'alimentation, béliers, disques durs) jusqu'à l'arrivée des pièces sous garantie.

Sauvegardes. Aucune quantité de redondance ne peut remplacer de bonnes sauvegardes. Vous avez de nombreuses options ici. Avec un si petit environnement, vous pourriez envisager de nombreuses solutions (Mozy, Carbonite, par exemple) qui prennent en charge les opérations hors site et automatisées en même temps pour un coût raisonnable. Vous pouvez également utiliser une solution de bande et utiliser un service tel que Iron Mountain pour stocker les bandes hors site. Quoi que vous fassiez, ne prenez pas de cassettes à la maison avec vous! surtout s'ils ont des informations précieuses sur eux (SS #, etc.)


5
2017-08-17 14:21



Pour être clair, j'étais plus intéressé par les aspects SCOM / SCVMM de SCE que par SCCM. Étant donné ma connaissance limitée de WSUS et de SCCM, j'ai l'impression que SCCM est un emballage / remplacement renforcé pour WSUS, n'est-ce pas? C’est principalement la surveillance de l’état de santé que je recherche, et selon ce que cite MS, il s’agirait d’un déploiement de 200 dollars environ - ce qui ne semblait pas excessivement excessif. - bwerks
Ce n'est pas exagéré en termes de prix. C'est excessif en termes de configuration, de configuration et d'options pour votre petit environnement. - GregD


D'après mon expérience, SBS a ses propres problèmes. Surtout si vous le configurez en cluster, etc. L'effort de maintenance est bien trop important pour un si petit magasin.

Configurez un petit serveur, 4 disques, RAID (5 | 10 | 6), un contrôleur RAID-e pci-e, un serveur de fichiers simple, ups (merci tomtom).

Les courriers destinés à quelques personnes sont probablement mieux gérés par un fournisseur externe.

Éloignez-vous de SCE et des situations similaires, car vous auriez besoin d'un VPN, d'Active Directory, etc. Mettre tout cela en place est un effort majeur, et peut-être pas dans le meilleur intérêt de votre client.

En guidant votre petit client vers une solution à la fois simple, efficace et fiable, vous lui apporterez beaucoup de satisfaction.

Apprenez-leur à examiner les journaux d'événements, peut-être en leur donnant un script simple qui vérifie les avertissements du disque. Visitez-les régulièrement, s'ils le souhaitent, et consultez les journaux correspondants. Traitez les problèmes un à la fois.


2
2017-08-17 14:22



Je dirais que vous auriez des problèmes avec la mise en cluster de Windows SBS car il ne prend en charge aucun type de solution de mise en cluster Microsoft prête à l'emploi. - Evan Anderson


Ce n'est pas un problème matériel principalement. Obtenez un USV - MAINTENANT. Celui qui est en ligne (c.-à-filtres de l'électricité).

En plus de cela, et je ne suis pas   embellissant cela, ils ont vu quatre   pannes matérielles de cette année à ce jour

C’est un peu comique - TRES rare - ou basé sur un pouvoir fluctuant ou quelque chose que le serveur ne gère pas aussi bien. Ce n'est PAS normal, et la probabilité que cela se produise est "extrêmement" faible. Comme à la loterie gagner bas. J'ai observé un comportement similaire - mais basé sur des sources d'alimentation CRAP ou ... sur des sources d'alimentation instables avec des pointes, partiellement intronisées (les serveurs vus meurent lorsque vous allumez les lumières grâce à un très mauvais commutateur où vous pouviez voir des étincelles).

  • SCE n'est pas nécessaire. WSUS est suffisant.
  • SBS ne prend pas vraiment en charge ce dont vous avez besoin pendant la période d'activité, mais vous pouvez essayer de l'exécuter sur une plate-forme de virtualisation. Il ne fonctionne en Hyper-V ... Je connais des gens qui le font à des fins de démonstration.

1
2017-08-17 14:27



Oui je suis d'accord. Ces taux d'échec me semblent impossibles. Et oui Je voulais dire que je pensais exécuter un SBS virtualisé en hyper-v, mais je ne suis pas sûr du coût de l’infrastructure sous-jacente. principalement parce que je ne suis pas tout à fait sûr de ce qui serait requis de l'infrastructure sous-jacente elle-même, heh. - bwerks
Eh bien, mon serveur domestique a une mémoire vive de 16 Go, un raid matériel, 8 disques durs avec raid matériel et est une carte micro-atx vased sur AMD sous Hyper-v;) Cela dit, je ne suis pas sûr du prix ... du contrôleur RAID lui-même était terriblement cher, tout comme le fond de panier sas pour les 8 disques. - TomTom
Convenu que de nombreuses défaillances matérielles semblent un peu excessives - OP devrait se pencher sur les onduleurs à équilibrage de ligne (j'avais des problèmes similaires chez un de mes aptes qui obtiendrait de fréquentes «baisses de tension» jusqu'à ce que je reçoive un tel UPS). - pjz
Je sais que les machines qui ont échoué sont effectivement sur UPS, mais j'attends la confirmation de l'équilibrage des lignes. Je ne sais pas avec certitude qu'ils ne concernent pas uniquement les pannes en ce moment. - bwerks
Les onduleurs bon marché ne sont souvent ni en ligne ni en ligne ... ils prennent essentiellement le relais en moins de x ms lorsqu'une panne de courant se produit. Les pointes dans la ligne les traversent. Les plus chères, fondamentalement, nous TOUJOURS toujours la batterie, qu'elles chargent en permanence, de sorte que la qualité de l'alimentation est toujours parfaite. Au milieu se trouvent ceux qui filtrent le pouvoir. - TomTom


Juste quelques idées supplémentaires:

  • Utilisez RAID-6 au lieu de RAID-5 + disque de secours. Avec RAID-6, la parité est doublée sur tous les disques, vous pouvez donc avoir 2 disques défaillants en même temps. Ou utilisez simplement RAID-5 et utilisez des sauvegardes de récupération d'urgence
  • Tout d'abord, visez la redondance à l'intérieur du serveur (disques, alimentation, refroidissement)
  • Achetez un service d'assistance premium pour le serveur, avec un accord de niveau de service en cas de défaillance du matériel (c'est beaucoup moins cher qu'une solution en cluster)
  • Achetez de (bons) UPS en ligne
  • Implémentez une solution de disponibilité basée sur la réplication, telle que DoubleTake Availability. Il existe une version de DoubleTake Availability adaptée à Windows SBS, qui est très économique. Vous aurez besoin de 2 serveurs pour le faire, mais votre temps d’arrêt en cas de panne matérielle diminuera à moins de 10 minutes.

1
2017-08-31 03:54





Je ne comprends pas quel problème le serveur est censé résoudre.

Si les quatre machines proviennent du même fournisseur et que votre emplacement n'a rien d'inhabituel (taux d'humidité / poussière très élevé, électricité statique, éclairs ou alimentation très peu fiable), vous avez besoin d'un nouveau fournisseur de matériel. Peu importe ce que Dell, HP et IBM ont fait pour contrarier leurs propriétaires, le fournisseur de ces machines est pire, du moins du point de vue matériel. Vous obtiendrez une meilleure fiabilité en achetant les machines les moins chères que vous pouvez trouver chez Wal-Mart.

Peut-être que ce n’est pas entièrement la faute du vendeur - peut-être que quelqu'un a spécifié un matériel particulier et / ou a insisté sur certains équipements très bas spécifications - mais il aurait quand même dû refuser de construire des machines mal configurées, ou bien avait agi de manière héroïque pour remplacer le mauvais Machines.

Je suggère que vous achetiez des ordinateurs intermédiaires à Dell / HP / Lenovo (ou que vous donniez un coup de pouce au fournisseur actuel pour supporter ce qu'ils vendaient), que vous vous connectiez à des comptes Dropbox payants (ou box.net, ou NetDocuments ) pour partager des fichiers et demander à votre fournisseur d'accès ou à Google de gérer le courrier et le service Web.

[* Oui, les services "en nuage" sont théoriquement moins sécurisés que la possession de votre propre serveur - mais si cela fonctionne dans un groupe de bureaux à domicile, les données sont en danger si l'une de ces maisons est cambriolée, ou si un membre de la famille utilise le machine de travail pour exécuter des logiciels malveillants aléatoires à partir d'Internet lorsque l'employé n'est pas à la maison ou en vacances. Le plus grand danger des temps d'arrêt proviendra des connexions réseau grand public, et non des temps d'arrêt du fournisseur de cloud.]

Il semble que vous ayez besoin de moins de matériel et de matériel plus simple si vous voulez de la fiabilité, pas de matériel / logiciel plus compliqué et plus coûteux.


0
2017-08-18 06:29