Question Sur un serveur à deux processeurs, est-il normal qu'un processeur soit plus chaud que l'autre?


J'ai un double serveur Opteron sous Linux avec libvirt pour héberger plusieurs ordinateurs virtuels. Les ordinateurs virtuels fonctionnent correctement et le serveur fonctionne correctement, mais je remarque qu'un processeur fonctionne toujours à environ 69 ° C (la régulation à 70 ° C) et l’autre à environ 15 ° C.

Cela ne me semble pas normal? Ne devraient-ils pas être tous les deux un peu plus proches de la température?

Je ne suis pas sûr de savoir comment dianose plus loin. Peut-être qu'il n'y a pas assez de pâte thermique sur l'un des processeurs?

Edit: La carte mère est ASUS KGPE-D16 et refroidi par double Fans de Noctua NH-U9DO.

Notez que je pense que les températures pourraient être inférieures à la température ambiante plutôt qu’à des valeurs absolues. Lorsque le serveur est inactif, la température de la CPU chute à 2C et 13C. J'utilise la configuration de lmsensors à partir de ici


47
2017-11-27 12:28


origine


Quelle est la marque / modèle du serveur? - ewwhite
Comment se répartit la charge du processeur? mpstat -P ALL 1 sur linux aidera - Christopher Perrin
ressemble à un capteur de température cassé - matcheek
15C est très probablement un censeur cassé .... - Reaces
Cela ressemble à un capteur cassé ou mal calibré. Si vous pouvez redémarrer le serveur, regardez le BIOS qui devrait afficher les valeurs correctes.


Réponses:


Le problème a fini par être un dissipateur thermique mal ajusté. Peut-être que mal en forme n'est pas la bonne description. Il s'avère que vous devez mettre de la pâte thermique sur le dissipateur thermique, pas sur le couvercle en plastique recouvrant le dissipateur thermique.

enter image description here

Après avoir retiré le couvercle en plastique, le processeur est agréable et cool, merci à tous!


106
2017-11-28 00:18



+1 juste parce que c'est drôle - HBruijn
Vous voulez dire que quelqu'un a laissé le couvercle en plastique en place, puis a appliqué de la pâte, puis un dissipateur thermique? Épique. - TomTom
Baaaaaahaaaaaahahahaa !! - Craig
J'aime la façon dont vous pouvez voir les termes et conditions, la garantie limitée et la politique de retour en arrière-plan. :) - Lightness Races in Orbit
Si vous vous sentez moins stupide (et ce ne sera pas le cas), j'ai fait la même chose avec ma nouvelle cafetière de bureau. Le café était trop froid pour être bu et je le préparais pour le retour au magasin avant qu'un disque de carton de protection ne tombe de l'élément chauffant :) - Martin James


D'après mon expérience, il est normal que des composants associés dans un boîtier fonctionnent à des températures différentes, car le flux d'air n'est pas le même partout. Voici un graphique de la température du disque dur de ma boîte aux lettres. Les disques sont mis en miroir, de sorte que les charges de travail sont presque identiques.

munin graph of HDD temps over past year

Comme vous pouvez le constater, ils se suivent mutuellement, mais ils ne sont pas identiques. ils sont aussi, en moyenne, seulement 6C à part. Que vos capteurs signalent une température absolue ou une température excessive, une différence de 55 ° C sous charge semble très grave. Si vous êtes certain que les données sont correctes, dans la mesure où la différence de repos diminue à 10 ° C, ce qui correspond au type de différence que je vois en raison du flux d'air, je soupçonne un dissipateur thermique mal ajusté.


23
2017-11-27 12:53



En utilisant mpstat (de Christopher Perrin, merci!), J'ai confirmé que la charge était répartie de manière relativement homogène. Les choses tournent au ralenti à + 3C et + 20C. Je vais essayer de jouer avec le dissipateur thermique pour voir s'il est lâche. Pensez-vous que cela pourrait être un problème de pâte thermique? - samoz
C'est très possible (et plus encore après l'avoir fait bouger). - MadHatter


Ce n'est pas. Sauf si vous avez des problèmes graves avec le flux d'air. Ou l'un des refroidisseurs est mauvais. La température variera - mais pas tant que ça (70 ° C à 15 ° C).

Étant donné le niveau bas de 15 degrés, je suppose que (a) votre capteur est éteint (vous stockez réellement le serveur dans une pièce aussi froide?).

Je suppose également que l’un des processeurs ne travaille tout simplement pas, pour une raison quelconque.

Les petites différences sont normales. Quelques petits plus gros peuvent être (le flux d'air me vient à l'esprit). mais ici nous parlons d'un être FROID.


7
2017-11-27 12:31





Cela peut être soit un refroidissement soit une charge inégale (étant donné la différence de température, votre situation est probablement une charge inégale). Vous devriez utiliser quelque chose comme prime95 pour charger tous les cœurs uniformément et voir si les températures varient encore. Si ce n'est pas le cas, vous devez équilibrer les ordinateurs virtuels, vérifiez que vos applications sont multithreads et occupées. Comment faire cela dépend de votre logiciel et de votre charge de travail individuelle dépasse donc vraiment le cadre de la question. Tenez compte du fait qu’il n’ya aucun avantage réel à faire cela si vous n’avez pas assez de charge pour alimenter un seul processeur / cœur. En fait, votre machine virtuelle peut éviter délibérément d’utiliser un deuxième processeur afin de pouvoir passer en mode économie d’énergie sur plusieurs processeurs. -cpu systèmes.

Si vous l’avez réduite au refroidissement. Une petite différence de jusqu'à 10 ° C pourrait être trop peu (ou trop!) De pâte thermique. Une différence plus importante indique un problème important ou une différence entre les refroidisseurs de processeurs. Il se peut que l’on ait bloqué la circulation de l’air, qu’un radiateur se soit détendu, etc.


2
2017-11-27 12:38





Je devrais être d'accord avec, temp défectueux. capteur, comme 15C est seulement 59F !!! À moins que l'ordinateur ne soit dans un centre de données extrêmement froid, j'imagine que la température de l'air ambiant serait supérieure à 59F! Vous essayez d'affecter les ordinateurs virtuels au noyau basse température et de voir s'il y a un changement. sinon, je soupçonnerais fortement que le capteur soit défectueux.

Vous voudrez peut-être aussi regarder la sortie de dmesg (messages de démarrage) et voyez s’il ya quelque chose d’extraordinaire.


0
2017-12-01 11:42