"mce: [Erreur matérielle]: les événements de vérification de la machine sont consignés" apparaît dans syslog. Que devrais-je faire?

18

J'ai installé la dernière version de OSSEC (2.8.1) et j'ai également activé les notifications par courrier électronique. Et je reçois des tonnes de ces types de notifications indiquant qu’il ya une erreur matérielle et quelque chose à propos de mce:

OSSEC HIDS Notification.
2015 Apr 04 20:09:22

Received From: Bath-Towel->/var/log/syslog
Rule: 1002 fired (level 2) -> "Unknown problem somewhere in the system."
Portion of the log(s):

Apr  4 20:09:21 Bath-Towel kernel: [ 1873.680872] mce: [Hardware Error]: Machine check events logged



 --END OF NOTIFICATION

Qu'est-ce que cela signifie exactement? Que représente mce? Et cette erreur matérielle apparente est-elle quelque chose dont je devrais m'inquiéter?

Informations sur le système d’exploitation:

Description:    Ubuntu 14.10
Release:    14.10
    
posée Eric Carvalho 04.04.2015 - 21:37
la source

1 réponse

21

Exception de vérification de la machine :

  

Une exception de contrôle de machine (MCE) est un type de matériel informatique   erreur qui se produit lorsque l'unité centrale de traitement d'un ordinateur détecte un   problème matériel.

Votre ordinateur a rencontré une erreur matérielle et le noyau a enregistré un événement dans un tampon. Vous pouvez utiliser mcelog pour vous connecter et afficher les événements de vérification de la machine. De page de manuel mcelog :

  

Les processeurs X86 signalent les erreurs détectées par le processeur en tant qu’événements de vérification de la machine   (MCE). Celles-ci peuvent être une corruption de données détectée dans les caches du processeur, dans   mémoire principale par un contrôleur de mémoire intégré, erreurs de transfert de données   sur le bus frontal ou l'interconnexion du processeur ou d'autres erreurs internes.   Les causes possibles peuvent être le rayonnement cosmique, les alimentations instables,   problèmes de refroidissement, matériel cassé, systèmes en cours d'exécution   spécification, ou la malchance.

     

La plupart des erreurs peuvent être corrigées par le processeur en corrigeant les erreurs internes   mécanismes. Les erreurs non corrigées provoquent des exceptions de vérification de la machine qui   peut tuer des processus ou paniquer la machine. Un petit nombre de corrections   les erreurs ne sont généralement pas une cause d'inquiétude, mais un grand nombre peut   indiquer un échec futur.

     

Lorsqu'une erreur corrigée ou récupérée se produit, le noyau x86 écrit un   enregistrement décrivant le MCE dans un tampon circulaire interne disponible   via le périphérique / dev / mcelog. mcelog récupère les erreurs de   / dev / mcelog, les décode dans un format lisible par l'homme et les imprime   sur la sortie standard ou éventuellement dans le journal système.

Si vous n'avez remarqué aucun crash, l'erreur a probablement été corrigée avec succès. Pourtant, je vous conseille d'installer mcelog pour suivre ces événements:

sudo apt-get install mcelog

Les événements seront enregistrés dans /var/log/mcelog . Vous pouvez également exécuter:

sudo mcelog --client

pour rechercher des erreurs dans le démon mcelog .

    
réponse donnée Eric Carvalho 11.04.2015 - 23:22
la source

Lire d'autres questions sur les étiquettes