Pregunta WHEA_UNCORRECTABLE_ERROR, ¿ahora qué?


Desde que construí mi propia PC con Windows 10, tuve problemas para que mi PC dejara de responder al azar. En todos los casos, tuve que realizar un reinicio en frío, porque Windows no se apagaba o reiniciaba cuando se lo pedían. En 2 casos, me enfrenté a WHEA_UNCORRECTABLE_ERROR en su lugar. Sospecho que los problemas pueden estar relacionados, así que me gustaría arreglar mi BSOD.

Aparentemente, WHEA_UNCORRECTABLE_ERROR aparece cuando hay un hardware defectuoso o un controlador defectuoso. Lamentablemente, el error en sí no es muy descriptivo, por lo que no tengo mucha información para trabajar.

Descubrí que Windows crea un .dmp archivo cada vez que se produce un BSOD, y que los archivos se guardan en C:\Windows\Minidump. Lamentablemente, no tengo idea de qué hacer con estos archivos. Cada vez que intento abrir un .dmp archivo con Notepad ++, obtengo:

No puede abrir el archivo

De acuerdo a https://support.microsoft.com/en-us/kb/315271, Debería usar Dumpchk.exe, pero parece que no está instalado en mi PC y el único enlace de aspecto relevante me permite descargar el Kit de controladores de Windows y las Herramientas de depuración para Windows junto con Visual Studio. No estoy interesado en depurar Windows o desarrollar controladores. Solo quiero ver lo que está escrito en el .dmp archivo, entonces sé qué controlador necesita ser reinstalado / actualizado, o qué componente necesita ser intercambiado.

¿Cómo abro un .dmp ¿archivo?


-1


origen


"Desafortunadamente, no tengo idea de qué hacer con estos archivos". Use windbg en ellos para determinar el controlador que causa el bloqueo. - Ramhound
copiar la carpeta C: \ Windows \ Minidump para escritorio, comprimir y compartir (enlace compartir en vivo) los archivos - magicandre1981
@ magicandre1981. ¿Y dónde lo compartiría? ¿Aquí? ¿Cómo se beneficiarían los futuros visitantes de eso? Agradezco la ayuda, pero prefiero resolver el problema yo mismo. - Nolonar
usa ondrive para compartir el zip. Voy a publicar detalles en mi respuesta posterior, aquí puedes ver lo que hago para analizar vertederos y otros pueden repetir esto para sus vertederos. - magicandre1981
@ magicandre1981. He comprimido la carpeta Minidump. - Nolonar


Respuestas:


Para ver más detalles cuando obtienes un Bug Check 0x124: WHEA_UNCORRECTABLE_ERROR, abre el dmp en Windbg.exe, que es parte del Debugging Tools for Windows, que a su vez es parte del SDK de Windows 10.

Ahora configurar los símbolos de depuración en windbgy ejecuta el !errrec comando con el valor del segundo argumento:

*******************************************************************************
*                                                                             *
*                        Bugcheck Analysis                                    *
*                                                                             *
*******************************************************************************

WHEA_UNCORRECTABLE_ERROR (124)
A fatal hardware error has occurred. Parameter 1 identifies the type of error
source that reported the error. Parameter 2 holds the address of the
WHEA_ERROR_RECORD structure that describes the error conditon.
Arguments:
Arg1: 0000000000000000, Machine Check Exception
Arg2: ffff8905a872c028, Address of the WHEA_ERROR_RECORD structure.
Arg3: 00000000fe000000, High order 32-bits of the MCi_STATUS value.
Arg4: 0000000000801136, Low order 32-bits of the MCi_STATUS value.

6: kd> !errrec ffff8905a872c028
===============================================================================
Common Platform Error Record @ ffff8905a872c028
-------------------------------------------------------------------------------
Record Id     : 01d24ff887f68558
Severity      : Fatal (1)
Length        : 928
Creator       : Microsoft
Notify Type   : Machine Check Exception
Timestamp     : 12/11/2016 10:04:07 (UTC)
Flags         : 0x00000000

===============================================================================
Section 0     : Processor Generic
-------------------------------------------------------------------------------
Descriptor    @ ffff8905a872c0a8
Section       @ ffff8905a872c180
Offset        : 344
Length        : 192
Flags         : 0x00000001 Primary
Severity      : Fatal

Proc. Type    : x86/x64
Instr. Set    : x64
Error Type    : Cache error
Operation     : Data Read
Flags         : 0x00
Level         : 2
CPU Version   : 0x00000000000506e3
Processor ID  : 0x0000000000000006

===============================================================================
Section 1     : x86/x64 Processor Specific
-------------------------------------------------------------------------------
Descriptor    @ ffff8905a872c0f0
Section       @ ffff8905a872c240
Offset        : 536
Length        : 128
Flags         : 0x00000000
Severity      : Fatal

Local APIC Id : 0x0000000000000006
CPU Id        : e3 06 05 00 00 08 10 06 - bf fb fa 7f ff fb eb bf
                00 00 00 00 00 00 00 00 - 00 00 00 00 00 00 00 00
                00 00 00 00 00 00 00 00 - 00 00 00 00 00 00 00 00

Proc. Info 0  @ ffff8905a872c240

===============================================================================
Section 2     : x86/x64 MCA
-------------------------------------------------------------------------------
Descriptor    @ ffff8905a872c138
Section       @ ffff8905a872c2c0
Offset        : 664
Length        : 264
Flags         : 0x00000000
Severity      : Fatal

Error         : DCACHEL2_DRD_ERR (Proc 6 Bank 9)
  Status      : 0xfe00000000801136
  Address     : 0x00000000b3800000
  Misc.       : 0x00000030e5000086

Aquí puede ver que tiene problemas al leer datos de la memoria caché L2 de la CPU:

Error Type    : Cache error
Operation     : Data Read
Error         : DCACHEL2_DRD_ERR 

Utilizando !sysinfo machineid muestra que usa un BIOS / UEFI anterior:

BiosVersion = 1805
BiosReleaseDate = 05/13/2016
BaseBoardManufacturer = ASUSTeK COMPUTER INC.
BaseBoardProduct = Z170 PRO GAMING

Asi que actualizar el BIOS / UEFI a la versión 3016 porque debería mejorar la estabilidad del sistema.

Si todavía tiene problemas, realice una prueba de esfuerzo de la CPU para comprobar si su CPU está dañada. También asegúrese de no subvertir la CPU.


2