Pregunta ¿Cómo puedo determinar el tipo de archivo sin una extensión en Windows?


A veces obtengo archivos de mis clientes que tienen una extensión de archivo incorrecta. Por ejemplo, el nombre es image.jpg pero el archivo es en realidad una imagen TIFF. En muchos casos, puedo aclararlo abriendo el archivo en un editor de texto, mirando los primeros bytes y deduciendo de qué tipo de archivo se trata.

Esto funciona para mí con archivos JPEG, TIFF, GIF y PDF. Sin embargo, hay muchos más tipos de archivos por ahí.

¿Es posible automatizar la identificación del tipo de archivo correcto mediante el análisis de los datos que contienen?


145


origen


Para aquellos interesados file comando hace esto en las máquinas * nix. - boehj
Muy buena pregunta! Algo que secretamente había querido todo este tiempo, pero siempre olvidé preguntar :) - pepoluan
No entiendo por qué esta pregunta está fuera de tema (después de 3 años). No pido un software específico (reescribí mi pregunta para subrayar esto). Solo solicito una solución. - Martin
No entiendo por qué 26 personas piensan que el comentario anterior relacionado con boehj * nix "agrega algo útil a la publicación". Esta pregunta está etiquetada windows, pero el comentario implica: "No puede hacer eso en Windows, debe usar * nix en su lugar". ¿Asi que? El comentario está dirigido "para los interesados". ¿En que? Cambiar la computadora? :( - Aacini
@Aacini es útil para las personas * nix que vienen aquí desde google. - jingyu9575


Respuestas:


Puedes usar el TrID herramienta que tiene una biblioteca en crecimiento de definiciones de tipo de archivo para identificar archivos.

Screenshot

Se admiten comodines, por lo que en su ejemplo, puede colocar todas las imágenes para examinarlas en una carpeta, p. C: \ verifyimages - entonces puedes usar el comando:

trid C:\verifyimages\*

Esto examinará todos los archivos en el verifyimages carpeta.


También hay una versión de GUI disponible, TrIDNet:

Screenshot

Hay documentación disponible sobre cómo puede integrar fácilmente TrID o TrIDNet en Windows Explorer y Total Commander:

Explorador de Windows

Comandante total


137



Tenga en cuenta que indica que no tiene licencia para uso comercial, solo para uso personal - Chris Magnuson
Tuve algunos problemas para averiguar qué archivos de descarga eran necesarios para usar este programa. Entonces este comentario es para ayudar en eso. Deberás descargar dos archivos. Primero, la utilidad de línea de comandos o la utilidad de la GUI. En segundo lugar, una carpeta de definiciones XML llamada "TrID XML defs". Coloque los archivos XML de definición en el mismo directorio que TrID. Luego escanea las definiciones. Finalmente puedes comenzar a usarlo. - mrtsherman


archivo

Archivo prueba cada argumento en un intento de clasificarlo. Hay tres conjuntos de pruebas, realizadas en este orden: pruebas del sistema de archivos, pruebas de números mágicos y pruebas de idiomas. los primero la prueba que tiene éxito hace que se imprima el tipo de archivo.

El tipo impreso generalmente contendrá una de las palabras texto (el archivo contiene solo caracteres de impresión y algunos caracteres de control comunes y probablemente sea seguro para leer en un terminal ASCII), ejecutable (el archivo contiene el resultado de compilar un programa en una forma comprensible para algún kernel de UNIX u otro), o datos significando cualquier otra cosa (los datos son usualmente "binarios" o no imprimibles). Las excepciones son formatos de archivos conocidos (archivos principales, archivos tar) que se sabe que contienen datos binarios.


48



file es estándar, pero en sistemas antiguos (especialmente no Linux) no es muy eficiente. Para Ubuntu, etc., debería ser bastante respetable e incluso instalarse como estándar. - Thorbjørn Ravn Andersen
@Anm_LA, no es estándar en Windows, pero el enlace en la respuesta es a un puerto de la versión GNU de file a Windows. Si otros comandos de * nix son interesantes para usted como usuario de Windows, entonces explore ese sitio para encontrar todo tipo de gemas. - RBerteig
Eso lo dudo mucho file es un experto en archivos creados por aplicaciones de Windows. - Robin Green
@Robin: puedes hacer la prueba. - Ignacio Vazquez-Abrams
@Robin: dudo mucho que hayas usado file en absoluto, y sin embargo, casi ha tomado una decisión acerca de su efectividad. - tzot


Solía ​​trabajar para la Biblioteca Nacional Francesa, para construir un sistema de archivo digital que contiene no solo libros digitalizados sino también millones de artefactos digitales con todo tipo de tipos de archivos extraños. Nosotros usamos JHOVE para reconocer formatos de archivo.

JHOVE es de código abierto, es mantenido por JSTOR y la Biblioteca de la Universidad de Harvard. Es bastante simple utilizar.


12



¡guay! pero, ¿reconoce formatos propietarios como TrID? de todos modos, yo hacer tener algunos usos para identificar subformatos / variantes de formatos no propietarios (o, para ser precisos, 'extensiones' patentadas a formatos estandarizados), por lo que esto sería útil. ¡Gracias por el aviso! - pepoluan


yo suelo Bibliotecas OutsideIn de Oracle en mis programas No es gratis, pero funcionan bien, especialmente para imágenes. El mercado habla que admite más de 500 tipos de archivos.


1





Puede verificar el tipo de archivo desde cualquier computadora, incluidas las ventanas en

http://www.checkfiletype.com


0



Bienvenido a Super Usuario! Por favor lee cómo recomendar software en las respuestas, particularmente los bits en negrita; luego edita tu respuesta para seguir las pautas allí. Esto se aplica a pesar de que está recomendando un sitio web. Aclamaciones - bertieb