2011-04-24 07:36:29 +0000 2011-04-24 07:36:29 +0000
155
155

Como posso determinar o tipo de ficheiro sem uma extensão no Windows?

Por vezes recebo ficheiros dos meus clientes que têm a extensão de ficheiro errada. Por exemplo, o nome é image.jpg mas o ficheiro é na realidade uma imagem TIFF. Em muitos casos, posso clarificá-la abrindo o ficheiro num editor de texto, olhando para os primeiros bytes, e depois deduzindo que tipo de ficheiro é.

Isto funciona para mim com ficheiros JPEG, TIFF, GIF e PDF. No entanto, há muitos mais tipos de ficheiros por aí.

É possível automatizar a identificação do tipo de ficheiro correcto através da análise dos dados que o contêm?

Respostas (5)

147
147
147
2011-04-24 07:47:21 +0000

Pode utilizar a ferramenta TrID que tem uma biblioteca crescente de definições de tipo de ficheiro para identificar ficheiros com.

Wildcards são suportados, pelo que no seu exemplo poderia simplesmente colocar todas as imagens a serem examinadas numa pasta, por exemplo C:\verifyimages - depois pode usar o comando:

trid C:\verifyimages\*

Isto examinará todos os ficheiros da pasta verifyimages.


Há também uma versão GUI disponível, TrIDNet :

Existe documentação disponível sobre como se pode integrar facilmente TrID ou TrIDNet no Explorador do Windows e no Comandante Total:

Windows Explorer

Total Commander

53
53
53
2011-04-24 07:38:08 +0000

ficheiro

Arquivo testa cada argumento numa tentativa de classificá-lo. Existem três conjuntos de testes, realizados por esta ordem: testes do sistema de ficheiros, testes do número mágico, e testes de linguagem. O primeiro teste que é bem sucedido faz com que o tipo de ficheiro seja impresso.

O tipo impresso irá normalmente conter uma das palavras texto (o ficheiro contém apenas caracteres de impressão e alguns caracteres de controlo comuns e é provavelmente seguro de ler num terminal ASCII), executável (o ficheiro contém o resultado da compilação de um programa numa forma compreensível para algum kernel UNIX ou outro), ou dados que significam qualquer outra coisa (os dados são normalmente “binários” ou não imprimíveis). As excepções são formatos de ficheiro bem conhecidos (ficheiros centrais, arquivos tar) que são conhecidos por conterem dados binários.

14
14
14
2011-04-24 13:16:09 +0000

Costumava trabalhar para a Biblioteca Nacional Francesa, para construir um sistema de arquivo digital que contém não só livros digitalizados, mas também milhões de artefactos digitais com todo o tipo de estranhos tipos de ficheiros. Utilizámos JHOVE para reconhecer formatos de ficheiro.

JHOVE é de código aberto, é mantido pela JSTOR e pela Biblioteca da Universidade de Harvard. É bastante simples de usar .

1
1
1
2018-06-04 11:24:55 +0000

Pode verificar o tipo de ficheiro a partir de qualquer computador, incluindo janelas em http://www.checkfiletype.com

1
1
1
2011-04-24 11:30:15 +0000

Utilizo As bibliotecas OutsideIn da Oracle nos meus programas. Não são gratuitos, mas funcionam bem, especialmente para imagens. O market-speak diz que suporta mais de 500 tipos de ficheiros.