.net-确定图像的文件类型

我正在从服务中下载一些图像,这些图像并不总是包含内容类型,并且不提供我正在下载的文件的扩展名(哦,不要问)。

确定.NET中图像格式的最佳方法是什么?

正在读取这些下载的图像的应用程序需要具有适当的文件扩展名,否则所有地狱都可能会崩溃。

Eric asked 2020-06-20T00:50:41Z
6个解决方案
55 votes

一种可能更简单的方法是使用Image.FromFile()然后使用RawFormat属性,因为它已经知道最常见格式的标头中的魔术位,如下所示:

Image i = Image.FromFile("c:\\foo");
if (System.Drawing.Imaging.ImageFormat.Jpeg.Equals(i.RawFormat)) 
    MessageBox.Show("JPEG");
else if (System.Drawing.Imaging.ImageFormat.Gif.Equals(i.RawFormat))
    MessageBox.Show("GIF");
//Same for the rest of the formats
Vinko Vrsalovic answered 2020-06-20T00:50:55Z
24 votes

您可以在不参考System.Drawing和不必要创建对象Image的情况下使用以下代码。 同样,即使没有流和System.IO的引用,您也可以使用Alex解决方案。

public enum ImageFormat
{
    bmp,
    jpeg,
    gif,
    tiff,
    png,
    unknown
}

public static ImageFormat GetImageFormat(Stream stream)
{
    // see http://www.mikekunz.com/image_file_header.html
    var bmp = Encoding.ASCII.GetBytes("BM");     // BMP
    var gif = Encoding.ASCII.GetBytes("GIF");    // GIF
    var png = new byte[] { 137, 80, 78, 71 };    // PNG
    var tiff = new byte[] { 73, 73, 42 };         // TIFF
    var tiff2 = new byte[] { 77, 77, 42 };         // TIFF
    var jpeg = new byte[] { 255, 216, 255, 224 }; // jpeg
    var jpeg2 = new byte[] { 255, 216, 255, 225 }; // jpeg canon

    var buffer = new byte[4];
    stream.Read(buffer, 0, buffer.Length);

    if (bmp.SequenceEqual(buffer.Take(bmp.Length)))
        return ImageFormat.bmp;

    if (gif.SequenceEqual(buffer.Take(gif.Length)))
        return ImageFormat.gif;

    if (png.SequenceEqual(buffer.Take(png.Length)))
        return ImageFormat.png;

    if (tiff.SequenceEqual(buffer.Take(tiff.Length)))
        return ImageFormat.tiff;

    if (tiff2.SequenceEqual(buffer.Take(tiff2.Length)))
        return ImageFormat.tiff;

    if (jpeg.SequenceEqual(buffer.Take(jpeg.Length)))
        return ImageFormat.jpeg;

    if (jpeg2.SequenceEqual(buffer.Take(jpeg2.Length)))
        return ImageFormat.jpeg;

    return ImageFormat.unknown;
}
Ivan Kochurkin answered 2020-06-20T00:51:15Z
22 votes

所有图像格式均将其初始字节设置为特定值:

  • JPG:0xFF 0xD8
  • PNG:0x89 0x50 0x4E 0x47 0x0D 0x0A 0x1A 0x0A
  • GIF:“ G”,“ I”,“ F”

搜索“ jpg文件格式”,将jpg替换为您需要识别的其他文件格式。

正如Garth所建议的那样,有一个数据库可以显示许多文件的文件类型。 如果您必须检测许多不同的文件类型,则值得一看,以查找所需的信息。 如果您确实需要扩展它以涵盖许多文件类型,请查看相关的文件命令,该命令实现了引擎以正确使用数据库(对于许多文件格式而言,这并非易事,并且几乎是一个统计过程)

-亚当

Adam Davis answered 2020-06-20T00:52:02Z
8 votes

亚当指的是正确的方向。

如果要查找几乎所有文件的方法,请查看UNIX,Linux或Mac OS X计算机上libmagic命令后面的数据库。

libmagic使用“魔术数”数据库(Adam列出的那些初始字节)来检测文件的类型。 man file会告诉您如何在计算机上找到数据库,例如 /usr/share/file/magicman magic将告诉您其格式。

您可以根据在数据库中看到的内容编写自己的检测代码,或者使用预打包的库(例如python-magic),或者(如果您真的很冒险的话)实施libmagic的.NET版本。我无法 找到一个,并希望另一个成员可以指出一个。

如果您没有方便的UNIX计算机,则数据库如下所示:

# PNG [Portable Network Graphics, or "PNG's Not GIF"] images
# (Greg Roelofs, newt@uchicago.edu)
# (Albert Cahalan, acahalan@cs.uml.edu)
#
# 137 P N G \r \n ^Z \n [4-byte length] H E A D [HEAD data] [HEAD crc] ...
#
0       string          \x89PNG         PNG image data,
>4      belong          !0x0d0a1a0a     CORRUPTED,
>4      belong          0x0d0a1a0a
>>16    belong          x               %ld x
>>20    belong          x               %ld,
>>24    byte            x               %d-bit
>>25    byte            0               grayscale,
>>25    byte            2               \b/color RGB,
>>25    byte            3               colormap,
>>25    byte            4               gray+alpha,
>>25    byte            6               \b/color RGBA,
#>>26   byte            0               deflate/32K,
>>28    byte            0               non-interlaced
>>28    byte            1               interlaced
1       string          PNG             PNG image data, CORRUPTED

# GIF
0       string          GIF8            GIF image data
>4      string          7a              \b, version 8%s,
>4      string          9a              \b, version 8%s,
>6      leshort         >0              %hd x
>8      leshort         >0              %hd
#>10    byte            &0x80           color mapped,
#>10    byte&0x07       =0x00           2 colors
#>10    byte&0x07       =0x01           4 colors
#>10    byte&0x07       =0x02           8 colors
#>10    byte&0x07       =0x03           16 colors
#>10    byte&0x07       =0x04           32 colors
#>10    byte&0x07       =0x05           64 colors
#>10    byte&0x07       =0x06           128 colors
#>10    byte&0x07       =0x07           256 colors

祝好运!

Garth Kidd answered 2020-06-20T00:52:45Z
3 votes

有编程的方法来确定图像MIMETYPE。

有一个类System.Drawing.Imaging.ImageCodecInfo。

此类具有MimeType和FormatID属性。 它还有一个GetImageEncoders方法,该方法返回所有图像编码器的集合。创建由格式ID索引的mime类型字典很容易。

System.Drawing.Image类具有类型System.Drawing.Imaging.ImageFormat的RawFormat属性,其属性Guid等效于System.Drawing.Imaging.ImageCodecInfo类的属性FormatID,这是从字典中获取MIMETYPE的关键。

例:

创建mime类型字典的静态方法

static Dictionary<Guid, string> GetImageFormatMimeTypeIndex()
{
  Dictionary<Guid, string> ret = new Dictionary<Guid, string>();

  var encoders = System.Drawing.Imaging.ImageCodecInfo.GetImageEncoders();

  foreach(var e in encoders)
  {
    ret.Add(e.FormatID, e.MimeType);
  }

  return ret;
}

采用:

Dictionary<Guid, string> mimeTypeIndex = GetImageFormatMimeTypeIndex();

FileStream imgStream = File.OpenRead(path);
var image = System.Drawing.Image.FromStream(imgStream);
string mimeType = mimeTypeIndex[image.RawFormat.Guid];
slobodans answered 2020-06-20T00:53:31Z
0 votes

尝试将流加载到System.IO.BinaryReader中。

然后,您需要参考所需的每种图像格式的规范,并逐字节加载标题以与规范进行比较。 例如,这是PNG规范

补充:PNG的实际文件结构。

Ash answered 2020-06-20T00:54:00Z
translate from https://stackoverflow.com:/questions/55869/determine-file-type-of-an-image