首页 > 开发 > .Net > 正文

asp.net 下载文件时根据MIME类型自动判断保存文件的扩展名

2020-04-24 22:13:09
字体:
来源:转载
供稿:网友
引言

用WebClient下载远程资源时,经常会遇到类似这样的网址:

http://www.uushare.com/filedownload?user=icesee&id=2205188

http://www.guaishow.com/u/luanfujie/g9675/

我们不知道这个Url具体代表的是一个网页,还是某种类型的文件。

而有些Url虽然带有扩展名,但可能是错误的扩展名,常见的比如把gif文件标上了jpg扩展名。

如果我们没法正确判断下载源的文件类型的话,就无法保存为正确的文件格式,会给后续操作及人工阅览造成困扰。

所幸的是,WebRequest可以给出下载源的MIME信息,这让我们可以确定文件的真实格式,并以此来决定最终的存储扩展名。(MIME是什么?)

建立MIME映射字典
我们首先需要做的工作就是建立一个MIME类型到其对应扩展名的映射字典。

我从网上找来了一个MIME类型列表,并通过正则表达式将其转换为程序代码,粘入了程序中:
image 
这个通过正则表达式转换而来的代码量非常大。
需注意的是,其中有很多MIME类型相同但扩展名不同的数据,我们在添加到字典时就将多余的不必要记录忽略了,比如高亮处的那三条都是audio/x-aiff类型,那么后两个扩展名都不会添加到字典中,也不会在后续的操作中被使用。
如果你觉得有些类型添加的对应扩展名不是最常见的对应类型的话,就得手动调整代码了。(下文中就出现了这种情况,如text/html对应的是dhtml扩展名,image/jpeg对应的是jpe扩展名)
字典构建完毕之后,就可以通过这样一个方法来获取MIME类型所对应的扩展名了:
string 获取对应扩展名(string ContentType)
{
foreach (var f in MimeDic.Keys)
{
if (ContentType.ToLower().IndexOf(f) >= 0) return MimeDic[f];
}
return null;
}
这里之所以使用IndexOf方法判断,是因为传入的ContentType中可能还包含其他信息,比如编码格式。
题外话:看到网上曾有人抱怨说WebClient下载网页时容易产生乱码,而且又不好读取网页的编码格式,其实WebRequest的ContentType中就包含MIME和编码格式信息:
image 
生成下载文件路径
现在有了上面的方法,我们就可以通过MIME类型确定文件的扩展名了。
现在我们将书写一个用于生成下载文件路径的方法,其功能为:
分析文件的源Url,将其文件名部分作为下载文件的文件名。
如果其Url中不含文件名部分(域名或目录形式),则以其目录名为下载文件的文件名。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表