检索案例:如何获取网页上的图片和视频信息

练习网址:

http://www.njcie.com/other/ir/2.html
http://www.njcie.com/onlineCourse/video1-1.html

这次我们结合几个案例来说明如何获取网页上的图片和视频信息。

比如这个例子。这里的网页上有一张图片,一般的右击获取并没有看到相关的图片另存为。仅有的另存为只是网页的另存为,保存后你只能看到网页的原始文件,还是没有任何图片信息。

首先我们必须了解一个基本情况,就是对于图片、音频和视频等各种多媒体信息,它们都不是网页内容的一部分,通常都是嵌入在网页中的其他文件,都有自己独立的访问位置,只不过嵌入在当前网页显示。

因此,在获取它们时,如果无法直接使用诸如右击显示图片另存为等常见方法时,基本的思路就是设法知道这个原始的位置,即使是一些较为先进和自动化的下载软件,也是通过类似的识别方法找到这些图片的位置。我们这次以查看网页源代码的方法来试一下。在网页的空白处,右击选择“查看网页源代码”,在打开的代码中,我们记得要找到那个图片的位置就可以了。一般图片都是JPG、GIF或者PNG等格式,因此可以再次利用检索,按下Ctrl+F,搜索下。我们很快就搜索到了有一个PNG图片名称,即LOGO.PNG。

那么接下来怎么使用呢?

这也是网络信息资源检索所必须了解的基本知识。所有的网页资源都有一个网址,如当前这个图片网页的网址,都包含这如下几个部分,即协议、域名、目录、文件名称。其中协议可以不用管它,通常都是http这种写法,域名就是我们前面所介绍过的site字段检索时利用的域名信息,不同的网站通常都有一个独有的域名。一个域名对应的网站上会有很多网页,不同的网页会在不同的目录下,这些都可以从当前网页的网址中看到。那么现在我们知道了当前图片网页的文件名称是2.html,其中的那个图片名称是LOGO.PNG,因此大胆的可以去将原始网页网址中的文件名称换成现在这个图片文件名称,然后将这个新网址粘贴到浏览器地址栏中。这一次果然成功了,而且看到了这确实是一张独立的图片。此时右击图片就以图片另存为了。

当然不同的浏览器,通常功能也各不一样,有时大家多积累经验,依然能找到更好的方法。比如在IE浏览器中,就可以看到右击图片可以显示“背景另存为”,直接就可以保存这种图片。

我们再来看一个视频信息的下载例子。

任何浏览器一般都没有下载视频的明显方式。因此,对于此类视频文件,通过网页源代码直接去找几乎是必须的方法。我们在网页视频外的地方右击选择“查看网页源代码”。对于视频文件,常见的格式有AVI、FLV、MP4等,我们也可以再次按下Ctrl+F,检索下这些格式文本信息。很快我们看到了它有一个MP4的视频文件名称。我想这次大家应该知道怎么做了,就像刚才的做法类似,再次把这个视频文件名称替换现有网页的名称,拼凑出完整的视频文件网址。虽然这个视频文件名称前面好像还有个目录,但是并不需要去过问,什么就是什么,直接拼凑放上去即可。很快就在浏览器中看到了这个视频文件。如何下载下来呢?如果此时只是一个单一的视频文件,浏览器通常就会提供下载的方法。右击视频,我们能看到明显的“视频另存为”。如果浏览器不支持,还可以就像保存网页一样,保存当前文件,由于当前文件是视频文件,因此此时的网页另存为,其实保存的就是这个视频文件。

不同浏览器对于视频文件网址的处理并不一样,比如你把这个网址粘贴到IE浏览器中,它会立刻提示是否下载,甚至还可以通过将这个网址复制到一些下载工具中,它们也会提示是否下载。

发表评论

邮箱地址不会被公开。 必填项已用*标注