Android实现网页图片下载器

Android实现网页图片下载器

网页图片下载器是配合神马笔记图像画廊功能使用的一个工具。

实现了抓取并下载网页页面图片功能。

实现过程:

  1. 使用WebView加载网页
  2. 获取网页的原始HTML内容
  3. 使用jsoup解析HTML数据,提取<img>标签
  4. 下载<img>标签内的src图片链接

实现思路比较清晰,使用WebView加载网页,再用jsoup进行解析,实现难度不大。

到第4步的使用碰到一个问题。

有的页面使用JS脚本动态加载<img>标签,src属性并不是真实的图片地址。

此时使用src下载的图片只是过渡图片,并不是目标图片。

因为每个网站可能使用不同的属性来记录真实地址,目前使用字典的方式来处理。

把所有遇到的特殊属性保存到字典中一个个查询。