离线浏览/网站下载 软件webzip/Teleport比较
想下载或者镜像一个网站,比较流行的有webzip、Teleport等,而且在华军、霏凡等软件下载站的同类软件下载排行榜上都是webzip排在前面。
但是,实际上,想镜像一个站点,最好用的软件还是Teleport。Teleport选项清晰明了,简洁好用。而webzip的选项就很让人找不着北,很不好用,它带的浏览器也没什么用,一般没人会打开它当浏览器用的。
所以,镜像站点的话,还是选择Teleport。Teleport有两个系列:Teleport Ultra和Teleport pro,前者功能更强大,是后者的扩展。可以从这里下载: http://www.aidboy.com/soft/Teleport_Ultra_1.60_SC.zip
补充一点,使用Teleport下载网站之后,只要是有链接的地方,就一定后面跟一个 tppabs 的 tag用以记录该链接的原始地址,图片链接和css链接也不例外。普通浏览器一般都忽略这种标签,虽不影响浏览,但最好是删除这类标记来给网页减肥。成千上万的这种标签用手工去改工作量可想而知,没必要这样费力,用正则表达式来处理几分钟搞定。
用Dreamweaver8建立站点,或者选文件夹:
查找范围:整个当前本地站点 或 文件夹
搜索:源代码
查找:\btppabs=”h[^"]*”
替换:(为空)
勾选:使用正则表达式
点替换全部按钮
CSS文件中有类似 /*tpa=http://www.dimensions-math.org/style_dim.css*/ 的代码,同样替换,正则表达式如下:
tpa=http://[^\s]*.css
匹配javascript代码:
href=”javascript:if\(confirm\(‘htt[^"]*”
替换为 href=”../”
为了避免出现对链接加js,在创建下载任务时,最后设置“项目属性”的“浏览/镜像”选项中“未下载文件的链接”选项为“链接到此文件的Internet地址”,不要选“链接到信息文件,此信息文件解释文件为什么没有被下载”,否则会在所有外链中加入js代码。
用好正则表达式事半功倍,多学习点绝对有用。
没有评论