岁月匆匆,蓦然回首,只有那逐渐消逝的深深浅浅的脚印…
« »
December 1, 2009随笔
63 views

离线浏览/网站下载 软件webzip/Teleport比较

想下载或者镜像一个网站,比较流行的有webzip、Teleport等,而且在华军、霏凡等软件下载站的同类软件下载排行榜上都是webzip排在前面。

但是,实际上,想镜像一个站点,最好用的软件还是Teleport。Teleport选项清晰明了,简洁好用。而webzip的选项就很让人找不着北,很不好用,它带的浏览器也没什么用,一般没人会打开它当浏览器用的。

所以,镜像站点的话,还是选择Teleport。Teleport有两个系列:Teleport Ultra和Teleport pro,前者功能更强大,是后者的扩展。可以从这里下载: http://www.aidboy.com/soft/Teleport_Ultra_1.60_SC.zip

补充一点,使用Teleport下载网站之后,只要是有链接的地方,就一定后面跟一个 tppabs 的 tag用以记录该链接的原始地址,图片链接和css链接也不例外。普通浏览器一般都忽略这种标签,虽不影响浏览,但最好是删除这类标记来给网页减肥。成千上万的这种标签用手工去改工作量可想而知,没必要这样费力,用正则表达式来处理几分钟搞定。

用Dreamweaver8建立站点,或者选文件夹:

查找范围:整个当前本地站点 或 文件夹
搜索:源代码
查找:\btppabs=”h[^"]*”
替换:(为空)
勾选:使用正则表达式
点替换全部按钮

CSS文件中有类似 /*tpa=http://www.dimensions-math.org/style_dim.css*/  的代码,同样替换,正则表达式如下:
tpa=http://[^\s]*.css

匹配javascript代码:
href=”javascript:if\(confirm\(‘htt[^"]*”
替换为  href=”../”
为了避免出现对链接加js,在创建下载任务时,最后设置“项目属性”的“浏览/镜像”选项中“未下载文件的链接”选项为“链接到此文件的Internet地址”,不要选“链接到信息文件,此信息文件解释文件为什么没有被下载”,否则会在所有外链中加入js代码。

用好正则表达式事半功倍,多学习点绝对有用。

文章信息 »

作者: YanGe   发表时间: 2009-12-01 12:58  所属分类: 随笔         Tags:

相关文章 »

没有评论

评论被关闭,联系作者请发邮件至 blog at yange.org

返回顶部