全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
楼主: 哥坏人
打印 上一主题 下一主题

[已解决] 发个无聊之作,自己专用的网站模版抓取器

[复制链接]
21#
发表于 2011-10-4 15:43:12 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
22#
 楼主| 发表于 2011-10-4 17:07:25 | 只看该作者

回复 15# xen 的帖子

扒不到的东西,自己在看看哪里缺了 ,补上。
这软件是用来省去扒版时间,太牛B的活 它干不了
刚出炉,采集规则还不多。


那个首页的这部分代码 软件没去做处理 ( 所以缺失http://a.tbcdn.cn/s/ac.js http://a.tbcdn.cn/s/atp.js
<body id="ww_body"><script type="text/javascript">
(function (d) {
var ta=d.createElement("script");ta.type="text/javascript";ta.async=true;ta.id="tb-beacon-ac";
ta.setAttribute("exparams","category=&userid=&channel=112&&stats_show=");
ta.src=("https:"==d.location.protocol?"https://s":"http://a")+".tbcdn.cn/s/ac.js";
d.getElementsByTagName("head")[0].appendChild(ta);
})(document);
</script>
<script type="text/javascript">
(function (d) {
var ta=d.createElement("script");ta.type="text/javascript";ta.async=true;ta.id="tb-beacon";
ta.setAttribute("exparams","category=&userid=&tid=14f1f9c3fb601af2a047bf57da577ff8&channel=112&&stats_show=");
ta.src=("https:"==d.location.protocol?"https://s":"http://a")+".tbcdn.cn/s/atp.js";
d.getElementsByTagName("head")[0].appendChild(ta);
})(document);
</script>

[ 本帖最后由 哥坏人 于 2011-10-4 17:13 编辑 ]
23#
 楼主| 发表于 2011-10-4 17:16:40 | 只看该作者

回复 14# ali727 的帖子

  我之前也都是手动,拔得蛋疼
24#
发表于 2011-10-4 17:18:36 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
25#
发表于 2011-10-4 17:28:02 | 只看该作者
原帖由 xen 于 2011-10-4 15:00 发表
wangwang.taobao.com
此页面天下无一款软件能扒,刚试了下楼主的也无效(没扒全)


用软件可能真的是扒不了,人工倒是搞得出来
26#
发表于 2011-10-4 17:34:31 | 只看该作者
Mark
27#
发表于 2011-10-5 03:01:44 | 只看该作者
易语言论坛里开源的  鉴定完毕
修改下界面和版权结束
28#
发表于 2011-10-5 04:09:02 | 只看该作者
原帖由 lazyzhu 于 2011-10-4 13:15 发表
可以WP吗
29#
发表于 2011-10-5 06:07:07 | 只看该作者
30#
发表于 2011-10-5 06:35:32 | 只看该作者
原帖由 xen 于 2011-10-4 15:00 发表
wangwang.taobao.com
此页面天下无一款软件能扒,刚试了下楼主的也无效(没扒全)

简单
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2024-5-27 06:57 , Processed in 0.064513 second(s), 8 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表