全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
查看: 881|回复: 5
打印 上一主题 下一主题

爬虫工具那个好用

[复制链接]
跳转到指定楼层
1#
发表于 2023-11-14 11:24:36 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
1、方便获取稳定的 selector 。最好可以在页面上直接选取元素,获得 selector 。
2、准确提取 data 。可以解析常见数据类型,如提取文本数字。也可以自定义解析脚本。
3、存储到指定的位置。将上述的 data 与 db 对应起来,最好可以用连线的方式,可视化的编辑 1 对 1 的关系。
4、构建循环的流程。爬虫一般都有循环结构,要能简单方便的构建流程,例如简单的逻辑不需要写代码。
5、异常的处理。如果采集过程中出错,要能够指定后续的流程。是返回上一级,还是抛出异常,还是加入到队列。
推荐
发表于 2023-11-14 12:12:40 | 只看该作者
多学学Python吧,简单的直接去学影刀RPA
4#
 楼主| 发表于 2023-11-14 15:43:23 | 只看该作者
Bigcan 发表于 2023-11-14 12:12
多学学Python吧,简单的直接去学影刀RPA

刚刚看了影刀PRA 确实好用
5#
发表于 2023-11-14 16:11:22 | 只看该作者
想找个开源的  爬虫管理平台...
6#
发表于 2023-11-14 21:20:18 | 只看该作者
easyspider
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2024-4-30 00:06 , Processed in 0.061073 second(s), 9 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表