全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

CeraNetworks网络延迟测速工具IP归属甄别会员请立即修改密码
查看: 382|回复: 0
打印 上一主题 下一主题

[笔记] 解决网络爬虫登陆问题

[复制链接]
跳转到指定楼层
1#
发表于 2023-11-2 22:33:23 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
        网络爬虫在爬取网站时会遇到一些登陆的问题,登陆过程中会遇到输入验证码,如何解决爬虫解决登陆和输入验证码?一般有两种方案。

1、使用cookie登陆
使用cookies登陆,获取浏览器的cookies,然后利用requests 库直接登陆cookies,服务器会认为你是一个真实登陆用户,所以就会返回给你一个已登陆的内容。因此,需要验证码的情况可以使用带验证码登陆的cookie解决。

2、强行登陆
使用requests登陆,requests的好处是速度快。
使用requests登陆一般分为几步:
1、发出请求时使用sess
2、需要把验证码图片下载到本地保存
3、需要通过验证码
4、使用post请求访问登陆网站
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2024-4-29 23:45 , Processed in 0.070263 second(s), 9 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表