您的位置: 网站首页> requests爬虫> 当前文章
requests自动登录的2种方法(session对象与cookie)
老董-我爱我家房产SEO2021-11-12183围观,115赞
Cookie的1个作用是用来标记用户,利用Cookie可以实现自动登录。 实现方法有2种,1种是先手动登录后抓包获取cookie,然后直接传参;另1种是利用s esssion实例自动登录。 但是自动登录有1个前提就是站点要是1个普通的网站,没有刻意的反爬措施,如果有一些反爬策略在里面,就没那么容易登录了!
现在很多网站都设置了手机验证码、滑块验证码或者在请求头加入了一些按某种规则生成的参数,这使自动登录变得比较艰难,往往需要一些恶心的js逆向才可以解决,本文只是介绍下自动登录原理,具体到某个站得需要专门研究他的算法规则。
1、直接手动cookie传参登录
对于普通站点,在请求网页的时候直接在请求头添加cookie(cookie值是提前在浏览器登陆后复制出来的cookie)即可登录,以登录百度为例:
# -*- coding: utf-8 -*- def get_html(url,retry=1): try: r = requests.get(url=url, headers=headers) except Exception as e: print(e) if retry > 0: get_html(url, retry - 1) else: html = r.text return html def parse_html(html): reobj = re.search('<title>(.*?)</title>',html,re.S|re.I) print(reobj.group(1)) # 如果是登录状态,页面title是个人中心 if __name__ == "__main__": url = 'https://www.baidu.com/my/index' headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.121 Safari/537.36', 'Cookie':'登录后从浏览器复制出来cookie' } html = get_html(url) if html: parse_html(html)
个人中心
2、session实例自动登录
因为session对象可以跨请求保存数据,所以只要找到填写表单提交地址,然后用session实例post用户名密码到这个地址,此时服务器响应的cookie内容会保存到session对象里面,所以下一次可直接请求登录后才可以看到的页面。
现在太多站反爬比较严格,在请求头里做了很多按规则生成的参数,故而暂时还没找到简单的测试网站,只把流程写一下:
# 1. 创建session实例,保存Cookie值 ssion = requests.session() # 2. 自定义headers headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2840.99 Safari/537.36"} # 3. 用户名和密码 key_value = {"user":"xxxxx","password":"yyyy",} # 4.抓包找到登录接口地址(post提交的地址)假设为: "http://rrwapi.某域名.com/account/v1/loginByPassword" # 5.post用户名和密码到接口地址 ssion.post("http://rrwapi.某域名.com/account/v1/loginByPassword", data = key_value) # 6.session包含用户登录后的Cookie值,可以直接访问那些登录后才可以看的页面 r = ssion.get("登录后的url") # 6. 返回的内容正常 html = r.text title = re.search('<title>(.*?)</title>',html) print(title.group(1))
很赞哦!
python编程网提示:转载请注明来源www.python66.com。
有宝贵意见可添加站长微信(底部),获取技术资料请到公众号(底部)。同行交流请加群
相关文章
文章评论
-
requests自动登录的2种方法(session对象与cookie)文章写得不错,值得赞赏