您的位置: 网站首页> requests爬虫> 当前文章

requests自动登录的2种方法(session对象与cookie)

老董-我爱我家房产SEO2021-11-12183围观,115赞

  Cookie的1个作用是用来标记用户,利用Cookie可以实现自动登录。 实现方法有2种,1种是先手动登录后抓包获取cookie,然后直接传参;另1种是利用s esssion实例自动登录。 但是自动登录有1个前提就是站点要是1个普通的网站,没有刻意的反爬措施,如果有一些反爬策略在里面,就没那么容易登录了!

  现在很多网站都设置了手机验证码、滑块验证码或者在请求头加入了一些按某种规则生成的参数,这使自动登录变得比较艰难,往往需要一些恶心的js逆向才可以解决,本文只是介绍下自动登录原理,具体到某个站得需要专门研究他的算法规则。

  1、直接手动cookie传参登录

  对于普通站点,在请求网页的时候直接在请求头添加cookie(cookie值是提前在浏览器登陆后复制出来的cookie)即可登录,以登录百度为例:

# -*- coding: utf-8 -*-

def get_html(url,retry=1):
    try:
        r = requests.get(url=url, headers=headers)
    except Exception as e:
        print(e)
        if retry > 0:
            get_html(url, retry - 1)
    else:
        html = r.text
        return html

def parse_html(html):
    reobj = re.search('<title>(.*?)</title>',html,re.S|re.I)
    print(reobj.group(1)) # 如果是登录状态,页面title是个人中心

if __name__ == "__main__":
  url = 'https://www.baidu.com/my/index'
  headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.121 Safari/537.36',
    'Cookie':'登录后从浏览器复制出来cookie'
    }
  html = get_html(url)
  if html:
    parse_html(html)
个人中心

  2、session实例自动登录

  因为session对象可以跨请求保存数据,所以只要找到填写表单提交地址,然后用session实例post用户名密码到这个地址,此时服务器响应的cookie内容会保存到session对象里面,所以下一次可直接请求登录后才可以看到的页面。

  现在太多站反爬比较严格,在请求头里做了很多按规则生成的参数,故而暂时还没找到简单的测试网站,只把流程写一下:

# 1. 创建session实例,保存Cookie值
ssion = requests.session()
# 2. 自定义headers
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2840.99 Safari/537.36"}
# 3. 用户名和密码
key_value = {"user":"xxxxx","password":"yyyy",}
# 4.抓包找到登录接口地址(post提交的地址)假设为:
"http://rrwapi.某域名.com/account/v1/loginByPassword"
# 5.post用户名和密码到接口地址
ssion.post("http://rrwapi.某域名.com/account/v1/loginByPassword", data = key_value)
# 6.session包含用户登录后的Cookie值,可以直接访问那些登录后才可以看的页面
r = ssion.get("登录后的url")
# 6. 返回的内容正常
html = r.text
title = re.search('<title>(.*?)</title>',html) 
print(title.group(1)) 

很赞哦!

python编程网提示:转载请注明来源www.python66.com。
有宝贵意见可添加站长微信(底部),获取技术资料请到公众号(底部)。同行交流请加群 python学习会

文章评论

    requests自动登录的2种方法(session对象与cookie)文章写得不错,值得赞赏

站点信息

  • 网站程序:Laravel
  • 客服微信:a772483200