requests模块使用-创新互联

安装 requests


# 在命令行工具中使用
pip install requests
# 使用前需要导入
import requests

下面我们来看一下requests库的几种常用高级用法

在南开等地区,都构建了全面的区域性战略布局,加强发展的系统性、市场前瞻性、产品创新能力,以专注、极致的服务理念,为客户提供成都网站设计、成都网站制作、外贸网站建设 网站设计制作定制网站制作,公司网站建设,企业网站建设,成都品牌网站建设,成都全网营销,外贸营销网站建设,南开网站建设费用合理。
会话对象
  • 会话对象可以跨请求保持某些参数,在同一个 Session 实例发出的所有请求之间保持 cookie,会话也可用来为请求方法提供缺省的数据;

from requests import Session
s = Session()
# 会话拿到
r = s.get('http://www.baidu.com')
print(r)   # 
print(r.cookies)   #  ]>
# 再次发起请求
r = s.get('https://www.csdn.net/')
print(r.text)

我们可以拿到一个名为 r 的 Response 对象,然后在这个对象中获取所有我们想要的信息,大家可以自己执行代码看看输出结果。

  • 会话还可以作为上下文管理器,这样就能确保 with 区块退出后即使发生了异常会话能被关闭;

import requests
with requests.get('http://httpbin.org/get', stream=True) as r:
    print(r.text)

  • 任何时候进行了类似 requests.get() 的调用,都在做两件主要的事情,一个是在构建一个 Request 对象, 该对象将被发送到某个服务器请求或查询一些资源,其二是一旦 requests 得到一个从服务器返回的响应就会产生一个 Response 对象。该响应对象包含服务器返回的所有信息,也包含你原来创建的 Request 对象;
使用Prepared Request对象
  • 当你从 API 或者session会话调用中收到一个 Response 对象时,request 属性其实是使用了 Prepared Request 对象。

from requests import Request, Session
s = Session()
# 获取Prepared Request对象
req = Request('GET', url,
    data=data,
    headers=header
)
prepped = req.prepare()
# do something with prepped.body
# do something with prepped.headers
resp = s.send(prepped,
    stream=stream,
    verify=verify,
    proxies=proxies,
    cert=cert,
    timeout=timeout
)
print(resp.status_code)

SSL 证书验证
  • Requests 可以为 HTTPS 请求验证 SSL 证书,就像 web 浏览器一样。verify 默认参数就是true,开启SSL 验证,如果将 verify 设置为 False,则会忽略对 SSL 证书的验证,但是会有警告,需要使用 urllib3.disable_warnings()

import requests
import urllib3
urllib3.disable_warnings()
# verify默认参数就是true
ret = requests.get('https://github.com', verify=True)
print(ret.status_code)
# 也可以关闭verify, 但是会有警告
ret = requests.get('https://github.com', verify=False)
print(ret.status_code)

流式上传
  • Requests支持流式上传,允许发送大的数据流或文件而无需先把它们读入内存,要使用流式上传,需要为请求体提供一个类文件对象;

with open('massive-body', 'rb') as f:
    requests.post('http://some.url/streamed', data=f)
与requests.post("http://httpbin.org/post", files=files)不一样

块编码请求
  • 当下载大文件时,用 Response.iter_content 或许更方便些。 requests.get(url) 默认是下载在内存中的,下载完成才存到硬盘上,可以用 Response.iter_content 来边下载边存

import requests
url = "/tupian/20230522/1.mp4"
# 这里设置stream=true的目的在于不会将内容全部储存在内存中,而是根据chunk_size的大小,去下载内容
ret = requests.get(url, stream=True)
with open('1.mp4', 'wb') as f:
    for block in ret.iter_content(chunk_size=1024):
        f.write(block)

POST 多个分块编码的文件
  • 使用POST表单提交的方式可以在一个请求中发送多个文件,只需要把文件设到一个元组的列表中。
    例如,假设你要上传多个图像文件到一个 HTML 表单,使用一个多文件 field 叫做 “images”:



然后把文件设到一个元组的列表中,其中元组结构为 (form_field_name, file_info):


import requests
url = 'http://httpbin.org/post'
multiple_files = [
        #  images是input的name属性
        ('images', ('foo.png', open('foo.png', 'rb'), 'image/png')),
        ('images', ('bar.png', open('bar.png', 'rb'), 'image/png'))]
r = requests.post(url, files=multiple_files)
print(r.text)

设置Proxy代理
  • 如果需要使用代理,可以通过为任意请求方法提供 proxies 参数来往请求中设置代理,还可以传递用户名和密码;

import requests
#普通代理
proxies = {
   "http": "http://23.10.1.10:80",
   "https": "https://23.10.1.11:80",
}
# 往请求中设置代理(proxies)
r = requests.get("https://www.baidu.com", proxies=proxies)
print(r.status_code)
# 带有用户名和密码的代理, basic认证
proxies = {
   "http": "http://user:password@227.1.0.1:9999/",
}
r = requests.get("https://www.baidu.com", proxies=proxies)
print(r.status_code)
# 设置socks代理
proxies = {
   'http': 'socks5://127.0.0.1:1080',
   'https': 'socks5://127.0.0.1:1080'
}
r = requests.get("https://www.facebook.com", proxies=proxies)
print(r.status_code)

参考: /tupian/20230522/login.html


当前名称:requests模块使用-创新互联
文章源于:http://csdahua.cn/article/jcpid.html
扫二维码与项目经理沟通

我们在微信上24小时期待你的声音

解答本文疑问/技术咨询/运营咨询/技术建议/互联网交流