王大哈哈 发表于 2021-1-8 13:03

python爬虫第三天,真香定理!!

本帖最后由 王大哈哈 于 2021-1-8 13:06 编辑

今天,我又真香了!
前两篇帖子同志们跟我说Requests库好用!!

我就算是写代码累死,也不会去用Requests库的
哎,Requests真香!

https://static.52pojie.cn/static/image/hrline/1.gif
今天就来总结以下 我学习的Requests库的知识点吧!!!
首先!什么是Requests库呢?
Requests库是用Python编写的,基于urllib库(也就是说,他爹是urllib库)
采用的是Apache2 Licensed开源协议的HTTP库(这和Apache这个玩意我也不知道是啥!懒得查)

https://static.52pojie.cn/static/image/hrline/1.gif




那么,都已经有了urllib库了,为啥还要写Requests库呢!
啊!那肯定是,随着时代的进步,科技也在不断的进步对不对!
呵!tui!
说人话!!
懒!!

https://static.52pojie.cn/static/image/hrline/1.gif


看代码:
import requests
import urllib.request
def urllib(url,head) :
    req = urllib.request.Request(url, headers=head)
    response = urllib.request.urlopen(req)
    html = response.read().decode('utf-8')
def Requests(url,head):
    req = requests.get(url, head)
    print(req.text)

https://static.52pojie.cn/static/image/hrline/1.gif


第一个方法是使用的urllib对网页发送请求,以及显示所获取的数据


第二个方法是使用的Requests库对网页发送请求,以及显示所获取的数据

https://static.52pojie.cn/static/image/hrline/1.gif


怎么说呢!
简单,明了,方便,代码少!真香!
下面就是一些Requests库的知识点!拿小本本记住啊啊啊啊!

https://static.52pojie.cn/static/image/hrline/1.gif


Requests库函数:

实在是懒得打字了,这是我做的ppt 截个图凑活看吧!

https://static.52pojie.cn/static/image/hrline/1.gif


Requests库的常用属性:



了解以后!啊,用途都差不多!
然后了解了解咋使用的呢!
第一个:

https://static.52pojie.cn/static/image/hrline/1.gif
requests.request(method, url, **kwargs)
method    请求方式,对应get/put/post等7种
url                     拟获取页面的url链接
**kwargs: 控制访问的参数,共13个

https://static.52pojie.cn/static/image/hrline/1.gif
method : 请求方式
requests.request('GET', url, **kwargs)
requests.request('HEAD', url, **kwargs)
requests.request('POST', url, **kwargs)
requests.request('PUT', url, **kwargs)
requests.request('PATCH', url, **kwargs)
requests.request(‘DELETE', url, **kwargs)
requests.request('OPTIONS', url, **kwargs)
https://static.52pojie.cn/static/image/hrline/1.gif
requests.get(url, params=None, **kwargs)
url    拟获取页面的url链接
params url中的额外参数,字典或字节流格式,可选



**kwargs: 12个控制访问的参数

https://static.52pojie.cn/static/image/hrline/1.gif
requests.head(url, **kwargs)
url : 拟获取页面的url链接
**kwargs: 12个控制访问的参数


https://static.52pojie.cn/static/image/hrline/1.gif


requests.post(url, data=None, json=None, **kwargs)
url         拟更新页面的url链接
data       字典、字节序列或文件,Request的内容
json       JSON格式的数据,Request的内容
**kwargs   12个控制访问的参数

https://static.52pojie.cn/static/image/hrline/1.gif
requests.put(url,data=None,**kwargs)
url   拟更新页面的url链接
data字典、字节序列或文件,Request的内容
**kwargs 12个控制访问的参数


https://static.52pojie.cn/static/image/hrline/1.gif


requests.patch(url,data=None,**kwargs)
url      拟更新页面的url链接
data   字典、字节序列或文件,Request的内容
**kwargs   12个控制访问的参数

https://static.52pojie.cn/static/image/hrline/1.gif
requests.delete(url,**kwargs)
url   拟删除页面的url链接
**kwargs   12个控制访问的参数



https://static.52pojie.cn/static/image/hrline/1.gif


完了!!公司还不放假!!
保定就要封城了!
回不去家了哎!!






风流倜傥你豪哥 发表于 2021-1-8 14:30

请教个问题,使用request代{过}{滤}理
proxies = {
    "http": f"http://49.86.219.238:20034"
}
r = requests.get("http://icanhazip.com", proxies=proxies)
if r:
    print("ip:"+str(r.text).encode('utf-8').decode('utf-8'))

检测是代练成功了,但是某个网站依旧可以追踪到我的真实ip,请问这种情况应该怎么处理?

WoShiXXX 发表于 2021-1-8 14:15

王大哈哈 发表于 2021-1-8 14:03
咱也不知道,咱也不敢问啊

有一次那些账号露馅了,因为那个帖子没有内容,还有一堆人发谢谢楼主,还有人评分加CB

Loker 发表于 2021-1-8 13:11

你好,请问你知道这俩问题怎么解决吗?https://www.52pojie.cn/thread-1346592-1-1.html

pearpear888 发表于 2021-1-8 13:13

谢谢分享,嘿嘿

TLYA999 发表于 2021-1-8 13:25

谢谢楼主分享!

nnelqw 发表于 2021-1-8 13:32

谢谢楼主,这么一看就很清楚功能了

wfgkcuf 发表于 2021-1-8 13:32

感谢分享 这次要好好学习

bloodwolf4177 发表于 2021-1-8 13:37

感谢楼主,这个一目了然,非常棒

Msea 发表于 2021-1-8 13:52


谢谢楼主分享!

dioxn 发表于 2021-1-8 14:00

怎么感觉好多评论是刷的

王大哈哈 发表于 2021-1-8 14:03

dioxn 发表于 2021-1-8 14:00
怎么感觉好多评论是刷的

咱也不知道,咱也不敢问啊{:1_905:}
页: [1] 2
查看完整版本: python爬虫第三天,真香定理!!