好友
阅读权限10
听众
最后登录1970-1-1
|
liqi
发表于 2019-7-15 10:14
这段代码是用代{过}{滤}理服务器去爬百度 的内容,然后我先自己写了一下报错,说端口必须映射,然后我又照着教程打了一遍,教程没问题,然后我慢慢改代码,改的跟教程的一模一样,还是报错,就在这时,我将教程的代码一行一行复制粘贴过去,发现,根本没有任何变化,但是最神奇的是,他又不报错了!!!!
import urllib.request
def use_proxy(url):
proxy = urllib.request.ProxyHandler({"http","119.23.238.202:3128"})
opener = urllib.request.build_opener(proxy,urllib.request.HTTPHandler)
urllib.request.install_opener(opener)
data = urllib.request.urlopen(url).read().decode("utf-8","ignore")
return data
url = "http://www.baidu.com"
data = use_proxy(url)
print(len(data))
# import urllib.request
# def use_proxy(url):
# proxy = urllib.request.ProxyHandler({"http":"119.23.238.202:3128"})
# opener = urllib.request.build_opener(proxy,urllib.request.HTTPHandler)
# urllib.request.install_opener(opener)
# data = urllib.request.urlopen(url).read().decode("utf-8","ignore")
# return data
# url = "http://www.baidu.com"
# data = use_proxy(url)
# print(len(data)) |
|
发帖前要善用【论坛搜索】功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。 |
|
|
|
|