好友
阅读权限25
听众
最后登录1970-1-1
|
鱼儿飞
发表于 2017-7-10 21:36
本帖最后由 鱼儿飞 于 2017-11-6 21:32 编辑
2017.11.6更新
珍爱网更新了搜索策略,必须要登陆才可以搜索,软件不可用了,
你们去别的网站搜吧,原理类似。
-----------------------------------------------------------------------------------今天看见有人在发真爱网头像获取的软件,
闲着无聊就用python写了一个
语言:python3
功能:获取珍爱网的头像,保存到本地.会在程序目录下新建一个logo的文件夹,保存图片
抓取的是手机端网页加载图像的API
效果展示
zhenai.zip
(1.05 KB, 下载次数: 72)
源码已经发出来了,你可以自己修改,帮到你的话可以加个CB和热心.
打包为exe,可以直接运行的版本.
链接: https://pan.baidu.com/s/1geHjgI3 密码: b6n8
[Python] 纯文本查看 复制代码 # -*- coding: utf-8 -*-
import datetime
import requests
import json
import urllib
import os
import time
from socket import timeout
# TOKEN_FILE = r'C:\fast\zhihuSpider\my-code\new.pkl'
headers = {'User-Agent':'Mozilla/5.0 (iPhone; CPU iPhone OS 9_1 like Mac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko) Version/9.0 Mobile/13B143 Safari/601.1'}
num = input("请输入获取图像张数(最好大于1000):")
get_num = 0
if not os.path.exists("logo"):
os.mkdir("logo")
for idName in range(int(int(num)/1000)):
try:
print(datetime.datetime.now())
url_1 = "http://m.zhenai.com/v2/search/getSearchListContent.do?pageNo=%s" % idName
temp = "&pageSize=1000&key=MyMemberId%3A-1%2FageBegin%3A20%2FageEnd%3A28%2Fh1%3A155%" \
"2Fh2%3A175%2Fsex%3A1%2Fmysex%3A0%2Fisall%3A1%2Fleer%3A1%2FEducation%3A-1%2FMarr" \
"iage%3A-1%2FSalary%3A-1%2Fmembertype%3A1%2FPhoto%3A1%2FWorkCity%3A10100000%2FOrder%" \
"3Ahpf%2FPage%3ApageNoNow%2FPageSize%3ApageSizeNow"
url = url_1+temp
r = requests.get(url, headers=headers,timeout = 10)
json1_data = json.loads(r.text)
for index in range(1000):
img_url = json1_data['searchList'][index]['defaultPhoto']
img_url = img_url.replace("_2", '',)
name = img_url.split('/')
urllib.request.urlretrieve(img_url, "logo\%s" % name[-1])
get_num += 1
print("第%s张" % get_num)
time.sleep(5)
except:
print("fuck-error")
time.sleep(10) # 出错休息10秒
print("获取完毕!!!")
|
免费评分
-
查看全部评分
|
发帖前要善用【论坛搜索】功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。 |
|
|
|
|