吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 2151|回复: 11
收起左侧

[Python 转载] Python自学记录--爬取豆瓣电影排名

[复制链接]
BoBuo 发表于 2021-9-26 13:51
[Python] 纯文本查看 复制代码
#爬取豆瓣电影排名
import re
import urllib.request
 
#确定数量
page=input("请输入您要查询的数量:")
 
#UA
headers={
"User-Agent":"Mozilla/5.0 \
(Windows NT 10.0; WOW64) AppleWebKit/537.36 \
(KHTML, like Gecko) Chrome/86.0.4240.198 \
Safari/537.36"
}
 
#排名链接
url="https://movie.douban.com/j/chart/top_list?type=11&interval_id=100%3A90&action=&start=0&limit="+page
 
#获取响应信息
req=urllib.request.Request(url,headers=headers)
 
#读取
data=urllib.request.urlopen(req).read().decode()
 
pat1=r'"rating":\["(.*?)","\d+"\]'
pat2=r'"title":"(.*?)"'
 
pattern1=re.compile(pat1)
pattern2=re.compile(pat2)
 
data1=pattern1.findall(data,re.I)
data2=pattern2.findall(data,re.I)
 
for i in range(len(data1)):
    print("排名:",i+1,"电影名:",data2[i],"豆瓣评分:",data1[i])
    
 
 

免费评分

参与人数 2吾爱币 +2 热心值 +2 收起 理由
Flipped123 + 1 + 1 谢谢@Thanks!
只有午安 + 1 + 1 刚好在学,楼主学习思路是怎么样的

查看全部评分

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

 楼主| BoBuo 发表于 2021-9-26 19:42
很吃力,编程方面几乎完全是小白,也不懂英语,看教程,看书,看完就忘。就找题目去做,边做边搜@只有午安
我今天是大佬 发表于 2021-9-27 09:05
本帖最后由 我今天是大佬 于 2021-9-27 09:08 编辑

用re不太好, bs4或者xpath不错

________________________________

进url看了一下返回的是json格式数据, 直接import json解析就好, 没必要用re
suyaming 发表于 2021-9-26 21:51
可以尝试用bs和xpath这些,只用正则的话,很多网站用起来很麻烦
aonima 发表于 2021-9-26 17:38
看到这个好怀念
田三水 发表于 2021-9-26 14:58
感谢!大佬
 楼主| BoBuo 发表于 2021-9-26 17:44
aonima 发表于 2021-9-26 17:38
看到这个好怀念

小白自学,期待老师指点
studentguo 发表于 2021-9-26 18:48
看看。。。。
 楼主| BoBuo 发表于 2021-9-26 22:38
suyaming 发表于 2021-9-26 21:51
可以尝试用bs和xpath这些,只用正则的话,很多网站用起来很麻烦

感谢回复,小白自学,谢谢指点
 楼主| BoBuo 发表于 2021-9-27 12:42
我今天是大佬 发表于 2021-9-27 09:05
用re不太好, bs4或者xpath不错

________________________________

感谢师兄指点,谢谢
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-25 11:39

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表