吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 4338|回复: 23
收起左侧

[Python 转载] 闲着没事干爬爬猫眼电影玩玩吧

  [复制链接]
cdsgg 发表于 2020-12-2 17:35
本帖最后由 cdsgg 于 2020-12-2 17:52 编辑

[Python] 纯文本查看 复制代码
import requests
from bs4 import BeautifulSoup
import xlsxwriter

page=input("请输入爬取电影的数量:")

workbook = xlsxwriter.Workbook('猫眼电影.xlsx')  # 创建一个excel文件
worksheet = workbook.add_worksheet(u'sheet1')  # 在文件中创建一个名为TEST的sheet,不加名字默认为sheet1



worksheet.write('A1', '电影名字')
worksheet.write('B1', '外文名字')
worksheet.write('C1', '类型')  
worksheet.write('D1', '上映日期')
worksheet.write('E1', '评分')
# worksheet.write('A2', 'WORLD', bold)  
# worksheet.write('B2', U'中文测试', bold) 

url=f'https://m.maoyan.com/ajax/moreClassicList?sortId=1&showType=3&limit={page}'

headers={'User-Agent':'Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.150 Aef/5.53.1.1 Qianniu/7.26.03N Safari/537.36'}

req=requests.get(url=url,headers=headers).content.decode()

soup=BeautifulSoup(req,'lxml')
res=soup.select('div[class="movie-info"]>div[class="title line-ellipsis"]')#中文名字
res2=soup.select('div[class="movie-info"]>div[class="english-title line-ellipsis"]')#英文名字
res3=soup.select('div[class="movie-info"]>div[class="actors line-ellipsis"]')#类型
res4=soup.select('div[class="movie-info"]>div[class="show-info line-ellipsis"]')#上印日期
res5=soup.select('div[class="score line-ellipsis"]>span[class="grade"]')
#body > a:nth-child(5) > div > div.movie-score > div > span.grade
b=2
for i,j,x,k,t in zip(res,res2,res3,res4,res5):
        worksheet.write(f'A{b}', f'{i.text}')
        worksheet.write(f'B{b}', f'{j.text}')
        worksheet.write(f'C{b}', f'{x.text}')  
        worksheet.write(f'D{b}', f'{k.text}')
        worksheet.write(f'E{b}', f'{t.text}')
        print(f'电影名字:{i.text}\n外文名字:{j.text}\n类型:{x.text}\n上映日期:{k.text}\n评分:{t.text}分')
        print('-------------我是分界线------------------------------------------------------------------')
        b=b+1
workbook.close()

# print(req)

# jsdata= req.json()
# title=jsonpath(jsdata,'$..nm')
# for i in title:
#         print(i50

免费评分

参与人数 5吾爱币 +5 热心值 +3 收起 理由
jiguanlang + 1 + 1 大佬帮忙写个爬虫https://www.52pojie.cn/thread-1318728-1-1.html
荆棘之吻 + 1 就喜欢这种通俗易懂的小教程~
小乖松 + 1 + 1 我很赞同!
承蒙厚爱丶 + 1 谢谢@Thanks!
Yeah_whr + 1 + 1 正好准备学爬虫

查看全部评分

本帖被以下淘专辑推荐:

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

 楼主| cdsgg 发表于 2020-12-2 18:03
代码有很多不完善的地方 花了几分钟写了小玩意玩 有需要的话可以自己更改
正在热映:https://m.maoyan.com/ajax/movieOnInfoList
影院:https://m.maoyan.com/ajax/filterCinemas?ci=57
参数:ci ⇒ 城市id
影院详情:https://m.maoyan.com/ajax/cinemaDetail?cinemaId=890
参数:cinemaId ⇒ 影院id
即将上映:https://m.maoyan.com/ajax/comingList?ci=10&token=&limit=10
参数:
ci ⇒ 城市id
limit ⇒ 请求几条
经典电影:https://m.maoyan.com/ajax/moreClassicList?sortId=1&showType=3&limit=10
最受欢迎:https://m.maoyan.com/ajax/moreClassicList?sortId=0&showType=3&limit=5
电影详情:https://m.maoyan.com/ajax/detailmovie?movieId=1203734
参数:movieId ⇒ 电影ID

免费评分

参与人数 1吾爱币 +1 热心值 +1 收起 理由
Doerchan + 1 + 1 求助一下dalao ,帮帮孩子把

查看全部评分

wxbb979 发表于 2020-12-2 17:39
xzyxzy 发表于 2020-12-2 17:39
可以可以的傅大范德萨范德萨范德萨 d's

免费评分

参与人数 1吾爱币 -8 收起 理由
wushaominkk -8 请勿灌水,提高回帖质量是每位会员应尽的义务!

查看全部评分

longge1988 发表于 2020-12-2 17:40
py大佬啊
头像被屏蔽
Doerchan 发表于 2020-12-2 17:52
提示: 作者被禁止或删除 内容自动屏蔽
孤帆月 发表于 2020-12-2 17:53
Python怎么下载安装啊
 楼主| cdsgg 发表于 2020-12-2 17:55
Doerchan 发表于 2020-12-2 17:52
大佬Nb !!!大佬可以问一下遇到TypeError: can only concatenate list (not "str") to list该怎么处理吗

加入list用append添加
头像被屏蔽
Doerchan 发表于 2020-12-2 17:59
提示: 作者被禁止或删除 内容自动屏蔽
 楼主| cdsgg 发表于 2020-12-2 18:05
Doerchan 发表于 2020-12-2 17:59
不懂欸。。能详细说说嘛。。这是我的代码

print(list1)这里都是可以正常输出的

你的list1里面有啥东西
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-25 11:34

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表