小白学习python之爬取豆瓣top250之排行榜

shihana 发表于 2023-5-7 19:49

import requests
import re
headers={
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/94.0.4606.71 Safari/537.36 Core/1.94.197.400 QQBrowser/11.6.5265.400'
}
with open('./豆瓣前10.txt', 'w') as f:
for start_name in range(0,10):
   start_name = start_name*25
   url = f'https://movie.douban.com/top250?start={start_name}&filter='
   html = requests.get(url,headers=headers).text
   zc = re.compile('<div class="info">.*?<span class="title">(.*?)</span>',re.S)
   data = re.findall(zc,html)
   for i in range(0, len(data)):
         f.write(data+'\n')

f.close()

kaisen868 发表于 2023-5-7 23:50

感谢分享应用实例。

luxingyu329 发表于 2023-5-8 00:27

用 with open 下面就没有必要 f.close()了

gailhu 发表于 2023-5-8 02:04

下次发个git地址吧，这样会更好，或者不介意我发git上吧？

O2H2O 发表于 2023-5-8 10:36

多看一个案例就多学习一点~谢谢！

wasd321 发表于 2023-5-8 14:06

感谢分享，正在学习大蟒蛇中。

同舟发表于 2023-5-8 15:22

很好，小白也能看明白的实例

seantian 发表于 2023-5-11 07:51

是不是“end with” 更好，感觉这段逻辑在vb里编译不过:keai

页: [1]

吾爱破解 - 52pojie.cn's Archiver

小白学习python之爬取豆瓣top250之排行榜