shihana 发表于 2023-5-7 19:49

小白学习python之爬取豆瓣top250之排行榜


import requests
import re
headers={
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/94.0.4606.71 Safari/537.36 Core/1.94.197.400 QQBrowser/11.6.5265.400'
}
with open('./豆瓣前10.txt', 'w') as f:
    for start_name in range(0,10):
      start_name = start_name*25
      url = f'https://movie.douban.com/top250?start={start_name}&filter='
      html = requests.get(url,headers=headers).text
      zc = re.compile('<div class="info">.*?<span class="title">(.*?)</span>',re.S)
      data = re.findall(zc,html)
      for i in range(0, len(data)):
            f.write(data+'\n')
            
f.close()

kaisen868 发表于 2023-5-7 23:50

感谢分享应用实例。

luxingyu329 发表于 2023-5-8 00:27

用 with open 下面就没有必要 f.close()了

gailhu 发表于 2023-5-8 02:04

下次发个git地址吧,这样会更好,或者不介意我发git上吧?

O2H2O 发表于 2023-5-8 10:36

多看一个案例就多学习一点~谢谢!

wasd321 发表于 2023-5-8 14:06

感谢分享,正在学习大蟒蛇中。

同舟 发表于 2023-5-8 15:22

很好,小白也能看明白的实例

seantian 发表于 2023-5-11 07:51

是不是“end with” 更好,感觉这段逻辑在vb里编译不过:keai
页: [1]
查看完整版本: 小白学习python之爬取豆瓣top250之排行榜