吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 3400|回复: 11
收起左侧

[Python 转载] Python实例记录----TXT文本文件储存

[复制链接]
BoBuo 发表于 2022-3-1 21:52
本帖最后由 BoBuo 于 2022-3-1 21:53 编辑

[Python] 纯文本查看 复制代码
import requests
from pyquery import PyQuery as pq
import re

url = 'https://ssr1.scrape.center/'
html = requests.get(url).text
doc = pq(html)  # 初始化
items = doc('.el-card').items()
# 字典 items() 方法以列表返回视图对象,是一个可遍历的对象 只读不可修改 不是列表,不支持索引,可以使用 list() 来转换为列表

file = open('movies.txt', 'w', encoding='utf-8')
'''
'w'每次写入文本时都会清空原有文件,将新的写入 wb w+ wb+ 都会覆盖已有文件或创建新文件
'a'追加方式打开,不会覆盖原文件,若无会创建 ab二进制写入  a+读写 ab+二进制读写
'r'只能读取不能写入
'rb'以二进制只读方式打开一个文件,例如音频,视频,图片
'r+'可读可写
'rb+'可读可写二进制文件
'''
for item in items:
    # print(item)

    # 电影名称
    name = item.find('a>h2').text()  # 查找a标签下h2标签内容
    file.write(f'名称:{name}\n')  # 写入换行
    # 类别
    
    
    categories = [item.text() for item in item.find('.categories button span').items()]
    
    
    file.write(f'类别:{categories}\n')
    # 上映时间
    publishend_at = item.find('.info:contains(上映)').text()  # .info:contains(上映)  获取.info下带有”上映“的内容
    publishend_at = re.search('(\d{4}-\d{2}-\d{2})', publishend_at).group(1) if publishend_at and re.search(
        '(\d{4}-\d{2}-\d{2})', publishend_at) else None
    file.write(f'上映时间:{publishend_at}\n')
    # 评分
    score = item.find('p.score').text()
    file.write(f'评分:{score}\n')
    file.write(f'{"=" * 50}\n')
file.close()

免费评分

参与人数 3吾爱币 +5 热心值 +3 收起 理由
good-idea + 3 + 1 热心回复!
jnez112358 + 1 + 1 谢谢@Thanks!
jiushi + 1 + 1 我很赞同!

查看全部评分

本帖被以下淘专辑推荐:

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

jiushi 发表于 2022-3-1 22:30
学习学习了
黑泽心教 发表于 2022-3-1 22:37
gunxsword 发表于 2022-3-1 22:57
xcz123m 发表于 2022-3-2 00:17
学习了  坚持
xxscwsrym 发表于 2022-3-2 06:35
感谢分享
小白2021 发表于 2022-3-2 08:26
刚开始学习python,也在研究文本读写和办公软件的读写。这个注释特别清晰。感谢分享
jnez112358 发表于 2022-3-2 11:18
进来学习,谢谢分享
marione 发表于 2022-3-2 11:25
新手学习一下
牛人王老五 发表于 2022-3-2 13:36
注解真是太赞了!
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-25 02:15

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表