吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1862|回复: 0
收起左侧

[求助] Python中对etree.HTML 进行xpath( \text())之后 数据处理问题

[复制链接]
独饮悲~ 发表于 2019-7-27 22:23
本帖最后由 独饮悲~ 于 2019-7-27 22:25 编辑

刚学两天爬虫,遇到了百度不到的问题,前来向各位请教
请指点指点小白

[Python] 纯文本查看 复制代码
        with requests.get(url, headers={'User-agent': ua}) as response:
            content = response.text
            # print(content)
            html = etree.HTML(content)
            Id = html.xpath(
                "//div[@class='mod-bd']//div[@class='comment-item']//div[@class='comment']/h3/span[@class='comment-info']/a/text()")
            view = html.xpath(
                "//div[@class='mod-bd']//div[@class='comment-item']//div[@class='comment']/p/span[@class='short']/text()")
            lis = dict(zip(Id, view))
            print(lis)
            del_sp = json.dumps(lis, ensure_ascii=False, indent='\n')  
            text = json.dumps(view)
            print(del_sp.split(','))
            with open('chenqing2.csv', 'a', encoding='utf-8') as file:
                file.write(del_sp)


代码中经历了变来变去才写入文件

我想请问一下python中  对上述代码中‘Id’,‘view‘  怎么将其写入文件中
write(view)会报错    该如何转换数据并按格式写入

另外请教一下有没有对xpath出来的内容 一些其他处理方式
QQ截图20190727215836.png

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-27 03:56

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表