Python中对etree.HTML 进行xpath( \text())之后数据处理问题

独饮悲~ · 发表于 2019-7-27 22:23

本帖最后由独饮悲~ 于 2019-7-27 22:25 编辑

刚学两天爬虫，遇到了百度不到的问题，前来向各位请教
请指点指点小白

[Python] 纯文本查看 复制代码

        with requests.get(url, headers={'User-agent': ua}) as response:
            content = response.text
            # print(content)
            html = etree.HTML(content)
            Id = html.xpath(
                "//div[@class='mod-bd']//div[@class='comment-item']//div[@class='comment']/h3/span[@class='comment-info']/a/text()")
            view = html.xpath(
                "//div[@class='mod-bd']//div[@class='comment-item']//div[@class='comment']/p/span[@class='short']/text()")
            lis = dict(zip(Id, view))
            print(lis)
            del_sp = json.dumps(lis, ensure_ascii=False, indent='\n')  
            text = json.dumps(view)
            print(del_sp.split(','))
            with open('chenqing2.csv', 'a', encoding='utf-8') as file:
                file.write(del_sp)

代码中经历了变来变去才写入文件

我想请问一下python中对上述代码中‘Id’,‘view‘ 怎么将其写入文件中
write（view）会报错该如何转换数据并按格式写入

另外请教一下有没有对xpath出来的内容一些其他处理方式

帐号		自动登录	找回密码
密码			注册[Register]

[求助] Python中对etree.HTML 进行xpath( \text())之后 数据处理问题

[求助] Python中对etree.HTML 进行xpath( \text())之后数据处理问题