吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 1276|回复: 15
收起左侧

[求助] python爬虫问题

[复制链接]
JIMaz 发表于 2020-5-10 19:41
本帖最后由 JIMaz 于 2020-5-10 20:52 编辑

打算用python的scrapy框架爬取一下黄金价格,但是可能是编码不同的原因,一直以下错误
got.jpg
在网上找了很久,都得不到解决,所以在此来向论坛大佬求助,还希望大佬们能不吝赐教,谢谢
代码如图
go2.jpg
# -*- coding: utf-8 -*-
import scrapy

class GoSpider(scrapy.Spider):
    name = 'go'
    allowed_domains = ['mybank.icbc.com.cn']
    start_urls = ['https://mybank.icbc.com.cn/icbc/newperbank/perbank3/frame/frame_index.jsp?serviceId=PBL200603']

    def parse(self, response):
        li_list = response.xpath("//div[@class='indexBlock']/table/tr")
        print(li_list)
        for li in li_list:
            item = {}
            item["price"] = li.xpath(".//td/text()").extract_first()
            print(item)

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

vista_info 发表于 2020-5-10 19:48
代码呢?
ymhld 发表于 2020-5-10 19:49
 楼主| JIMaz 发表于 2020-5-10 19:57
 楼主| JIMaz 发表于 2020-5-10 19:58
ymhld 发表于 2020-5-10 19:49
还是贴代码出来吧,大佬 们会出手

代码贴出来了,帮忙看看,谢谢
qifeon 发表于 2020-5-10 20:03
看log是貌似是读取robots.txt出错,试试
scrapy  默认的是遵循  robots.txt 协议,setting 文件里修改True 为False  
# Obey robots. txt rules
ROBOTSTXT_ _OBEY = False
ymhld 发表于 2020-5-10 20:29
JIMaz 发表于 2020-5-10 19:58
代码贴出来了,帮忙看看,谢谢

用帖子里的高级模式
image.png
image.png
ReLoading 发表于 2020-5-10 20:52
报错已经告诉你  编码错误了,自己转换一下编码,问题就解决了
 楼主| JIMaz 发表于 2020-5-10 20:53
ymhld 发表于 2020-5-10 20:29
用帖子里的高级模式

按照高级方式贴出来了
挑灯看花 发表于 2020-5-10 20:53
utf8用不了的时候我就换成gbk解决一半问题
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-11-26 16:59

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表