double07 发表于 2021-10-19 21:57

python爬取数据遇到的空格问题?

下图是网页Respon返回的信息,但不知道如何写代码清除字段间的空格?

   html_detail = gethtml(i)
                  html = etree.HTML(html_detail)
                  b = html.xpath('//li[@class="clear"]')
                  for i in range(len(b)):
                        lst = {}
                        lst['索引'] = ''
                        lst['小区名称'] = b.xpath('./div/div/div/div/a/text()')
                        lst['房屋信息'] = b.xpath('./div/div/div/text()').replace('\n', '').replace('\r', '')
                        lst['出售价格'] = b.xpath('./div/div/div/div/span/text()')      

导出的数据是这样的:

      ↓
希望导出的数据变成这样的?


代码该如何优化?




ForGot_227 发表于 2021-10-19 22:07

a = 'text'
b = a.replace(' ', '')
函数不知道有没有写错。

double07 发表于 2021-10-19 22:16

ForGot_227 发表于 2021-10-19 22:07
函数不知道有没有写错。

恭喜,答对了:lol

ForGot_227 发表于 2021-10-19 22:30

double07 发表于 2021-10-19 22:16
恭喜,答对了

我看你代码都有去掉换行了{:1_925:}

kk159 发表于 2021-10-19 23:15

ForGot_227 发表于 2021-10-19 22:30
我看你代码都有去掉换行了

\n\r只是去换行回车,没去空。strip()不知道能否行呢?{:1_936:}

qwe12344 发表于 2021-10-19 23:35

Mrstick 发表于 2021-10-20 00:34

楼主这个问题我也有遇到过,建议用replace代替,用这个.replace('\n', '').replace('\r', '').replace(" ", "").replace('\t', '')

似水流年2015 发表于 2021-10-20 01:45

有大半年没写python代码了.........差不多忘光了,哈哈

chermy 发表于 2021-10-20 02:01

没接触过py, 有没有类似trim()的函数呢. 2L的替换也是可以的

jacky98617 发表于 2021-10-20 02:53

用strip()應該可以?
页: [1] 2 3
查看完整版本: python爬取数据遇到的空格问题?