python爬取数据遇到的空格问题？

double07 发表于 2021-10-19 21:57

下图是网页Respon返回的信息，但不知道如何写代码清除字段间的空格？

html_detail = gethtml(i)
               html = etree.HTML(html_detail)
               b = html.xpath('//li[@class="clear"]')
               for i in range(len(b)):
                     lst = {}
                     lst['索引'] = ''
                     lst['小区名称'] = b.xpath('./div/div/div/div/a/text()')
                     lst['房屋信息'] = b.xpath('./div/div/div/text()').replace('\n', '').replace('\r', '')
                     lst['出售价格'] = b.xpath('./div/div/div/div/span/text()')

导出的数据是这样的：

   ↓
希望导出的数据变成这样的？

代码该如何优化？

ForGot_227 发表于 2021-10-19 22:07

a = 'text'
b = a.replace(' ', '')
函数不知道有没有写错。

double07 发表于 2021-10-19 22:16

ForGot_227 发表于 2021-10-19 22:07
函数不知道有没有写错。

恭喜，答对了:lol

ForGot_227 发表于 2021-10-19 22:30

double07 发表于 2021-10-19 22:16
恭喜，答对了

我看你代码都有去掉换行了{:1_925:}

kk159 发表于 2021-10-19 23:15

ForGot_227 发表于 2021-10-19 22:30
我看你代码都有去掉换行了

\n\r只是去换行回车，没去空。strip()不知道能否行呢？{:1_936:}

qwe12344 发表于 2021-10-19 23:35

Mrstick 发表于 2021-10-20 00:34

楼主这个问题我也有遇到过，建议用replace代替，用这个.replace('\n', '').replace('\r', '').replace(" ", "").replace('\t', '')

似水流年2015 发表于 2021-10-20 01:45

有大半年没写python代码了.........差不多忘光了,哈哈

chermy 发表于 2021-10-20 02:01

没接触过py, 有没有类似trim()的函数呢. 2L的替换也是可以的

jacky98617 发表于 2021-10-20 02:53

用strip()應該可以?

页: [1] 2 3

吾爱破解 - 52pojie.cn's Archiver

python爬取数据遇到的空格问题？