部分房产信息获取，简单的python代码

xianrenzhang · 发表于 2022-3-28 22:05

本帖最后由 xianrenzhang 于 2022-3-28 22:12 编辑

# 部分房产信息获取
# from requests_html import HTMLSession
# from bs4 import BeautifulSoup
#
# session = HTMLSession()
#
# url = ''
# headers = {
#    'user-agent': 'abc'}
# res = session.get(url=url, headers=headers).text
#
# soup = BeautifulSoup(res, 'lxml')
# page_info = soup.select('body > div.main1200.clearfix > div.main945.floatl > div.shop_list.shop_list_4 > dl')
# with open('./fangchan.csv', 'w') as f:
#    info_fangchan = []
#    for i in page_info:
#       titles = i.select('dd:nth-child(2) > h4 > a')
#       pric = i.select('dd.price_right > span.red > b')
#       sim_pric = i.select('dd.price_right > span:nth-child(2)')
#       for j in titles:
#          # 删除前空格和后空行
#          tits = j.text.lstrip().strip('\n') + '\n'
#          info_fangchan.append(tits)
#             url拼接
#          urls = 'https://abc' + j.attrs['href'] + '\n'
#          info_fangchan.append(urls)
#       for h1 in sim_pric:
#          h3 = '单价：' + h1.text + '\n'
#          info_fangchan.append(h3)
#       for k2 in pric:
#          k3 = '总价：' + k2.text + '万元' + '\r\n'
#          info_fangchan.append(k3)
#    for all_info in info_fangchan:
#       f.write(all_info)
# print('下载完毕！！！')

wlkss001 · 发表于 2022-3-29 06:42

这个厉害了

zalei1976 · 发表于 2022-3-29 08:37

怎么使用？

水鸟 · 发表于 2022-3-29 09:12

从什么网站获取的信息呢？？？？

ofw · 发表于 2022-3-29 09:32

学习一下。。。。

xianrenzhang · 发表于 2022-3-29 09:41

水鸟发表于 2022-3-29 09:12
从什么网站获取的信息呢？？？？

房产网址，比如https://qhd.esf.fang.com/，把url粘到url里，UA填自己用的浏览器UA，就行了。

xianrenzhang · 发表于 2022-3-29 09:43

zalei1976 发表于 2022-3-29 08:37
怎么使用？

安装python软件及环境，修改部分代码，就可以了哦！！！

zalei1976 · 发表于 2022-3-30 09:46

谢了，不会用。

帐号		自动登录	找回密码
密码			注册[Register]

[讨论] 部分房产信息获取，简单的python代码

免费评分

本帖被以下淘专辑推荐: