xianrenzhang 发表于 2022-3-28 22:05

部分房产信息获取,简单的python代码

本帖最后由 xianrenzhang 于 2022-3-28 22:12 编辑

# 部分房产信息获取
# from requests_html import HTMLSession
# from bs4 import BeautifulSoup
#
# session = HTMLSession()
#
# url = ''
# headers = {
#   'user-agent': 'abc'}
# res = session.get(url=url, headers=headers).text
#
# soup = BeautifulSoup(res, 'lxml')
# page_info = soup.select('body > div.main1200.clearfix > div.main945.floatl > div.shop_list.shop_list_4 > dl')
# with open('./fangchan.csv', 'w') as f:
#   info_fangchan = []
#   for i in page_info:
#         titles = i.select('dd:nth-child(2) > h4 > a')
#         pric = i.select('dd.price_right > span.red > b')
#         sim_pric = i.select('dd.price_right > span:nth-child(2)')
#         for j in titles:
#             # 删除前空格和后空行
#             tits = j.text.lstrip().strip('\n') + '\n'
#             info_fangchan.append(tits)
#            url拼接
#             urls = 'https://abc' + j.attrs['href'] + '\n'
#             info_fangchan.append(urls)
#         for h1 in sim_pric:
#             h3 = '单价:' + h1.text + '\n'
#             info_fangchan.append(h3)
#         for k2 in pric:
#             k3 = '总价:' + k2.text + '万元' + '\r\n'
#             info_fangchan.append(k3)
#   for all_info in info_fangchan:
#         f.write(all_info)
# print('下载完毕!!!')

wlkss001 发表于 2022-3-29 06:42

这个厉害了{:1_927:}

zalei1976 发表于 2022-3-29 08:37

怎么使用?

水鸟 发表于 2022-3-29 09:12

从什么网站获取的信息呢????

ofw 发表于 2022-3-29 09:32

学习一下。。。。

xianrenzhang 发表于 2022-3-29 09:41

水鸟 发表于 2022-3-29 09:12
从什么网站获取的信息呢????

房产网址,比如https://qhd.esf.fang.com/,把url粘到url里,UA填自己用的浏览器UA,就行了。

xianrenzhang 发表于 2022-3-29 09:43

zalei1976 发表于 2022-3-29 08:37
怎么使用?

安装python软件及环境,修改部分代码,就可以了哦!!!

zalei1976 发表于 2022-3-30 09:46

谢了,不会用。
页: [1]
查看完整版本: 部分房产信息获取,简单的python代码