kira20220313 发表于 2022-10-22 09:51

采集爱采购企业联系方式

本帖最后由 kira20220313 于 2023-5-9 10:04 编辑

最近需要一些企业信息用于营销,无意间发现百度爱采购的企业信息还是比较全的,微信,电话 ,qq,邮箱,都有



# -*- coneding = utf-8 -*-
# @Time : 2021/7/19 21:39
# @Author:phoenix
# @file : 5. 百度爱采购ajax.py
# @Softwara : PyCharm
import condition as condition
import requests
import re
import csv
from time import sleep
import os
kw = input("请输入一个查询关键词:")
file_name = '百度爱采购-%s.csv'%kw
f = open(file_name,mode='a',encoding='gbk')
cscwrite = csv.writer(f)
num = 0
for i in range(1,100):
    params = {
      'ajax': '1',
      'q': kw,
      'p': i,
      'sa':'',
      'mk': '全部结果',
      's': '30',
      'adn': '0',
      'resType': 'product',
      'from': 'search'
    }

    headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.114 Safari/537.36'}
    response = requests.get('https://b2b.baidu.com/s/a',params=params,headers=headers).json()
    name_list = response['data']['productList']
    list_num = len(name_list)
    print(len(name_list))
    for name in name_list:
      corporate_name = name.get('fullProviderName')       #获取到公司名称
      #构造公司联系页链接
      url = f'https://b2b.baidu.com/shop?name={corporate_name}&tpath=contact'
      resp = requests.get(url=url,headers=headers).text
      phoneNumber = re.findall('"phoneNumber":"(.*?)"', resp, re.S)       #手机
      telNumber = re.findall('"telNumber":"(.*?)"', resp, re.S)         #电话
      faxNumber = re.findall('"faxNumber":"(.*?)"', resp, re.S)         #传真
      qqNumber = re.findall('"qqNumber":"(.*?)"', resp, re.S)             #qq号码
      wechatNumber = re.findall('"wechatNumber":"(.*?)"', resp, re.S)   #微信
      email = re.findall('"email":"(.*?)"', resp, re.S)                   #电子邮箱
      print(corporate_name, phoneNumber, telNumber, telNumber, faxNumber, qqNumber, wechatNumber, email)
      cscwrite.writerow()
      sleep(0.05)
      num +=1
    print('---第%s页采集完成---'%i )
    if (list_num == 0):
      f.close()
      print('---爬取完毕,共获取到%d条数据---' % num)
      os._exit(0)


补一个 exe 可执行文件 下载:
方便 大家 使用 链接:
更新下载地址
链接:https://pan.baidu.com/s/1sQE9AUjgQuXSsl4s1yj_oA?pwd=l19x
提取码:l19x

kira20220313 发表于 2023-11-8 00:50

最新版本发布
链接:https://pan.baidu.com/s/1mGpS7MBAXVGYRJct2gaZtg?pwd=rmjf
提取码:rmjf

kira20220313 发表于 2023-2-11 11:08

软件更新 新 下载 地址
链接:https://pan.baidu.com/s/1LjmbXV994lBz4paj1w2OIw?pwd=q2vp
提取码:q2vp

苏紫方璇 发表于 2022-10-22 16:33

建议使用置顶帖方法插入代码
【公告】发帖代码插入以及添加链接教程(有福利)
https://www.52pojie.cn/thread-713042-1-1.html
(出处: 吾爱破解论坛)

kira20220313 发表于 2022-10-22 17:05

苏紫方璇 发表于 2022-10-22 16:33
建议使用置顶帖方法插入代码
【公告】发帖代码插入以及添加链接教程(有福利)
https://www.52pojie.cn/t ...

谢谢, 学会了

lin1519222 发表于 2022-11-21 14:32

感谢分享

射手潇潇 发表于 2022-11-24 17:04

程序很好用,感谢

嬉皮笑脸 发表于 2022-12-15 22:32

爱采购,去看看

hhgdgs 发表于 2022-12-17 00:30

很不错,感谢楼主,百度知道采集能实现吗?或者全网关键词爬取内容。我这里有用

kira20220313 发表于 2023-2-11 11:21

hhgdgs 发表于 2022-12-17 00:30
很不错,感谢楼主,百度知道采集能实现吗?或者全网关键词爬取内容。我这里有用

百度 采集什么内容? 可以留 联系方式吗?

小挚 发表于 2023-2-11 23:17

可以做个其他的网址的采集吗{:1_921:}
页: [1] 2 3 4 5
查看完整版本: 采集爱采购企业联系方式