seo必备工具脚本，批量挖掘采集关键词到EXCEL表

小姐姐退下吧 发表于 2020-7-10 16:19

本帖最后由小姐姐退下吧于 2021-5-11 18:07 编辑

下午收到小伙伴反馈失效了，为啥经常失效呢，因为现在是付费时代，干啥都需要充值，不然啥都获取不到，都有限制，所以有需要的还是选择付费吧，抽了点时间将文中代码更改为了A站的api，这样感觉就一劳永逸了，本帖不再更新。

下午收到小伙伴反馈失效了，抽了几分钟修复了下，2020-12-1日代码更新，最新下载地址在文末：
想知道我为啥能第一时间收到小伙伴的反馈消息？点击前往这篇帖子：https://www.52pojie.cn/thread-1276791-1-1.html
还记得自己是这个疫情期间的情人节注册的吾爱破解，这期间也学习到了很多大佬分享的教程和源码，收获颇多。

这不昨天在浏览论坛的时候发现了一个python写的seo关键词采集挖掘脚本（原帖：https://www.52pojie.cn/forum.php?mod=viewthread&tid=985188&extra=page%3D1%26filter%3Dtypeid%26typeid%3D29&page=1），因为我自己也做了个小网站，平时虽不怎么关注seo这方面，但是对于这种能解放双手的工具还是挺喜爱的，所以我马上就copy下来试了试，发现代码报错，于是我开始翻帖子的评论，发现很多人和我是一样的报错，比如下面这个，和我一样的小白，在求助。

几年前我就曾自学过一段时间的python，再加上自己有一点点编程语言的基础，再加上善于利用百度搜索，总算功夫不负有心人，把这个脚本修复了，至少能够跑起来了，现分享给大家，回馈论坛，互助你我。先贴上代码。大佬们不要见笑

#爱站网长尾关键词挖掘
#2021-5-11更新
# -*- coding=utf-8 -*-

import requests
import xlwt
import json

#secrect_Id 登录爱站后获取
secrect_Id ='805422c95131161b845661eb7afe14c5'
headers = {
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.93 Safari/537.36',
'Accept':'text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9',
"Connection": "keep-alive",
"Accept-Encoding": "gzip, deflate, br",
"Accept-Language": "zh-CN,zh;q=0.9"
}

#获取关键词数据
def get_keyword_datas(keyword):
data={
   'word': keyword,
}
url = "https://apistore.aizhan.com/word/related/{0}".format(secrect_Id)
print(url)
html=requests.post(url,data=data,headers=headers).text
res = json.loads(html)
# print(res)
data_list = []
if res['code'] == 200000:
   if res['data']['count'] > 0 :
         print('已采集到{0}关键词，正在保存中...'.format(res['data']['count']))
         for value in res['data']['list']:
            item = []
            for k,v in value.items():
               item.append(v)
            data_list.append(item)
elif res['code'] == 100003:
   print("接口维护")
elif res['code'] == 200002:
   print("非法关键词")
elif res['code'] == 100005:
   print("余额不足,请充值")
else:
   print("系统错误")
return data_list

#保存关键词数据为excel格式
def bcsj(keyword,data):
workbook = xlwt.Workbook(encoding='utf-8')
booksheet = workbook.add_sheet('Sheet 1', cell_overwrite_ok=True)
title = [['长尾关键词', '全网指数', 'pc指数', '移动指数']]
title.extend(data)
#print(title)
for i, row in enumerate(title):
   for j, col in enumerate(row):
         booksheet.write(i, j, col)
workbook.save(f'{keyword}.xls')
print(f"保存数据为 {keyword}.xls 成功！")

if __name__ == '__main__':
keyword = input('请输入关键词>>')
print('正在采集长尾关键词数据，请稍后...')
datas_list=get_keyword_datas(keyword)
if datas_list:
   print('========================采集结束========================\n')
   bcsj(keyword, datas_list)
else:
   print('采集失败\n')

再附上采集部分过程图：

部分成果图：

我的exe文件是用pyinstaller这个来打包的，打包的体积有点大，有需要的可以下载。

2021-5-11日更新下载: https://aima.lanzouj.com/i6MDmp13bza

如果觉得好用的话，可以给我来个免费评分鼓励下么，谢谢大家了！

小姐姐退下吧 发表于 2020-7-11 19:22

落日惊鸿发表于 2020-7-11 18:32
请问这个怎么使用啊？

先安装python3
然后安装模块lxml xlwt
然后命令提示符运行python 文件名.py就可以了

当然了我知道如果对于没有接触过python的人来说我上面这么说可能还是不懂但是可以借助百度

小姐姐退下吧 发表于 2020-7-17 17:43

骑士哥丶发表于 2020-7-16 22:20
exe一直运行，我连续跑了1个小时了，跑了好多关键字，贼开心~
但是任意键都停止不了，我手动×了，它 ...

停止还是可以停止的 ctrl+C按两次一般正常的关键词都有100页因为代码中设置了延迟所以可能确实需要花费的时间久一点其实如果手动跑的话将代码中的64行注释然后打开65行将1改为30 采集到30页应该差不多了吧

代码还有优化的空间我也继续研究研究

晓则又木风 发表于 2020-7-10 16:55

:lol膜拜膜拜

by、不疼 发表于 2020-7-10 19:33

我也想搞个网站玩玩，但是不知道弄哪方面的

小姐姐退下吧 发表于 2020-7-10 22:05

by、不疼发表于 2020-7-10 19:33
我也想搞个网站玩玩，但是不知道弄哪方面的

弄自己感兴趣的方面可能会坚持的更长久些

by、不疼 发表于 2020-7-10 23:27

小姐姐退下吧发表于 2020-7-10 22:05
弄自己感兴趣的方面可能会坚持的更长久些

到现在，都不知道自己喜欢什么了。哈哈

凌乱的思绪 发表于 2020-7-11 08:34

之前搭建过，没空去运行维护，就放弃了…

zzx0822 发表于 2020-7-11 10:52

凌乱的思绪发表于 2020-7-11 08:34
之前搭建过，没空去运行维护，就放弃了…

我有大把时间，就是没技术{:1_907:}

asd66666688 发表于 2020-7-11 11:18

先下载试试看好不好用

落日惊鸿 发表于 2020-7-11 18:32

请问这个怎么使用啊？

页: [1] 2 3 4 5 6 7 8 9 10

吾爱破解 - 52pojie.cn's Archiver

seo必备工具脚本，批量挖掘采集关键词到EXCEL表