号码归属地库
数据库的号码归属地是18年之前的,因为出现很多号码新号码不识是的问题,所以需要更新一遍。
在此之前我想了下流程,主要是分以下几步。
-
获取号码和区域代码(区号)
-
制作区号代码字典(区号,省份,城市)
-
根据区号补充号码的省份和城市(号码,区号,身份,城市)
-
拼接插库语句
获取号码和区域代码
这里我采用很久之前看到的GitHub上一位大佬的库,使用PHP拉取3大运营商的号码和区号,我直接取用大佬拉好的数据。
数据格式如下
1330010 010
1330011 010
1330018 021
制作区号代码字典
根据我从之前数据库拉出来的区号信息制作字典。
数据格式如下,并保存至txt文本中
00852 香港 香港
010 北京 北京
020 广东 广州
具体方法如下,让python逐行读取文本内容,分割文本之后存入list,然后再依次存入两个字典中。
#初始化参数
province = {} #创建空字典省份
city = {} #创建空字典城市
a_dist = open('./dist.txt', 'r', encoding='UTF-8') #读取文件,使用utf-8格式使用
#读取,分割,制作字典
for line in a_dist:
lines = line.replace('\n', '') #可能存在换行符,影响结果,这里置换为空
split = lines.split('\t') #以制表符为分割点,分割
province[split[0]] = split[1] #添加区号查询的省份字典
city[split[0]] = split[2] #添加区号查询的城市字典
a_dist.close()
根据区号补充号码的省份和城市
根据上面两个步骤得出的数据可以生成一份,号码-区号-省份-城市 的对应数据。
a_10000 = ('./10000.txt', 'r', encoding='UTF-8')
for number in a_10000:
lines = line.replace('\n', '')
split = lines.split(' ') #同理可得对应list
#写入txt文件
try:
w_txt = open('./dianxin.sql', 'a', encoding='UTF-8') # 'a' 为追加模式,请确保文本为空
w_txt.write('号码:%s,区号:%s,省份:%s,城市:%s' % (split[0], split[1], province[split[1]], city[a[1]]))
excrpt:
print(split[0]) #打印号码
print(split[1]) #打印区号
f_name.close()
拼接插库语句
根据写入文件的方法自行修改
a_10000 = ('./10000.sql', 'r', encoding='UTF-8')
for number in a_10000:
lines = line.replace('\n', '')
split = lines.split(' ') #同理可得对应list
#写入txt文件
try:
w_txt = open('./dianxin.sql', 'a', encoding='UTF-8') # 'a' 为追加模式,请确保文本为空
w_txt.write('INSERT into splitresplitNumber (Number,splitresplitNumber,Province,City) VsplitLUES (\'%s\',\'%s\',\'%s\',\'%s\');\n' % (split[0], split[1], province[split[1]], city[split[1]]))
excrpt:
print(split[0]) #打印号码
print(split[1]) #打印区号
f_name.close()
接着执行sql文件,就能愉快的添加了。
dist.txt
(7.04 KB, 下载次数: 96)
初学方法,比较费时费力。欢迎吐槽~