15774211127 发表于 2019-5-21 16:03

行政区划代码爬取(2018版)

本帖最后由 15774211127 于 2019-5-21 16:05 编辑

目前最新的行政区划代码网站是(官网)大家可以自己编写爬取的代码哦
http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2018/index.html
闲来无事用JAVA写了爬取行政区划代码到数据库的程序。
没有使用多线程爬取,大家可以自己修改成多线程爬取
不会写文案,请见谅!!!
1.数据库设计(Mysql8.0)
CREATE TABLE `address`(
`code` char(12) CHARACTER SET utf8mb4 COLLATE utf8mb4_0900_ai_ci NULL DEFAULT NULL,
`name` varchar(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_0900_ai_ci NULL DEFAULT NULL,
`classify_code` char(12) CHARACTER SET utf8mb4 COLLATE utf8mb4_0900_ai_ci NULL DEFAULT NULL,
`parent_code` char(12) CHARACTER SET utf8mb4 COLLATE utf8mb4_0900_ai_ci NULL DEFAULT NULL,
INDEX `code`(`code`) USING BTREE,
INDEX `parent_code`(`parent_code`) USING BTREE,
CONSTRAINT `address_ibfk_1` FOREIGN KEY (`parent_code`) REFERENCES `address` (`code`) ON DELETE RESTRICT ON UPDATE RESTRICT
)
INSERT INTO `address` VALUES ('0', '中国', NULL, '0');

2.部分代码截图

3.爬取完毕后数据库截图

源码文件下载地址:链接: https://pan.baidu.com/s/1xYDBPjQCZv_zrDVCOXncmg 提取码: 1234
小白一枚,欢迎指教。

A00 发表于 2019-5-21 21:28

感谢分享

rovertang 发表于 2019-5-26 17:11

支持!!!
京东天猫的地址应该就是按这个来的。
页: [1]
查看完整版本: 行政区划代码爬取(2018版)