行政区划代码爬取(2018版)
本帖最后由 15774211127 于 2019-5-21 16:05 编辑目前最新的行政区划代码网站是(官网)大家可以自己编写爬取的代码哦
http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2018/index.html
闲来无事用JAVA写了爬取行政区划代码到数据库的程序。
没有使用多线程爬取,大家可以自己修改成多线程爬取
不会写文案,请见谅!!!
1.数据库设计(Mysql8.0)
CREATE TABLE `address`(
`code` char(12) CHARACTER SET utf8mb4 COLLATE utf8mb4_0900_ai_ci NULL DEFAULT NULL,
`name` varchar(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_0900_ai_ci NULL DEFAULT NULL,
`classify_code` char(12) CHARACTER SET utf8mb4 COLLATE utf8mb4_0900_ai_ci NULL DEFAULT NULL,
`parent_code` char(12) CHARACTER SET utf8mb4 COLLATE utf8mb4_0900_ai_ci NULL DEFAULT NULL,
INDEX `code`(`code`) USING BTREE,
INDEX `parent_code`(`parent_code`) USING BTREE,
CONSTRAINT `address_ibfk_1` FOREIGN KEY (`parent_code`) REFERENCES `address` (`code`) ON DELETE RESTRICT ON UPDATE RESTRICT
)
INSERT INTO `address` VALUES ('0', '中国', NULL, '0');
2.部分代码截图
3.爬取完毕后数据库截图
源码文件下载地址:链接: https://pan.baidu.com/s/1xYDBPjQCZv_zrDVCOXncmg 提取码: 1234
小白一枚,欢迎指教。 感谢分享 支持!!!
京东天猫的地址应该就是按这个来的。
页:
[1]