博海拾贝--批量创建文件夹（一）

youyeaini · 发表于 2019-5-31 01:21

水平有限，今天的代码如下：
还请大神多多留言指点----

，

[Python] 纯文本查看 复制代码

# coding:utf-8
import requests
from bs4 import BeautifulSoup
import os
import time

path = 'f:\\bohaishibei'


# if not os.path.exists(path):
#     os.makedirs(path)
#
# else:
#     print('path is exist')


# 获取标题
def get_title(urls):
    # 加个header，比较安全
    header = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.169 Safari/537.36'
    }
    res = requests.get(urls, params=header).text
    bsobj = BeautifulSoup(res, 'lxml')
    bs_select = bsobj.select('div > article > header > h2 > a')
    # 返回a标签列表
    return bs_select[2:]


# 创建文件夹
def write_title(t):
    for titles in t:
        print('正在创建文件夹:{}'.format((titles.text)[11:]))
        time.sleep(1)
        # 切换目录
        os.chdir(path)
        # 创建文件夹
        os.makedirs(str((titles.text)[11:]))
    print('**********文件创建完毕**********')


# todo 抓取图片，存入对应的标题文件夹

if __name__ == '__main__':
    url = 'https://bh.sb/post/category/main/'
    a = get_title(url)
    write_title(a)

我叫大鑫 · 发表于 2019-5-31 01:35

请问下怎么发这个代码样子的这个

zcylw · 发表于 2019-5-31 06:35

Python的源码

4everlove · 发表于 2019-5-31 07:34

35行其实没必要睡眠1秒

WilsonTing2017 · 发表于 2019-5-31 08:31

没有看懂。。有解释吗

glk1010282338 · 发表于 2019-5-31 09:20

看不懂.......................

youyeaini · 发表于 2019-5-31 10:44

4everlove 发表于 2019-5-31 07:34
35行其实没必要睡眠1秒

好的。谢谢。

youyeaini · 发表于 2019-5-31 10:46

WilsonTing2017 发表于 2019-5-31 08:31
没有看懂。。有解释吗

我也是新手，现在是跟着感觉写，回头复习的时候再来整理注释。

bituplink · 发表于 2019-6-1 06:55

1. 看print函数应该是python3版本,头部无需再加编码声明
2. 建议以注释的形式,写下关键的技术点和整体目的和步骤,有时不止别人看得懵,时间久了自己也看得懵
3. 用到了切片截取数据好像,有点魔鬼数字的感觉,不解释一下,想要看懂只有使用者自己再分析一遍网页了
os.makedirs(str((titles.text)[11:])) 这个我就表示不明白,除非自己debug看

youyeaini · 发表于 2019-6-2 01:33

bituplink 发表于 2019-6-1 06:55
1. 看print函数应该是python3版本,头部无需再加编码声明
2. 建议以注释的形式,写下关键的技术点和整体目的 ...

哈哈，谢谢大神的提点...

帐号		自动登录	找回密码
密码			注册[Register]

[Python 转载] 博海拾贝--批量创建文件夹（一）

免费评分