小雨呀 发表于 2022-4-20 15:24

某个按钮样式网站爬取

本帖最后由 q1287166316 于 2022-4-20 15:25 编辑

这么好的东西不爬下来岂不是很亏

{:301_1001:}

写的简陋,用的时候记得将path改成要下载的位置


import requests
import os


class Code:
    def __init__(self):
      self.url = [
            "https://api.uiverse.io/buttons?type=button&orderBy=popular",
            "https://api.uiverse.io/buttons?type=button-of-the-day&orderBy=popular",
            "https://api.uiverse.io/buttons?type=card&orderBy=popular",
            "https://api.uiverse.io/buttons?type=checkbox&orderBy=popular",
            "https://api.uiverse.io/buttons?type=input&orderBy=popular",
            "https://api.uiverse.io/buttons?type=spinner&orderBy=popular",
            "https://api.uiverse.io/buttons?type=switch&orderBy=popular",
      ]
      self.headers = {
            "user-agent": "Mozilla / 5.0(Windows NT 10.0;WOW64) AppleWebKit / 537.36(KHTML, likeGecko) Chrome / 86.0.4240.198Safari / 537.36"
      }

    def send_request(self, url):
      return requests.get(url, headers=self.headers, timeout=3).json()

    def run(self):
      for url in self.url:
            html_str = self.send_request(url)
            for val in html_str['buttons']:
                css = val['scopedCss']
                html = val['html']
                first = css.index('.')
                last = css.find(' ', first)
                print(first)
                print(css)

                content = (
                        '<html lang="en">'
                        '<head>'
                        '<meta charset="UTF-8">'
                        '<meta name="viewport" content="width=device-width, initial-scale=1.0">'
                        '<title > Document </title>'
                        '<style >' + css + '</style>'
                        '</head>'
                        '<body><div class="' + css + '">' + html + '</div></body>'
                        '</html>'
                )
                # break
                path = "C:/Users/Administrator/Downloads/Documents"+url
                if not os.path.exists(path=path):
                  os.makedirs(path)
                with open(path + '/' + val['id'] + '.html', 'w',
                        encoding='utf-8') as ht:
                  ht.write(content)


def main():
    code = Code()
    code.run()


if __name__ == '__main__':
    main()

李佑辰 发表于 2022-4-20 15:38

学到了学到了学到了学到了

wantongkeji 发表于 2022-4-20 15:53

学到了学到了学到了

zhengsg5 发表于 2022-4-20 16:17

非常不错,学到了!

JAKE2021 发表于 2022-4-20 16:26

学到了学到了学到了

Harold123 发表于 2022-4-20 16:31

nice,感谢分享

wasm2023 发表于 2022-4-20 16:41

厉害了,感谢分享

yuechaomax 发表于 2022-4-20 16:58

这个工具不错,感谢分享。

mfchaos 发表于 2022-4-20 17:23

这怎么使用啊

1006706246 发表于 2022-4-20 17:50

看起来不错
页: [1] 2
查看完整版本: 某个按钮样式网站爬取