GatesBin 发表于 2021-12-5 16:06

假期无聊爬网站,欢迎交流,勿喷!~

假期了~无聊中随手写一个避免手生,不喜勿喷,大家共同进步{:1_893:}
import requests
import re
from bs4 import BeautifulSoup
import json


def insert_json(lists):
    with open("car.json", "a", encoding='utf-8') as f:
      for info in lists:
            json.dump(info, f, ensure_ascii=False, indent=4)
      return True


def get_data(num):
    base_url = 'https://www.akd.cn/carlist/pg' + str(num) + '/'
    page = requests.get(base_url, timeout=10)
    soup = BeautifulSoup(page.content, 'html.parser')
    a_list = soup.select('.CarList_main > a')
    lists = []
    if a_list:
      for info in a_list:
            info = str(info)
            car_name = re.findall(r'<p class="CarName">(.*?)</p>', info)
            car_date = re.findall(r'<p class="CarDate">(.*?)</p>', info)
            car_price = re.findall(r'<span>车价:</span>(.*?)万', info)
            car_price_zb = re.findall(r'<span>\+整备服务费(.*?)元</span>', info)
            old_car_price = re.findall(r'<p class="OldCarprice">原新车价:(.*?)万 为您节省(.*?)万</p>', info)
            lists.append( if len(car_name) > 0 else '',
                        car_date if len(car_date) > 0 else '',
                        car_price if len(car_price) > 0 else '',
                        car_price_zb if len(car_price_zb) > 0 else '',
                        old_car_price if len(old_car_price) > 0 else ''
                        ])
            # print(car_name)
            # print(car_date)
            # print(car_price)
            # print(car_price_zb)
            # print(old_car_price)
            # print('----------------------------')
    print(lists)
    s = insert_json(lists)
    return s


def main():
    for i in range(1, 9):
      ss = get_data(i)
      if ss:
            print('成功完成' + str(i) + '页')


if __name__ == '__main__':
    main()


侵权删哈,纯属娱乐

vicky526356 发表于 2021-12-5 19:20

支持,支持。一起加油

ytfrdfiw 发表于 2021-12-5 18:06

顶一个。

wp19910107 发表于 2021-12-5 19:13

顶一个。

ChakingZ 发表于 2021-12-6 15:44

666啊 可以的

ZENGNENG 发表于 2022-2-14 16:05

楼主 加下我微信cqxfx-vip 有活(备注:吾爱破解)

b5523 发表于 2022-2-15 09:08

这么6吗?求带!

阿隆 发表于 2022-2-15 11:22

加油 我也想学python 向大佬学习

diwuc 发表于 2022-2-15 11:30

支持一下,一起加油。

luxingyu329 发表于 2022-2-15 14:26

好样的,我有三个月没有写了,学的皮毛全丢了!
页: [1] 2
查看完整版本: 假期无聊爬网站,欢迎交流,勿喷!~