DoveNest 发表于 2024-1-14 20:44

Python获取小红书内容及图片

import re

import requests


def get_small_red_book(url):
    commom_header = {
      "user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/119.0.0.0 Safari/537.36"}

    resp = requests.get(url, headers=commom_header)
    result = re.search('og:title.*="(.*?)">', resp.text).group(1)
    print(result)

    pic_url = re.search('og:image.*="(.*?)">', resp.text).group(1)
    print(pic_url)


if __name__ == '__main__':
    url = 'http://xhslink.com/62c3kz'
    get_small_red_book(url)

Paulwalkera 发表于 2024-1-14 23:32

图片是去水印的图片吗

sw7057 发表于 2024-1-15 07:00

学习了,谢谢楼主分享。

okmad 发表于 2024-1-15 08:40

图片格式不显示,不能转换

ironmaneva 发表于 2024-1-15 08:58

不懂~感觉很赞!收藏学习

mzq2mmd 发表于 2024-1-15 09:17

jessylake 发表于 2024-1-15 09:20

'og:title.*="(.*?)">' 这是正则吧,表示什么意思? 不用正则行吗?

weilai8023 发表于 2024-1-15 09:29

能否打包成独立应用呀

无知灰灰 发表于 2024-1-15 09:46

jessylake 发表于 2024-1-15 09:20
'og:title.*="(.*?)">' 这是正则吧,表示什么意思? 不用正则行吗?

学一下正则要不了半小时。。。采集数据的时候,正则还是很有必要的。。。

jessylake 发表于 2024-1-17 08:05

无知灰灰 发表于 2024-1-15 09:46
学一下正则要不了半小时。。。采集数据的时候,正则还是很有必要的。。。

让你说的我又想学了
页: [1] 2
查看完整版本: Python获取小红书内容及图片