wkdxz 发表于 2023-11-11 18:07

【已失效】小红书下载视频、图片

本帖最后由 wkdxz 于 2024-8-2 14:21 编辑


### 2024-08-02,说明

小红薯在未登录时,无法通过笔记链接获取到正确的笔记内容。所以,本软件失效了。
如有更先进的方法提取内容,本软件再更新。下次、有缘、再见!

.

###2024-07-03更新:
支持无水印图片。
修改提取逻辑,自动提取剪贴板链接。
更多功能详见EXE介绍页。

.
### 关于水印
**v2.1提供去水印功能**。
      
.
### 打包好的成品EXE
此贴只更新**源码**,成品请移步(https://www.52pojie.cn/thread-1855615-1-1.html)

      
.
### 下载后的图片需要合并
下载好的图片,如果想转成一个PDF文件,可以使用这个软件合并:[目录内图片转PDF(试卷打印助手:https://www.52pojie.cn/thread-1843083-1-1.html)](https://www.52pojie.cn/thread-1843083-1-1.html)


.
### 运行截图



.
### 源码截图


.
### 源码下载: 附件都带Gui,前一个不支持无水印图片(免费),后一个支持(免费)

.
.
v2.1源码已更新,支持无水印图片下载,与EXE同步更新。支持无水印图片的exe成品[免费下载地址](https://www.52pojie.cn/thread-1855615-1-1.html)。

yuupuu 发表于 2023-11-11 23:04

本帖最后由 yuupuu 于 2023-11-11 23:23 编辑

简单做了一个改进,可以在服务器运行,然后通过HTTP传参,实现了一个API,可以用来开发网页版或者小程序解析。

from flask import Flask, request, jsonify
import requests
import re

app = Flask(__name__)

@app.route('/')
def index():
    url = request.args.get('url')
    if url:
      result = get_image_urls(url)
      return jsonify(result)
    else:
      return jsonify({'error': 'Missing URL parameter'})

def get_html(url):
    headers = {
      "authority": "www.xiaohongshu.com",
      "cache-control": "max-age=0",
      "sec-ch-ua": '"Chromium";v="21", " Not;A Brand";v="99"',
      "sec-ch-ua-mobile": "?0",
      "sec-ch-ua-platform": '"Windows"',
      "upgrade-insecure-requests": "1",
      "user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/95.0.4638.69 Safari/537.36",
      "accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9",
      "sec-fetch-site": "same-origin",
      "sec-fetch-mode": "navigate",
      "sec-fetch-user": "?1",
      "sec-fetch-dest": "document",
      "accept-language": "zh-CN,zh;q=0.9",
    }
    response = requests.get(url, headers=headers)
    return response.text

def json_content(html):
    rule = r"<script>window\.__INITIAL_STATE__=(.*?)</script>"
    js = re.search(rule, html, re.I)
    if js:
      content = js.group(1)
      return content
    else:
      return None

def get_image_urls(url):
    html = get_html(url)
    js = json_content(html)
    js = js.replace(r"\u002F", r"/")

    all_urls = re.findall(r'url":"(http://[^\":\{\}\[\]]*?wm_1)"', js)
   
    return {'image_urls': all_urls}

if __name__ == "__main__":
    app.run(debug=True)


返回的是JSON

https://img10.360buyimg.com/imgzone/jfs/t1/207970/36/38327/39493/654f97c9Fdbe8d977/8603cb69ebd8e4cf.png

http://127.0.0.1:5000/?url=http://xhslink.com/wZh4pw

PHP版


<?php

    function get_html($url) {
      $headers = array(
            "authority" => "www.xiaohongshu.com",
            "cache-control" => "max-age=0",
            "sec-ch-ua" => '"Chromium";v="21", " Not;A Brand";v="99"',
            "sec-ch-ua-mobile" => "?0",
            "sec-ch-ua-platform" => '"Windows"',
            "upgrade-insecure-requests" => "1",
            "user-agent" => "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/95.0.4638.69 Safari/537.36",
            "accept" => "text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.9",
            "sec-fetch-site" => "same-origin",
            "sec-fetch-mode" => "navigate",
            "sec-fetch-user" => "?1",
            "sec-fetch-dest" => "document",
            "accept-language" => "zh-CN,zh;q=0.9",
      );
   
      $options = array(
            'http' => array(
                'header' => implode("\r\n", array_map(
                  function ($v, $k) {
                        return $k . ':' . $v;
                  },
                  $headers,
                  array_keys($headers)
                )),
            ),
      );
   
      $context = stream_context_create($options);
      $response = file_get_contents($url, false, $context);
   
      return $response;
    }
   
    function json_content($html) {
      $rule = '/<script>window\.__INITIAL_STATE__=(.*?)<\/script>/i';
      preg_match($rule, $html, $matches);
   
      if ($matches) {
            $content = $matches;
            return $content;
      } else {
            return null;
      }
    }
   
    function get_image_urls($url) {
      $html = get_html($url);
      $js = json_content($html);
      $js = str_replace("\\u002F", "/", $js);
   
      preg_match_all('/"url":"(http:\/\/[^":\{\}\[\]]*?wm_1)"/', $js, $all_urls);
   
      return array('image_urls' => $all_urls);
    }
   
    if ($_SERVER['REQUEST_METHOD'] === 'GET') {
      $url = $_GET['url'];
      if ($url) {
            $result = get_image_urls($url);
            header('Content-Type: application/json');
            echo json_encode($result);
      } else {
            header('Content-Type: application/json');
            echo json_encode(array('error' => 'Missing URL parameter'));
      }
    }
   
?>


https://域名/xiaohongshu/?url=http://xhslink.com/wZh4pw

GuoWuYuan 发表于 2023-11-12 15:55

感谢这位大神的分享 希望一如继往的发光发热 为大家点亮一盏希望的灯 永远支持

Sugarmapler 发表于 2023-11-12 09:21

嗯,很棒的设计,有的时候看到水印真的很烦

孤独无情 发表于 2023-11-11 18:42

麻烦问一下 源码修改用什么软件

shuanglinlu 发表于 2023-11-11 20:33

小红书用的不多
所以对我来说
这个就没啥兴趣了

也要感谢楼主的用心与奉献

Yb丶 发表于 2023-11-11 18:19

感谢大佬!

石昊荒天帝 发表于 2023-11-11 18:34

qiaoyj666 发表于 2023-11-11 18:47

感谢分享!

qqpoly 发表于 2023-11-11 19:03

感谢楼主的分享,学习学习再学习啊

dg1997 发表于 2023-11-11 19:08

感谢分享                                    

shijufeiwj 发表于 2023-11-11 19:11

不错的工具!有书看了

夜白沙 发表于 2023-11-11 19:31

石昊荒天帝 发表于 2023-11-11 18:34
http://xhslink.com/l080Cm怎么用?输入链接回车后闪退

可能得复制到浏览器,然后再复制,链接会变长(或为重定向)。再用就行,我试了一下,用那个有缩略图的版本,是可以的。{:301_1000:}

小赤佬 发表于 2023-11-11 19:38

这个下载有水印嘛
页: [1] 2 3 4 5 6 7 8 9 10
查看完整版本: 【已失效】小红书下载视频、图片