guyinqian 发表于 2022-4-21 14:59

科学文库原版PDF下载方法思路分析

# 科学文库原版PDF下载方法思路分析

我自己总算是捣鼓出来了原版PDF的下载方法了

以下为分析过程:

## 抓包分析

经过抓包分析,阅读PDF的时候图片地址类似于https://wkobwp.sciencereading.cn/asserts/cd4bf6f17b42403fb192ef570a5b111d/image/4/tiles/100/400/2/2?accessToken=accessToken

这样,经过修改比较,发现各个参数分别代表:

https://wkobwp.sciencereading.cn/asserts/图书编码ID/image/页码/tiles/分辨率/图片尺寸/纵向第n块/横向第n块?accessToken=accessToken

由是观之,其实服务器返回的只是图片罢了~

因此最笨的方法便是获取每一张图片并合并,其中的分辨率共有50,75,100,125,150,200,400,800,1000九个级别

但是显而易见,这肯定不是下载文档的最优解,于是继续分析

## 点击打印返回图片

继续抓包,就可以和楼主一样发现打印时返回每一页的图片,

结合页面上的分辨率,和不断尝试,抓取如下图片分析得到:

https://wkobwp.sciencereading.cn/asserts/837cbe62aaf64504ae48c992dcc5e7cf/image/2/tiles/50/400/1/1?accessToken=accessToken

https://wkobwp.sciencereading.cn/asserts/837cbe62aaf64504ae48c992dcc5e7cf/image/2/tiles/75/400/1/1?accessToken=accessToken

https://wkobwp.sciencereading.cn/asserts/837cbe62aaf64504ae48c992dcc5e7cf/image/2/tiles/100/400/1/1?accessToken=accessToken

https://wkobwp.sciencereading.cn/asserts/837cbe62aaf64504ae48c992dcc5e7cf/image/2/tiles/125/400/1/1?accessToken=accessToken

https://wkobwp.sciencereading.cn/asserts/837cbe62aaf64504ae48c992dcc5e7cf/image/2/tiles/150/400/2/1?accessToken=accessToken

https://wkobwp.sciencereading.cn/asserts/837cbe62aaf64504ae48c992dcc5e7cf/image/2/tiles/200/400/1/1?accessToken=accessToken

https://wkobwp.sciencereading.cn/asserts/837cbe62aaf64504ae48c992dcc5e7cf/image/2/tiles/400/400/1/1?accessToken=accessToken

https://wkobwp.sciencereading.cn/asserts/837cbe62aaf64504ae48c992dcc5e7cf/image/2/tiles/800/400/3/3?accessToken=accessToken

https://wkobwp.sciencereading.cn/asserts/837cbe62aaf64504ae48c992dcc5e7cf/image/2/tiles/1000/400/4/3?accessToken=accessToken

【整页图片】

https://wkobwp.sciencereading.cn/asserts/cd4bf6f17b42403fb192ef570a5b111d/image/2/1000?accessToken=accessToken

## 原版PDF思路提示

确实可以获取原PDF,但是需要修改**别的参数**,大家可以自己抓包试一下,应该不难发现

至于为什么知道了方法不在论坛公布,我想是因为论坛人流量太大,一旦公之于众,即使设置较高的权限,官方都会很快修复

我是不会改名的 发表于 2022-4-21 16:43

图片的发了多少遍了,前年就有人发了。
网页一点意思都没有,直接就拿到pdf了解密都不用,还是逆向研究客户端有意思
https://img02-xusong.taihe.com/1F3A2840-88E7-4343-A6E5-DCCB5072C864.png

kindbigbear0 发表于 2022-4-22 19:36

不明觉厉,自己动手抓包分析还是值得分享的,希望楼主给出更多分析细节,可以设置权限啊

guyinqian 发表于 2022-4-21 20:02

johnguan 发表于 2022-4-21 20:00
感谢分享,成功了

@johnguan 恭喜啦

田田爱崽崽 发表于 2022-4-21 15:44

没有权限的我也可以用您这个方法吗?

guyinqian 发表于 2022-4-21 15:28

zmdljd 发表于 2022-4-21 15:23
请问用什么软件抓包好一些?

@zmdljd Windows端推荐使用Fiddler,也可以用浏览器F12调试网络请求
iPhone推荐Thor,但是需要付费下载
安卓推荐Http Canary,可以找到破解版的

guyinqian 发表于 2022-4-21 15:02

占楼备用,有什么想法都可以回复哦

chenjingyes 发表于 2022-4-21 15:04

不错 很科学 ,谢谢楼主分享{:1_918:}

weijian1215 发表于 2022-4-21 15:12

感谢大神分享~

zmdljd 发表于 2022-4-21 15:23

请问用什么软件抓包好一些?

zmdljd 发表于 2022-4-21 15:29

guyinqian 发表于 2022-4-21 15:28
@zmdljd Windows端推荐使用Fiddler,也可以用浏览器F12调试网络请求
iPhone推荐Thor,但是需要付费下载
...

谢谢老大,我好好学一下

chenballack 发表于 2022-4-21 15:31

不明觉厉。。。

漁滒 发表于 2022-4-21 15:58

整页图片这个不错,亲测可用
页: [1] 2 3 4 5 6 7 8 9 10
查看完整版本: 科学文库原版PDF下载方法思路分析