m3u8加密视频文件下载的通用方法
本帖最后由 jimmyzang 于 2020-4-24 13:31 编辑4-24 日:widevine的破解方法也已经搞定,思路也发在52pojie上面了。谢谢大家关注。
======================================================================================================================================嗯,有件比较郁闷的事情,关于widevine方面,google默认开源代码不带widevine的库,要想下载编译通过,需要过他的一个认证,如果有哪位兄弟手头上有这个库,给我共享一下,让我继续研究,感激不尽。
所以现在如果采用widevine加密的,我暂时卡住没办法继续了,但是可以提供一个思路,其实可以通过浏览器模拟一个widevine的回复给js。伪装已经有这个库,这样可以继续往下面跑跑看。但是估计后面还会有坑,我就不往下跳了。
其他不采用这种加密方式的,应该不受影响。
我也会继续再网上找找,万一有那个好心人共享了(虽然希望比较渺茫)
===========================================================================================================================================首先老规矩,先劝退:
1:这篇文件仅仅是技术分析,不提供任何工具进行试用。
2:这篇文件是针对于对编程有一定基础的同学
3:实现本文章的方法需要下载chrome浏览器源码并且编译。
4:本文提到的下载其实您完全可以用录屏来解决,这里只是对于技术的追求和讨论
来句振奋人心的:重剑无锋,大巧不工。
看到html5下载,一般大家都会去找m3u8,得到对应的key,然后根据KEY计算偏移。复杂点的搞个算法,藏到js里面,让你找不到key,或者干脆给一个加过密的,于是解密变成了对于js的阅读理解。
而且您可以分析出一个网站的key生成方式,但是换了另外一个网站,基本上还要从头搞起。
这里提供一个方法,从根本上搞定html5的播放,因为这个方法太危险,基本上可以扫清市面上所有的加密方式,我自己也怕了,所以这里只说一下思路,不提供源码,不提供源码,不提供源码。
首先html5是采用的浏览器内部的播放和解码程序,firefox我没有研究,我研究是chrome。对于chrome来说,在之前版本用的是ffmpeg做的媒体解码,我最近下载源码时,已经在往mojo切换了,这些都不重要,重要的是,您可以知道,
无论那些加密视频怎么玩花样,最后一定是需要输出音频流,视频流到播放器的,这里的播放器就是ffmpeg,或者是mojo,他们是chrome这个box和外界设备的交互。
答案现在很显而易见,只要可以得到音视频流,基本上可以为所欲为了。
事实上,这个音视频流想要得到并不难,你要知道firefox和chrome可是开源的浏览器,这些代码就是明明白白的放在那里。
这里给大家讲三个思路,分别是难,中,易:
1:最难的,也是基本上无法防范的,直接修改底层播放器代码,分别得到音频流和视频流。主要关系到的文件应该是:
chromium\src\media\mojo\clients\mojo_audio_decoder.cc,
chromium\src\media\mojo\clients\mojo_video_decoder.cc
这里又有很多做法,可以直接攫取frame,然后做同步,或者重写decode。不展开,估计用的同学比较少,但是这种方法的好处是,即使采用最高级别的CDM加密,也是不能阻挡你的步伐。
2:中等难度:
Pipeline里面重写read。 这里简单多说两句,网页开始播放多媒体时,会生成一个media::WebMediaPlayerImpl对象,它包含media::PipelineController,这个controller负责管理media::DataSource, media::Demuxer, and media::Renderer
其中datasource是用来提供数据给demuxer进行音视频流解码或者同步的。从这里入手的好处是:不需要自行去做frame的音视频同步,不好的地方是,如果采用playready和widevine方式加密的话,这个地方拿到的可能是没有经过解密的数据。
BTW:既然说到这个地方,就顺便再说两句,这里datasource有两种数据读取的方式,一种是Media Source Extensions (MSE),一种是直接从network读取。如果在这一层解决,可以handle到这两种方式。
需要注意的是readcb这个方法。
3:最低难度:
大部分市面上的m3u8可以再浏览器上看的,都是采用的MSE进行数据传输的,他们绝大多数都是通过html5提供的方法把数据传递给浏览器进行播放,而且根据html5规定,传递给浏览器解码器的数据必须按照顺序提交。解码器是不给你进行排序的。
所以其实只要针对浏览器的接口,把响应的数据直接导出,合并后就是传给你的媒体文件。
这里多说一句,有的网站上会有一个动态的logo,是你的会员名称或者和登录身份有关的显示出来,防止录屏,这其实是MSE中的一路视频流,干掉他就得到无水印的版本。
浏览器的接口是addSourceBuffer。 怎么去hook有很多种方法,我这里只说和浏览器直接相关的。
在chrome 源文件目录下有个chromium\src\third_party\blink\renderer\modules\mediasource\source_buffer.cc ,这个文件里面有几个方法,方法名叫做:appendBuffer, AppendBufferAsyncPart。
其中appendbuffer函数里面的参数NotShared<DOMArrayBufferView> data 和AppendBufferAsyncPart函数里面有一句:
bool append_success = web_source_buffer_->Append(append_data, append_size, ×tamp_offset_);
在这里的append_data, append_size就是MSE传递进来的数据。这两个地方可以对照着看。
这两个地方就是原原本本的解密数据,其实直接把这两个地方的数据转存出来,就是当前网络视频播放的小东西了。根本无需去研究什么key,什么加密方式。
一般来说用最低难度的方法去做,市面上已经可以横扫了。因为当前的主流都是HLS+key 都是在js层的方法,我们用底层方式去搞真是杀鸡用牛刀,不过我恰恰是最喜欢杀鸡用牛刀的。哈哈
我还有几个没有讲到的地方,简单列一下:
当视频没有从第一帧开始播放时,如何处理。 其实是有个文件叫做resource_fetcher.cc,他会告诉你当前load的是哪个文件,可以根据文件排序,然后点击最开头,让视频开始播放。这样就可以更方便一些。
如何多线程下载,嗯。。。这个需要好好想想,可以做一下快进。默认快速播放,强迫缓冲区刷新。这样可以快速下载,多线程有点麻烦。
有的网站会检测是不是标准浏览器(目前为止只遇到一个),这个没有继续研究,其实想想,浏览器在你手里,源码都有了,返回啥不行呀。
我测试时直接用的log输出数据到文件,通过读取log文件生成MP4证明思路可行,附上一个python代码,可以从十六进制转换成十进制写文件。作为文章的结尾吧。
with open("ChromeHTML5\chrome_debug.log",'r',encoding='UTF-8') as file:
with open("D:\\lesson4.mp4",'wb') as g:
for line in file.readlines():
key_str = "this is data source:"
if line.find(key_str) != -1:
key_str = key_str
ifind =line.find(key_str)
if ifind > 0:
ifind = ifind + len(key_str)
str_line = line
str_line = str_line.strip()
g.write(bytes.fromhex(str_line))
else:
continue
哎……看完楼主的文章。感觉能看懂你这文章的思路的自然不用看也会明白,不懂的还真是一点都不明白。你写这篇文章和意义不就在于能让大家懂你在说些什么?到吾爱来的大多数都是来学习的,让人看不懂就分享的毫无意义……个人见解不喜勿喷! 本帖最后由 yuemiss 于 2020-4-21 15:12 编辑
直接可以用Xtreme Download Manager 下载,哪需要这么麻烦?只要能播放,基本上就能下载了。 13684163772 发表于 2020-5-4 10:32
楼主这个相关需要什么知识,我想学习一下这方面的东西,我要从基础初级开始学,有推荐的课吗
关于这个方面,个人推荐:
1:基础编程知识,掌握一门语言
2:mpeg编解码知识
3:浏览器调试方法
4:fiddler抓包
首先要掌握一门编程语言,主要是了解写代码的思路,一般来说我都会先想想,如果这个功能我来实现,会如何编写。这里面我会有哪些地方容易想不到,那些地方容易被攻击。
然后需要了解浏览器的调试如何进行,基本上都是js相关,知道如何跟踪代码,如何看到来回的请求,这样可以加快定位到关键点。
有些在浏览器里面做不到的,可以用fiddler帮忙,fiddler可以帮忙如何修改request,response。
5:这些都搞定后,基本上简单的都可以拿下来了,如果需要再进一步,就需要了解文件格式,看看实际传输过来的数据格式和播放器可以播放格式的差异。如果整到浏览器缓冲区这块,就需要了解mpeg,flv等多媒体格式。
这个过程会非常长,要有耐心。
其实主要是第一步,自己多写点程序,等有经验了,在多想想如果我来完成这个功能,有哪些函数可以调用。逻辑会怎么写,然后调试程序看是否和自己想象的一致。 这种js解密的视频没必要hook浏览器,直接使用URLRedirect替换掉原始的js文件,在js文件里面找到appendBuffer方法进行拦截即可,JS利用Blob对象实现本地下载。 本帖最后由 爱上这个小网站 于 2020-4-23 15:52 编辑
lz,可以告诉我怎样下载医学教育网里的视频吗?我搞了好久还是不会弄,可以教我一下吗{:301_980:}
链接在这https://www.med66.com/demo/zhiyeyaoshi/c712441/ saviorvg 发表于 2021-3-20 09:24
大佬有没办法能弄个获取App的m38u文件的办法!
如果APP可以投屏的话,之前做过一个软件是直接模拟电脑为dlna客户端,显示m3u8。原理一样的。 楼主思路很强, 之前也感觉只要能在浏览器播放就一定能下载下来, 但是有些却无从下手, 楼主的思路确实有借鉴的地方感谢楼主 lipinghao 发表于 2020-4-20 15:10
@jimmyzang 楼主,我只是想知道优酷加密怎么解密!
我都把思路写出来了,您可以自己实现,但是不敢放软件出来。 都是hook浏览器的办法嘛,反正难者不会会者不难,你在一个小白这么多的站发这种纯理论的帖子太那啥了{:1_907:} 一般支持html5播放的m3u8,加不加密也就那样 看完之后一脸茫然!{:301_1007:} @jimmyzang 楼主,我只是想知道优酷加密怎么解密! 虽然看不懂,但觉得很厉害,加油 哈哈这就对了,否则市面上那些卖加密方案的咋赚钱呀。我觉得很奇怪的是他们难道不是沙滩上的城堡么。 嗯,纯技术文章,看的脑壳痛。 三脸懵逼 以前没少找这个下载的软件或者方法,还是需要多加学习吧~ 我是十楼,我十脸懵逼,对于编程一点都不了解的我,看着这个跟天书一样。