网页加密文本解析
网站:https://www.chacewang.com/ProjectSearch其网页内容是加密的,看到的内容和html文档中的内容不一致。
针对这种网页,应该如何获取最终显示出来的文本呢?
目前想到的就是用图片或PDF,然后做OCR识别,但是感觉这样很麻烦,也很耗电脑性能。 学习学习! 本帖最后由 75769837 于 2021-3-7 17:10 编辑
https://blog.csdn.net/qq_41297934/article/details/105278457
https://www.cnblogs.com/mswei/p/12174839.html
https://www.cnblogs.com/mswei/p/12175505.html
这个文章说的很清楚而且的确是有这个对应的
其中网页代码中的内容 ccw.ttf
@font-face {
font-family: 'ccwfont';
src: url('/Content/Crawler/ccw.eot') format('embedded-opentype'), url('/Content/Crawler/ccw.ttf') format('truetype');
} 而且详情内容也是全部加密的
https://www.chacewang.com/ProjectSearch/FindWithPager?sortField=CreateDateTime&sortOrder=desc&pageindex=0&pageSize=20&cylb=&diqu=&bumen=&cylbName=&partition=&partitionName=&searchKey=&_=161510508
返回值就是你要的结果。没加密啊 他用了自己的字体,字体把文字都混淆了 是网页采用的字体 https://www.chacewang.com/Content/Crawler/ccw.ttf 里面与正常编码不同 用的是一种字体。你可以看看他的style 来学习一下 虽然感觉可能学不会 过来看看,学习学习
页:
[1]
2