tom54007 发表于 2021-3-7 16:03

网页加密文本解析

网站:https://www.chacewang.com/ProjectSearch
其网页内容是加密的,看到的内容和html文档中的内容不一致。

针对这种网页,应该如何获取最终显示出来的文本呢?
目前想到的就是用图片或PDF,然后做OCR识别,但是感觉这样很麻烦,也很耗电脑性能。

a3223999 发表于 2021-3-7 16:20

学习学习!

75769837 发表于 2021-3-7 17:09

本帖最后由 75769837 于 2021-3-7 17:10 编辑

https://blog.csdn.net/qq_41297934/article/details/105278457
https://www.cnblogs.com/mswei/p/12174839.html
https://www.cnblogs.com/mswei/p/12175505.html

这个文章说的很清楚而且的确是有这个对应的
其中网页代码中的内容 ccw.ttf
@font-face {
            font-family: 'ccwfont';
            src: url('/Content/Crawler/ccw.eot') format('embedded-opentype'), url('/Content/Crawler/ccw.ttf') format('truetype');
      }

tom54007 发表于 2021-3-7 16:05

而且详情内容也是全部加密的

jay20070223 发表于 2021-3-7 16:19

https://www.chacewang.com/ProjectSearch/FindWithPager?sortField=CreateDateTime&sortOrder=desc&pageindex=0&pageSize=20&cylb=&diqu=&bumen=&cylbName=&partition=&partitionName=&searchKey=&_=161510508
返回值就是你要的结果。没加密啊

曦阳520 发表于 2021-3-7 16:22

他用了自己的字体,字体把文字都混淆了

1170 发表于 2021-3-7 16:23

是网页采用的字体 https://www.chacewang.com/Content/Crawler/ccw.ttf 里面与正常编码不同

xyhallo 发表于 2021-3-7 17:00

用的是一种字体。你可以看看他的style

肖恩马里奥 发表于 2021-3-7 18:19

来学习一下 虽然感觉可能学不会

butwatch 发表于 2021-3-7 21:22

过来看看,学习学习
页: [1] 2
查看完整版本: 网页加密文本解析