如何在不改变html排版的情况下翻译并替换html文件?
本帖最后由 netspirit 于 2022-10-30 13:02 编辑我想翻译一些epub格式的电子书。然后我发现epub格式里面都是html文件
然后我想问下如何在不改变原来html的格式的情况下,把所有的英文文本给提取出来然后翻译成中文再替换掉原来的英文?
关键是不要改变html的排版
如果只是提取文字的话很简单 但是我想要保留原来的排版和图片
请问如何实现如何使用python实现这种替换呢?翻译并替换原来html文件里面的文字并且替换到原来的地方
当然最好还能删掉html文件里面的广告并且不影响原来网页的排版
一个epub里面有上百个网页,一个个用浏览器翻译然后手动保存不太好 我想问下如何用脚本实现html文本的提取和替换?
感谢大家的回答~~~~ 使用网页,然后使用浏览器的扩展功能:翻译,翻译网页,这样就可以将HTML英文版翻译成中文版 本帖最后由 pansong291 于 2022-10-30 13:53 编辑
Edge 浏览器自带翻译功能,但是 Edge 在某些情况下会使排版错乱。
比如这个地址:https://deerchao.cn/projects/jsonlite/
使用 Edge 进去后进行整页翻译,文字排版就会错乱:
Apollo233 发表于 2022-10-30 12:50
使用网页,然后使用浏览器的扩展功能:翻译,翻译网页,这样就可以将HTML英文版翻译成中文版
感谢回答 我要大量批量地翻译网页 一个epub有几百个网页 我不能一个个手动翻译再保存 我想用脚本批量翻译然后再保存的 这需求我记得之前有人悬赏3000RMB也没做成 wkdxz 发表于 2022-10-30 13:04
这需求我记得之前有人悬赏3000RMB也没做成
你说的是真的吗?
https://s2.loli.net/2022/10/30/SvQtn1ThgsoC39X.png netspirit 发表于 2022-10-30 13:09
你说的是真的吗?
这问题难点不在翻译,在提取和提取后回填 wkdxz 发表于 2022-10-30 13:15
这问题难点不在翻译,在提取和提取后回填
唉 不知道浏览器是怎么做到的 为什么浏览器翻译后可以不改变排版 自己翻译就不知道怎么做了啊{:301_1004:} 浏览器自带翻译功能,但是 Edge 在某些情况下会使排版错乱。
页:
[1]
2