netspirit 发表于 2022-10-30 12:13

如何在不改变html排版的情况下翻译并替换html文件?

本帖最后由 netspirit 于 2022-10-30 13:02 编辑

我想翻译一些epub格式的电子书。然后我发现epub格式里面都是html文件
然后我想问下如何在不改变原来html的格式的情况下,把所有的英文文本给提取出来然后翻译成中文再替换掉原来的英文?


关键是不要改变html的排版
如果只是提取文字的话很简单 但是我想要保留原来的排版和图片
请问如何实现如何使用python实现这种替换呢?翻译并替换原来html文件里面的文字并且替换到原来的地方


当然最好还能删掉html文件里面的广告并且不影响原来网页的排版


一个epub里面有上百个网页,一个个用浏览器翻译然后手动保存不太好 我想问下如何用脚本实现html文本的提取和替换?

感谢大家的回答~~~~

Apollo233 发表于 2022-10-30 12:50

使用网页,然后使用浏览器的扩展功能:翻译,翻译网页,这样就可以将HTML英文版翻译成中文版

pansong291 发表于 2022-10-30 12:52

本帖最后由 pansong291 于 2022-10-30 13:53 编辑

Edge 浏览器自带翻译功能,但是 Edge 在某些情况下会使排版错乱。
比如这个地址:https://deerchao.cn/projects/jsonlite/




使用 Edge 进去后进行整页翻译,文字排版就会错乱:



netspirit 发表于 2022-10-30 13:01

Apollo233 发表于 2022-10-30 12:50
使用网页,然后使用浏览器的扩展功能:翻译,翻译网页,这样就可以将HTML英文版翻译成中文版

感谢回答 我要大量批量地翻译网页 一个epub有几百个网页 我不能一个个手动翻译再保存 我想用脚本批量翻译然后再保存的

wkdxz 发表于 2022-10-30 13:04

这需求我记得之前有人悬赏3000RMB也没做成

netspirit 发表于 2022-10-30 13:09

wkdxz 发表于 2022-10-30 13:04
这需求我记得之前有人悬赏3000RMB也没做成

你说的是真的吗?
https://s2.loli.net/2022/10/30/SvQtn1ThgsoC39X.png

wkdxz 发表于 2022-10-30 13:15

netspirit 发表于 2022-10-30 13:09
你说的是真的吗?

这问题难点不在翻译,在提取和提取后回填

netspirit 发表于 2022-10-30 13:17

wkdxz 发表于 2022-10-30 13:15
这问题难点不在翻译,在提取和提取后回填

唉 不知道浏览器是怎么做到的 为什么浏览器翻译后可以不改变排版 自己翻译就不知道怎么做了啊{:301_1004:}

qinlongilk 发表于 2022-10-30 13:29

浏览器自带翻译功能,但是 Edge 在某些情况下会使排版错乱。

xiadongming 发表于 2022-10-30 13:44

页: [1] 2
查看完整版本: 如何在不改变html排版的情况下翻译并替换html文件?