如何在不改变html排版的情况下翻译并替换html文件？

netspirit 发表于 2022-10-30 12:13

本帖最后由 netspirit 于 2022-10-30 13:02 编辑

我想翻译一些epub格式的电子书。然后我发现epub格式里面都是html文件
然后我想问下如何在不改变原来html的格式的情况下，把所有的英文文本给提取出来然后翻译成中文再替换掉原来的英文？

关键是不要改变html的排版
如果只是提取文字的话很简单但是我想要保留原来的排版和图片
请问如何实现如何使用python实现这种替换呢？翻译并替换原来html文件里面的文字并且替换到原来的地方

当然最好还能删掉html文件里面的广告并且不影响原来网页的排版

一个epub里面有上百个网页，一个个用浏览器翻译然后手动保存不太好我想问下如何用脚本实现html文本的提取和替换？

感谢大家的回答～～～～

Apollo233 发表于 2022-10-30 12:50

使用网页，然后使用浏览器的扩展功能：翻译，翻译网页，这样就可以将HTML英文版翻译成中文版

pansong291 发表于 2022-10-30 12:52

本帖最后由 pansong291 于 2022-10-30 13:53 编辑

Edge 浏览器自带翻译功能，但是 Edge 在某些情况下会使排版错乱。
比如这个地址：https://deerchao.cn/projects/jsonlite/

使用 Edge 进去后进行整页翻译，文字排版就会错乱：

netspirit 发表于 2022-10-30 13:01

Apollo233 发表于 2022-10-30 12:50
使用网页，然后使用浏览器的扩展功能：翻译，翻译网页，这样就可以将HTML英文版翻译成中文版

感谢回答我要大量批量地翻译网页一个epub有几百个网页我不能一个个手动翻译再保存我想用脚本批量翻译然后再保存的

wkdxz 发表于 2022-10-30 13:04

这需求我记得之前有人悬赏3000RMB也没做成

netspirit 发表于 2022-10-30 13:09

wkdxz 发表于 2022-10-30 13:04
这需求我记得之前有人悬赏3000RMB也没做成

你说的是真的吗？
https://s2.loli.net/2022/10/30/SvQtn1ThgsoC39X.png

wkdxz 发表于 2022-10-30 13:15

netspirit 发表于 2022-10-30 13:09
你说的是真的吗？

这问题难点不在翻译，在提取和提取后回填

netspirit 发表于 2022-10-30 13:17

wkdxz 发表于 2022-10-30 13:15
这问题难点不在翻译，在提取和提取后回填

唉不知道浏览器是怎么做到的为什么浏览器翻译后可以不改变排版自己翻译就不知道怎么做了啊{:301_1004:}

qinlongilk 发表于 2022-10-30 13:29

浏览器自带翻译功能，但是 Edge 在某些情况下会使排版错乱。

xiadongming 发表于 2022-10-30 13:44

页: [1] 2

吾爱破解 - 52pojie.cn's Archiver

如何在不改变html排版的情况下翻译并替换html文件？