
BabelDOC 大更新:4 个月,我们憋了这些大招——
今天的主角是安静了很久的 BabelDOC。
给新来的朋友介绍一下,BabelDOC 是沉浸式翻译旗下一款专注 PDF 场景的 AI 翻译工具,主打以下特点:
- 无损解析:完整提取PDF内嵌图表、脚注、公式等非文本元素
- 精准还原:译文与源文件保持像素级版式对齐
- 智能优化:自动识别学术论文/招股书/行业白皮书等专业文档结构,确保翻译后布局与数据可视化效果,同原文档高度一致
目前市面上有不下数百款 PDF 翻译工具,各有各的特点。而 BabelDOC 的优势在于从 PDF 文件架构出发,在解析、翻译、重构等方面进行了大量创新和优化,达到了与同类产品相比更为优质的重排效果。
对 PDF 的前世今生,以及 BabelDOC 的工作原理感兴趣的朋友,不妨回顾一下这篇文章上新|BabelDOC PDF:极致文档翻译体验是这样打造的。
而正因为在 PDF 翻译工作和产品工程上的诸多创新,自从 BabelDOC 在 GitHub 上开源以来便成了热门项目,最高达曾达到全站第三名。(可以回顾这篇了解一下当时的盛况:BabelDOC 登上 Github 热门榜前三:技术极客们的春日狂想。
BabelDOC 的项目负责人 AW 是个不折不扣的技术狂人,还没毕业就已经是小有名气的 GitHub 大佬。自从今年 4 月 BabelDOC 更新了对韩语的支持后,AW 大佬每天忙于钻研各种用户提交的奇形怪状的 PDF,并不断优化产品,沉寂了将近半年后,终于捧出了又一个史诗级别更新——
BabelDOC 0.5
我们迫不及待地找 AW 聊了聊,看看这半年都有什么新进展。
据大佬自述,这半年以来,几乎一周一小版本,一个月一个大版本。历次更新都围绕一个核心目标——让翻译更自然、更顺畅。
BabelDOC 0.5 的进步,我们一一为你解析——
重磅!矢量图和表格也能翻译了!
很多用户都经常问, 什么时候 BabelDOC可以翻译图表里的文字。
这一天终于来了!
经过几个月攻关,新版本已经可以翻译表格和矢量图中的水平文字了!
在此之前,旧版 BabelDOC 会直接跳过图表和矢量图的文字内容。
大家可以点开下面的大图感受一下——

公式和表格线条优化
细细的线条是 BabelDOC 的大大大问题。
在此之前,BabelDOC 会把公式里的分数线、根号横线,以及表格的一些线条弄丢。这给表格、公式的阅读造成了困扰。
现在,经过多次迭代优化,表格和公式里的线条终于得以保留,译文的排版也更接近原始文件了——

跨页段落连贯性增强
使用旧版 BabelDOC 翻译 PDF 时,如果一句话正好跨栏或跨页,就会被拆开翻译,导致译文断裂、不连贯。
现在,系统对这类问题进行了优化,能自动识别并合并这些跨页段落,翻译出来顺畅得多。

例如图中这份论文的 第二页到第三页的交界处,有一句原文(...and filtered search [Gollapudi et al., 2023].)被拆分成了两个部分。
如果是旧版 BabelDOC,会把 filtered 和 search 分为两个断句进行翻译(“……及过滤功能。”和“搜索 [Gollapudi 等人, 2023]。”)。
而新版 BabelDOC 能够识别这个被切断的句子,让他们重组,从而正确输出译文,并遵循原始排版将译文分布在两个页面的第一行和最后一行(“……及过滤搜索 [Gollapudi等人, 2023]。”)。
术语更加统一
此前很多用户反馈,同一个术语在不同的段落中,可能会被翻译成不同的词语。
原因是在旧版本 BabelDOC 中采用的是并行翻译技术,能够加快翻译速度,但缺少统一术语机制。
现在,新版本加入了术语提取功能,在翻译时会进行以下步骤:
- 先扫描全文,识别出重要术语;
- 给每个术语协商一个唯一的译法;
- 在翻译过程中自动应用,保证全篇术语一致。
从而尽可能保证术语名词在同一篇 PDF 文档中译文的一致性。

⚠️注意:正如我们此前解释的一样(答疑|为什么用大模型翻译时,Token 消耗会多于文本长度),打开术语提取功能后,由于指令、文本额外处理、术语提取返回等流程,会消耗更多的 Token,这一功能默认是关闭的。
有需要的用户朋友可以在翻译时自行选择打开这个功能——

字号大小更稳定
原文和译文的长度经常会不同。通常来说,从英文翻译为德文可能会产生 20%-30% 的篇幅膨胀,而英文翻译为中文日文等东亚语种则会反过来,出现篇幅缩小。
旧版 BabelDOC 的动态缩放是逐段计算。
这就导致了有的段落字很大,有的又很小,看起来不美观。
现在,BabelDOC 0.5 版引入了「二阶段排版」技术:
- 先为全文计算一个统一的缩放比例;
- 大部分段落用统一比例显示;
- 只有极少数重排过程中实在放不下的段落,才会继续缩小。
这样一来,整份译文看起来就更加整齐,可读性和美观度都有明显的提升,如下图——

额度计算方式调整BabelDOC
自上线以来,经过多次优化,翻译效果日渐提升,使用量也大幅增长。
原有的「解析页数额度+翻译 Token 额度」计算模式已不能很好地反映当下现实。
因此,经过慎重考虑,我们将从 2025 年 10月 31日下午三点起,对额度体系进行调整。
- 取消 BabelDOC 页面解析额度限制,仅保留翻译 Token 额度限制。
- 所有 BabelDOC 用户每月可获得 50 万 Token 额度,用来在 BabelDOC 中使用免费翻译模型。
对于已经是 Pro 用户的朋友:
- 每月可享受高达 2000 万 Token 的高级翻译模型额度(与沉浸式翻译额度共用)
对于已经是 Max 用户的朋友:
- 每月可享受高达 5000 万 Token 的高级翻译模型额度(与沉浸式翻译额度共用)
(Max 用户的顶级模型暂时无法用于 BabelDOC)
注意:免费模型实际可用性取决于上游供应商的供应情况,额度根据实际负载动态调整。
对于之前购买过 BabelDOC 页数加量包的朋友,无论是否使用,您的加量包会在额度调整生效后,进行如下转换:
每 10000 页解析额度 → 转换为 1000 万高级翻译模型额度
注意:如果您不希望进行额度转换,也可以联系人工客服,申请转换为其他类型的额度包或退款。
尾声
PDF 翻译是一个非常复杂的系统工程。一个个难题被攻克,又会有一个个新问题冒头。
翻译和排版状况依然会不断出现。这也催促着我们不能放慢脚步,要继续优化产品,加强和用户的沟通交流。接下来,我们还会在以下几个方面继续努力:
- 持续提升翻译质量;
- 支持更多文件类型;
- 优化使用体验。
最后,感谢所有用户的支持与反馈!你们的意见让 BabelDOC 不断变得更好。虽然团队人手有限,没能回复每一条反馈,但我们一直在认真倾听,每一条用户群中的消息我们都会看并及时跟进、尽力改进。
希望 BabelDOC 能继续做你学术研究、学习、工作之路上的翻译伙伴。
本文所展示的示例文档,选取自以下五篇论文的部分页面,相关内容依据 CC-BY 授权,使用 BabelDOC 进行翻译:
- Douze M, Guzhva A, Deng C, et al. The faiss library. arXiv preprint arXiv:2401.08281, 2024.
- Liu Y, Lin C, Zeng Z, et al. Syncdreamer: Generating multiview-consistent images from a single-view image. arXiv preprint arXiv:2309.03453, 2023.
- Wong L, Grand G, Lew A K, et al. From word models to world models: Translating from natural language to the probabilistic language of thought. arXiv preprint arXiv:2306.12672, 2023.
- Yang T L, Lee K Y, Zhang K, et al. Functional Linear Non-Gaussian Acyclic Model for Causal Discovery. arXiv preprint arXiv:2401.09641, 2024.
- Zhao X, Wang M, Zhao X, et al. Embedding in recommender systems: A survey[J]. arXiv preprint arXiv:2310.18608, 2023