Saltar para o conteúdo principal

PDF 帮助文档

沉浸式翻译 PDF 双语阅读是一个双语对照实时翻译的工具,适合用来辅助阅读。

目前由于采用纯文本识别技术,所以无法正确处理数学公式,表格等特殊字符。

如果你的 PDF 包含表格和数学公式,对它们有更高质量翻译要求,且你有一定的编码能力。建议参考这篇 Nouga-OCR + 沉浸式翻译 文章

基本的使用问题请查看这里的文档

以下是一些 PDF 翻译高级使用技巧:

移动调整译文框

编辑框

默认译文是可以编辑的。甚至可以点击面板的“显示原文”,文本框的内容会显示成智能识别出的原文内容,这个时候你可以在编辑框中对原文做修正。然后重新点击面板翻译

移动文本框

当有些段落识别的位置不正确的时候,可以选择将鼠标放到左上角来移动整个段落编辑框的位置。(如果遇到拖不动的情况,可以右下角缩放拖动下,左上角的移动就正常了)

删除文本框

当某些段落可能识别有问题,手动合并了之前的段落了,这个段落可能多余了,这个时候就可以点击这个按钮删除它了

缩放文本框大小

因为默认译文高度和宽度默认和原文段落一样,当译文内容超过原文的时候就会出现溢出,这种时候可以通过内滚查看。也可以右下角拖拽适当放大这个文本框让内容完全展示。

控制样式按钮

带图模式

默认是将原文的图片还原到右侧的译文区域。当发现译文文字有白色背景框,这是正常现象,因为要遮盖 canvas 绘制的原文文本,这样才能正常显示译文文本。

如果发现底图模式影响阅读,关闭即可

重叠限制

因为我们采用的尽可能的还原原文的排版效果,所以段落起始位置是原文段落的左上角坐标为准。正常情况下英译中,中文内容一般会小于英文,这个时候译文能够完全展示。当某些情况译文内容要多余原文时候,这种情况就会出现上下内容重叠。为了避免这种情况我们某些给译文限定了跟原文段落同等的高度。

当我们感觉上下段落之间的距离足够超出的译文部分展示的时候,就可以关闭这项

间距紧凑

这个得目的其实跟上面那项类似,因为为了保证译文文本的可读性,所以每行文字之间有一定的间距。

如果屏幕小,上下段落间距可能不足以显示译文溢出部分的内容,可以开启这项,删除文字行间距,这样段落的文本就可以完全展示出来

段首缩进

因为各种 PDF 排版复杂,无法智能认定一个段落就是符合缩进特征,但是没有缩进的话可能看文章段落有点吃力。所以是这文章类的段落,用户可以开启它,每一段的段首会缩进显示

行间距大,识别不出段落

某些 PDF 可能为了显示的原因,段落间距比较大,导致智能识别的时候会判断成这一句独立成段了。所以需要适当调整比如10, 这样就会将10px作为行间距重新识别页面的段落。

调整译文的水平位置

因为显示译文的水平坐标是读取 pdf 原始数据来的,部分 pdf 的水平坐标会存在偏大的情况。这种情况下可以通过拖拽进度条让译文内容向左移动。

调整译文的缩放比例

译文的大小是和原文基本一致,当觉得译文大小不合适的时候,可以通过拖拽进度条让字号按照比例调整

选择性翻译

如果遇到代码块等情况,不想翻译代码块,但是想翻译其他内容

  • 点击悬浮球,让右侧的译文恢复到英文状态
  • 然后设置鼠标悬停快捷键,悬停滑过需要翻译的段落,避开代码段 (注意光标不要进入右侧的段落编辑框中)

手动调整错误分段

如果智能识别段落错误,可以以下步骤手动调整

  • 点击翻译面板显示识别的原文内容
  • 然后对照左边原文,通过复制和换行等手动调整段落
  • 当确认段落无误后,再次点击翻译

下载打印

点击右上角的下载图标

因为我们工具依赖浏览器,所以下载速度和效果都严重依赖浏览器自身。所以建议不要处理超过300页的PDF

译文下载(打印)

此功能下载的是仅译文,不包含双语。 默认翻译显示的时候,为了阅读效果,缩放模式设定为页宽。

但当需要打印保存的时候则建议适当调整缩放模式,一般建议调整成百分百或者实际大小,打印效果会比较好。

双语保存

受技术限制双语保存效果,译文是以图片形式保存的,能够所见即所得的保留在线译文效果。300页 PDF 导出大概5/6分钟左右。

其他情况

保存的双语文件,打开报错

如果遇到下面这些情况

  • 本地双语 pdf 文件拖到浏览器中提示如下信息

原因

  • 这是因为原 pdf 文件是加密文件,能阅读是因为通过技术手段临时擦除了密码设置,但是密码安全设置实际仍然存在,导致保存的双语 pdf 文件打开就会呈现需要密码的状态

方案

  • 建议这种情况采用上面的仅译文打印来保存单语的 pdf

本地 PDF 点击【翻译】页面白屏

这是因为浏览器默认不允许插件访问本地文件造成的,您可以通过点击【更多】,打开【PDF本地文件翻译】,然后手动上传您的PDF文件来翻译。

或者如果您使用Chrome 内核的浏览器(比如Chrome浏览器,Edge浏览器),您可以在插件管理页面找到沉浸式翻译的插件,进入【详情】,开启【允许访问文件URL】,如下图:

无法翻译

  • 检查左侧原文是否可以复制,如果不能复制,则证明是图片PDF,当前暂不支持对图片PDF翻译
  • 检查译文是否已识别但是未翻译,段落末尾没有出现 🔄❓,插件的面板的按钮显示“翻译”。这个时候点击下这个翻译按钮触发下翻译
  • 如果存在 🔄❓,点击下❓看报错信息

邮件反馈文件

可以将您的问题描述+截图,并附上 PDF 原文发送到邮箱 [email protected]。我们将检查 PDF 情况,安排计划进入智能识别规则中。