Help:内容翻译/翻译/内置机器翻译

This page is a translated version of the page Help:Content translation/Translating/Initial machine translation and the translation is 100% complete.
PD 注意:當您編輯本頁面時,即同意以CC0協議授權您的貢獻。您可以在公有領域帮助页面找到更多信息。 PD

在翻译中添加新段落时,您可以从头开始或使用自动翻译作为起点。 如果可用,机器翻译的结果将作为默认的初始翻译。 下文描述了不同的选项、其可用性的详细信息以及使用机器翻译时的注意事项。

内置翻译的选项

工具栏中的“初始翻译”选项允许您决定将初始内容用作每个段落的起点。 可用选项如下:

  • 使用机器翻译服务这使你可以从原段落的自动翻译版本开始翻译。 这些选项的数量和名称会有所不同。 “使用 Apertium”或“使用 Yandex”等选项将根据这些服务所支持的语言提供(有关更多信息,请参阅下一节)。
  • 复制原内容。 原始段落将被复制到翻译中。 虽然内容将保留原始语言,但一些元素会适应目标 wiki。 例如,链接将指向目标语言的相应文章,模板将被转换为等效的模板。 翻译人员仍然需要完全重写内容,但改编的元素可能更容易重用。
  • 从空段落开始。在替换内容比重新键入更费力时,从空段落开始会很有用。

考虑到不同的内容可能适用不同的翻译方法,你可以对各段落快速切换不同的方法,而彼此相互独立。 在不同方法之间切换时,会保留在段落中所做的更改。 即使已经开始编辑原段落,也可以通过这种方式尝试不同的翻译方法,而不必担心决定使用最初的翻译方法时丢失原先编辑的段落。 在这种场合下,还有两个相关的附加选项:

  • 重置翻译选项在修改初始内容后可用。 通过这个选项可以丢弃所做的更改来重置原内容。
  • 设为默认选项在已选定当前非默认的翻译方法时可用。 通过这个选项可以设置翻译后续所有段落的默认方法。 如果你发现某个翻译服务总体上来说效果更好,这个选项会很方便。

机器翻译可用性

内容翻译集成了多种翻译服务,每项服务都支持一组不同的语言。 下面列出支持的服务,并附有它们支持的语言列表的链接:

上面的语言列表指向配置代码,以确保信息与工具当前的工作方式同步。 这些列表显示了初始缩进级别的源语言的语言代码,以及其下所有受支持的目标语言的代码。

还可以使用我们的 API 检查特定语言对的可用服务。 在这个西班牙语-加泰罗尼亚语对的示例中,您可以看到Apertium 是其他可用服务中的默认服务(列表中的第一个)。

根据观察到的结果和社区反馈,各语言将逐步可用。 某些语言的机器翻译可能暂时不可用,即使底层服务支持。

改善现有的翻译服务

使用“内容翻译”进行翻译,将帮助翻译服务改进。 对初始机器翻译所做的所有更正都将记录于 API 和数据转储中,并可能用于改进现有服务。 不仅如此,你还可以通过翻译服务提供的特定方法来为他们的项目做出贡献。

MinT

The translations provided by MinT are based on translation models such as NLLB-200 and OpusMT. The training data compiled by the Opus project is resused by many translation models, and you can contribute to it in order to help improve the translation quality for your language.

OpusMT 是一个开源的神经网络机器翻译系统,它基于网络上自由许可的多语言文档训练。 这个开放的语料库用于训练翻译系统,扩展语料库将带来更好的翻译。 使用内容翻译生成的内容会自动集成到语料库中,但您可以进一步扩展语料库:

  • 提出将新来源整合到开放语料库中。您可以联系 Jörg Tiedemann,提出一个新的数据源来扩展语料库。
  • 直接提交文档(还在初始原型阶段)。 你可以通过多种格式上传翻译的文档(如翻译的网页)来拓展语料库。
  • 在本地试试OPUS-CAT 的语言模型(Windows 可用)
  • 为其他项目做出贡献,为这个开放语料库提供翻译,如Tatoeba,这是一个在线开放社区,收集多种语言的句子翻译。

OpusMT 基于同样是开源项目的 MarianNMT 。 拥有技术知识且对机器学习感兴趣的人也可以为改进机器学习做出贡献。

Apertium

Apertium 是一个开源的基于规则的翻译系统。 你可以通过编码你的语言的相关规则来为项目做出贡献。 这个过程需要语言和高级技术知识,但你可以获得 Apertium 团队的支持,以扩大对新语言对的翻译支持。

Google 翻译

Google 翻译不是一个开源项目,但用户仍然有办法贡献:

通过新的翻译服务扩大语言支持

内容翻译被设计成一个可扩展的平台。 因此,可以开发新客户端来整合额外的翻译服务。 關於翻譯服務整合方式的一些注意事項:

  • 机器翻译和用户所做的更正将作为已发布翻译的数据的一部分发布,这些数据可为创建或改进您的翻译服务提供有用的资源。
  • 集成的外部服务仅接收公开可用的 wiki 内容,并返回与 wiki 中使用的许可证兼容的此类内容的翻译版本。 我們不會與翻譯服務分享任何個人資訊。

针对每种语言所提供的支持的反馈非常有用。 如果您缺少某种语言的支持,或者是否有更高质量的选项,请告知我们。 您可以在项目讨论页面此票证中提供此类反馈。


内容质量的考量

机器翻译作为最终结果还远未达到完美。 然而,许多用户发现它作为起点非常有用。 请确保从以下不同角度复核内容:

  • 确保保留原来的含义。
  • 检查是否有信息缺失,尤其是链接、参考和模板等包含表面上并不总是可见的信息的元素。
  • 阅读翻译后的内容,确保其作为独立页面自然地阅读。

复杂元素的局限性

在某些情况下,内容可能不会按预期显示在翻译中:

  • 某些支持的服务仅适用于纯文本。 这意味着翻译中会丢失原始文章中的格式和丰富的内容元素(例如链接和引用),内容翻译需要猜测这些元素在翻译文本中的位置。 重新添加这些元素并不总是完美的,某些元素可能位于错误的位置或应用于文本的错误部分。
  • 参考或模板等复杂元素在每种语言中可能使用不同的结构,这使得将内容从一种语言转移到另一种语言变得困难。 请务必检查这些元素中的内容,以确保没有遗漏任何重要信息。

加强机器翻译审核

存在多种自动机制来强制对初始内容进行审查。 通过这种方式,该工具可确保在内容发布之前对初始自动翻译进行充分的审核。