This page is a translated version of the page Writing systems and the translation is 89% complete.
i18n文档

本页为写作体系提供多方面的基本信息:多种语言手写本、写作方向、前沿翻译以及输入。

多种文字,多种方言

许多语言都用多种文字书写。 通常这是可以实现的,但缺乏软件支持,而且有时候如果不能实施,情况将变得非常复杂。 一些语言有用于支持多套书写系统的LanguageConverter。

一些语言拥有使用相同体系书写的相似方言,它们——在技术上——可以采用和不同体系书写的语言相同的方式处理。

语言转换器

關於如何使用语言转换器的文档,請參考书写系统/语法

语言转换器 (LC)是一个基于语言变体的系统,可自动将页面内容转换为不同的变体。 变体主要是用不同的文字书写相同的语言。 要使用语言转换器,请进入国际化首选项。 如果你所在的维基支持转换,你会看到一个额外的选择脚本的选项。

Phab:T21044 -- 这需要更多的记录!

它适用于以下语言(截至 2023 年 7 月;最新列表见"languagesWithVariants"):

  • 巴厘语 (ban): Balinese (ban-bali), Latin (ban-latn) [1.36+]
  • 克里米亚鞑靼语 (crh): Latin (crh-latn), Cyrillic (crh-cyrl)
  • 英语 (en): Normal (en), Pig Latin (en-x-piglatin) (用于测试,仅当启用$wgUsePigLatinVariant 时)
  • 赣语 (gan): Simplified (gan-hans), Traditional (gan-hant)
  • 因纽特语 (iu): Latin (ike-latn), Syllabics (ike-cans) [1.18+]
  • 哈萨克语 (kk): Cyrillic (kk-cyrl), Latin (kk-latn), Arabic (kk-arab) 2023年停止支持,原因请查阅phab:T268143phab:T350684
  • 库尔德语 (ku): Latin (ku-latn), Arabic (ku-arab) [1.11+]
  • 塞尔维亚-克罗地亚语 (sh): Cyrillic (sh-cyrl), Latin (sh-latn) [1.40+]
  • 希尔哈语 (shi): Tifinagh (shi-tfng), Latin (shi-latn) [1.19+]
  • 塞尔维亚语 (sr): Cyrillic (sr-ec), Latin (sr-el)
  • 塔吉克语 (tg): Cyrillic (tg-cyrl), Latin (tg-latn)
  • 塔里什文 (tly): Cyrillic (tly-cyrl), Latin (tly-latn) [1.36+]
  • 乌兹别克语 (uz): Cyrillic (uz-cyrl), Latin (uz-latin) [1.20+]
  • 吴语 (wuu): Simplified (wuu-hans), Traditional (wuu-hant) [1.41+]
  • 标准摩洛哥塔马塞特语 (zgh): Tamazigh (zgh-tfng), Latin (zgh-latn) [1.42+]
  • 中文 (zh):
    • 简体中文 (zh-hans): China (zh-cn), Singapore (zh-sg), Malaysia (zh-my)
    • 繁体中文 (zh-hant): Taiwan (zh-tw), Hong Kong (zh-hk),[1] Macau (zh-mo)

更多的语言也需要它!

脚本的语言代码标签应遵循ISO 15924标准。 However, for legacy reasons, 塞尔维亚语 is an exception, with sr-ec instead of sr-cyrl and sr-el instead of sr-latn. This is in discussion in phab:T117845.

该系统目前的一个局限是,它可能特别不擅长处理基于同一底层脚本的多种书写系统。 中文维基人偶尔会在失败的情况下使用=>(单向)。 在PHP中,LC总是尝试使用strtr解析数据块最大的单词,因此-{}-(分词)也经常很有用。

支持配置

通过zhwp的sitelib(现已弃用,参见zh:Wikipedia:HanAssist获取当前版本)可以在用户脚本用户界面中轻松选择变量。 这可以帮助脚本编写者为用户制作一个可感知变量的界面。 对于 LC 无法访问的其他地方,可以使用 {{int:Conversionname}} 来获取当前的用户界面语言/变量。

小工具使用变体预览允许维基人在编辑器预览中检查转换结果。 您可以为自己的 wiki 进行配置。

"外语标记 "模板(如 {{lang}} )应在引用的外文文本周围添加 "禁用转换 "标记 text 以避免错误转换。 在简体/繁体维基百科中,这成为日文汉字和越南汉文的一个问题,而在标有拉丁文的维基百科中,这一问题应立即得到解决。

通过WikitextLC模块,可以在Lua输出中轻松插入LC命令。 NoteTACGroup系统允许访问预定义的特定主题转换集。 Module:地区用词允许自适应输出“foo,在PLACE和PLACE中称为bar,在PLACE中称为baz”。

对 URL 的自动标题重定向可能会给没有此功能的界面带来明显的不便。 有关 Lua 任务,请参阅 "T49725",有关 section-anchor 任务,请参阅 "T160952"。

网址重定向

In some installations of MediaWiki, a short URL is employed. For example, in Chinese Wikipedia, instead of https://zh.wikipedia.org/wiki/维基百科 (if no variant is specified) or https://zh.wikipedia.org/w/index.php?title=维基百科&variant=zh-cn (if the variant is specified without rewrite rules), a shortened URL such as https://zh.wikipedia.org/zh-cn/维基百科 can be used as a temporary link to the specified script variant (zh-cn in this case).

This behaviour can be seen several language Wikipedia such as Chinese Wikipedia, Serbian Wikipedia, etc. However, others like Gan Chinese Wikipedia and Balinese Wikipedia often keeps the long url with index.php&variant=.

This is controlled by $wgVariantArticlePath and web server rewrite rules (see manuals for short URL in Apache and nginx ).

参见

书写方向

许多书写系统的字符从左往右写(LTR),行文自上而下(TtB)。

一些常见的脚本(尤其是阿拉伯语和希伯来语)会从右向左 (RTL) 书写字符--有关我们如何使用 HTML 输出和 CSS 样式处理从右向左和混合双向文本的更多详情,请参阅方向性支持

请注意,个别语言可与具有不同方向性的脚本一起使用,例如哈萨克语和库尔德语支持拉丁语和阿拉伯语变体。

还要注意的是,万维网联盟定义了更多用于网页的方向性,例如东北亚的从上到下,线条从左到右或从右到左堆叠。[2]

字体渲染与输入

许多脚本都没有方便用户使用的合适字体。 这可能是因为操作系统没有提供这些字体,或者用户不知道如何安装,或者没有足够的权限来安装。 通用语言选择器 扩展试图通过将字体嵌入维基本身来解决这个问题。 字体将由服务器提供,用户系统无需安装字体。

通用语言选择器增加了对键入特定脚本的支持,因此用户无需依赖外部工具或系统支持。

参考

  1. 台湾和香港是使用相同繁体字书写的两个主要变体,但由于市场分离和受当地zho 语言的影响,在短语用法上存在显著差异,因此您可能希望至少将 CN、TW 和 HK 保留在您的变体列表中。 如果您坚持要将中文变体的范围扁平化为基于脚本的繁简体分离,请遵循记者在phab:T149278中的做法。
  2. CSS编写模式3级