Extension:Cognate
Cognate リリースの状態: 安定 |
|
---|---|
実装 | データベース |
説明 | Link different language versions of a page by using the page title. |
作者 | Gabriel Birke, Addshore |
最新バージョン | Continuous updates |
互換性の方針 | MediaWiki とともにリリースされるスナップショット。 master には後方互換性がありません。 |
MediaWiki | 1.29+ |
データベースの変更 | はい |
テーブル | cognate_sites cognate_pages cognate_titles |
ライセンス | GNU 一般公衆利用許諾書 2.0 以降 |
ダウンロード | |
|
|
四半期ごとのダウンロード数 | 1 (Ranked 132nd) |
translatewiki.net で翻訳を利用できる場合は、Cognate 拡張機能の翻訳にご協力ください | |
問題点 | 未解決のタスク · バグを報告 |
The Cognate extension creates a central store where the page titles for a group of sites are stored. It can then generate interwiki links across wiki projects in cases where the titles are the same. It was developed to solve the "Centralize interwiki language links for Wiktionary" task.
"Cognate" is a linguistic concept, referring to words in different languages developed from the same origin. This means that this extension is misnamed—since this extension links pages with the same title across wikis, a proper name would be “Homograph”.
Assumptions and restrictions
- Pages must be in one of the standard MediaWiki namespaces.
- Page titles are the same across languages (with some simple normalization applied).
- Sites should have the same interwiki structure for language links.
- Pages should not contain inter language links in wikitext as these will override the link provided by Cognate.
- Unexpected hash conflicts are unlikely but could occur, and would result in unexpected language links.
動作の仕組み
Title Normalization
Very simple title normalization (reduction to ASCII) occurs within the extension. This can be seen in the StringNormalizer class.
Initially the amount of normalization is very small. Requests can be made to expand this and will be added on a case by case basis.
文字列 | Normalized | 注記 |
---|---|---|
Hello…
|
Hello...
|
The raw string contains an ellipsis character. This is normalized to three . characters |
lepelle’
|
lepelle'
|
The normalized string has a normalized apostrophe. |
Title Hashing
Titles are hashed using sha256. This can be seen in the StringHasher class.
Part of the hash is then stored in the database in a BIG_INT field for efficient lookups.
There are roughly 18,446,744,073,709,551,615 possible values.
文字列 | ハッシュ | 整数 |
---|---|---|
A
|
559AEAD08264D5795D3909718CDD05ABD49572E84FE55590EEF31A88A08FDFFD | 6168500820899059065 |
Foo
|
1CBEC737F863E4922CEE63CC2EBBFAAFCD1CFF8B790D8CFD2E6A5D550B648AFA | 2071311921841431698 |
1234567890
|
C775E7B757EDE630CD0AA1113BD102661AB38829CA52A6422AB782862F268646 | -4074095513246505424 |
Matching Hashes
As titles that require links are assumed to be the same post normalization, they will result in the same hash and thus the same Int stored in the database.
Some sample data might look as follows when loading the "Foo..." page on enwiktionary.
ウィキ | Title | ハッシュ整数 | Normalized Hash Int | 注記 |
---|---|---|---|---|
enwiktionary | Foo...
|
395730596998145766 | 395730596998145766 | Matched row |
frwiktionary | Foo…
|
-7435652355441782233 | 395730596998145766 | Matched row, even though the pre normalized title includes the ellipsis character. |
dewiktionary | Foo...
|
395730596998145766 | 395730596998145766 | Matched row |
arwiktionary | Foo
|
2071311921841431698 | 2071311921841431698 |
Overwriting
It is possible to overwrite the automatic links provided by Cognate, simply by adding one or more interwiki links in the page.
That also means that to make Cognate work when the extension is deployed, the pages should not contain inter language links in their wikitext.
Testing
The extension can be tested on beta wiktionary sites:
- https://en.wiktionary.beta.wmflabs.org/wiki/Wiktionary:Main_Page
- https://de.wiktionary.beta.wmflabs.org/wiki/Hauptseite
- https://he.wiktionary.beta.wmflabs.org/wiki/%D7%A2%D7%9E%D7%95%D7%93_%D7%A8%D7%90%D7%A9%D7%99
These sites are linked together using the Cognate extension with added interwiki sorting provided by the InterwikiSorting extension.
インストール
- ダウンロードして、ファイルを
extensions/
フォルダー内のCognate
という名前のディレクトリ内に配置します。
開発者とコード寄稿者は、上記の代わりに以下を使用してGitからインストールします:cd extensions/
git clone https://gerrit.wikimedia.org/r/mediawiki/extensions/Cognate - 以下のコードを LocalSettings.php ファイルの末尾に追加します:
wfLoadExtension( 'Cognate' ); # Settings used in WMF production # Use the external cluster 'extension1' and dbname 'cognate_wiktionary' $wgCognateDb = 'cognate_wiktionary'; $wgCognateCluster = 'extension1'; # Only work on the main namespace $wgCognateNamespaces = [ 0 ];
- 更新スクリプトを実行します。このスクリプトは、この拡張機能が必要とするデータベーステーブルを自動的に作成します。
- 完了 – ウィキの「Special:Version」に移動して、拡張機能が正しくインストールされたことを確認します。
- Populate the
sites
table by running the populateCognateSites.php maintenance script. Sites must already exist in the MediaWiki sites table with the correct groupings.
php ./maintenance/populateCognateSites.php --site-group=wiktionary
- Populate the page and title tables by running the populateCognatePages.php maintenance script.
php ./maintenance/populateCognatePages.php
この拡張機能は 1 つ以上のウィキメディアのプロジェクトで使用されています。 これはおそらく、この拡張機能が安定していて高いトラフィックのウェブサイトでも十分に動作することを意味します。 この拡張機能がインストールされている場所を確認するには、ウィキメディアの設定ファイル CommonSettings.php および InitialiseSettings.php 内で、この拡張機能の名前を探してください。 特定のウィキにインストールされている拡張機能の完全な一覧は、そのウィキの Special:Version ページにあります。 |