Help:検索エンジンによるインデックス化の制御
注意: このページを編集すると、編集内容が CC0 のもとで公開されることに同意したと見なされます。詳細はパブリック・ドメインのヘルプ ページを参照してください。 このページの古い版の一部は、CC BY-SA ライセンスのもとで取り込まれました。 新しい編集のみがパブリックドメインと見なされます。 |
MediaWiki では、通常、ページがインデックスされるという既定の状態であるため、検索エンジンのインデックスを制御するという目的で、さまざまな方法が利用者に提供されています。一般的には「noindexing」と呼ばれます。 これらの方法のほとんどは、検索エンジンに特定のページをインデックスしないようにする noindex HTML メタ タグを使用することに依存しています。 このタグや robots.txt ファイルに関して、特に既にインデックスされたコンテンツの削除などについては、個々の検索エンジンによって尊重されるかどうかは異なり、理論上は完全に無視される可能性もあります。
制御の方法は以下の通り:
- MediaWiki ソフトウェアの設定による、名前空間全体の制御
- MediaWiki:Robots.txt を使用した、ページのクラスごとの制御
- 個々のページに
__NOINDEX__
マジックワードを直接的にまたはそれを含むテンプレートを使用して追加することによるページの制御 - 特定の状況で使用される標準テンプレートに
__NOINDEX__
マジックワードを追加することによるページの制御
Indexing policy set by one of the means above only apply for the page content only. Views that are a part of MediaWiki interface (such as the page history, historical page version or most special pages) are never indexed, irrespective of the settings set above.[1]
ソフトウェアの設定とrobots.txt
ソフトウェアの設定
特定の名前空間全体を noindex 化するには、$wgNamespaceRobotPolicies を使用できます。
同時に、__NOINDEX__
を特定の名前空間で無効にすることもできます。
This is controlled by the MediaWiki software setting $wgExemptFromUserRobotsControl
, which defaults to $wgContentNamespaces
.
$wgArticleRobotPolicies can be used to specify different policies for individual pages.
robots.txt による noindex
System message MediaWiki:Robots.txt can be used to noindex pages. Unlike the software settings, it can be directly edited.
NOINDEXマジックワード
個別のページ
Individual pages can be noindexed by adding the __NOINDEX__
magic word into that page.
This can be done either directly or using a template designed to contain the magic word (eg {{NOINDEX }}); this can make use of the keyword easier to track.
Pages with the keyword are tracked by MediaWiki, and automatically categorized in a tracking category. The category name is determined by MediaWiki:Noindex-category.
Standard template noindexing
Standard templates can include the __NOINDEX__
keyword, thereby noindexing pages to which the templates are applied. A template used to flag a particularly sensitive type of page can then automatically noindex it.
INDEXマジックワード
個別のページ
Individual pages can override namespace noindexing by adding the __INDEX__
magic word into that page.
Pages with the keyword are tracked by MediaWiki, and automatically categorized in a tracking category.
The category name is determined by MediaWiki:Index-category.
However, INDEX does not override noindexing via MediaWiki:Robots.txt.
It does override $wgArticleRobotPolicies
.
現在の問題点
- phab:T24251 – Magic word to remove page from internal MediaWiki search results
脚注
- ↑
For details, see
Article
's call tosetRobotPolicy()
.