Extension:Proofread Page
Proofread Page 拡張機能は以下のいずれかの方法で、ブックを作成する拡張機能です:
- 画像とOCR処理した文字欄とを並べる、もしくは
- 散文は段落ごと、詩文の場合は1句単位。文書の内容は MediaWiki のページの体裁 (参照読み込み) として。
目的は電子化した原稿と、画像処理により読み取った文字列を簡単に比較するためです。
元の文字列を複写せずに、いくつかの方法で表示します。[1]
使用法
この拡張機能はどのウィキソースのウィキにもインストールされます。 For the syntax, see the Wikisource Proofread Page documentation. また Bibliowiki も導入していました。
要件と推奨事項
- DjVu 形式のファイルを使用するには (必須ではありませんが推奨)、設定用にネイティブの DjVu ハンドラを用意してください。 Manual:How to use DjVu with MediaWiki も参照してください。
- 加えて、 ProofreadPage は以下の拡張機能と併用すると、かなり使用感が改善されます。
- LabeledSectionTransclusion (強く推奨)
- Cite (既定のページ フッターは
<references />
を含みます - Poem
- PdfHandler (追加的な PHP パッケージを必要とする場合があります) — PDF 対応を追加します
- PagedTiffHandler
- ParserFunctions
- TemplateStyles (Enables Index-specific CSS)
- Scribunto (Enables the proofreading Lua library)
インストール
拡張機能
- ダウンロードして、ファイルを
extensions/
フォルダー内のProofreadPage
という名前のディレクトリ内に配置します。
開発者とコード寄稿者は、上記の代わりに以下を使用してGitからインストールします:cd extensions/
git clone https://gerrit.wikimedia.org/r/mediawiki/extensions/ProofreadPage - 以下のコードを LocalSettings.php ファイルの末尾に追加します:
wfLoadExtension( 'ProofreadPage' );
- 更新スクリプトを実行します。このスクリプトは、この拡張機能が必要とするデータベーステーブルを自動的に作成します。
- 完了 – ウィキの「Special:Version」に移動して、拡張機能が正しくインストールされたことを確認します。
Thumbnailing
拡張機能は直接、画像のサムネイルにリンクしようとするものの、用意されていない場合がしばしばあります。 そこで リンク先不明の 404 エラーが出たら、必ずサムネール作成をしなければなりません。 その手順は、次のどれかひとつ を選んで実行します。
- Apache RewriteRule を .htaccess に設定し、未作成のサムネールを thumb.php する。
RewriteEngine On RewriteCond %{REQUEST_FILENAME} !-f RewriteCond %{REQUEST_FILENAME} !-d RewriteRule ^/w/images/thumb/[0-9a-f]/[0-9a-f][0-9a-f]/([^/]+)/page([0-9]+)-?([0-9]+)px-.*$ /w/thumb.php?f=$1&p=$2&w=$3 [L,QSA]
- or set the Apache 404 handler to Wikimedia's thumb-handler.
This is a general-purpose 404 handler with Wikimedia-specific code, not simply a thumbnail generator.
ErrorDocument 404 /w/extensions/upload-scripts/404.php
- For MediaWiki >= 1.20, you can simply redirect to thumb_handler.php:
RewriteEngine On RewriteCond %{REQUEST_FILENAME} !-f RewriteCond %{REQUEST_FILENAME} !-d RewriteRule ^/w/images/thumb/[0-9a-f]/[0-9a-f][0-9a-f]/([^/]+)/page([0-9]+)-?([0-9]+)px-.*$ /w/thumb_handler.php [L,QSA]
- or in apache2.conf:
ErrorDocument 404 /w/thumb_handler.php
If you encounter a problem similar to the following:
- phab:T301291 – PDF and DjVu files on Commons failed to be processed (no thumbnails, zero pages) but otherwise valid
- phab:T298417 – Undeleted DjVu files show incorrect metadata: 0x0 size, no page number info
- phab:T299521 – PDF file has 0x0 image size in Commons after uploading a new version while the page number is correct
Try next steps:
- repair thumbnails for DjVu files of the core MediaWiki (for PDF use mimetype
application/pdf
)php maintenance/refreshImageMetadata.php --verbose --mime image/vnd.djvu --force
- needed for actualization info about the pages counts of the
Special:IndexPages
php maintenance/refreshLinks.php --namespace 252
名前空間
ProofreadPage create by default two custom namespaces named "Page" and "Index" in English with respectively ids 250 and 252.
Their names are translated if your wiki use another language. 完全な一覧。
You can customize their name or their ID: Create namespaces by hand and set their IDs in Manual:LocalSettings.php using $wgProofreadPageNamespaceIds global. You will do something like:
define( 'NS_PROOFREAD_PAGE', 250);
define( 'NS_PROOFREAD_PAGE_TALK', 251);
define( 'NS_PROOFREAD_INDEX', 252);
define( 'NS_PROOFREAD_INDEX_TALK', 253);
$wgExtraNamespaces[NS_PROOFREAD_PAGE] = 'Page';
$wgExtraNamespaces[NS_PROOFREAD_PAGE_TALK] = 'Page_talk';
$wgExtraNamespaces[NS_PROOFREAD_INDEX] = 'Index';
$wgExtraNamespaces[NS_PROOFREAD_INDEX_TALK] = 'Index_talk';
$wgProofreadPageNamespaceIds = array(
'index' => NS_PROOFREAD_INDEX,
'page' => NS_PROOFREAD_PAGE
);
Namespace id customization is not recommended and might not be supported in the future.
設定
- In order to use the page quality system, it is necessary to create five categories.
The names of these categories must be defined in MediaWiki:Proofreadpage_quality0_category to MediaWiki:Proofreadpage_quality4_category.
- Ensure that you have installed Extension:ParserFunctions
Configuration of index namespace
For more details, see Extension:Proofread Page/Index data configuration
- You need to create MediaWiki:Proofreadpage_index_template in order to display index pages.
This page is a template that receive as parameter entries of the edition form.
- You need to create MediaWiki:Proofreadpage_index_data_config.json that contain the configuration of the index form.
This new configuration page overrides MediaWiki:Proofreadpage_index_attributes and MediaWiki:Proofreadpage_js_attributes.
The configuration is a JSON array of properties. Here is the structure of a property in the array, all the parameters are optional, the default value are set:
{
"ID": { //id of the metadata (first parameter of proofreadpage_index_attributes)
"type": "string", //the property type (for compatibility reasons the values have not to be of this type). Possibles values: string, number, page. If set, the newly set values should be valid according to the type (e.g. for a number a valid number, for a page an existing wiki page...)
"size": 1, //only for the type string : number of lines of the input (third parameter of proofreadpage_index_attributes)
"values": {"a":"A", "b":"B","c":"C", "d":"D"}, //an array values : label that list the possible values (for compatibility reasons the stored values have not to be one of these)
"default": "", //the default value
"header": false, //add the property to MediaWiki:Proofreadpage_header_template template (true is equivalent to being listed in proofreadpage_js_attributes)
"label": "ID", //the label in the form (second parameter of proofreadpage_index_attributes)
"help": "", //a short help text
"delimiter": [], //list of delimiters between two part of values. By example ["; ", " and "] for strings like "J. M. Dent; E. P. Dutton and A. D. Robert"
"data": "" //proofreadpage's metadata type that the property is equivalent to
}
}
The data parameter can have for value:
"type", "language", "title", "author", "translator", "illustrator", "editor", "school", "year", "publisher", "place", "progress"
ページ区切り
The extension puts a separator between every transcluded page and the next, which is defined by wgProofreadPagePageSeparator
.
The default value is  
(a whitespace).
Set wgProofreadPagePageSeparator = ""
to suppress the separator.
Join hyphenated words across pages
When a word is hyphenated between a page and the next, the extension joins together the two halves of the word.
Example: his- and tory becomes history.
The "joiner" character is defined by wgProofreadPagePageJoiner
and defaults to '-' (the ASCII hyphen character).
Configure change tagging (optional)
See Change tagging to set up change tags.
使用法
Creating your first page (example with DjVu)
- Before following these steps ensure you have followed the instructions in Manual:How to use DjVu with MediaWiki .
- (when and in which namespace is the DjVu file itself uploaded?)
- Create a page in the "Page" namespace (or the internationalized name if you use an not-English wiki).
For example if your namespace is 'Page' create Page:Carroll - Alice's Adventures in Wonderland.djvu
- Create the corresponding file for this page commons:File:Carroll - Alice's Adventures in Wonderland.djvu (or set Manual:$wgUseInstantCommons to
true
).
- Create the index page
Index:Carroll - Alice's Adventures in Wonderland.djvu
- Insert the tag
<pagelist />
in the Pages field to visualize the page list
- Insert the tag
- To edit page 5 of the book navigate to 'Page:Carroll - Alice's Adventures in Wonderland/5' and click edit
構文
This extension introduces the following tags:
<pages>
, <pagelist>
注記
- ↑ これらのページ群はメインの名前空間に置かれないため、テキスト単位の集計には反映されません。
関連項目
- Sections
- Index data configuration
- Change tagging
- Lua library reference
- Page viewer
- Edit-in-Sequence — A new system (as of 2022) for proofreading without having to reload the entire page.
- Roadmap of the development
- API
- Metadata API — The
proofread
meta submodule - Proofread properties API — Proofreading-related properties of individual pages
- Index data API — Access index pages data (fields and categories)
- Index pagination API — List pages in a given index
- Metadata API — The
- Manual:How to use DjVu with MediaWiki
- PdfHandler — Adds PDF support to Proofread Page
- The current full description and instructions (in English) may be found at: s:Help:Proofread
- Usage statistics can be found here: https://phetools.toolforge.org/statistics.php
- ToDo and feature request list from the Community
- A public-domain user manual is being written at: Help:Extension:ProofreadPage
- MediaWiki:OCR.js - OCR スクリプト
この拡張機能は 1 つ以上のウィキメディアのプロジェクトで使用されています。 これはおそらく、この拡張機能が安定していて高いトラフィックのウェブサイトでも十分に動作することを意味します。 この拡張機能がインストールされている場所を確認するには、ウィキメディアの設定ファイル CommonSettings.php および InitialiseSettings.php 内で、この拡張機能の名前を探してください。 特定のウィキにインストールされている拡張機能の完全な一覧は、そのウィキの Special:Version ページにあります。 |
この拡張機能は以下のウィキ ファーム/ウィキ ホスト/パッケージに含まれています: これは正式な一覧ではありません。 一部のウィキ ファーム/ウィキ ホスト/パッケージは、ここに記載されていなくてもこの拡張機能を含んでいる場合があります。 必ずご利用のウィキ ファーム、ウィキ ホスト、バンドルで確認してください。 |