Tiện ích:Proofread Page
Tiện ích mở rộng Proofread Page cũng tạo ra một cuốn sách:
- dưới dạng một cột văn bản OCR bên cạnh một cột hình ảnh được quét hoặc
- được chia thành các chương hoặc bài thơ. Nội dung của tài liệu xuất hiện trong trang MediaWiki (thông qua loại trừ).
Phần mở rộng nhằm mục đích cho phép dễ dàng so sánh văn bản với bản gốc số hóa.
Tiện ích mở rộng này hiển thị văn bản theo nhiều cách mà không thực sự sao chép văn bản gốc.[1]
Sử dụng
Tiện ích mở rộng này được cài đặt trên tất cả wiki Wikisource. Đối với cú pháp, xem $1. Tiện ích cũng được sử dụng trên Bibliowiki.
Yêu cầu và khuyến nghị
- Cần có quyền truy cập vào dòng lệnh nếu chạy tập lệnh cập nhật (maintenance/update.php) từ trình duyệt web không thành công (tài liệu tại đây và tại đây).
- Nếu bạn muốn sử dụng tệp DjVu (tùy chọn nhưng được khuyến nghị), cần có trình xử lý DjVu gốc để định cấu hình. Xem thêm Manual:How to use DjVu with MediaWiki .
- Ngoài ra, việc sử dụng ProofreadPage có thể được cải thiện rất nhiều bằng cách sử dụng các tiện ích mở rộng sau:
- LabeledSectionTransclusion (được khuyến nghị cao)
- Cite (chân trang mặc định chứa
<references />
- Poem
- PdfHandler (có thể yêu cầu các gói PHP bổ sung) — thêm hỗ trợ PDF
- PagedTiffHandler
- ParserFunctions
- TemplateStyles (Cho phép CSS riêng cho chỉ mục)
- Scribunto (Cho phép hiệu đính thư viện Lua)
Cài đặt
Tiện ích
- Download and move the extracted
ProofreadPage
folder to yourextensions/
directory.
Developers and code contributors should install the extension from Git instead, using:cd extensions/
git clone https://gerrit.wikimedia.org/r/mediawiki/extensions/ProofreadPage - Thêm mã sau vào dưới cùng tệp $LocalSettings của bạn:
wfLoadExtension( 'ProofreadPage' );
- Chạy mã cập nhật mà sẽ tự động tạo các bảng cơ sở dữ liệu mà phần mở rộng này cần.
- Xong – Chuyển tới Special:Version trên wiki của bạn để xác nhận phần mở rộng được cài đặt thành công.
Hình thu nhỏ
Tiện ích mở rộng liên kết trực tiếp đến hình thu nhỏ của hình ảnh thường không tồn tại. Bạn phải phát hiện lỗi 404 và tạo các hình thu nhỏ bị thiếu. Bạn có thể làm điều này với một trong các giải pháp sau:
- Đặt Apache RewriteRule trong .htaccess thành thumb.php cho các hình thu nhỏ bị thiếu:
RewriteEngine On RewriteCond %{REQUEST_FILENAME} !-f RewriteCond %{REQUEST_FILENAME} !-d RewriteRule ^/w/images/thumb/[0-9a-f]/[0-9a-f][0-9a-f]/([^/]+)/page([0-9]+)-?([0-9]+)px-.*$ /w/thumb.php?f=$1&p=$2&w=$3 [L,QSA]
- hoặc đặt trình xử lý Apache 404 thành thumb-handler của Wikimedia. Đây là trình xử lý 404 có mục đích chung với mã dành riêng cho Wikimedia, không chỉ đơn giản là trình tạo hình thu nhỏ.
ErrorDocument 404 /w/extensions/upload-scripts/404.php
- Đối với phiên bản MediaWiki >= 1.20, bạn có thể chỉ cần đổi hướng đến thumb_handler.php:
RewriteEngine On RewriteCond %{REQUEST_FILENAME} !-f RewriteCond %{REQUEST_FILENAME} !-d RewriteRule ^/w/images/thumb/[0-9a-f]/[0-9a-f][0-9a-f]/([^/]+)/page([0-9]+)-?([0-9]+)px-.*$ /w/thumb_handler.php [L,QSA]
- Hoặc trong apache2.conf:
ErrorDocument 404 /w/thumb_handler.php
If you encounter a problem similar to the following:
- phab:T301291 – PDF and DjVu files on Commons failed to be processed (no thumbnails, zero pages) but otherwise valid
- phab:T298417 – Undeleted DjVu files show incorrect metadata: 0x0 size, no page number info
- phab:T299521 – PDF file has 0x0 image size in Commons after uploading a new version while the page number is correct
Try next steps:
- repair thumbnails for DjVu files of the core MediaWiki (for PDF use mimetype
application/pdf
)php maintenance/refreshImageMetadata.php --verbose --mime image/vnd.djvu --force
- needed for actualization info about the pages counts of the
Special:IndexPages
php maintenance/refreshLinks.php --namespace 252
Không gian tên
ProofreadPage sẽ tạo theo mặc định hai không gian tên tùy chỉnh có tên là "Trang" và "Chỉ mục" bằng tiếng Anh với id tương ứng là 250 và 252.
Tên của chúng sẽ được dịch nếu wiki của bạn sử dụng ngôn ngữ khác. Danh sách đầy đủ.
Bạn có thể tùy chỉnh tên hoặc ID của các không gian tên này: Tạo không gian tên bằng tay và đặt id của chúng trong Thủ công:LocalSettings.php bằng cách sử dụng $wgProofreadPageNamespaceIds toàn cục. Ví dụ như sau:
define( 'NS_PROOFREAD_PAGE', 250);
define( 'NS_PROOFREAD_PAGE_TALK', 251);
define( 'NS_PROOFREAD_INDEX', 252);
define( 'NS_PROOFREAD_INDEX_TALK', 253);
$wgExtraNamespaces[NS_PROOFREAD_PAGE] = 'Page';
$wgExtraNamespaces[NS_PROOFREAD_PAGE_TALK] = 'Page_talk';
$wgExtraNamespaces[NS_PROOFREAD_INDEX] = 'Index';
$wgExtraNamespaces[NS_PROOFREAD_INDEX_TALK] = 'Index_talk';
$wgProofreadPageNamespaceIds = array(
'index' => NS_PROOFREAD_INDEX,
'page' => NS_PROOFREAD_PAGE
);
Tùy chỉnh id không gian tên không được khuyến nghị và có thể không được hỗ trợ trong tương lai.
Cấu hình
- Để sử dụng hệ thống chất lượng trang, cần phải tạo năm thể loại. Tên của các thể loại này phải được xác định trong MediaWiki:Proofreadpage_quality0_category đến MediaWiki:Proofreadpage_quality4_category.
- Đảm bảo rằng bạn đã cài đặt Extension:ParserFunctions
Cấu hình không gian tên chỉ mục
Để biết thêm thông tin, xem Extension:Proofread Page/Index data configuration .
- Bạn cần tạo MediaWiki:Proofreadpage_index_template để hiển thị các trang chỉ mục. Trang này là một mẫu nhận dưới dạng các mục tham số của biểu mẫu phiên bản.
- Bạn cần tạo MediaWiki:Proofreadpage_index_data_config.json chứa cấu hình của biểu mẫu chỉ mục. Trang cấu hình mới này ghi đè MediaWiki:Proofreadpage_index_attributes và MediaWiki:Proofreadpage_js_attributes.
Cấu hình là một mảng thuộc tính JSON. Đây là cấu trúc của một thuộc tính trong mảng, tất cả các tham số là tùy chọn, giá trị mặc định được đặt:
{
"ID": { //id of the metadata (first parameter of proofreadpage_index_attributes)
"type": "string", //the property type (for compatibility reasons the values have not to be of this type). Possibles values: string, number, page. If set, the newly set values should be valid according to the type (e.g. for a number a valid number, for a page an existing wiki page...)
"size": 1, //only for the type string : number of lines of the input (third parameter of proofreadpage_index_attributes)
"values": {"a":"A", "b":"B","c":"C", "d":"D"}, //an array values : label that list the possible values (for compatibility reasons the stored values have not to be one of these)
"default": "", //the default value
"header": false, //add the property to MediaWiki:Proofreadpage_header_template template (true is equivalent to being listed in proofreadpage_js_attributes)
"label": "ID", //the label in the form (second parameter of proofreadpage_index_attributes)
"help": "", //a short help text
"delimiter": [], //list of delimiters between two part of values. By example ["; ", " and "] for strings like "J. M. Dent; E. P. Dutton and A. D. Robert"
"data": "" //proofreadpage's metadata type that the property is equivalent to
}
}
Tham số dữ liệu có thể có giá trị: "type", "language", "title", "author", "translator", "illustrator", "editor", "school", "year", "publisher", "place", "progress"
Tách trang
Tiện ích mở rộng đặt dấu phân cách giữa mọi trang được nhúng và trang tiếp theo, được xác định bằng wgProofreadPagePageSeparator
.
Giá trị mặc định là  
(khoảng trắng).
Đặt wgProofreadPagePageSeparator = ""
để chặn dấu tách.
Nối các từ được gạch nối giữa các trang
Khi một từ được gạch nối giữa một trang và trang tiếp theo, phần mở rộng sẽ nối hai nửa của từ lại với nhau.
Ví dụ: his- và tory trở thành history.
Ký tự "joiner" được xác định bởi wgProofreadPagePageJoiner
và mặc định là '-' (ký tự ASCII gạch nối).
Định cấu hình gắn thẻ thay đổi (tùy chọn)
Xem Thay đổi gắn thẻ để thiết lập thẻ thay đổi.
Cách sử dụng
Tạo trang đầu tiên của bạn (ví dụ với DjVu)
- Trước khi làm theo các bước này, hãy đảm bảo bạn đã làm theo hướng dẫn tại Manual:How to use DjVu with MediaWiki .
- (tệp djvu được tải lên khi nào và trong không gian tên nào?)
- Tạo một trang trong không gian tên "Trang" (hoặc tên được quốc tế hóa nếu bạn sử dụng wiki không phải tiếng Anh). Ví dụ: nếu không gian tên của bạn là 'Page', hãy tạo
Page:Carroll - Alice's Adventures in Wonderland.djvu
- Tạo tệp tương ứng cho trang này commons:File:Carroll - Alice's Adventures in Wonderland.djvu (hoặc đặt Manual:$wgUseInstantCommons thành
true
). - Tạo trang chỉ mục
Index:Carroll - Alice's Adventures in Wonderland.djvu
- Chèn thẻ
<pagelist />
vào trường Trang để trực quan hóa danh sách trang
- Chèn thẻ
- Để chỉnh sửa trang 5 của cuốn sách, hãy điều hướng đến 'Page:Carroll - Alice's Adventures in Wonderland/5' và nhấp vào chỉnh sửa
Cú pháp
Tiện ích mở rộng này giới thiệu các thẻ sau:
<pages>
, <pagelist>
Ghi chú
- ↑ Vì các trang không nằm trong không gian tên chính nên chúng không được đưa vào thống kê số lượng đơn vị văn bản.
Xem thêm
- Phần
- Index data configuration
- Change tagging
- Lua library reference
- Page viewer
- Edit-in-Sequence — A new system (as of 2022) for proofreading without having to reload the entire page.
- Roadmap of the development
- API
- Metadata API — The
proofread
meta submodule - Proofread properties API — Proofreading-related properties of individual pages
- Index data API — Access index pages data (fields and categories)
- Index pagination API — List pages in a given index
- Metadata API — The
- Manual:How to use DjVu with MediaWiki
- PdfHandler — Thêm hỗ trợ PDF vào Proofread Page
- Mô tả và hướng dẫn đầy đủ hiện tại (bằng tiếng Anh) có thể được tìm thấy tại: s:Help:Proofread
- Thống kê sử dụng có thể được tìm thấy ở đây: https://phetools.toolforge.org/statistics.php
- Việc Cần Làm và danh sách yêu cầu tính năng từ Cộng đồng
- Hướng dẫn sử dụng thuộc phạm vi công cộng hiện đang được viết tại: Help:Extension:ProofreadPage
- MediaWiki:OCR.js - tập lệnh OCR
This extension is being used on one or more Wikimedia projects. This probably means that the extension is stable and works well enough to be used by such high-traffic websites. Look for this extension's name in Wikimedia's CommonSettings.php and InitialiseSettings.php configuration files to see where it's installed. A full list of the extensions installed on a particular wiki can be seen on the wiki's Special:Version page. |
This extension is included in the following wiki farms/hosts and/or packages: This is not an authoritative list. Some wiki farms/hosts and/or packages may contain this extension even if they are not listed here. Always check with your wiki farms/hosts or bundle to confirm. |