Додаток:Proofread Page
Додаток Proofread Page також створює книгу:
- у вигляді стовпчика тексту OCR поруч зі стовпчиком відсканованих зображень, або
- з розбиттям на розділи або вірші. Вміст документа з'являється на сторінці MediaWiki (через включення).
Додаток призначений для легкого порівняння тексту з оригінальною оцифровкою.
Цей додаток відображає текст кількома способами, фактично не дублюючи оригінальний текст.[1]
Використання
Додаток встановлюється на всі Вікіджерела. Для синтаксису, подивіться s:mul:Wikisource:ProofreadPage за допомогою документації WikiSource Proofread Page. Раніше він також використовувався на Бібліовікі.
Вимоги та рекомендації
- Доступ до командного рядка потрібен, якщо запуск сценарію оновлення (maintenance/update.php) з веб-браузера не вдасться (див. Документація з оновлення та Update.php документація).
- Якщо ви хочете використовувати файли DjVu (необов'язково, але рекомендовано), для конфігурації має бути доступний власний обробник DjVu. Див. також Manual:How to use DjVu with MediaWiki .
- Крім того, використання ProofreadPage значно покращується завдяки використанню наступних розширень:
- LabeledSectionTransclusion (наполегливо рекомендується)
- Cite (за замовчуванням нижній колонтитул сторінки містить
<references />
- Poem
- PdfHandler (можуть знадобитися додаткові PHP-пакети) — додано підтримку PDF
- PagedTiffHandler
- ParserFunctions
- TemplateStyles (Вмикає Index-specific CSS.)
- Scribunto (Вмикає коректуру Lua library.)
Встановлення
Розширення
- Завантажте і розмістіть файли в каталозі з назвою
ProofreadPage
у вашійextensions/
папці.
Розробники та автори коду повинні замість цього встановити розширення з Git, використовуючи:cd extensions/
git clone https://gerrit.wikimedia.org/r/mediawiki/extensions/ProofreadPage - Додайте такий код унизу вашого файлу LocalSettings.php :
wfLoadExtension( 'ProofreadPage' );
- Запустіть скрипт оновлення, який автоматично створить необхідні таблиці бази даних, які потрібні цьому розширенню.
- Готово – Перейдіть до Special:Version вашої вікі, щоб переконатися, що розширення встановлено успішно.
Ескізи
Розширення посилається безпосередньо на мініатюри зображень, яких часто не існує. Ви повинні відстежувати помилки 404 і генерувати відсутні мініатюри. Ви можете зробити це за допомогою будь-якого "одного" з цих рішень:
- Встановіть Apache RewriteRule за .htaccess до thumb.php для відсутніх мініатюр:
RewriteEngine On RewriteCond %{REQUEST_FILENAME} !-f RewriteCond %{REQUEST_FILENAME} !-d RewriteRule ^/w/images/thumb/[0-9a-f]/[0-9a-f][0-9a-f]/([^/]+)/page([0-9]+)-?([0-9]+)px-.*$ /w/thumb.php?f=$1&p=$2&w=$3 [L,QSA]
- або встановіть обробник 404 Apache на thumb-handler Вікімедіа. Це обробник 404 загального призначення зі специфічним для Вікімедіа кодом, а не просто генератор мініатюр.
ErrorDocument 404 /w/extensions/upload-scripts/404.php
- Для MediaWiki >= 1.20 ви можете просто перенаправляти на thumb_handler.php:
RewriteEngine On RewriteCond %{REQUEST_FILENAME} !-f RewriteCond %{REQUEST_FILENAME} !-d RewriteRule ^/w/images/thumb/[0-9a-f]/[0-9a-f][0-9a-f]/([^/]+)/page([0-9]+)-?([0-9]+)px-.*$ /w/thumb_handler.php [L,QSA]
- або в apache2.conf:
ErrorDocument 404 /w/thumb_handler.php
Якщо ви зіткнулися з проблемою, подібною до наведеної нижче:
- phab:T301291 – PDF- та DjVu-файли на Вікісховищі не вдалося обробити (немає мініатюр, нуль сторінок), але в іншому вони дійсні
- phab:T298417 – Невидалені DjVu-файли показують неправильні метадані: Розмір 0x0, немає інформації про номер сторінки
- phab:T299521 – PDF-файл має розмір зображення 0x0 у Вікісховищі після завантаження нової версії, хоча номер сторінки правильний
Спробуйте наступні кроки:
- відновити мініатюри для DjVu-файлів ядра MediaWiki (для PDF використовуйте MIME тип
application/pdf
)php maintenance/refreshImageMetadata.php --verbose --mime image/vnd.djvu --force
- необхідну для актуалізації інформацію про кількість сторінок
Special:IndexPages
php maintenance/refreshLinks.php --namespace 252
Простори назв
ProofreadPage створить за замовчуванням два користувацькі простори імен "Page" та "Index" англійською мовою з ідентифікаторами 250 та 252 відповідно.
Їхні назви перекладаються, якщо у вашій вікі використовується інша мова. Full list.
Ви можете налаштувати їхні назви або ідентифікатори: Створення просторів назв вручну і встановити їхні ідентифікатори у Manual:LocalSettings.php за допомогою $wgProofreadPageNamespaceIds global. Ви зробите щось на кшталт:
define( 'NS_PROOFREAD_PAGE', 250);
define( 'NS_PROOFREAD_PAGE_TALK', 251);
define( 'NS_PROOFREAD_INDEX', 252);
define( 'NS_PROOFREAD_INDEX_TALK', 253);
$wgExtraNamespaces[NS_PROOFREAD_PAGE] = 'Page';
$wgExtraNamespaces[NS_PROOFREAD_PAGE_TALK] = 'Page_talk';
$wgExtraNamespaces[NS_PROOFREAD_INDEX] = 'Index';
$wgExtraNamespaces[NS_PROOFREAD_INDEX_TALK] = 'Index_talk';
$wgProofreadPageNamespaceIds = array(
'index' => NS_PROOFREAD_INDEX,
'page' => NS_PROOFREAD_PAGE
);
Налаштування ідентифікатора простору імен не рекомендується і може не підтримуватися у майбутньому.
Конфігурація
- Для того, щоб використовувати систему якості сторінка, необхідно створити п'ять категорій. Назви цих категорій повинні бути визначені в межах від MediaWiki:Proofreadpage_quality0_category до MediaWiki:Proofreadpage_quality4_category.
- Переконайтеся, що ви встановили Extension:ParserFunctions
Конфігурація простору імен покажчиків
Для більш детальної інформації див. Extension:Proofread Page/Index data configuration
- Для відображення індексних сторінок потрібно створити MediaWiki:Proofreadpage_index_template. Ця сторінка є шаблоном, який отримує в якості параметрів записи форми редагування.
- Вам потрібно створити MediaWiki:Proofreadpage_index_data_config.json, який містить конфігурацію індексної форми. Ця нова сторінка конфігурації перевизначає MediaWiki:Proofreadpage_index_attributes і MediaWiki:Proofreadpage_js_attributes.
Конфігурація являє собою масив властивостей JSON. Ось структура властивості в масиві, всі параметри не є обов'язковими, встановлюються значення за замовчуванням:
{
"ID": { //id of the metadata (first parameter of proofreadpage_index_attributes)
"type": "string", //the property type (for compatibility reasons the values have not to be of this type). Possibles values: string, number, page. If set, the newly set values should be valid according to the type (e.g. for a number a valid number, for a page an existing wiki page...)
"size": 1, //only for the type string : number of lines of the input (third parameter of proofreadpage_index_attributes)
"values": {"a":"A", "b":"B","c":"C", "d":"D"}, //an array values : label that list the possible values (for compatibility reasons the stored values have not to be one of these)
"default": "", //the default value
"header": false, //add the property to MediaWiki:Proofreadpage_header_template template (true is equivalent to being listed in proofreadpage_js_attributes)
"label": "ID", //the label in the form (second parameter of proofreadpage_index_attributes)
"help": "", //a short help text
"delimiter": [], //list of delimiters between two part of values. By example ["; ", " and "] for strings like "J. M. Dent; E. P. Dutton and A. D. Robert"
"data": "" //proofreadpage's metadata type that the property is equivalent to
}
}
Параметр data може мати значення for: "type", "language", "title", "author", "translator", "illustrator", "editor", "school", "year", "publisher", "place", "progress"
Розділювач сторінок
Розширення ставить роздільник між кожною виключеною сторінкою і наступною, який визначається значенням wgProofreadPagePageSeparator
.
Значення за замовчуванням -  
(пробіл).
Встановіть wgProofreadPagePageSeparator = ""
, щоб приховати роздільник.
З'єднання слів через дефіс на різних сторінках
Коли слово переноситься через дефіс між сторінками, розширення з'єднує дві половини слова.
Приклад: "іс-" і "торія" стає "історія".
Символ "з'єднувач" визначається wgProofreadPagePageJoiner
і за замовчуванням дорівнює "-" (символ ASCII дефіс).
Налаштування тегування змін (необов'язково)
Щоб налаштувати мітки змін, див. Мітки змін.
Використання
Створення першої сторінки (приклад з DjVu)
- Перед виконанням цих кроків переконайтеся, що ви виконали інструкції в Manual:How to use DjVu with MediaWiki .
- (коли і в якому просторі імен завантажено сам DjVu-файл?)
- Створіть сторінку в просторі імен "Page" (або інтернаціоналізовану назву, якщо ви використовуєте неанглійську вікі). Наприклад, якщо ваш простір імен 'Page', створіть
Page:Carroll - Alice's Adventures in Wonderland.djvu
- Створіть відповідний файл для цієї сторінки commons:File:Carroll - Alice's Adventures in Wonderland.djvu (або встановіть Manual:$wgUseInstantCommons на
true
). - Створіть індексну сторінку
Index:Carroll - Alice's Adventures in Wonderland.djvu
- Вставте тег
<pagelist />
у поле Pages для візуалізації списку сторінок
- Вставте тег
- Щоб відредагувати сторінку 5 книги, перейдіть на 'Page:Carroll - Alice's Adventures in Wonderland/5' і натисніть "Редагувати"
Синтаксис
Це розширення вводить наступні теги:
<pages>
, <pagelist>
Примітки
- ↑ Оскільки сторінки не знаходяться в основному просторі імен, вони не враховуються при статистичному підрахунку текстових одиниць.
Див. також
- Розділи
- Index data configuration
- Change tagging
- Lua library reference
- Page viewer
- Edit-in-Sequence — Нова система (з 2022 року) для коректури без необхідності перезавантажувати всю сторінку.
- Roadmap of the development
- API
- Metadata API — Підмодуль
proofread
мета-модуль - Proofread properties API — Властивості окремих сторінок, пов'язані з коректурою
- Index data API — Доступ до даних індексних сторінок (полів та категорій)
- Index pagination API — Перелік сторінок у заданому індексі
- Metadata API — Підмодуль
- Manual:How to use DjVu with MediaWiki
- PdfHandler — Додано підтримку PDF до Proofread Page
- Поточний повний опис та інструкції (англійською мовою) можна знайти за посиланням: s:Help:Proofread
- Статистику використання можна знайти тут: https://phetools.toolforge.org/statistics.php
- Список завдань та запитів від спільноти на доопрацювання
- Наразі пишеться загальнодоступний посібник користувача: Довідка:Розширення:ProofreadPage
- MediaWiki:OCR.js - сценарій розпізнавання тексту
Це розширення використовується в одному або декількох проєктах Вікімедіа. Це, мабуть, означає, що розширення стабільне і працює досить добре, щоб його могли використовувати веб-сайти з великим трафіком. Шукайте назву цього розширення у файлах конфігурації Wikimedia CommonSettings.php та InitialiseSettings.php, щоб побачити, де це встановлене. Повний перелік розширень, встановлених на певній вікі, можна переглянути на сторінці Special:Version вікі. |
Це розширення включено до таких вікі-ферм/хостів та/або пакетів: Це не авторитетний список. Деякі вікі-ферми/хости та/або пакунки можуть містити це розширення, навіть якщо вони не вказані тут. Завжди звертайтеся до своїх вікі-ферм/хостів або комплекту для підтвердження. |