Rozšíření:Proofread Page
Rozšíření Proofread Page (Rozšíření: Stránka korektury) generuje stránku knihy buď jako:
- dva sloupce, kdy se na jedné straně zobrazuje textový obsah, pokud bylo aplikováno OCR, a vedle něj obrázek naskenovaného originálu nebo
- zalomenou do kapitol či lépe bloků, přičemž textový obsah na stránce MediaWiki je zalomen pod obrázkem dokumentu (přes transkluzi - zahrnutí části nebo celého elektronického dokumentu do jednoho nebo více dalších dokumentů pomocí hypertextového odkazu).
Rozšíření je navrženo tak, aby umožnilo snadné porovnání textu s digitalizovaným originálem.
Textový obsah dokáže zobrazit několika různými způsoby, aniž by při tom docházelo k jeho duplikování.[1]
Použití
Toto rozšíření je nainstalováno na všechny wikiny Wikisource. O syntaxi se více dozvíte na stránce dokumentace Wikisource Proofread Page. Bylo také použito na Bibliowiki.
Co potřebujete a co je doporučeno
- Přístup k příkazovému řádku je vyžadován, pokud selže spuštění aktualizačního skriptu (maintenance/update.php) z webového prohlížeče (dokumentace zde a zde).
- Pokud chcete používat dokumenty v DjVu formátu (volitelný a doporučený)(otevřený souborový formát vyvinutý pro ukládání naskenovaných dokumentů), stačí v nastavení povolit, aby se používal nativní (v nezměněném stavu) DjVu handler (speciální systémový software pro obsluhu událostí). Viz též Manual:How to use DjVu with MediaWiki .
- Kromě toho, se vám při použití ProofreadPage budou hodit i následující rozšíření:
- LabeledSectionTransclusion (silně doporučeno)
- Cite (výchozí patička stránek obsahuje tag
<references />
- Poem
- PdfHandler (může vyžadovat doinstalování dalších balíčků, které rozšíří možnosti PHP) — přidává podporu pro PDF
- PagedTiffHandler
- ParserFunctions
- TemplateStyles (povoluje CSS specifické pro index)
- Scribunto (umožňuje korekturu Lua library)
Instalace
Rozšíření
- Stáhněte soubor/y a vložte je do adresáře pojmenovaného
ProofreadPage
ve vaší složceextensions/
.
Vývojáři a přispěvatelé kódu by si místo toho měli nainstalovat rozšíření from Git pomocí:cd extensions/
git clone https://gerrit.wikimedia.org/r/mediawiki/extensions/ProofreadPage - Na konec vašeho souboru LocalSettings.php přidejte následující kód:
wfLoadExtension( 'ProofreadPage' );
- Spusťte aktualizační skript, který automaticky provede všechny nezbytné databázové změny, jaké rozšíření vyžaduje.
- Dokončeno – Přejděte na stránku Special:Version vaší wiki a zkontrolujte, zda bylo rozšíření úspěšně nainstalováno.
Generování náhledů
Rozšíření odkazuje přímo na miniatury obrázků, které často neexistují. Musíte zachytit chybu 404 a vygenerovat chybějící miniatury. Můžete to udělat pomocí některého z těchto řešení:
- Nastavte Apache RewriteRule v .htaccess na thumb.php pro chybějící miniatury:
RewriteEngine On RewriteCond %{REQUEST_FILENAME} !-f RewriteCond %{REQUEST_FILENAME} !-d RewriteRule ^/w/images/thumb/[0-9a-f]/[0-9a-f][0-9a-f]/([^/]+)/page([0-9]+)-?([0-9]+)px-.*$ /w/thumb.php?f=$1&p=$2&w=$3 [L,QSA]
- nebo nastavte popisovač Apache 404 na thumb-handler na Wikimedii. Toto je obecný obslužný program 404 s kódem specifickým pro Wikimedii, ne generátor miniatur.
ErrorDocument 404 /w/extensions/upload-scripts/404.php
- U MediaWiki >= 1,20 můžete jednoduše přesměrovat na thumb_handler.php:
RewriteEngine On RewriteCond %{REQUEST_FILENAME} !-f RewriteCond %{REQUEST_FILENAME} !-d RewriteRule ^/w/images/thumb/[0-9a-f]/[0-9a-f][0-9a-f]/([^/]+)/page([0-9]+)-?([0-9]+)px-.*$ /w/thumb_handler.php [L,QSA]
- nebo na apache2.conf:
ErrorDocument 404 /w/thumb_handler.php
Pokud narazíte na problém podobný následujícímu:
- phab:T301291 – Soubory PDF a DjVu na Commons se nepodařilo zpracovat (žádné miniatury, nula stránek), ale jinak platné
- phab:T298417 – Neodstraněné soubory DjVu zobrazují nesprávná metadata: Velikost 0x0, žádné informace o čísle stránky
- phab:T299521 – Soubor PDF má v Commons velikost obrázku 0x0 po nahrání nové verze, když je číslo stránky správné
Zkuste následující kroky:
- oprava miniatur pro soubory DjVu jádra MediaWiki (pro PDF použijte mimetype
application/pdf
)php maintenance/refreshImageMetadata.php --verbose --mime image/vnd.djvu --force
- potřebné pro aktualizaci informací o počtu stránek z
Special:IndexPages
php maintenance/refreshLinks.php --namespace 252
Jmenné prostory
ProofreadPage zakládá při instalaci dva uživatelsky definované jmenné prostory, v angličtině pojmenované "Page" a "Index", které mají id 250 a 252.
Pokud vaše wiki používá jako výchozí jiný jazyk než angličtinu, budou jejich názvy přeložené. Úplný seznam.
Názvy těchto jmenných prostorů i jejich ID můžete změnit: Vytvořte si vlastní jmenné prostory v konfiguračním souboru Příručka:LocalSettings.php a nastavte jim ID, jaké vám vyhovuje, přes globání proměnnou $wgProofreadPageNamespaceIds. Váš kód v konfiguraci pak bude vypadat asi takto:
define( 'NS_PROOFREAD_PAGE', 250);
define( 'NS_PROOFREAD_PAGE_TALK', 251);
define( 'NS_PROOFREAD_INDEX', 252);
define( 'NS_PROOFREAD_INDEX_TALK', 253);
$wgExtraNamespaces[NS_PROOFREAD_PAGE] = 'Page';
$wgExtraNamespaces[NS_PROOFREAD_PAGE_TALK] = 'Page_talk';
$wgExtraNamespaces[NS_PROOFREAD_INDEX] = 'Index';
$wgExtraNamespaces[NS_PROOFREAD_INDEX_TALK] = 'Index_talk';
$wgProofreadPageNamespaceIds = array(
'index' => NS_PROOFREAD_INDEX,
'page' => NS_PROOFREAD_PAGE
);
Vezměte ale na vědomí fakt, že si s tím můžete do budoucna komplikovat situaci, protože nelze vyloučit, že se metoda pro zakládání vlastních jmenných prostorů změní.
Konfigurace
- Aby bylo možné použít systém kvality stránky, je nutné vytvořit pět kategorií. Názvy těchto kategorií musí být definovány v MediaWiki:Proofreadpage_quality0_category a MediaWiki:Proofreadpage_quality4_category.
- Ujistěte se, že máte nainstalováno Rozšíření:ParserFunctions .
Nastavení jmenného prostoru index
Další podrobnosti najdete na stránce Extension:Proofread Page/Index data configuration
- Aby se vám vygenerovala indexová stránka, musíte nejprve vytvořit stránku MediaWiki:Proofreadpage_index_template. Tato stránka je ve své podstatě šablona, jejíž parametry vyplňujete prostřednictvím editačního formuláře.
- Nastavení jednotlivých položek formuláře se provádí přes stránku MediaWiki:Proofreadpage_index_data_config.json, kterou musíte vytvořit. Nastavení této stránky přepisuje obsah stránek MediaWiki:Proofreadpage_index_attributes a MediaWiki:Proofreadpage_js_attributes, přes které se nastavení dělalo dříve.
Konfigurace je ve formátu JSON. Takto vypadá struktura pro jedno formulářové pole a jeho výchozí parametry. Pokud některý vynecháte, použije se výchozí hodnota:
{
"ID": { //id of the metadata (first parameter of proofreadpage_index_attributes)
"type": "string", //the property type (for compatibility reasons the values have not to be of this type). Possibles values: string, number, page. If set, the newly set values should be valid according to the type (e.g. for a number a valid number, for a page an existing wiki page...)
"size": 1, //only for the type string : number of lines of the input (third parameter of proofreadpage_index_attributes)
"values": {"a":"A", "b":"B","c":"C", "d":"D"}, //an array values : label that list the possible values (for compatibility reasons the stored values have not to be one of these)
"default": "", //the default value
"header": false, //add the property to MediaWiki:Proofreadpage_header_template template (true is equivalent to being listed in proofreadpage_js_attributes)
"label": "ID", //the label in the form (second parameter of proofreadpage_index_attributes)
"help": "", //a short help text
"delimiter": [], //list of delimiters between two part of values. By example ["; ", " and "] for strings like "J. M. Dent; E. P. Dutton and A. D. Robert"
"data": "" //proofreadpage's metadata type that the property is equivalent to
}
}
Parametr data může obsahovat některou z následujících hodnot: "type", "language", "title", "author", "translator", "illustrator", "editor", "school", "year", "publisher", "place", "progress"
Oddělovač stránek
Rozšíření vkládá mezi transkludované (automatické vkládání obsahu do stránky s využitím dvojitých složených závorek "{{}}") stránky oddělovač, který je uložen v proměnné wgProofreadPagePageSeparator
.
Ve výchozím stavu obsahuje  
(mezera).
Chcete-li jej zcela potlačit, nastavte wgProofreadPagePageSeparator = ""
.
Spojení slov rozdělených mezi stránky
Přechází-li slovo rozdělené pomlčkou na další stránku, budou obě části spojeny do jednoho slova.
Konkrétně: z "hi-" a "storie" bude "historie".
Jako "spojovník" je interpretován znak uložený v proměnné wgProofreadPagePageJoiner
, ve výchozím stavu je to '-' (znak ASCII spojovník).
Konfigurace změnových značek (volitelné)
Pokud chcete nastavit značky pro změnu, podívejte se na změny označení (change tagging).
Použití
Vytvoření první stránky (pro DjVu soubor)
- Předtím, než budete pokračovat, zkontrolujte, jestli máte vaši konfiguraci nastavenou jak uvádí Manual:How to use DjVu with MediaWiki .
- (kdy a v jakém jmenném prostoru je samotný soubor DjVu nahrán?)
- Pokračujte založením stránky ve jmenném prostoru "Page" (jeho název se může pochopitelně lišit, pokud používáte jinou wiki než anglickou a máte intenacionalizované názvy jmenných prostorů). Pokud se váš jmenný prostor jmenuje 'Page', tak založte stránku
Page:Carroll - Alice's Adventures in Wonderland.djvu
. - Poté si do wiki nainstalujte soubor odpovídající této stránce commons:File:Carroll - Alice's Adventures in Wonderland.djvu (nebo si nastavte proměnnou Příručka:$wgUseInstantCommons na
true
). - Pro vložený soubor vytvořte indexovou stránku
Index:Carroll - Alice's Adventures in Wonderland.djvu
.- Do vstupního pole Pages (stránky) vložte tag
<pagelist />
, aby se vám vygeneroval seznam odkazů na stránky.
- Do vstupního pole Pages (stránky) vložte tag
- Kliknete-li na číslo 5, které vede na stranu 'Page:Carroll - Alice's Adventures in Wonderland/5' a můžete začít stránku editovat.
Syntaxe
Toto rozšíření zavádí následující tagy:
<pages>
, <pagelist>
Poznámky
- ↑ Protože stránky nejsou umístěny v hlavním jmenném prostoru, nemohou být zahrnuty do celkové součtu, ve statistice zpracovaných textových jednotek.
Související odkazy
- Oddělení
- Index data configuration
- Change tagging
- Lua library reference
- Page viewer
- Edit-in-Sequence — Nový systém (od roku 2022) pro korektury bez nutnosti znovu načítat celou stránku.
- Roadmap of the development
- API
- Metadata API —
proofread
submodul meta - Proofread properties API — Vlastnosti jednotlivých stránek související s korekturou
- Index data API — Přístup k datům indexových stránek (pole a kategorie)
- Index pagination API — Seznam stránek v daném indexu
- Metadata API —
- Manual:How to use DjVu with MediaWiki
- PdfHandler — Umožňuje použít Proofread Page i na soubory v PDF formátu
- Aktuální úplný popis a pokyny (v angličtině) najdete na: s:Help:Proofread
- Statistiky pro Wikisource najdete zde: https://phetools.toolforge.org/statistics.php
- Seznam úkolů a seznam požadavků na funkce z komunity
- Uživatelská příručka ve pro veřejnou doménu: Help:Extension:ProofreadPage
- MediaWiki:OCR.js - skript OCR
Toto rozšíření se používá na jednom nebo více projektech Wikimedie. Pravděpodobně to znamená, že rozšíření je stabilní a funguje dostatečně dobře, aby jej mohly používat weby s tak vysokou návštěvností. Vyhledejte tento název rozšíření v konfiguračních souborech CommonSettings.php a InitialiseSettings.php Wikimedie, abyste viděli, kde je nainstalováno. Úplný seznam rozšíření nainstalovaných na konkrétní wiki lze vidět na stránce wiki Special:Version. |
Toto rozšíření je zahrnuto v následujících wiki farmách/hostitelích a/nebo balíčcích: Toto není autoritativní seznam. Některé wiki farmy/hostitelé a/nebo balíčky mohou toto rozšíření obsahovat, i když zde nejsou uvedeny. Pro potvrzení se vždy obraťte na své wiki farmy/hostitele nebo balíček. |