Rozšíření:Proofread Page

This page is a translated version of the page Extension:Proofread Page and the translation is 100% complete.
Základní informace k tomuto rozšíření MediaWiki
Proofread Page
Stav rozšíření: stabilní
Zavádění Akce stránky , ContentHandler , Značka , API , Databáze
Popis The Proofread Page extension can render a book either as a column of OCR text beside a column of scanned images, or broken into its logical organization (such as chapters or poems) using transclusion.
Napsal(i) ThomasV (original author)
Tpt (current maintainer)
Nejnovější verze continuous updates
Zásady kompatibility Vydání snímků následuje MediaWiki. Hlavní vývojová větev není zpětně kompatibilní.
MediaWiki current master
PHP 7.0+
Změny v databázi Ano
Composer mediawiki/proofread-page
Tabulky pr_index
Licence GNU General Public License 2.0 nebo pozdější
Zdrojový kód
Nápověda Help:Extension:ProofreadPage
Příklad s:Index:Wind in the Willows (1913).djvu
Page, Index
  • $wgProofreadPagePageJoiner
  • $wgProofreadPagePageSeparator
  • $wgProofreadPageNamespaceIds
  • $wgProofreadPageEnableEditInSequence
  • $wgProofreadPageBookNamespaces
  • $wgProofreadPageUseStatusChangeTags
  • $wgProofreadPagePageSeparatorPlaceholder

  • pagequality
  • pagequality-admin
  • pagequality-validate
Přeložte rozšíření Proofread Page, používá-li lokalizaci z translatewiki.net
Problémy Otevřené úkoly · Nahlásit chybu

Proofread Page extension

2020 Coolest Tool
Award Winner

in the category
Impact


Rozšíření Proofread Page (Rozšíření: Stránka korektury) generuje stránku knihy buď jako:

  1. dva sloupce, kdy se na jedné straně zobrazuje textový obsah, pokud bylo aplikováno OCR, a vedle něj obrázek naskenovaného originálu nebo
  2. zalomenou do kapitol či lépe bloků, přičemž textový obsah na stránce MediaWiki je zalomen pod obrázkem dokumentu (přes transkluzi - zahrnutí části nebo celého elektronického dokumentu do jednoho nebo více dalších dokumentů pomocí hypertextového odkazu).

Rozšíření je navrženo tak, aby umožnilo snadné porovnání textu s digitalizovaným originálem.

Textový obsah dokáže zobrazit několika různými způsoby, aniž by při tom docházelo k jeho duplikování.[1]

Použití

Toto rozšíření je nainstalováno na všechny wikiny Wikisource. O syntaxi se více dozvíte na stránce dokumentace Wikisource Proofread Page. Bylo také použito na Bibliowiki.

Co potřebujete a co je doporučeno

  • Přístup k příkazovému řádku je vyžadován, pokud selže spuštění aktualizačního skriptu (maintenance/update.php) z webového prohlížeče (dokumentace zde a zde).
  • Pokud chcete používat dokumenty v DjVu formátu (volitelný a doporučený)(otevřený souborový formát vyvinutý pro ukládání naskenovaných dokumentů), stačí v nastavení povolit, aby se používal nativní (v nezměněném stavu) DjVu handler (speciální systémový software pro obsluhu událostí). Viz též Manual:How to use DjVu with MediaWiki .
  • Kromě toho, se vám při použití ProofreadPage budou hodit i následující rozšíření:


Instalace

Rozšíření

  • Stáhněte soubor/y a vložte je do adresáře pojmenovaného ProofreadPage ve vaší složce extensions/.
    Vývojáři a přispěvatelé kódu by si místo toho měli nainstalovat rozšíření from Git pomocí:cd extensions/
    git clone https://gerrit.wikimedia.org/r/mediawiki/extensions/ProofreadPage
  • Na konec vašeho souboru LocalSettings.php přidejte následující kód:
    wfLoadExtension( 'ProofreadPage' );
    
  • Spusťte aktualizační skript, který automaticky provede všechny nezbytné databázové změny, jaké rozšíření vyžaduje.
  •   Dokončeno – Přejděte na stránku Special:Version vaší wiki a zkontrolujte, zda bylo rozšíření úspěšně nainstalováno.

Generování náhledů

Rozšíření odkazuje přímo na miniatury obrázků, které často neexistují. Musíte zachytit chybu 404 a vygenerovat chybějící miniatury. Můžete to udělat pomocí některého z těchto řešení:

  • Nastavte Apache RewriteRule v .htaccess na thumb.php pro chybějící miniatury:
    RewriteEngine On
    RewriteCond %{REQUEST_FILENAME} !-f
    RewriteCond %{REQUEST_FILENAME} !-d
    RewriteRule ^/w/images/thumb/[0-9a-f]/[0-9a-f][0-9a-f]/([^/]+)/page([0-9]+)-?([0-9]+)px-.*$ /w/thumb.php?f=$1&p=$2&w=$3 [L,QSA]
  • nebo nastavte popisovač Apache 404 na thumb-handler na Wikimedii. Toto je obecný obslužný program 404 s kódem specifickým pro Wikimedii, ne generátor miniatur.
    ErrorDocument 404 /w/extensions/upload-scripts/404.php
  • U MediaWiki >= 1,20 můžete jednoduše přesměrovat na thumb_handler.php:
    RewriteEngine On
    RewriteCond %{REQUEST_FILENAME} !-f
    RewriteCond %{REQUEST_FILENAME} !-d
    RewriteRule ^/w/images/thumb/[0-9a-f]/[0-9a-f][0-9a-f]/([^/]+)/page([0-9]+)-?([0-9]+)px-.*$ /w/thumb_handler.php [L,QSA]
  • nebo na apache2.conf:
    ErrorDocument 404 /w/thumb_handler.php
  Varování: V adresáři images je soubor .htaccess, který může narušovat jakákoli pravidla .htaccess, která instalujete.

Pokud narazíte na problém podobný následujícímu:

  • phab:T301291 – Soubory PDF a DjVu na Commons se nepodařilo zpracovat (žádné miniatury, nula stránek), ale jinak platné
  • phab:T298417 – Neodstraněné soubory DjVu zobrazují nesprávná metadata: Velikost 0x0, žádné informace o čísle stránky
  • phab:T299521 – Soubor PDF má v Commons velikost obrázku 0x0 po nahrání nové verze, když je číslo stránky správné

Zkuste následující kroky:

  1. oprava miniatur pro soubory DjVu jádra MediaWiki (pro PDF použijte mimetype application/pdf)
    php maintenance/refreshImageMetadata.php --verbose --mime image/vnd.djvu --force
    
  2. potřebné pro aktualizaci informací o počtu stránek z Special:IndexPages
    php maintenance/refreshLinks.php --namespace 252
    

Jmenné prostory

ProofreadPage zakládá při instalaci dva uživatelsky definované jmenné prostory, v angličtině pojmenované "Page" a "Index", které mají id 250 a 252.

Pokud vaše wiki používá jako výchozí jiný jazyk než angličtinu, budou jejich názvy přeložené. Úplný seznam.

Názvy těchto jmenných prostorů i jejich ID můžete změnit: Vytvořte si vlastní jmenné prostory v konfiguračním souboru Příručka:LocalSettings.php a nastavte jim ID, jaké vám vyhovuje, přes globání proměnnou $wgProofreadPageNamespaceIds. Váš kód v konfiguraci pak bude vypadat asi takto:

define( 'NS_PROOFREAD_PAGE', 250);
define( 'NS_PROOFREAD_PAGE_TALK', 251);
define( 'NS_PROOFREAD_INDEX', 252);
define( 'NS_PROOFREAD_INDEX_TALK', 253);
$wgExtraNamespaces[NS_PROOFREAD_PAGE] = 'Page';
$wgExtraNamespaces[NS_PROOFREAD_PAGE_TALK] = 'Page_talk';
$wgExtraNamespaces[NS_PROOFREAD_INDEX] = 'Index';
$wgExtraNamespaces[NS_PROOFREAD_INDEX_TALK] = 'Index_talk';
$wgProofreadPageNamespaceIds = array(
    'index' => NS_PROOFREAD_INDEX,
    'page' => NS_PROOFREAD_PAGE
);

Vezměte ale na vědomí fakt, že si s tím můžete do budoucna komplikovat situaci, protože nelze vyloučit, že se metoda pro zakládání vlastních jmenných prostorů změní.

Konfigurace

Nastavení jmenného prostoru index

Další podrobnosti najdete na stránce Extension:Proofread Page/Index data configuration

Konfigurace je ve formátu JSON. Takto vypadá struktura pro jedno formulářové pole a jeho výchozí parametry. Pokud některý vynecháte, použije se výchozí hodnota:

{
  "ID": { //id of the metadata (first parameter of proofreadpage_index_attributes)
    "type": "string", //the property type (for compatibility reasons the values have not to be of this type). Possibles values: string, number, page. If set, the newly set values should be valid according to the type (e.g. for a number a valid number, for a page an existing wiki page...)
    "size": 1, //only for the type string : number of lines of the input (third parameter of proofreadpage_index_attributes)
    "values":  {"a":"A", "b":"B","c":"C", "d":"D"}, //an array values : label that list the possible values (for compatibility reasons the stored values have not to be one of these)
    "default": "", //the default value
    "header": false, //add the property to MediaWiki:Proofreadpage_header_template template (true is equivalent to being listed in proofreadpage_js_attributes)
    "label": "ID", //the label in the form (second parameter of proofreadpage_index_attributes)
    "help": "", //a short help text
    "delimiter": [], //list of delimiters between two part of values. By example ["; ", " and "] for strings like "J. M. Dent; E. P. Dutton and A. D. Robert"
    "data": "" //proofreadpage's metadata type that the property is equivalent to
  }
}

Parametr data může obsahovat některou z následujících hodnot: "type", "language", "title", "author", "translator", "illustrator", "editor", "school", "year", "publisher", "place", "progress"

Oddělovač stránek

Rozšíření vkládá mezi transkludované (automatické vkládání obsahu do stránky s využitím dvojitých složených závorek "{{}}") stránky oddělovač, který je uložen v proměnné wgProofreadPagePageSeparator. Ve výchozím stavu obsahuje   (mezera). Chcete-li jej zcela potlačit, nastavte wgProofreadPagePageSeparator = "".

Spojení slov rozdělených mezi stránky

Přechází-li slovo rozdělené pomlčkou na další stránku, budou obě části spojeny do jednoho slova. Konkrétně: z "hi-" a "storie" bude "historie". Jako "spojovník" je interpretován znak uložený v proměnné wgProofreadPagePageJoiner, ve výchozím stavu je to '-' (znak ASCII spojovník).

Konfigurace změnových značek (volitelné)

Pokud chcete nastavit značky pro změnu, podívejte se na změny označení (change tagging).

Použití

Vytvoření první stránky (pro DjVu soubor)

  • Předtím, než budete pokračovat, zkontrolujte, jestli máte vaši konfiguraci nastavenou jak uvádí Manual:How to use DjVu with MediaWiki .
  • (kdy a v jakém jmenném prostoru je samotný soubor DjVu nahrán?)
  • Pokračujte založením stránky ve jmenném prostoru "Page" (jeho název se může pochopitelně lišit, pokud používáte jinou wiki než anglickou a máte intenacionalizované názvy jmenných prostorů). Pokud se váš jmenný prostor jmenuje 'Page', tak založte stránku Page:Carroll - Alice's Adventures in Wonderland.djvu.
  • Poté si do wiki nainstalujte soubor odpovídající této stránce commons:File:Carroll - Alice's Adventures in Wonderland.djvu (nebo si nastavte proměnnou Příručka:$wgUseInstantCommons na true).
  • Pro vložený soubor vytvořte indexovou stránku Index:Carroll - Alice's Adventures in Wonderland.djvu.
    • Do vstupního pole Pages (stránky) vložte tag ‎<pagelist />, aby se vám vygeneroval seznam odkazů na stránky.
  • Kliknete-li na číslo 5, které vede na stranu 'Page:Carroll - Alice's Adventures in Wonderland/5' a můžete začít stránku editovat.

Syntaxe

Toto rozšíření zavádí následující tagy: ‎<pages>, ‎<pagelist>

Poznámky

  1. Protože stránky nejsou umístěny v hlavním jmenném prostoru, nemohou být zahrnuty do celkové součtu, ve statistice zpracovaných textových jednotek.

Související odkazy