Příručka:Zálohování wiki

This page is a translated version of the page Manual:Backing up a wiki and the translation is 100% complete.

Je důležité pravidelně zálohovat svou wiki (data a soubory). Tato stránka poskytuje přehled procesu zálohování pro typickou wiki MediaWiki. Pravděpodobně budete chtít vymyslet vlastní zálohovací skripty nebo plán, který bude vyhovovat velikosti vaší wiki a vašim individuálním potřebám.

Nápověda:Export je rychlý a snadný způsob, jak uložit všechny stránky na vaší wiki.

Přehled

MediaWiki ukládá důležitá data na dvou místech:

Databáze
Stránky a jejich obsah, uživatelé a jejich preference, metadata, vyhledávací index atd.
Systém souborů
Konfigurační soubory softwaru, vlastní vzhledy, rozšíření, obrázky (včetně smazaných obrázků) atd.

Před vytvořením zálohy zvažte nastavení wiki pouze pro čtení – viz $wgReadOnly . Tím zajistíte, že všechny části vaší zálohy jsou konzistentní (některá z vašich nainstalovaných rozšíření mohou přesto zapisovat data).

Přístup k souborům

Budete muset zvolit způsob přenosu souborů ze serveru, kde jsou:

Hostitelská společnost může poskytnout rozhraní správce souborů prostřednictvím webového prohlížeče. Ověřte si u svého poskytovatele.

Databáze

Většina důležitých dat na wiki je uložena v databázi. Pokud je vaše wiki v současné době offline, může být její databáze zálohována jednoduše zkopírováním souboru databáze.

Při použití výchozího backendu MySQL nebo MariaDB lze databázi vypsat do souboru skriptu, který lze později použít k opětovnému vytvoření databáze a všech dat v ní od začátku.

MySQL

Automysqlbackup

Podívejte se na balíček na Debianu:

$ apt show automysqlbackup
[...]
Description: automysqlbackup creates backup every day, week and month for all of your MySQL database, to a configured folder. There's nothing to do but to install this package, and you'll rest assured that you have a way to go back in the history of your database.
[...]

Nainstalujte balíček:

# apt install automysqlbackup

Všechny vaše databáze budou uloženy v /var/lib/automysqlbackup/:

$ find /var/lib/automysqlbackup/
/var/lib/automysqlbackup/
/var/lib/automysqlbackup/weekly
/var/lib/automysqlbackup/weekly/my_wiki
/var/lib/automysqlbackup/weekly/my_wiki/my_wiki_week.18.2016-05-07_15h32m.sql.gz
/var/lib/automysqlbackup/monthly
/var/lib/automysqlbackup/daily
/var/lib/automysqlbackup/daily/my_wiki

Ruční zálohování:

# automysqlbackup

Obnovení databáze:

gunzip < /var/lib/automysqlbackup/weekly/my_wiki/my_wiki_week.18.2016-05-07_15h32m.sql.gz|mysql -uUSER -pPASSWORD my_wiki

Další distribuce naleznete na Sourceforge.

Mysqldump z příkazového řádku

Nejpohodlnější způsob, jak vytvořit soubor výpisu databáze, kterou chcete zálohovat, je použít standardní nástroj pro výpis paměti MySQL mysqldump z příkazového řádku. Ujistěte se, že máte správné parametry, jinak můžete mít potíže s obnovou databáze. V závislosti na velikosti databáze může mysqldump trvat značnou dobu.

Nejprve vložte následující řádek do LocalSettings.php

$wgReadOnly = 'Dumping Database, Access will be restored shortly';

toto lze odstranit, jakmile je výpis dokončen.

Příklad příkazu ke spuštění v prostředí Linux/UNIX:

mysqldump -h hostname -u userid -p --default-character-set=charset dbname > backup.sql

Podle potřeby nahraďte hostname (název hostitele), userid (ID uživatele), charset (cokoli) a dbname (jméno databáze). Všechny čtyři lze nalézt ve vašem souboru LocalSettings.php (LSP). hostname lze nalézt pod $wgDBserver . Ve výchozím nastavení je localhost. userid lze nalézt pod $wgDBuser , charset lze nalézt pod $wgDBTableOptions , kde je uvedeno po DEFAULT CHARSET=. Pokud není zadáno charset, mysqldump pravděpodobně použije výchozí utf8, nebo pokud používáte starší verzi MySQL, latin1. Zatímco dbname lze nalézt pod $wgDBname . Po spuštění tohoto řádku z příkazového řádku mysqldump budete vyzváni k zadání hesla serveru (které lze nalézt podle stránky Příručka:$wgDBpassword v LSP).

Úplný seznam parametrů příkazového řádku naleznete na mysqldump.

Výstup z mysqldump může být pro menší výstupní soubor místo toho přesměrován do gzip a to následovně

mysqldump -h hostname -u userid -p dbname | gzip > backup.sql.gz

Některé novější verze MySQL mohou zobrazovat chybu o tabulkových prostorech a oprávnění PROCESS. MediaWiki tabulkové prostory nepoužívá. Řešením je přidat do příkazu volbu --no-tablespaces:

mysqldump --no-tablespaces -h hostname -u userid -p dbname | gzip > backup.sql.gz

K vytvoření výstupu XML lze místo toho použít podobný příkaz mysqldump a to zahrnutím parametru --xml.

mysqldump -h hostname -u userid -p --xml dbname > backup.xml

a pro komprimaci souboru pomocí svislítka do gzip

mysqldump -h hostname -u userid -p --xml dbname | gzip > backup.xml.gz

Další možnosti, které byste měli zvážit při zálohování s mysqldump, zahrnují následující.

Další možnosti na Mysqldump
Volba Popis
--default-character-set Zadá výchozí znakovou sadu
--no-tablespaces Do výstupu nepište příkazy CREATE LOGFILE GROUP nebo CREATE TABLESPACE
--single-transaction Před uložením dat ze serveru vydá výpis BEGIN SQL
--triggers Spouštěče výpisu pro každou tabulku výpisu
--routines Vypíše uložené rutiny (procedury a funkce) z uložených databází
--events Výpis událostí z výpisů databází
--add-drop-table Přidá výpis DROP DATABASE před každý výpis CREATE DATABASE
--create-options Zahrne do příkazů CREATE TABLE možnosti tabulky specifické pro MySQL
--extended-insert Použije víceřádkovou syntaxi INSERT

Pokud nepoužíváte --single-transakci , měli byste zvážit použití možností --lock-tabulky a --add-zámky.

Kvůli neočekávané změně ve verzích MySQL 5.7.41 a 8.0.32 v únoru 2023 vyžadovala možnost transakce --single, aby měl uživatel zálohy oprávnění RELOAD nebo FLUSH_TABLES. Problém byl opraven ve verzích MySQL 5.7.42 a 8.0.33.roblém byl opraven ve verzích MySQL 5.7.42 a 8.0.33. Podrobnosti naleznete v MySQL Bug 109685 a Ubuntu Bug 2003866.

Nezapomeňte zálohovat další součásti systému souborů používané wiki, které mohou být vyžadovány během obnovy, jako jsou obrázky, logo, vzhledy a rozšíření.

Spuštění mysqldump s Cronem

Cron je časový plánovač úloh v počítačových operačních systémech podobných Unixu. Cron umožňuje uživatelům naplánovat úlohy (příkazy nebo skripty shellu) tak, aby se spouštěly pravidelně v určitých časech nebo datech.

Ukázkový příkaz, který můžete spustit z crontab, může vypadat takto:

nice -n 19 mysqldump -u $USER --password=$PASSWORD $DATABASE -c | nice -n 19 gzip -9 > ~/backup/wiki-$DATABASE-$(date '+%Y%m%d').sql.gz

nice -n 19 snižuje prioritu procesu.

Použijte platné hodnoty pro $USER, $PASSWORD a $DATABASE. Tím se zapíše záložní soubor s vloženým dnem v týdnu v názvu souboru, takže budete mít pohyblivou sadu záloh. Pokud chcete uložit i soubory a přípony, možná budete chtít použít toto.

  Varování: Nepokoušejte se zálohovat svou databázi MediaWiki pomocí mysqlhotcopy. Formát tabulky používaný MediaWiki nelze tímto nástrojem zálohovat a v tichosti selže!

Pokud chcete přidat tento úkol v Cronu přes Cpanel, musíte se vyhnout znaku "%"

/usr/bin/mysqldump -u $USER --password=$PASSWORD $DATABASE -c | /bin/gzip > ~/backup/wiki-$DATABASE-$(date '+\%Y\%m\%d').sql.gz

nebo dostanete chybu:

/bin/sh: -c: line 0: unexpected EOF while looking for matching `''
/bin/sh: -c: line 1: syntax error: unexpected end of file

Spuštění mysqldump s Systemd

Systemd sjednocuje konfigurace služeb a ovládání. Časovače (timers) jsou systémové soubory jednotek, které řídí soubory služeb nebo události. Časovače lze použít jako alternativu ke cronu. Níže je uveden příklad souborů jednotek systemd a skriptu zálohování.

wiki-backup.timer

Následující časovač spouští službu zálohování wiki každé ráno v 5:10.

$ cat /etc/systemd/system/wiki-backup.timer

[Unit]
Description=Run the backup service once a day
Documentation=...

[Timer]
OnCalendar=*-*-* 05:10:00
RandomizedDelaySec=600
Persistent=true

[Install]
WantedBy=timers.target
wiki-backup.service

Když se spustí časovač zálohování wiki, spustí se služba. Služba spouští skript umístěný v /sbin.

$ cat /etc/systemd/system/wiki-backup.service

[Unit]
Description=Run the backup service once a day
Documentation=...

[Service]
Type=oneshot
User=root
ExecStart=/sbin/wiki-backup
wiki-backup script
$ cat /sbin/wiki-backup

#!/usr/bin/env bash

# Systemd adds random paths at times. Take full control of PATH.
PATH=/bin:/sbin:/usr/bin:/usr/sbin
export PATH

# Read the backup password from conf or ini Failed
wiki_password=...

# Fix the wiki tables just in case. This step produces a lot of noise,
# so send stdout to /dev/null.
if MYSQL_PWD="${wiki_password}" \
   mysqlcheck my_wiki --auto-repair --user=mwuser 1>/dev/null;
then
    echo "Repair wiki database ok"
else
    echo "Failed to repair wiki database"
    echo "Continuing anyways"
fi

# Disable the connection from Apache to MySQL for the dump
if ! systemctl stop apache2.service ;
then
    echo "Failed to stop Apache service"
    echo "Continuing anyways"
fi

# Lock option choice due to MySQL change at versions 5.7.41 and 8.0.32 in
# February 2023. See https://bugs.mysql.com/bug.php?id=109685 and
# https://bugs.launchpad.net/ubuntu/+source/mysql-5.7/+bug/2003866.
if mysql --version 2>&1 | grep -q -E 'mysql[[:space:]]+Ver 8\.0\.32'; then
   echo "Using MySQL --lock-tables --add-locks options"
   mysql_lock_opt="--lock-tables --add-locks"
else
   echo "Using MySQL --single-transaction option"
   mysql_lock_opt="--single-transaction"
fi

if MYSQL_PWD="${wiki_password}" \
   mysqldump --no-tablespaces \
     ${mysql_lock_opt} \
     --events --triggers --routines \
     --add-drop-table --create-options \
     --extended-insert \
     --default-character-set=utf8 \
     -u mwuser -h localhost my_wiki | gzip -q -v9 > /backup/wiki-backup.sql.gz ;
then
    echo "Dump wiki database ok"
else
    echo "Failed to dump wiki database"
    echo "Continuing anyways"
fi

# Re-enable connection from Apache to MySQL for the dump
if ! systemctl start apache2.service ;
then
    echo "Failed to start Apache service"
    echo "Continuing anyways"
fi

exit 0

Tabulky

Některé z tabulek mají různé stupně dočasnosti. Kvůli úspoře místa na disku (mimo gzipování), ačkoli tyto tabulky musí být přítomny ve správném výpisu, jejich data nikoli. Za určitých okolností však může nevýhoda nutnosti přestavět všechna tato data převážit úsporu místa na disku (například na velké wiki, kde je rychlost obnovy prvořadá).

Viz vlákno konference binární schéma mysql5 o tomto tématu.

Převod latinky-1 na UTF-8

Informace o tomto procesu naleznete v části stránky o aktualizaci. Další obecné informace o práci se znakovými sadami najdete také na diskusní stránce.

PostgreSQL

K zálohování databáze MediaWiki PostgreSQL můžete použít nástroj pg_dump. Například:

pg_dump mywiki > mywikidump.sql

vypíše databázi mywiki na mywikidump.sql.

Chcete-li obnovit výpis:

psql mywiki -f mywikidump.sql

Můžete také chtít vypsat globální informace, např. uživatelé databáze:

pg_dumpall --globals > postgres_globals.sql

SQLite

Pokud je vaše wiki v současné době offline, může být její databáze zálohována jednoduše zkopírováním souboru databáze. V opačném případě byste měli použít skript údržby: php maintenance/SqliteMaintenance.php --backup-to <backup file name>, který zajistí, že operace je přesná a neexistují žádné nesrovnalosti. Pokud vaše databáze není opravdu obrovská a server není pod silným zatížením, uživatelé editující wiki si nevšimnou ničeho jiného než krátkého zpoždění. Uživatelé, kteří právě čtou, si v žádném případě nic nevšimnou.

phpMyAdmin

Změňte svou wiki na pouze pro čtení přidáním $wgReadOnly = 'Site Maintenance'; do LocalSettings.php.

Najděte databázi wiki v LocalSettings.php. Zde je příklad toho, jak to vypadá v LocalSettings.php:

## Database settings
$wgDBtype           = "mysql";
$wgDBserver         = "localhost";
$wgDBname           = "sashtmax_mw19999";
$wgDBuser           = "sashtmax_mw19999";
$wgDBpassword       = "S7[88p]jJJ";
  1. Otevřete prohlížeč na svůj odkaz na phpadmin, přihlaste se, vyberte databázi wiki.
  2. Vyberte Export. Ujistěte se, že jsou zvýrazněny všechny položky pod Exportovat a ujistěte se, že je zvýrazněna Struktura (structure)(je důležité zachovat strukturu tabulky). Volitelně zaškrtněte Add DROP TABLE, chcete-li při importu odstranit existující reference. Ujistěte se, že jsou zaškrtnuta Data.
  3. Vyberte zipování.
  4. Poté klikněte na GO a uložte záložní soubor.[1]
  5. Odeberte $wgReadOnly = 'Site Maintenance'; z LocalSettings.php

Nezapomeňte také zálohovat součásti systému souborů wiki, které mohou být vyžadovány, např. obrázky, loga a rozšíření.

Externí odkazy

HeidiSQL (alternative to phpMyAdmin)

HeidiSQL je podobný phpMyAdmin, ale bez jakýchkoli omezení bezplatné verze phpMyAdmin. HeidiSQL vyžaduje přímé připojení k databázi, kde někteří hostitelé mohou nabízet pouze webová rozhraní (phpMyAdmin) k databázím chráněným firewallem.

Systém souborů

MediaWiki ukládá další součásti wiki do souborového systému.

Nejdůležitější z nich jsou:

  • LocalSettings.php
  • nahrané soubory v adresáři images/ (včetně smazaných souborů, miniatur a vykreslených matematických a SVG obrázků, pokud jsou použitelné).

Nejlepší metodou, jak je zálohovat, je umístit je do archivního souboru, jako je soubor .tar, který lze v případě potřeby zkomprimovat. V systému Windows lze použít aplikace jako WinZip nebo 7-zip.

Pro varianty Linuxu za předpokladu, že wiki je uložena v /srv/www/htdocs/wiki

tar zcvhf wikidata.tgz /srv/www/htdocs/wiki

Pokud používáte XAMPP, mělo by být možné zálohovat celou složku "wiki" v "htdocs".

Konfigurační soubory

LocalSettings.php je nejdůležitější z nich, ale wiki může mít také věci jako .htaccess nebo jiné konfigurační soubory webového serveru, které by měly být zálohovány.

Nahrané soubory

Soubory nahrané na wiki jsou standardně umístěny do adresáře images/, rozděleny do podadresářů, jako je images/8/8f. Existují také další adresáře, například images/archive/ a images/deleted/. To vše by mělo být zálohováno.

images/thumb/ lze zálohovat spolu se vším ostatním, ale lze je volitelně vyloučit, aby se ušetřilo místo pro zálohování. Tento adresář ukládá odvozené miniatury obrázků a dalších souborů. Obecně více náhledů na wiki soubor. Po obnovení ze zálohy budou tyto miniatury podle potřeby znovu vytvořeny (ačkoli v závislosti na $wgGenerateThumbnailOnParse to může být ruční proces).

Zálohování obsahu wiki (výpis XML)

Kromě výpisu databáze je také vhodné vytvořit výpis XML. XML výpisy obsahují obsah wiki (wiki stránky se všemi jejich revizemi), bez dat souvisejících s webem (neobsahují uživatelské účty, metadata obrázků, protokoly atd.).[2]

Je méně pravděpodobné, že výpisy XML způsobí problémy s kódováním znaků jako prostředku k rychlému přenosu velkého množství obsahu a mohou být snadno použity nástroji třetích stran, díky čemuž jsou výpisy XML dobrým záložním řešením. Váš hlavní výpis databáze se stane nepoužitelným.

Chcete-li vytvořit výpis XML, použijte nástroj příkazového řádku dumpBackup.php , který se nachází v adresáři maintenance vaší instalace MediaWiki. Další podrobnosti najdete na stránce Manual:dumpBackup.php .

Můžete také vytvořit výpis XML pro konkrétní sadu stránek online pomocí Special:Export, i když pokus o výpis velkého množství stránek přes toto rozhraní obvykle selže.

Chcete-li importovat výpis XML do wiki, použijte nástroj příkazového řádku importDump.php . Pro malou sadu stránek můžete také použít stránku Special:Import prostřednictvím vašeho prohlížeče (ve výchozím nastavení je tato možnost omezena na skupinu sysop).

Další informace získáte na stránce Manual:Importing XML dumps .

Bez shellového přístupu k serveru

MediaWiki Dump Generator

Pokud nemáte přístup k shellu, použijte skript dumpgenerator MediaWiki Dump Generator. Spouští se z příkazového řádku v terminálu.

Výpis XML může obsahovat celou nebo pouze nejnovější historii stránek. Výpis obrázků bude obsahovat všechny typy souborů s přidruženými popisy. Soubory siteinfo.json a SpecialVersion.html budou obsahovat informace o funkcích wiki, jako jsou nainstalovaná rozšíření a vzhledy. Informace o uživatelském účtu nebudou zachovány.

Úplné pokyny jsou k dispozici v úložišti GitHub Mediawiki Dump Generator MediaWiki Client Tools.

Viz také stránka Meta:Data dumps.

Skripty

  Varování: Používáte je na vlastní nebezpečí. Podívejte se na LocalSettings.php vaší wiki pro správnou znakovou sadu k použití, protože možná budete muset upravit skript tak, aby vyhovoval.
  • Neoficiální zálohovací skript od Flominatora. Vytvoří zálohu všech souborů a databáze s volitelnou rotací záloh. Shell script, last updated 2012.
  • Další [zálohovací skript https://github.com/samwilson/MediaWiki_Backup], který: Vypisuje DB, soubory (ve výchozím nastavení pouze obrázky, možnost zahrnout všechny soubory do instalace) a XML. Přepne web do režimu pouze pro čtení. Zálohuje časová razítka. Přečte znakovou sadu z LocalSettings. Skript není nutné upravovat pro každý web, který má být zálohován. Nerotuje (zatím) staré zálohy. Použití: backup.sh -d backup/directory -w installation/directory. Poskytuje také skript pro obnovení zálohy restore.sh -a backup/directory/dated_archive.tar.gz -w installation/directory. Shell skript, poslední aktualizace 2013.
  • User:Darizotas/MediaWiki Backup Script for Windows – skript pro zálohování instalace Windows MediaWiki. Poznámka: Nemá funkci obnovení. Shell skript, poslední aktualizace 2015.
  • Neoficiální zálohovací skript od User:Duesentrieb. Shell skript, poslední aktualizace 2016.
  • Skript pro pravidelné zálohování mw_backup. Tento skript bude provádět denní, týdenní a měsíční zálohy vaší databáze a adresáře obrázků, když je spuštěn jako denní úloha Cronu. PHP skript, poslední aktualizace 2017.
  • Další neoficiální záložní skript MediaWiki pro Windows od Lanthanis, který: Exportuje stránky specifikovaných jmenných prostorů jako soubor XML. Vypíše zadané databázové tabulky. Přidá další určené složky a soubory do záložního souboru ZIP. Lze použít s plánovačem úloh systému Windows. Poslední aktualizace 2019.
  • Nástroje WikiTeamu – pokud nemáte přístup na server (např. vaše wiki je na bezplatné wikifarmě), můžete pomocí nástrojů WikiTeamu vygenerovat výpis XML a výpis obrázků (viz některé uložené wiki). Skript Python 2.
  • MediaWiki Dump Generator - pokud nemáte přístup k serveru (např. vaše wiki je na bezplatné wikifarmě), můžete vygenerovat výpis XML a výpis obrázků pomocí dumpgeneratoru z Mediawiki Client Tools, skript Python 3, poslední aktualizace 2023.

Rozšíření

Související odkazy

Poznámky pod čarou

  1. Manual talk:Backing up a wiki#Ubuntu 10.10 - Step by Step Instructions
  2. XML výpisy jsou nezávislé struktury databáze a lze je importovat do budoucích (a dokonce i minulých) verzí MediaWiki.