Příručka:Zálohování wiki
Je důležité pravidelně zálohovat svou wiki (data a soubory). Tato stránka poskytuje přehled procesu zálohování pro typickou wiki MediaWiki. Pravděpodobně budete chtít vymyslet vlastní zálohovací skripty nebo plán, který bude vyhovovat velikosti vaší wiki a vašim individuálním potřebám.
Přehled
MediaWiki ukládá důležitá data na dvou místech:
- Databáze
- Stránky a jejich obsah, uživatelé a jejich preference, metadata, vyhledávací index atd.
- Systém souborů
- Konfigurační soubory softwaru, vlastní vzhledy, rozšíření, obrázky (včetně smazaných obrázků) atd.
Před vytvořením zálohy zvažte nastavení wiki pouze pro čtení – viz $wgReadOnly . Tím zajistíte, že všechny části vaší zálohy jsou konzistentní (některá z vašich nainstalovaných rozšíření mohou přesto zapisovat data).
Přístup k souborům
Budete muset zvolit způsob přenosu souborů ze serveru, kde jsou:
- Nesoukromá data můžete jednoduše publikovat na archive.org nebo v adresáři
dumps/
vašeho webového serveru. - SCP (nebo WinSCP), SFTP/FTP nebo jakýkoli jiný protokol přenosu, který si vyberete.
Hostitelská společnost může poskytnout rozhraní správce souborů prostřednictvím webového prohlížeče. Ověřte si u svého poskytovatele.
Databáze
Většina důležitých dat na wiki je uložena v databázi. Pokud je vaše wiki v současné době offline, může být její databáze zálohována jednoduše zkopírováním souboru databáze.
Při použití výchozího backendu MySQL nebo MariaDB lze databázi vypsat do souboru skriptu, který lze později použít k opětovnému vytvoření databáze a všech dat v ní od začátku.
MySQL
Automysqlbackup
Podívejte se na balíček na Debianu:
$ apt show automysqlbackup
[...]
Description: automysqlbackup creates backup every day, week and month for all of your MySQL database, to a configured folder. There's nothing to do but to install this package, and you'll rest assured that you have a way to go back in the history of your database.
[...]
Nainstalujte balíček:
# apt install automysqlbackup
Všechny vaše databáze budou uloženy v /var/lib/automysqlbackup/:
$ find /var/lib/automysqlbackup/
/var/lib/automysqlbackup/
/var/lib/automysqlbackup/weekly
/var/lib/automysqlbackup/weekly/my_wiki
/var/lib/automysqlbackup/weekly/my_wiki/my_wiki_week.18.2016-05-07_15h32m.sql.gz
/var/lib/automysqlbackup/monthly
/var/lib/automysqlbackup/daily
/var/lib/automysqlbackup/daily/my_wiki
Ruční zálohování:
# automysqlbackup
Obnovení databáze:
gunzip < /var/lib/automysqlbackup/weekly/my_wiki/my_wiki_week.18.2016-05-07_15h32m.sql.gz|mysql -uUSER -pPASSWORD my_wiki
Další distribuce naleznete na Sourceforge.
Mysqldump z příkazového řádku
Nejpohodlnější způsob, jak vytvořit soubor výpisu databáze, kterou chcete zálohovat, je použít standardní nástroj pro výpis paměti MySQL mysqldump z příkazového řádku. Ujistěte se, že máte správné parametry, jinak můžete mít potíže s obnovou databáze. V závislosti na velikosti databáze může mysqldump trvat značnou dobu.
Nejprve vložte následující řádek do LocalSettings.php
$wgReadOnly = 'Dumping Database, Access will be restored shortly';
toto lze odstranit, jakmile je výpis dokončen.
Příklad příkazu ke spuštění v prostředí Linux/UNIX:
mysqldump -h hostname -u userid -p --default-character-set=charset dbname > backup.sql
Podle potřeby nahraďte hostname
(název hostitele), userid
(ID uživatele), charset
(cokoli) a dbname
(jméno databáze).
Všechny čtyři lze nalézt ve vašem souboru LocalSettings.php (LSP).
hostname
lze nalézt pod $wgDBserver . Ve výchozím nastavení je localhost.
userid
lze nalézt pod $wgDBuser , charset
lze nalézt pod $wgDBTableOptions , kde je uvedeno po DEFAULT CHARSET=
.
Pokud není zadáno charset
, mysqldump pravděpodobně použije výchozí utf8, nebo pokud používáte starší verzi MySQL, latin1.
Zatímco dbname
lze nalézt pod $wgDBname .
Po spuštění tohoto řádku z příkazového řádku mysqldump budete vyzváni k zadání hesla serveru (které lze nalézt podle stránky Příručka:$wgDBpassword v LSP).
Úplný seznam parametrů příkazového řádku naleznete na mysqldump.
Výstup z mysqldump může být pro menší výstupní soubor místo toho přesměrován do gzip a to následovně
mysqldump -h hostname -u userid -p dbname | gzip > backup.sql.gz
Některé novější verze MySQL mohou zobrazovat chybu o tabulkových prostorech a oprávnění PROCESS.
MediaWiki tabulkové prostory nepoužívá.
Řešením je přidat do příkazu volbu --no-tablespaces
:
mysqldump --no-tablespaces -h hostname -u userid -p dbname | gzip > backup.sql.gz
K vytvoření výstupu XML lze místo toho použít podobný příkaz mysqldump a to zahrnutím parametru --xml.
mysqldump -h hostname -u userid -p --xml dbname > backup.xml
a pro komprimaci souboru pomocí svislítka do gzip
mysqldump -h hostname -u userid -p --xml dbname | gzip > backup.xml.gz
Další možnosti, které byste měli zvážit při zálohování s mysqldump, zahrnují následující.
Volba | Popis |
---|---|
--default-character-set | Zadá výchozí znakovou sadu |
--no-tablespaces | Do výstupu nepište příkazy CREATE LOGFILE GROUP nebo CREATE TABLESPACE |
--single-transaction | Před uložením dat ze serveru vydá výpis BEGIN SQL |
--triggers | Spouštěče výpisu pro každou tabulku výpisu |
--routines | Vypíše uložené rutiny (procedury a funkce) z uložených databází |
--events | Výpis událostí z výpisů databází |
--add-drop-table | Přidá výpis DROP DATABASE před každý výpis CREATE DATABASE |
--create-options | Zahrne do příkazů CREATE TABLE možnosti tabulky specifické pro MySQL |
--extended-insert | Použije víceřádkovou syntaxi INSERT |
Pokud nepoužíváte --single-transakci , měli byste zvážit použití možností --lock-tabulky a --add-zámky.
Kvůli neočekávané změně ve verzích MySQL 5.7.41 a 8.0.32 v únoru 2023 vyžadovala možnost transakce --single, aby měl uživatel zálohy oprávnění RELOAD nebo FLUSH_TABLES. Problém byl opraven ve verzích MySQL 5.7.42 a 8.0.33.roblém byl opraven ve verzích MySQL 5.7.42 a 8.0.33. Podrobnosti naleznete v MySQL Bug 109685 a Ubuntu Bug 2003866.
Nezapomeňte zálohovat další součásti systému souborů používané wiki, které mohou být vyžadovány během obnovy, jako jsou obrázky, logo, vzhledy a rozšíření.
Spuštění mysqldump s Cronem
Cron je časový plánovač úloh v počítačových operačních systémech podobných Unixu. Cron umožňuje uživatelům naplánovat úlohy (příkazy nebo skripty shellu) tak, aby se spouštěly pravidelně v určitých časech nebo datech.
Ukázkový příkaz, který můžete spustit z crontab, může vypadat takto:
nice -n 19 mysqldump -u $USER --password=$PASSWORD $DATABASE -c | nice -n 19 gzip -9 > ~/backup/wiki-$DATABASE-$(date '+%Y%m%d').sql.gz
nice -n 19
snižuje prioritu procesu.
Použijte platné hodnoty pro $USER
, $PASSWORD
a $DATABASE
. Tím se zapíše záložní soubor s vloženým dnem v týdnu v názvu souboru, takže budete mít pohyblivou sadu záloh. Pokud chcete uložit i soubory a přípony, možná budete chtít použít toto.
Pokud chcete přidat tento úkol v Cronu přes Cpanel, musíte se vyhnout znaku "%"
/usr/bin/mysqldump -u $USER --password=$PASSWORD $DATABASE -c | /bin/gzip > ~/backup/wiki-$DATABASE-$(date '+\%Y\%m\%d').sql.gz
nebo dostanete chybu:
/bin/sh: -c: line 0: unexpected EOF while looking for matching `'' /bin/sh: -c: line 1: syntax error: unexpected end of file
Spuštění mysqldump s Systemd
Systemd sjednocuje konfigurace služeb a ovládání. Časovače (timers) jsou systémové soubory jednotek, které řídí soubory služeb nebo události. Časovače lze použít jako alternativu ke cronu. Níže je uveden příklad souborů jednotek systemd a skriptu zálohování.
wiki-backup.timer
Následující časovač spouští službu zálohování wiki každé ráno v 5:10.
$ cat /etc/systemd/system/wiki-backup.timer [Unit] Description=Run the backup service once a day Documentation=... [Timer] OnCalendar=*-*-* 05:10:00 RandomizedDelaySec=600 Persistent=true [Install] WantedBy=timers.target
wiki-backup.service
Když se spustí časovač zálohování wiki, spustí se služba.
Služba spouští skript umístěný v /sbin
.
$ cat /etc/systemd/system/wiki-backup.service [Unit] Description=Run the backup service once a day Documentation=... [Service] Type=oneshot User=root ExecStart=/sbin/wiki-backup
wiki-backup script
$ cat /sbin/wiki-backup #!/usr/bin/env bash # Systemd adds random paths at times. Take full control of PATH. PATH=/bin:/sbin:/usr/bin:/usr/sbin export PATH # Read the backup password from conf or ini Failed wiki_password=... # Fix the wiki tables just in case. This step produces a lot of noise, # so send stdout to /dev/null. if MYSQL_PWD="${wiki_password}" \ mysqlcheck my_wiki --auto-repair --user=mwuser 1>/dev/null; then echo "Repair wiki database ok" else echo "Failed to repair wiki database" echo "Continuing anyways" fi # Disable the connection from Apache to MySQL for the dump if ! systemctl stop apache2.service ; then echo "Failed to stop Apache service" echo "Continuing anyways" fi # Lock option choice due to MySQL change at versions 5.7.41 and 8.0.32 in # February 2023. See https://bugs.mysql.com/bug.php?id=109685 and # https://bugs.launchpad.net/ubuntu/+source/mysql-5.7/+bug/2003866. if mysql --version 2>&1 | grep -q -E 'mysql[[:space:]]+Ver 8\.0\.32'; then echo "Using MySQL --lock-tables --add-locks options" mysql_lock_opt="--lock-tables --add-locks" else echo "Using MySQL --single-transaction option" mysql_lock_opt="--single-transaction" fi if MYSQL_PWD="${wiki_password}" \ mysqldump --no-tablespaces \ ${mysql_lock_opt} \ --events --triggers --routines \ --add-drop-table --create-options \ --extended-insert \ --default-character-set=utf8 \ -u mwuser -h localhost my_wiki | gzip -q -v9 > /backup/wiki-backup.sql.gz ; then echo "Dump wiki database ok" else echo "Failed to dump wiki database" echo "Continuing anyways" fi # Re-enable connection from Apache to MySQL for the dump if ! systemctl start apache2.service ; then echo "Failed to start Apache service" echo "Continuing anyways" fi exit 0
Tabulky
Některé z tabulek mají různé stupně dočasnosti. Kvůli úspoře místa na disku (mimo gzipování), ačkoli tyto tabulky musí být přítomny ve správném výpisu, jejich data nikoli. Za určitých okolností však může nevýhoda nutnosti přestavět všechna tato data převážit úsporu místa na disku (například na velké wiki, kde je rychlost obnovy prvořadá).
Viz vlákno konference binární schéma mysql5 o tomto tématu.
Převod latin-1 na UTF-8
Informace o tomto procesu naleznete v části stránky o aktualizaci. Další obecné informace o práci se znakovými sadami najdete také na diskusní stránce.
PostgreSQL
K zálohování databáze MediaWiki PostgreSQL můžete použít nástroj pg_dump
. Například:
pg_dump mywiki > mywikidump.sql
vypíše databázi mywiki
na mywikidump.sql.
Chcete-li obnovit výpis:
psql mywiki -f mywikidump.sql
Můžete také chtít vypsat globální informace, např. uživatelé databáze:
pg_dumpall --globals > postgres_globals.sql
SQLite
Pokud je vaše wiki v současné době offline, může být její databáze zálohována jednoduše zkopírováním souboru databáze.
V opačném případě byste měli použít skript údržby: php maintenance/SqliteMaintenance.php --backup-to <backup file name>
, který zajistí, že operace je přesná a neexistují žádné nesrovnalosti.
Pokud vaše databáze není opravdu obrovská a server není pod silným zatížením, uživatelé editující wiki si nevšimnou ničeho jiného než krátkého zpoždění.
Uživatelé, kteří právě čtou, si v žádném případě nic nevšimnou.
phpMyAdmin
Změňte svou wiki na pouze pro čtení přidáním $wgReadOnly = 'Site Maintenance';
do LocalSettings.php.
Najděte databázi wiki v LocalSettings.php. Zde je příklad toho, jak to vypadá v LocalSettings.php:
## Database settings
$wgDBtype = "mysql";
$wgDBserver = "localhost";
$wgDBname = "sashtmax_mw19999";
$wgDBuser = "sashtmax_mw19999";
$wgDBpassword = "S7[88p]jJJ";
- Otevřete prohlížeč na svůj odkaz na phpadmin, přihlaste se, vyberte databázi wiki.
- Vyberte Export. Ujistěte se, že jsou zvýrazněny všechny položky pod Exportovat a ujistěte se, že je zvýrazněna Struktura (structure) (je důležité zachovat strukturu tabulky). Volitelně zaškrtněte Add DROP TABLE, chcete-li při importu odstranit existující reference. Ujistěte se, že jsou zaškrtnuta Data.
- Vyberte zipování.
- Poté klikněte na GO a uložte záložní soubor.[1]
- Odeberte
$wgReadOnly = 'Site Maintenance';
z LocalSettings.php
Nezapomeňte také zálohovat součásti systému souborů wiki, které mohou být vyžadovány, např. obrázky, loga a rozšíření.
Externí odkazy
HeidiSQL (alternative to phpMyAdmin)
HeidiSQL je podobný phpMyAdmin, ale bez jakýchkoli omezení bezplatné verze phpMyAdmin. HeidiSQL vyžaduje přímé připojení k databázi, kde někteří hostitelé mohou nabízet pouze webová rozhraní (phpMyAdmin) k databázím chráněným firewallem.
Systém souborů
MediaWiki ukládá další součásti wiki do souborového systému.
Nejdůležitější z nich jsou:
- LocalSettings.php
- nahrané soubory v adresáři
images/
(včetně smazaných souborů, miniatur a vykreslených matematických a SVG obrázků, pokud jsou použitelné).
Nejlepší metodou, jak je zálohovat, je umístit je do archivního souboru, jako je soubor .tar
, který lze v případě potřeby zkomprimovat. V systému Windows lze použít aplikace jako WinZip nebo 7-zip.
Pro varianty Linuxu za předpokladu, že wiki je uložena v /srv/www/htdocs/wiki
tar zcvhf wikidata.tgz /srv/www/htdocs/wiki
Pokud používáte XAMPP, mělo by být možné zálohovat celou složku "wiki" v "htdocs".
Konfigurační soubory
LocalSettings.php je nejdůležitější z nich, ale wiki může mít také věci jako .htaccess
nebo jiné konfigurační soubory webového serveru, které by měly být zálohovány.
Nahrané soubory
Soubory nahrané na wiki jsou standardně umístěny do adresáře images/
, rozděleny do podadresářů, jako je images/8/8f
.
Existují také další adresáře, například images/archive/
a images/deleted/
.
To vše by mělo být zálohováno.
images/thumb/
lze zálohovat spolu se vším ostatním, ale lze je volitelně vyloučit, aby se ušetřilo místo pro zálohování.
Tento adresář ukládá odvozené miniatury obrázků a dalších souborů. Obecně více náhledů na wiki soubor.
Po obnovení ze zálohy budou tyto miniatury podle potřeby znovu vytvořeny (ačkoli v závislosti na $wgGenerateThumbnailOnParse to může být ruční proces).
Zálohování obsahu wiki (výpis XML)
Kromě výpisu databáze je také vhodné vytvořit výpis XML. XML výpisy obsahují obsah wiki (wiki stránky se všemi jejich revizemi), bez dat souvisejících s webem (neobsahují uživatelské účty, metadata obrázků, protokoly atd.).[2]
Je méně pravděpodobné, že výpisy XML způsobí problémy s kódováním znaků jako prostředku k rychlému přenosu velkého množství obsahu a mohou být snadno použity nástroji třetích stran, díky čemuž jsou výpisy XML dobrým záložním řešením. Váš hlavní výpis databáze se stane nepoužitelným.
Chcete-li vytvořit výpis XML, použijte nástroj příkazového řádku dumpBackup.php
, který se nachází v adresáři maintenance
vaší instalace MediaWiki.
Další podrobnosti najdete na stránce Manual:dumpBackup.php .
Můžete také vytvořit výpis XML pro konkrétní sadu stránek online pomocí Special:Export, i když pokus o výpis velkého množství stránek přes toto rozhraní obvykle selže.
Chcete-li importovat výpis XML do wiki, použijte nástroj příkazového řádku importDump.php
.
Pro malou sadu stránek můžete také použít stránku Special:Import prostřednictvím vašeho prohlížeče (ve výchozím nastavení je tato možnost omezena na skupinu sysop).
Další informace získáte na stránce Manual:Importing XML dumps .
Bez shellového přístupu k serveru
See m:Data dumps about Wikimedia database dumps.
WikiTeam3
Pokud nemáte přístup k shellu, použijte skript dumpgenerator MediaWiki Dump Generator.
:*?"<>|
in filenames, some files may not be downloaded, please check the errors.log file.Example usage
- --curonly dumps only the latest revision of pages
- --xml exports an XML dump, uses Special:Export by default when no other xmldump method is specified.
- --xmlrevisions uses API:Allrevisions (MediaWiki 1.27+) xmldump method. Recommended as it's quicker and puts almost no pressure on the MediaWiki backend compared to Special:Export.
- --images generates an image dump
- --force generates a dump even if there is one already at Internet Archive
- Public wikis
wikiteam3dumpgenerator <WIKI_URL> --xml --xmlrevisions
- Private wikis
- To dump a private wiki you will have to use a login that has at least read permission on the wiki.
wikiteam3dumpgenerator <WIKI_URL> --xml --xmlrevisions --force --user <USER> --pass <PASSWORD>
- If that doesn't work. Login with a web browser, save the site cookies in Netscape format to cookies.txt, and add option
--cookies cookies.txt
Skripty
With server shell access
- Neoficiální zálohovací skript od Flominatora. Vytvoří zálohu všech souborů a databáze s volitelnou rotací záloh. Shell script - last updated 2012.
- Další [zálohovací skript https://github.com/samwilson/MediaWiki_Backup], který: Vypisuje DB, soubory (ve výchozím nastavení pouze obrázky, možnost zahrnout všechny soubory do instalace) a XML. Přepne web do režimu pouze pro čtení. Zálohuje časová razítka. Přečte znakovou sadu z LocalSettings. Skript není nutné upravovat pro každý web, který má být zálohován. Nerotuje (zatím) staré zálohy. Použití:
backup.sh -d backup/directory -w installation/directory
. Poskytuje také skript pro obnovení zálohyrestore.sh -a backup/directory/dated_archive.tar.gz -w installation/directory
. Shell skript, poslední aktualizace 2013. - User:Darizotas/MediaWiki Backup Script for Windows – skript pro zálohování instalace Windows MediaWiki. Poznámka: Nemá funkci obnovení. Shell skript, poslední aktualizace 2015.
- Neoficiální zálohovací skript od User:Duesentrieb. Shell skript, poslední aktualizace 2016.
- Skript pro pravidelné zálohování mw_backup. Tento skript bude provádět denní, týdenní a měsíční zálohy vaší databáze a adresáře obrázků, když je spuštěn jako denní úloha Cronu. PHP skript, poslední aktualizace 2017.
- Další neoficiální záložní skript MediaWiki pro Windows od Lanthanis, který: Exportuje stránky specifikovaných jmenných prostorů jako soubor XML. Vypíše zadané databázové tabulky. Přidá další určené složky a soubory do záložního souboru ZIP. Lze použít s plánovačem úloh systému Windows. Poslední aktualizace 2019.
Without server shell access
For example your wiki is in a wikifarm , using the MediaWiki API .
- WikiTeam's dumpgenerator Python 2 script can generate an XML dump and an image dump - last updated 2023.
- Mediawiki Client Tools' MediaWiki Dump Generator dumpgenerator Python 3 script can generate an XML dump and an image dump - last updated 2023.
- See above: Save the Web Project's WikiTeam3 wikiteam3dumpgenerator Python 3 script can generate an XML dump and an image dump - actively maintained in 2024.
Rozšíření
- Extension:DumpsOnDemand – Umožňuje uživatelům vytvářet a stahovat výpisy z databáze
- Extension:DataDump – Umožňuje uživatelům vytvářet a stahovat soubory XML a výpisy souborů/obrázků
Související odkazy
- Nápověda:Export je rychlý a snadný způsob, jak uložit všechny stránky na vaší wiki.
- Manual:Restoring a wiki from backup
- Manual:Moving a wiki
- Příručka:Aktualizace
- Manual:Restoring wiki code from cached HTML — jak obnovit obsah wiki, pokud nemáte použitelnou zálohu
- Exporting all the files of a wiki
Poznámky pod čarou
- ↑ Manual talk:Backing up a wiki#Ubuntu 10.10 - Step by Step Instructions
- ↑ XML výpisy jsou nezávislé struktury databáze a lze je importovat do budoucích (a dokonce i minulých) verzí MediaWiki.