Manual: Hacer una copia de seguridad de un wiki

This page is a translated version of the page Manual:Backing up a wiki and the translation is 48% complete.
Outdated translations are marked like this.

Es importante que de forma periódica hagas una copia de seguridad de los datos de tu wiki. Esta página describe este proceso para un wiki típico basado en MediaWiki; probablemente quieras hacerte tus propios scripts que se encarguen de esto automáticamente, o usar una frecuencia distinta para esta tarea según el tamaño de tu wiki y tus necesidades particulares.

Help:Export is a quick and easy way to save all pages on your wiki.

Sumario

MediaWiki guarda información importante en dos lugares:

La base de datos
Las páginas y su contenido, los usuarios y sus preferencias personales, metadatos, índice de búsqueda, etc.
Sistema de archivos
Archivos de configuración del software, apariencias personalizadas, extensiones, imágenes y archivos multimedia (incluyendo los archivos borrados), etc.

Deberías poner tu wiki en modo lectura antes de empezar a crear la copia: mira $wgReadOnly . Esto garantizará que todas las partes de tu copia de seguridad sean consistentes, aunque algunas de las extensiones que tengas instaladas puedan escribir información al disco de todos modos.

Transferencia de archivos

Tendrás que elegir un método para transferir los archivos desde el servidor en el que se encuentran:

  • En el caso de información que no sea privada, puedes simplemente publicarla en archive.org y/o en un directorio dumps/ de tu servidor web.
  • SCP (o WinSCP), SFTP / FTP o cualquier otro protocolo de transferencia que elija.
  • La empresa que hospeda el wiki podría a lo mejor ofrecer una interfaz administrativa accesible con un navegador; consúltales.

Base de datos

La mayor parte de la información vital que contiene el wiki se encuentra en la base de datos, de la cual normalmente es bastante sencillo hacer una copia de seguridad. Cuando se usa el MySQL o MariaDB backend, la base de datos se puede volcar en un archivo de script que se puede usar más tarde para recrear la base de datos y todos los datos que contiene desde cero. If your wiki is currently offline, its database can be backed up by simply copying the database file.

When using the default MySQL or MariaDB backend, the database can be dumped into a script file which can be used later to recreate the database and all the data in it from scratch.

MySQL

Automysqlbackup

Ver el paquete en Debian:

$ apt show automysqlbackup
[...]
Description: automysqlbackup creates backup every day, week and month for all of your MySQL database, to a configured folder. There's nothing to do but to install this package, and you'll rest assured that you have a way to go back in the history of your database.
[...]

Instalar el paquete:

# apt install automysqlbackup

Todas tus bases de datos serán salvadas en /var/lib/automysqlbackup/:

$ find /var/lib/automysqlbackup/
/var/lib/automysqlbackup/
/var/lib/automysqlbackup/weekly
/var/lib/automysqlbackup/weekly/my_wiki
/var/lib/automysqlbackup/weekly/my_wiki/my_wiki_week.18.2016-05-07_15h32m.sql.gz
/var/lib/automysqlbackup/monthly
/var/lib/automysqlbackup/daily
/var/lib/automysqlbackup/daily/my_wiki

Copia de seguridad manual:

# automysqlbackup

Restaurar una base de datos:

gunzip < /var/lib/automysqlbackup/weekly/my_wiki/my_wiki_week.18.2016-05-07_15h32m.sql.gz|mysql -uUSER -pPASSWORD my_wiki

Para otras distribuciones, busca en Sourceforge.

Mysqldump desde la línea de comandos

La forma más práctica de crear un volcado de la base de datos que quieres copiar es usar la herramienta de volcado estándar de MySQL mysqldump desde la línea de comandos. Asegúrate de usar los parámetros correctos, o tendrás problemas para restaurar la base de datos. Dependiendo del tamaño de la base de datos, mysqldump puede tardar un tiempo considerable.

Antes de nada, añade una línea como esta a LocalSettings.php:

$wgReadOnly = 'Dumping Database, Access will be restored shortly';

Puedes quitar esa línea en cuanto concluya el proceso de volcado de información.

Ejemplo del comando a ejecutar en la línea de comandos de Linux/UNIX:

mysqldump -h hostname -u userid -p --default-character-set=charset dbname > backup.sql

Sustituye hostname, userid, whatever y dbname según corresponda. All four may be found in your LocalSettings.php (LSP) file. hostname may be found under $wgDBserver ; by default it is localhost. userid may be found under $wgDBuser , charset may be found under $wgDBTableOptions , where it is listed after DEFAULT CHARSET=. If charset is not specified mysqldump will likely use the default of utf8, or if using an older version of MySQL, latin1. While dbname may be found under $wgDBname . After running this line from the command line mysqldump will prompt for the server password (which may be found under Manual: $wgDBpassword in LSP).

Mira la documentación de mysqldump para ver una lista completa de los parámetros que admite el comando.

La salida de mysqldump puede pasarse por tubería a gzip para producir un archivo de salida más pequeño, de este modo:

mysqldump -h hostname -u userid -p dbname | gzip > backup.sql.gz

Some newer versions of MySQL might show an error about tablespaces and PROCESS privilege. MediaWiki does not use tablespaces. The solution is to add the --no-tablespaces option to the command:

mysqldump --no-tablespaces -h hostname -u userid -p dbname | gzip > backup.sql.gz

Puede usarse una orden similar de mysqldump para producir salida en formato XML, indicando la opción --xml:

mysqldump -h hostname -u userid -p --xml dbname > backup.xml

y comprimir el archivo enviándolo por tubería a gzip:

mysqldump -h hostname -u userid -p --xml dbname | gzip > backup.xml.gz

Additional options you should consider using with mysqldump for a backup includes the following.

Additional Mysqldump Options
Option Description
--default-character-set Specify default character set
--no-tablespaces Do not write CREATE LOGFILE GROUP or CREATE TABLESPACE statements in output
--single-transaction Issue a BEGIN SQL statement before dumping data from server
--triggers Dump triggers for each dumped table
--routines Dump stored routines (procedures and functions) from dumped databases
--events Dump events from dumped databases
--add-drop-table Add DROP DATABASE statement before each CREATE DATABASE statement
--create-options Include MySQL-specific table options in CREATE TABLE statements
--extended-insert Use multiple-row INSERT syntax

If you do not use --single-transaction, then you should consider using the --lock-tables and --add-locks options.

Due to an unexpected change in MySQL versions 5.7.41 and 8.0.32 in February 2023, the --single-transaction option required the backup user to have RELOAD or FLUSH_TABLES privileges. The issue was fixed in MySQL versions 5.7.42 and 8.0.33. See MySQL Bug 109685 and Ubuntu Bug 2003866 for details.

Recuerda hacer copia también de los componentes del sistema de archivos que también forman parte del wiki y que puedes necesitar, como las imágenes, el logotipo y las extensiones.

Ejecutar mysqldump con Cron

En los sistemas que corren sistemas operativos tipo Unix, un Cron es un administrador regular de procesos en segundo plano que permite lanzar ciertos procesos (comandos o scripts de línea de comandos) de forma periódica o en determinadas fechas.

He aquí un ejemplo de comando que podrías lanzar desde un crontab:

nice -n 19 mysqldump -u $USER --password=$PASSWORD $DATABASE -c | nice -n 19 gzip -9 > ~/backup/wiki-$DATABASE-$(date '+%Y%m%d').sql.gz

El comando nice -n 19 reduce la prioridad del proceso.

Procura usar valores válidos con $USER, $PASSWORD y $DATABASE. Este comando creará una copia de seguridad poniendo el día de la semana en el nombre del archivo, con lo cual tendrías una buena referencia de copias. Si quieres copiar también los archivos y las extensiones, quizá te interese ver esto.

  Advertencia: No intentes hacer una copia de seguridad de tu base de datos de MediaWiki usando mysqlhotcopy. ¡El formato de tablas que usa MediaWiki no se puede copiar con esta herramienta, ¡con lo cual no hará bien su trabajo aunque parezca que sí!

Si quieres añadir esta tarea en Cron por medio de Cpanel, debes usar el carácter de escape "%":

/usr/bin/mysqldump -u $USER --password=$PASSWORD $DATABASE -c | /bin/gzip > ~/backup/wiki-$DATABASE-$(date '+\%Y\%m\%d').sql.gz

De lo contrario obtendrás un error:

/bin/sh: -c: line 0: unexpected EOF while looking for matching `''
/bin/sh: -c: line 1: syntax error: unexpected end of file

Running mysqldump with Systemd

Systemd unifies service configurations and control. Timers are systemd unit files that control service files or events. Timers can be used as an alternative to cron. An example of systemd unit files and backup script is shown below.

wiki-backup.timer

The following timer runs the wiki-backup service at 5:10 AM every morning.

$ cat /etc/systemd/system/wiki-backup.timer

[Unit]
Description=Run the backup service once a day
Documentation=...

[Timer]
OnCalendar=*-*-* 05:10:00
RandomizedDelaySec=600
Persistent=true

[Install]
WantedBy=timers.target
wiki-backup.service

When the wiki-backup timer fires, then the service is invoked. The service runs a script located in /sbin.

$ cat /etc/systemd/system/wiki-backup.service

[Unit]
Description=Run the backup service once a day
Documentation=...

[Service]
Type=oneshot
User=root
ExecStart=/sbin/wiki-backup
wiki-backup script
$ cat /sbin/wiki-backup

#!/usr/bin/env bash

# Systemd adds random paths at times. Take full control of PATH.
PATH=/bin:/sbin:/usr/bin:/usr/sbin
export PATH

# Read the backup password from conf or ini Failed
wiki_password=...

# Fix the wiki tables just in case. This step produces a lot of noise,
# so send stdout to /dev/null.
if MYSQL_PWD="${wiki_password}" \
   mysqlcheck my_wiki --auto-repair --user=mwuser 1>/dev/null;
then
    echo "Repair wiki database ok"
else
    echo "Failed to repair wiki database"
    echo "Continuing anyways"
fi

# Disable the connection from Apache to MySQL for the dump
if ! systemctl stop apache2.service ;
then
    echo "Failed to stop Apache service"
    echo "Continuing anyways"
fi

# Lock option choice due to MySQL change at versions 5.7.41 and 8.0.32 in
# February 2023. See https://bugs.mysql.com/bug.php?id=109685 and
# https://bugs.launchpad.net/ubuntu/+source/mysql-5.7/+bug/2003866.
if mysql --version 2>&1 | grep -q -E 'mysql[[:space:]]+Ver 8\.0\.32'; then
   echo "Using MySQL --lock-tables --add-locks options"
   mysql_lock_opt="--lock-tables --add-locks"
else
   echo "Using MySQL --single-transaction option"
   mysql_lock_opt="--single-transaction"
fi

if MYSQL_PWD="${wiki_password}" \
   mysqldump --no-tablespaces \
     ${mysql_lock_opt} \
     --events --triggers --routines \
     --add-drop-table --create-options \
     --extended-insert \
     --default-character-set=utf8 \
     -u mwuser -h localhost my_wiki | gzip -q -v9 > /backup/wiki-backup.sql.gz ;
then
    echo "Dump wiki database ok"
else
    echo "Failed to dump wiki database"
    echo "Continuing anyways"
fi

# Re-enable connection from Apache to MySQL for the dump
if ! systemctl start apache2.service ;
then
    echo "Failed to start Apache service"
    echo "Continuing anyways"
fi

exit 0

Tablas

Algunas de las tablas vertidas tienen diferentes grados de temporalidad. Así que, para ahorrar espacio (más allá de aplicar gzip), si bien estas tablas tienen que estar presentes para tener un volcado como es debido, no ocurre lo mismo con la información que contienen. Sin embargo, en determinadas circunstancias el inconveniente de tener que reconstruir toda esta información puede ser mayor que el ahorro de espacio en disco (por ejemplo, en un wiki muy grande donde la velocidad a la que se restaura información es un factor clave).

Mira el hilo mysql5 binary schema de la lista de correo donde se trata este asunto.

Conversión Latin-1 a UTF-8

Mira la sección correspondiente en la página que trata la actualización para ver información sobre este proceso. En la página de discusión también encontrarás más información en general sobre cómo trabajar con juegos de caracteres.

PostgreSQL

Puedes usar la herramienta pg_dump para hacer una copia de seguridad de una base de datos de MediaWiki basada en PostgreSQL. Por ejemplo:

pg_dump mywiki > mywikidump.sql

volcará la base de datos mywiki en mywikidump.sql.

Para restaurar el volcado:

psql mywiki -f mywikidump.sql

También te puede interesar volcar la información global, por ejemplo los usuarios de la base de datos:

pg_dumpall --globals > postgres_globals.sql

SQLite

Si tu wiki está fuera de línea, puedes hacer una copia de su base de datos simplemente copiando el archivo en el que se encuentra. De lo contrario, usa el script de mantenimiento: php maintenance/SqliteMaintenance.php --backup-to <backup file name>, que se asegurará de que la operación sea atómica y que no haya inconsistencias. Si tu base de datos no es excesivamente grande y tu servidor no está bajo una fuerte carga de trabajo, los usuarios que estén editando el wiki tan sólo percibirán un ligero retardo. Los usuarios que sólo estén leyendo no notarán nada en cualquier caso.

phpMyAdmin

Pon tu wiki en modo lectura añadiendo $wgReadOnly = 'Site Maintenance'; a LocalSettings.php.

Find the wiki database in LocalSettings.php. Here is an example of what this looks like in LocalSettings.php:

## Database settings
$wgDBtype           = "mysql";
$wgDBserver         = "localhost";
$wgDBname           = "sashtmax_mw19999";
$wgDBuser           = "sashtmax_mw19999";
$wgDBpassword       = "S7[88p]jJJ";
  1. Sigue el enlace a tu página administrativa, identifícate y elige la base de datos del wiki.
  2. Elige Exportar. Asegúrate de que todos los elementos que puedes exportar están marcados, incluyendo Estructura (es importante mantener la estructura de las tablas). Opcionalmente marca también "Añadir DROP TABLE" para borrar las referencias existentes al importar. Asegúrate de que Datos está marcada.
  3. Elige "En zip".
  4. Finalmente, pulsa CONFIRMAR para guardar la copia de seguridad.[1]
  5. Elimina $wgReadOnly = 'Site Maintenance'; de LocalSettings.php.

Recuerda hacer copia también de los componentes del sistema de archivos del wiki que puedas necesitar, como las imágenes, el logotipo y las extensiones.

Enlaces externos

HeidiSQL (alternative to phpMyAdmin)

HeidiSQL es similar a phpMyAdmin, pero sin las limitaciones de la versión gratuita de phpMyAdmin. HeidiSQL necesita una conexión directa con la base de datos; algunos servidores sólo ofrecen interfaces web (phpMyAdmin) a bases de datos protegidas por cortafuegos.

Sistema de archivos

MediaWiki guarda otros componentes del wiki en el sistema de archivos cuando es más apropiado hacerlo así que insertarlos en la base de datos, por ejemplo en el caso de los archivos de configuración del sitio ($1, $2 (eliminado en MediaWiki 1.23)), los archivos de imágenes (incluyendo las imágenes borradas, las imágenes en miniatura y las imágenes SVG, si corresponde), además de las apariencias personalizadas, los archivos de las extensiones, etc.

The most important of these are:

  • LocalSettings.php
  • uploaded files in the images/ directory (including deleted files, thumbnails, and rendered math and SVG images, if applicable).

El mejor método para hacer una copia de seguridad de estos archivos es almacenarlos por ejemplo en un archivo .tar, que luego puede comprimirse si se desea. En Windows, pueden usarse aplicaciones como WinZip o 7-zip si se prefiere.

En un sistema basado en Linux, suponiendo que el wiki se encuentre en /srv/www/htdocs/wiki, podrías usar algo como:

tar zcvhf wikidata.tgz /srv/www/htdocs/wiki

Debería ser posible hacer una copia de seguridad de todo el directorio "wiki" de la carpeta "htdocs" si estás usando XAMPP.

Configuration files

LocalSettings.php is the most important of these, but a wiki might also have things like .htaccess or other web server configuration files that should be backed up.

Uploaded files

Files uploaded to the wiki are by default put into the images/ directory, separated into subdirectories such as images/8/8f. There are also other directories such as images/archive/ and images/deleted/. These should all be backed up.

The images/thumb/ can be backed up along with everything else, but can optionally be excluded in order to save backup space. This directory stores the derived thumbnails of images and other files; generally multiple thumbnails per wiki file. After restoring from backup, these thumbnails will be recreated as required (although depending on $wgGenerateThumbnailOnParse this may need to be a manual process).

Copia de seguridad del contenido del wiki (volcado XML)

También es una buena idea crear un volcado XML además del volcado de la base de datos. Los volcados XML albergan el contenido del wiki (las páginas del wiki y todas sus revisiones) sin los datos relacionados con el sitio (no tienen las cuentas de usuario, metadatos de las imágenes, registros, etc.).[2]

Los volcados XML tienen menos posibilidades de causar problemas con la codificación de caracteres y son una forma de transferir gran cantidad de contenido de forma rápida; también son más fáciles de usar con herramientas externas, lo que los convierte en un buen recurso si se da el caso de que el volcado principal de la base de datos se vuelve inutilizable.

Para crear un volcado XML, usa la herramienta de línea de comando dumpBackup.php , que encontrarás en el directorio maintenance de tu instalación de MediaWiki. Véase Manual:dumpBackup.php para más información.

También puedes crear un volcado XML de un grupo específico de páginas usando Especial:Exportar, aunque normalmente si intentas volcar muchas páginas desde esta interfaz te encontrarás con que la petición del navegador caduca.

Para importar un volcado XML en un wiki, usa la herramienta de línea de comando importDump.php . Si se trata sólo de unas pocas páginas, también puedes usar Especial:Importar mediante tu navegador, aunque de forma predeterminada sólo los administradores pueden usar esta página.

See Manual:Importación de volcados XML for more information.

Sin acceso a nivel de consola al servidor

MediaWiki Dump Generator

If you have no shell access, use the MediaWiki Client Tools' MediaWiki Dump Generator dumpgenerator script. It is run from the command-line in a terminal.

The XML dump can include full or only most recent page history. The images dump will contain all file types with associated descriptions. The siteinfo.json and SpecialVersion.html files will contain information about wiki features such as the installed extensions and skins. User account information won't be preserved.

Full instructions are at the MediaWiki Client Tools' MediaWiki Dump Generator GitHub repository.

Mira también Meta:Data dumps.

Scripts

  Advertencia: Usa estos scripts bajo tu cuenta y riesgo. Mira en el LocalSettings.php de tu wiki el juego de caracteres correcto que debes usar, ya que también es posible que tengas que modificar los scripts en tu caso particular.
  • Otro script para crear copias de seguridad que crea volcados de la base de datos, los archivos y el XML, pone el sitio en modo lectura, marca las copias por fechas y lee el juego de caracteres a utilizar de LocalSettings.php. El script no necesita ser modificado por cada sitio a copiar. De momento no soporta la rotación de viejas copias. Uso: $code. También proporciona un script para restaurar un $code de respaldo.

Script does not need to be modified for each site to be backed up. Does not (yet) rotate old backups. Usage: backup.sh -d backup/directory -w installation/directory. Also provides a script to restore a backup restore.sh -a backup/directory/dated_archive.tar.gz -w installation/directory. Shell script, last updated 2013.

  • User:Darizotas/MediaWiki Backup Script for Windows - un script que hace una copia de seguridad de una instalación de MediaWiki basada en Windows. Nota: No tiene función de restauración. Shell script, last updated 2015.
  • Script no oficial para hacer copias de seguridad creado por Duesentrieb. Shell script, last updated 2016.
  • mw_backup, un script para realizar copias de seguridad periódicas. Este script genera copias de seguridad diarias, semanales o mensuales de tu base de datos y del directorio de imágenes cuando se ejecuta como un proceso diario de Cron. PHP script, last updated 2017.
  • Another unofficial MediaWiki backup script for Windows by Lanthanis that: exports the pages of specified namespaces as an XML file; dumps specified database tables; and adds further specified folders and files to a ZIP backup file.

Puede ser usado con el Programador de Tareas de Windows. Last updated 2019.

Python 2 script.

  • MediaWiki Dump Generator - if you do not have server access (e.g. your wiki is in a free wikifarm), you can generate an XML dump and an image dump using dumpgenerator from Mediawiki Client Tools, Python 3 script, last update 2023.

Extensions

Véase también

Referencias

  1. Manual talk:Backing up a wiki#Ubuntu 10.10 - Step by Step Instructions
  2. Los volcados XML son independientes de la estructura de la base de datos, y pueden importarse en versiones futuras (e incluso pasadas) de MediaWiki.