Manual: Hacer una copia de seguridad de un wiki
Es importante que de forma periódica hagas una copia de seguridad de tu wiki (datos y archivos). Esta página describe este proceso para un wiki típico basado en MediaWiki; probablemente quieras hacerte tus propios scripts que se encarguen de esto automáticamente, o usar una frecuencia distinta para esta tarea según el tamaño de tu wiki y tus necesidades particulares.
Sumario
MediaWiki guarda información importante en dos lugares:
- La base de datos
- Las páginas y su contenido, los usuarios y sus preferencias personales, metadatos, índice de búsqueda, etc.
- Sistema de archivos
- Archivos de configuración del software, apariencias personalizadas, extensiones, imágenes y archivos multimedia (incluyendo los archivos borrados), etc.
Deberías poner tu wiki en modo lectura antes de empezar a crear la copia: mira $wgReadOnly . Esto garantizará que todas las partes de tu copia de seguridad sean consistentes, aunque algunas de las extensiones que tengas instaladas puedan escribir información al disco de todos modos.
Transferencia de archivos
Tendrás que elegir un método para transferir los archivos desde el servidor en el que se encuentran:
- En el caso de información que no sea privada, puedes simplemente publicarla en archive.org y/o en un directorio
dumps/
de tu servidor web. - SCP (o WinSCP), SFTP / FTP o cualquier otro protocolo de transferencia que elija.
- La empresa que hospeda el wiki podría a lo mejor ofrecer una interfaz administrativa accesible con un navegador; consúltales.
Base de datos
La mayor parte de la información vital que contiene el wiki se encuentra en la base de datos, de la cual normalmente es bastante sencillo hacer una copia de seguridad. Si su wiki está actualmente fuera de línea, se puede hacer una copia de seguridad de su base de datos simplemente copiando el archivo de la base de datos.
Cuando se usa el MySQL o MariaDB backend, la base de datos se puede volcar en un archivo de script que se puede usar más tarde para recrear la base de datos y todos los datos que contiene desde cero.
MySQL
Automysqlbackup
Ver el paquete en Debian:
$ apt show automysqlbackup
[...]
Description: automysqlbackup creates backup every day, week and month for all of your MySQL database, to a configured folder. There's nothing to do but to install this package, and you'll rest assured that you have a way to go back in the history of your database.
[...]
Instalar el paquete:
# apt install automysqlbackup
Todas tus bases de datos serán salvadas en /var/lib/automysqlbackup/:
$ find /var/lib/automysqlbackup/
/var/lib/automysqlbackup/
/var/lib/automysqlbackup/weekly
/var/lib/automysqlbackup/weekly/my_wiki
/var/lib/automysqlbackup/weekly/my_wiki/my_wiki_week.18.2016-05-07_15h32m.sql.gz
/var/lib/automysqlbackup/monthly
/var/lib/automysqlbackup/daily
/var/lib/automysqlbackup/daily/my_wiki
Copia de seguridad manual:
# automysqlbackup
Restaurar una base de datos:
gunzip < /var/lib/automysqlbackup/weekly/my_wiki/my_wiki_week.18.2016-05-07_15h32m.sql.gz|mysql -uUSER -pPASSWORD my_wiki
Para otras distribuciones, busca en Sourceforge.
Mysqldump desde la línea de comandos
La forma más práctica de crear un volcado de la base de datos que quieres copiar es usar la herramienta de volcado estándar de MySQL mysqldump desde la línea de comandos. Asegúrate de usar los parámetros correctos, o tendrás problemas para restaurar la base de datos. Dependiendo del tamaño de la base de datos, mysqldump puede tardar un tiempo considerable.
Antes de nada, añade una línea como esta a LocalSettings.php
:
$wgReadOnly = 'Dumping Database, Access will be restored shortly';
Puedes quitar esa línea en cuanto concluya el proceso de volcado de información.
Ejemplo del comando a ejecutar en la línea de comandos de Linux/UNIX:
mysqldump -h hostname -u userid -p --default-character-set=charset dbname > backup.sql
Sustituye hostname
, userid
, charset
y dbname
según corresponda.
Los cuatro pueden encontrarse en su archivo LocalSettings.php (LSP).
hostname
puede encontrarse en $wgDBserver ; por defecto es localhost.
userid
puede encontrarse en $wgDBuser , charset
se puede encontrar en $wgDBTableOptions , donde aparece después de DEFAULT CHARSET=
.
Si charset
no se especifica, mysqldump probablemente usará el valor predeterminado utf8, o latin1 si usa una versión anterior de MySQL.
Mientras que dbname
pueden encontrarse en $wgDBname .
Después de ejecutar esta línea desde la línea de comandos, mysqldump solicitará la contraseña del servidor (que se puede encontrar en Manual: $wgDBpassword en LSP).
Mira la documentación de mysqldump para ver una lista completa de los parámetros que admite el comando.
La salida de mysqldump puede pasarse por tubería a gzip para producir un archivo de salida más pequeño, de este modo:
mysqldump -h hostname -u userid -p dbname | gzip > backup.sql.gz
Algunas versiones más recientes de MySQL pueden mostrar un error sobre los espacios de tablas (tablespaces) y el privilegio PROCESS.
MediaWiki no utiliza espacios de tablas.
La solución es añadir la opción --no-tablespaces
al comando:
mysqldump --no-tablespaces -h hostname -u userid -p dbname | gzip > backup.sql.gz
Puede usarse una orden similar de mysqldump para producir salida en formato XML, indicando la opción --xml:
mysqldump -h hostname -u userid -p --xml dbname > backup.xml
y comprimir el archivo enviándolo por tubería a gzip:
mysqldump -h hostname -u userid -p --xml dbname | gzip > backup.xml.gz
Opciones adicionales que debería considerar usar con mysqldump para una copia de seguridad incluye lo siguiente.
Opción | Descripción |
---|---|
--default-character-set | Especifica el conjunto de caracteres por defecto. |
--no-tablespaces | No escribe las sentencias CREATE LOGFILE GROUP o CREATE TABLESPACE en la salida |
--single-transaction | Emite una sentencia BEGIN SQL antes de volcar los datos del servidor |
--triggers | Vuelca los disparadores (triggers) para cada tabla volcada |
--routines | Vuelca las rutinas almacenadas (procedimientos y funciones) de las bases de datos volcadas |
--events | Vuelca los eventos de las bases de datos volcadas |
--add-drop-table | Añade la sentencia DROP DATABASE antes de cada sentencia CREATE DATABASE |
--create-options | Incluye opciones de tabla específicas de MySQL en las sentencias CREATE TABLE |
--extended-insert | Utiliza la sintaxis INSERT de varias filas |
Si no usa --single-transaction, entonces debería considerar usar las opciones --lock-tables y --add-locks.
Debido a un cambio inesperado en las versiones 5.7.41 y 8.0.32 de MySQL en Febrero de 2023, la opción --single-transaction requería que el usuario encargado de la copia de seguridad tuviera los privilegios RELOAD o FLUSH_TABLES. El problema fue resuelto en las versiones de MySQL 5.7.42 y 8.0.33. Consulte Error 109685 de MySQL y Error 2003866 de Ubuntu para más detalles.
Recuerde hacer una copia de seguridad de los componentes adicionales del sistema de archivos utilizados por la wiki que podrían ser necesarios durante una restauración, como las imágenes, el logotipo, la apariencia y las extensiones.
Ejecutar mysqldump con Cron
En los sistemas que corren sistemas operativos tipo Unix, un Cron es un administrador regular de procesos en segundo plano que permite lanzar ciertos procesos (comandos o scripts de línea de comandos) de forma periódica o en determinadas fechas.
He aquí un ejemplo de comando que podrías lanzar desde un crontab:
nice -n 19 mysqldump -u $USER --password=$PASSWORD $DATABASE -c | nice -n 19 gzip -9 > ~/backup/wiki-$DATABASE-$(date '+%Y%m%d').sql.gz
El comando nice -n 19
reduce la prioridad del proceso.
Procura usar valores válidos con $USER
, $PASSWORD
y $DATABASE
. Este comando creará una copia de seguridad poniendo el día de la semana en el nombre del archivo, con lo cual tendrías una buena referencia de copias. Si quieres copiar también los archivos y las extensiones, quizá te interese ver esto.
Si quieres añadir esta tarea en Cron por medio de Cpanel, debes usar el carácter de escape "%":
/usr/bin/mysqldump -u $USER --password=$PASSWORD $DATABASE -c | /bin/gzip > ~/backup/wiki-$DATABASE-$(date '+\%Y\%m\%d').sql.gz
De lo contrario obtendrás un error:
/bin/sh: -c: line 0: unexpected EOF while looking for matching `'' /bin/sh: -c: line 1: syntax error: unexpected end of file
Ejecutar mysqldump con Systemd
Systemd unifica las configuraciones y el control de los servicios. Los temporizadores son archivos de unidad de systemd que controlan archivos de servicio o eventos. Los temporizadores pueden utilizarse como alternativa a cron. A continuación se muestra un ejemplo de archivos de unidad de systemd y un script de copia de seguridad.
wiki-backup.timer
El siguiente temporizador ejecuta el servicio wiki-backup
a las 5:10 AM cada mañana.
$ cat /etc/systemd/system/wiki-backup.timer [Unit] Description=Run the backup service once a day Documentation=... [Timer] OnCalendar=*-*-* 05:10:00 RandomizedDelaySec=600 Persistent=true [Install] WantedBy=timers.target
wiki-backup.service
Cuando el temporizador wiki-backup
se dispara, entonces el servicio es invocado.
El servicio ejecuta un script ubicado en /sbin
.
$ cat /etc/systemd/system/wiki-backup.service [Unit] Description=Run the backup service once a day Documentation=... [Service] Type=oneshot User=root ExecStart=/sbin/wiki-backup
wiki-backup script
$ cat /sbin/wiki-backup #!/usr/bin/env bash # Systemd adds random paths at times. Take full control of PATH. PATH=/bin:/sbin:/usr/bin:/usr/sbin export PATH # Read the backup password from conf or ini Failed wiki_password=... # Fix the wiki tables just in case. This step produces a lot of noise, # so send stdout to /dev/null. if MYSQL_PWD="${wiki_password}" \ mysqlcheck my_wiki --auto-repair --user=mwuser 1>/dev/null; then echo "Repair wiki database ok" else echo "Failed to repair wiki database" echo "Continuing anyways" fi # Disable the connection from Apache to MySQL for the dump if ! systemctl stop apache2.service ; then echo "Failed to stop Apache service" echo "Continuing anyways" fi # Lock option choice due to MySQL change at versions 5.7.41 and 8.0.32 in # February 2023. See https://bugs.mysql.com/bug.php?id=109685 and # https://bugs.launchpad.net/ubuntu/+source/mysql-5.7/+bug/2003866. if mysql --version 2>&1 | grep -q -E 'mysql[[:space:]]+Ver 8\.0\.32'; then echo "Using MySQL --lock-tables --add-locks options" mysql_lock_opt="--lock-tables --add-locks" else echo "Using MySQL --single-transaction option" mysql_lock_opt="--single-transaction" fi if MYSQL_PWD="${wiki_password}" \ mysqldump --no-tablespaces \ ${mysql_lock_opt} \ --events --triggers --routines \ --add-drop-table --create-options \ --extended-insert \ --default-character-set=utf8 \ -u mwuser -h localhost my_wiki | gzip -q -v9 > /backup/wiki-backup.sql.gz ; then echo "Dump wiki database ok" else echo "Failed to dump wiki database" echo "Continuing anyways" fi # Re-enable connection from Apache to MySQL for the dump if ! systemctl start apache2.service ; then echo "Failed to start Apache service" echo "Continuing anyways" fi exit 0
Tablas
Algunas de las tablas vertidas tienen diferentes grados de temporalidad. Así que, para ahorrar espacio (más allá de aplicar gzip), si bien estas tablas tienen que estar presentes para tener un volcado como es debido, no ocurre lo mismo con la información que contienen. Sin embargo, en determinadas circunstancias el inconveniente de tener que reconstruir toda esta información puede ser mayor que el ahorro de espacio en disco (por ejemplo, en un wiki muy grande donde la velocidad a la que se restaura información es un factor clave).
Mira el hilo mysql5 binary schema de la lista de correo donde se trata este asunto.
Conversión Latin-1 a UTF-8
Mira la sección correspondiente en la página que trata la actualización para ver información sobre este proceso. En la página de discusión también encontrarás más información en general sobre cómo trabajar con juegos de caracteres.
PostgreSQL
Puedes usar la herramienta pg_dump
para hacer una copia de seguridad de una base de datos de MediaWiki basada en PostgreSQL. Por ejemplo:
pg_dump mywiki > mywikidump.sql
volcará la base de datos mywiki
en mywikidump.sql.
Para restaurar el volcado:
psql mywiki -f mywikidump.sql
También te puede interesar volcar la información global, por ejemplo los usuarios de la base de datos:
pg_dumpall --globals > postgres_globals.sql
SQLite
Si tu wiki está fuera de línea, puedes hacer una copia de su base de datos simplemente copiando el archivo en el que se encuentra.
De lo contrario, usa el script de mantenimiento: php maintenance/SqliteMaintenance.php --backup-to <backup file name>
, que se asegurará de que la operación sea atómica y que no haya inconsistencias.
Si tu base de datos no es excesivamente grande y tu servidor no está bajo una fuerte carga de trabajo, los usuarios que estén editando el wiki tan sólo percibirán un ligero retardo.
Los usuarios que sólo estén leyendo no notarán nada en cualquier caso.
phpMyAdmin
Pon tu wiki en modo lectura añadiendo $wgReadOnly = 'Site Maintenance';
a LocalSettings.php.
Encuentra la base de datos de wiki en LocalSettings.php. Aquí hay un ejemplo de cómo se ve esto en LocalSettings.php:
## Database settings
$wgDBtype = "mysql";
$wgDBserver = "localhost";
$wgDBname = "sashtmax_mw19999";
$wgDBuser = "sashtmax_mw19999";
$wgDBpassword = "S7[88p]jJJ";
- Sigue el enlace a tu página administrativa, identifícate y elige la base de datos del wiki.
- Elige Exportar. Asegúrate de que todos los elementos que puedes exportar están marcados, incluyendo Estructura (es importante mantener la estructura de las tablas). Opcionalmente marca también "Añadir DROP TABLE" para borrar las referencias existentes al importar. Asegúrate de que Datos está marcada.
- Elige "En zip".
- Finalmente, pulsa CONFIRMAR para guardar la copia de seguridad.[1]
- Elimina
$wgReadOnly = 'Site Maintenance';
de LocalSettings.php.
Recuerda hacer copia también de los componentes del sistema de archivos del wiki que puedas necesitar, como las imágenes, el logotipo y las extensiones.
Enlaces externos
HeidiSQL (alternative to phpMyAdmin)
HeidiSQL es similar a phpMyAdmin, pero sin las limitaciones de la versión gratuita de phpMyAdmin. HeidiSQL necesita una conexión directa con la base de datos; algunos servidores sólo ofrecen interfaces web (phpMyAdmin) a bases de datos protegidas por cortafuegos.
Sistema de archivos
MediaWiki guarda otros componentes de la wiki en el sistema de archivos.
Las más importantes son:
- LocalSettings.php
- Los archivos cargados en el directorio
images/
(incluidos los archivos borrados, las imágenes en miniatura, las imágenes matemáticas renderizadas y las imágenes SVG, si corresponde).
El mejor método para hacer una copia de seguridad de estos archivos es almacenarlos por ejemplo en un archivo .tar
, que luego puede comprimirse si se desea. En Windows, se pueden utilizar aplicaciones como WinZip o 7-zip.
En un sistema basado en Linux, suponiendo que el wiki se encuentre en /srv/www/htdocs/wiki
, podrías usar algo como:
tar zcvhf wikidata.tgz /srv/www/htdocs/wiki
Debería ser posible hacer una copia de seguridad de todo el directorio "wiki" de la carpeta "htdocs" si estás usando XAMPP.
Archivos de configuración
LocalSettings.php es el más importante de ellos, pero una wiki también puede tener cosas como .htaccess
u otros archivos de configuración del servidor web que deberían ser respaldados.
Archivos cargados
Los archivos subidos a la wiki se colocan por defecto en el directorio images/
, separados en subdirectorios tales como images/8/8f
.
También hay otros directorios como images/archive/
y images/deleted/
.
Todos estos deberían ser respaldados.
El directorio images/thumb/
puede ser respaldado junto con todo lo demás, pero opcionalmente puede ser excluido para ahorrar espacio en la copia de seguridad.
Este directorio almacena las miniaturas derivadas de imágenes y otros archivos; generalmente varias miniaturas por archivo wiki.
Después de restaurar desde la copia de seguridad, estas miniaturas se volverán a crear según sea necesario (aunque dependiendo de $wgGenerateThumbnailOnParse , es posible que deba ser un proceso manual).
Copia de seguridad del contenido del wiki (volcado XML)
También es una buena idea crear un volcado XML además del volcado de la base de datos. Los volcados XML albergan el contenido del wiki (las páginas del wiki y todas sus revisiones) sin los datos relacionados con el sitio (no tienen las cuentas de usuario, metadatos de las imágenes, registros, etc.).[2]
Los volcados XML tienen menos posibilidades de causar problemas con la codificación de caracteres y son una forma de transferir gran cantidad de contenido de forma rápida; también son más fáciles de usar con herramientas externas, lo que los convierte en un buen recurso si se da el caso de que el volcado principal de la base de datos se vuelve inutilizable.
Para crear un volcado XML, usa la herramienta de línea de comando dumpBackup.php
, que encontrarás en el directorio maintenance
de tu instalación de MediaWiki.
Véase Manual:dumpBackup.php para más información.
También puedes crear un volcado XML de un grupo específico de páginas usando Especial:Exportar, aunque normalmente si intentas volcar muchas páginas desde esta interfaz te encontrarás con que la petición del navegador caduca.
Para importar un volcado XML en un wiki, usa la herramienta de línea de comando importDump.php
.
Si se trata sólo de unas pocas páginas, también puedes usar Especial:Importar mediante tu navegador, aunque de forma predeterminada sólo los administradores pueden usar esta página.
Véase Manual:Importación de volcados XML para más información.
Sin acceso a la consola del servidor
See m:Data dumps about Wikimedia database dumps.
WikiTeam3
If you have no server shell access, use Save the Web Project's WikiTeam3 Python 3 script, (full instructions are at that link).
:*?"<>|
in filenames, some files may not be downloaded, please check the errors.log file.Example usage
- --curonly dumps only the latest revision of pages
- --xml exports an XML dump, uses Special:Export by default when no other xmldump method is specified.
- --xmlrevisions uses API:Allrevisions (MediaWiki 1.27+) xmldump method. Recommended as it's quicker and puts almost no pressure on the MediaWiki backend compared to Special:Export.
- --images generates an image dump
- --force generates a dump even if there is one already at Internet Archive
- Public wikis
wikiteam3dumpgenerator <WIKI_URL> --xml --xmlrevisions
- Private wikis
- To dump a private wiki you will have to use a login that has at least read permission on the wiki.
wikiteam3dumpgenerator <WIKI_URL> --xml --xmlrevisions --force --user <USER> --pass <PASSWORD>
- If that doesn't work. Login with a web browser, save the site cookies in Netscape format to cookies.txt, and add option
--cookies cookies.txt
Scripts
With server shell access
- Script no oficial para crear copias de seguridad de Flominator: sirve para crear una copia de seguridad de todos los archivos y de la base de datos, e incluye opcionalmente rotación de las copias. Shell script - last updated 2012.
- Otro script para crear copias de seguridad que crea volcados de la base de datos, los archivos y el XML, pone el sitio en modo lectura, marca las copias por fechas y lee el juego de caracteres a utilizar de LocalSettings.php. El script no necesita ser modificado por cada sitio a respaldar. De momento no soporta la rotación de viejas copias. Uso:
backup.sh -d backup/directory -w installation/directory
. También proporciona un script para restaurar unrestore.sh -a backup/directory/dated_archive.tar.gz -w installation/directory
de respaldo. Shell script - last updated 2013. - User:Darizotas/MediaWiki Backup Script for Windows - un script que hace una copia de seguridad de una instalación de MediaWiki basada en Windows. Nota: No tiene función de restauración. Shell script - last updated 2015.
- Script no oficial para hacer copias de seguridad creado por Duesentrieb. Shell script - last updated 2016.
- mw_backup, un script para realizar copias de seguridad periódicas. Este script genera copias de seguridad diarias, semanales o mensuales de tu base de datos y del directorio de imágenes cuando se ejecuta como un proceso diario de Cron. PHP script - last updated 2017.
- Another unofficial MediaWiki backup script for Windows by Lanthanis that: exports the pages of specified namespaces as an XML file; dumps specified database tables; and adds further specified folders and files to a ZIP backup file.
Puede ser usado con el Programador de Tareas de Windows. Last updated 2019.
Without server shell access
For example your wiki is in a wikifarm , using the MediaWiki API .
- WikiTeam's dumpgenerator Python 2 script can generate an XML dump and an image dump - last updated 2023.
- Mediawiki Client Tools' MediaWiki Dump Generator dumpgenerator Python 3 script can generate an XML dump and an image dump - last updated 2023.
- See above: Save the Web Project's WikiTeam3 wikiteam3dumpgenerator Python 3 script can generate an XML dump and an image dump - actively maintained in 2024.
Extensiones
- Extension:DumpsOnDemand – Permite a los usuarios generar y descargar volcados de bases de datos
- Extension:DataDump – Permite a los usuarios generar y descargar XML, y volcados de archivos/imágenes
Véase también
- Help:Export es una forma rápida y fácil de guardar todas las páginas de tu wiki.
- Manual:Restoring a wiki from backup
- Manual:Moving a wiki
- Manual: Actualización
- Manual:Restoring wiki code from cached HTML — si no tienes una copia de seguridad válida
- Exporting all the files of a wiki
Referencias
- ↑ Manual talk:Backing up a wiki#Ubuntu 10.10 - Step by Step Instructions
- ↑ Los volcados XML son independientes de la estructura de la base de datos, y pueden importarse en versiones futuras (e incluso pasadas) de MediaWiki.