Extension:CommonsMetadata

This page is a translated version of the page Extension:CommonsMetadata and the translation is 42% complete.
Manual de extensiones de MediaWiki
CommonsMetadata
Estado de lanzamiento: estable
Implementación API
Descripción Intentos de extraer metadatos de páginas comunes
Autor(es) Brian Wolff (bawolffdiscusión)
Política de compatibilidad Lanzamientos de screenshots junto con MediaWiki. Master no es compatible con versiones anteriores.
MediaWiki 1.25+
PHP 5.4+
Cambios de la base de datos No
Licencia GNU Licencia Pública general 2.0 o posterior
Descarga
  • $wgCommonsMetadataForceRecalculate
  • $wgCommonsMetadataPublicDomainPageUrl
  • $wgCommonsMetadataSetTrackingCategories
Descargas trimestrales 75 (Ranked 69th)
Wikis públicos que lo utilizan 1,055 (Ranked 247th)
Traduce la extensión CommonsMetadata si está disponible en translatewiki.net
Asuntos Tareas abiertas · Reportar un bug

La extensión CommonsMetadata es un intento de extraer metadatos de las páginas de Wikimedia Commons pero también está disponible en todos los otros proyectos de Wikimedia. Añade información adicional a la API de imageinfo basándose en plantillas y categorías en la descripción de la imagen. Se utiliza por una serie de extensiones / herramientas (como Extensión:MultimediaViewer , Extension:VisualEditor , Extensión:MobileFrontend , Servicio-de-contenido-móvil (SCM)) para proporcionar mejores cajas de luz o diálogos de selección de imágenes.

La extensión en su forma actual pretende ser una solución temporal, eventualmente reemplazada por Wikidata en Commons.

Instalación

  • Descarga y extrae los archivos en un directorio denominado «CommonsMetadata» dentro de la carpeta extensions/.
    Developers and code contributors should install the extension from Git instead, using:cd extensions/
    git clone https://gerrit.wikimedia.org/r/mediawiki/extensions/CommonsMetadata
  • Añade el siguiente código en la parte final de tu archivo LocalSettings.php :
    wfLoadExtension( 'CommonsMetadata' );
    
  •   Hecho – Navega a Special:Version en el wiki para verificar que la extensión se haya instalado correctamente.

Elecciones & de diseño de la motivación

Véase mailarchive:wikitech-l/2013-August/071593.html.

La extensión asume lo siguiente.

  • En algún momento en el futuro, wikidata se hará cargo del manejo de los metadatos en los bienes comunes. Para evitar cambios disruptivos, que pronto deberán cambiarse nuevamente, la extensión debería funcionar con metadatos comunes tal como está actualmente (por lo tanto, no introducir nuevas funciones de analizador). De ahí el raspado de pantalla.
  • El contenido de muchos de los campos en una página de descripción de bienes comunes incluye formato enriquecido (en particular: enlaces, cursiva, negrita. En algunos casos, cosas más complejas como imágenes incrustadas)
    • Como resultado, la extensión genera HTML analizado (el wikitext apesta, el texto sin formato no captura los datos)
    • Además, los datos tienden a estar formateados para visualización humana, en lugar de (por ejemplo) fechas formateadas por máquina. Cuando el campo de fecha dice algo como "alrededor de 1600", es difícil convertirlo a una fecha precisa (ooh, muchos ejemplos pueden serlo).
    • Para llevar esto adelante, aplique también el formato a los metadatos exif, que se controlan en wiki (por ejemplo, commons vincula el nombre de la cámara a un artículo de wikipedia)
  • Si no podemos extraer información de la página de descripción, pero el archivo tiene el autor etiquetado en metadatos exif/XMP/iptc, deberíamos usarlo como alternativa.
  • Lo ideal sería que un sistema de este tipo fuera lo más inespecífico posible sobre los bienes comunes, con la parte de bienes comunes y no comunes separada.
  • Las páginas de descripción de Commons tienen descripciones en varios idiomas. Muchos usuarios probablemente solo quieran un idioma.
    • En esta implementación, se aplica según las convenciones del idioma a fechas y cosas. Además, para campos explícitamente multilingües (descripción), existe una opción para devolver todos o solo un idioma. Incluso en el modo de un solo idioma, algunas cosas siguen siendo específicas del idioma (como el separador de miles en los números)

Configuración

parámetro por defecto description
$wgCommonsMetadataSetTrackingCategories false Add the following tracking categories to file pages when the corresponding information is not provided either via templates on the file page of (for some of these) EXIF metadata:
  • Files with no machine-readable license (commonsmetadata-trackingcategory-no-license)
  • Files with no machine-readable description (commonsmetadata-trackingcategory-no-description)
  • Files with no machine-readable author (commonsmetadata-trackingcategory-no-author)
  • Files with no machine-readable source (commonsmetadata-trackingcategory-no-source)
  • Files with no machine-readable patent (commonsmetadata-trackingcategory-no-patent) (for 3D files)
$wgCommonsMetadataPublicDomainPageUrl https://commons.wikimedia.org/wiki/Help:Public_domain Link used for 'license' attribute in schema.org markup for files in the public domain.
$wgCommonsMetadataForceRecalculate false Force calculation of metadata even when the image is from a foreign repository that would provide it. This is meant for local development.

Pruebas

  Advertencia: If you're developing or testing this extension, we do NOT suggest you copy the Commons templates for image metadata, as they take extremely long to compile and have complicated dependencies like Scribunto. Instead, get an expanded version with only wikitext/HTML and manually put in the various parameter references (or don't). You can find an example (to be used with "Special:Import") here. Or use Vagrant which includes certain templates by default.

When testing with remote images (e.g. Commons images if you have enabled $wgUseInstantCommons ), you can set $wgCommonsMetadataForceRecalculate = true; to force CommonsMetadata to parse the description page of the image and extract the metadata (normally, if the remote repository had CommonsMetadata installed as well, it would just copy the API output from there).

Uso

Utilice la API imageinfo e incluya extmetadata como propiedad de información de imagen especificada mediante iiprop.

Ejemplo de uso:

https://commons.wikimedia.org/w/api.php?action=query&prop=imageinfo&format=json&iiprop=extmetadata&iilimit=10&titles=File%3ACommon%20Kingfisher%20Alcedo%20atthis.jpg

View this example in the API sandbox:

https://www.mediawiki.org/wiki/Special:ApiSandbox#action=query&prop=imageinfo&format=json&iiprop=extmetadata&iilimit=10&titles=File%3ACommon%20Kingfisher%20Alcedo%20atthis.jpg

Returned data

The extension currently provides the following items in the extmetadata field of the response (the field names were chosen, where possible, to follow the IPTC-IIM format used in EXIF headers):

  • ImageDescription - image description
  • Artist - author name (might contain complex HTML, multiple authors, etc)
  • Credit - source
  • DateTimeOriginal - time of creation (space-separated ISO 8601 timestamp whenever possible, but can be any other textual description of a date, possibly with HTML mixed in)
  • ObjectName - title (for a book/painting; otherwise just the file name)
  • Permission - contents of the Permission field of the template. It can be a lot of things (license template, OTRS ID, details on how to attribute...)
  • AuthorCount - the number of templates with authors (e.g., Book, Photograph...). The number of actual authors might be higher if a template describes multiple authors in a single string.
  • GPSLatitude - latitude
  • GPSLongitude - longitude
  • GPSMapDatum - coordinate type (only WGS-84 supported for now)
  • LicenseShortName - short human-readable license name
  • LicenseUrl
  • UsageTerms
  • Copyrighted - True or False (for public domain images)

For multi-licensed images, these values are currently unreliable.

  • Attribution - custom attribution that should replace Artist + Credit (can also originate from the Information template)
  • AttributionRequired - booleanish (phab:T86726), tells whether there is a legal requirement to attribute
  • NonFree - booleanish, true means the image is not under a free license. (Used for non-Commons images only.)

Other data:

  • CommonsMedadataExtension - contains the metadata parser version number; mostly for internal use
  • License - a best guess at the license of the image (mostly for internal use by MediaViewer, might change; LicenseShortName is probably more reliable)
  • Categories - a |-separated list of the categories of the image.

Based on parsing category names, probably won't work for images not hosted on Commons.

  • Restrictions - reuse restrictions such as trademarks or personality rights; an array of keywords (the class names from this table, without the restriction- prefix). See also the restrict-* icons in MediaViewer.
  • DeletionReason - if set, the template is being considered for deletion.

(Based on the nuke template, probably not reliable outside Commons.) It contains a deletion reason, but it is phrased to be applicable for a log entry, so it might be misleading (e.g. past tense when actually it is not yet decided whether the image will be deleted).

Véase también