Extension:CirrusSearch/fr
CirrusSearch État de la version : stable |
|
---|---|
Implémentation | Rechercher, API , Accroche |
Description | Implémente la recherche dans MediaWiki en utilisant Elasticsearch |
Auteur(s) | Nik Everett, Chad Horohoe, Erik Bernhardson |
Dernière version | mises à jour continues |
Politique de compatibilité | Versions ponctuelles alignées avec MediaWiki. Le master n'est pas compatible arrière. |
MediaWiki | >= 1.43 |
Composer | mediawiki/cirrussearch |
Licence | Licence publique générale GNU v2.0 ou supérieur |
Téléchargement | README |
|
|
|
|
|
|
Téléchargements trimestriels | 282 (Ranked 18th) |
Utilisé par les wikis publics | 1,226 (Ranked 212nd) |
Traduire l’extension CirrusSearch sur translatewiki.net si elle y est disponible | |
Rôle Vagrant | cirrussearch |
Problèmes | Tâches ouvertes · Signaler un bogue |
L'extension CirrusSearch implémente la recherche dans MediaWiki en utilisant Elasticsearch.
CirrusSearch a été programmé pour que la migration utilise OpenSearch comme serveur, mais cette décision est examinée sur la base d'un article de blog publié fin août 2024 par le fournisseur amont de l'actuel serveur de recherche concernant sa licence. Voir Wikimedia Search Platform/Decision Records/Search backend replacement technology pour plus d'informations. |
Elastic Search est un logiciel tiers indépendant qui doit être installé avant cette extension. C'est un système de base de données qui fournit des fonctionnalités de recherche et d'indexation, et qui indique où le texte actuel de chaque page de votre wiki sera indexé pour accélérer et améliorer le résultat des recherches. La communication entre MediaWiki et ElasticSearch se fait via les services web.
Voir aussi la page d'aide sur l'utilisation de cette extension.
Objectifs
- Aucune dépendance native qui rendrait l'installation difficile. ** Les seules dépendances sont celles de PHP, les extensions MediaWiki, et Elasticsearch lui-même.
- Fournir un index de recherche quasiment en temps réel pour les pages wiki extensibles par d'autres extensions MediaWiki.
- Fournir aux utilisateurs toutes les options de recherche dont MWSearch disposait, et davantage.
Dépendances
- PHP et cURL
- En plus des besoins standard de MediaWiki pour PHP, CirrusSearch nécessite que PHP soit compilé avec la prise en charge de cURL.
- Elasticsearch
- Vous devrez installer Elasticsearch.
Chaque version de ElasticSearch modifie la manière dont fonctionnent les services web et causent des problèmes de compatibilité. Vous devez installer la version de Elastic Search qui est compatible avec la version de MediaWiki que vous utilisez.
Notez bien qu'une installation supplémentaire de Java comme OpenJDK est nécessaire. Il vaut mieux utiliser l'image Docker officielle de Elasticsearch ou une version auto-hébergée. Un produit géré tel que Amazon OpenSearch (initialement Amazon Elasticsearch) peut fonctionner mais peut nécessiter une configuration supplémentaire en fonction de ses spécificités. Par exemple, Amazon OpenSearch n'écoute que les requêtes de l'API Elasticsearch sur HTTPS port 443 (c'est à dire qu'il n'expose pas le port par défaut Elasticsearch 9200), donc un proxy avec TLS (comme Nginx) peut activer CirrusSearch pour communiquer avec une grappe Amazon OpenSearch.
- Elastica est une bibliothèque PHP pour parler à Elasticsearch. Installez Elastica à l'aide des instructions ci-dessous.
- Autres
- A cause de la manière dont l'extension CirrusSearch gère actuellement les tâches, il est recommandé de fixer les tâches dans Redis afin d'empêcher les messages tels que Notice: unserialize(): Error at offset 64870 of 65535 bytes in JobQueueDB.php et les erreurs qui en découlent comme Unsupported operand types. Voir tâche T157759.
Installation
Bien que les instructions ci-dessous vous indiquent de n'excuter Composer que lorsque vous faites une installation à partir de Git, il peut être nécessaire de le faire passer dans tous les cas afin d'installer toutes les dépendances PHP.
- Téléchargez et placez le(s) fichier(s) dans un répertoire appelé
Elastica
dans votre dossierextensions/
.
Les développeurs et les contributeurs au code doivent à la place installer l'extension à partir de Git en utilisant:cd extensions/
git clone https://gerrit.wikimedia.org/r/mediawiki/extensions/Elastica - Seulement lorsque vous installez à partir de Git, exécutez Composer pour installer les dépendances PHP, en entrant
composer install --no-dev
après vous être positionné dans le répertoire de l'extension. (Voir tâche T173141 pour des complications potentielles.) - Ajoutez le code suivant à la fin de votre fichier LocalSettings.php :
wfLoadExtension( 'Elastica' );
- Fait – Accédez à Special:Version sur votre wiki pour vérifier que l'extension a bien été installée.
CirrusSearch
- Téléchargez et placez le(s) fichier(s) dans un répertoire appelé
CirrusSearch
dans votre dossierextensions/
.
Les développeurs et les contributeurs au code doivent à la place installer l'extension à partir de Git en utilisant:cd extensions/
git clone https://gerrit.wikimedia.org/r/mediawiki/extensions/CirrusSearch - Seulement lorsque vous installez à partir de Git, exécutez Composer pour installer les dépendances PHP, en entrant
composer install --no-dev
après vous être positionné dans le répertoire de l'extension. (Voir tâche T173141 pour des complications potentielles.) - Ajoutez le code suivant à la fin de votre fichier LocalSettings.php :
wfLoadExtension( 'CirrusSearch' );
- Maintenant suivez les instructions de configuration du fichier CirrusSearch README figurant avec votre extension par exemple
$IP/extensions/CirrusSearch/README
. Notez bien que toutes les informations qui y figurent ne s'appliquent pas forcément à la version de votre extension, particulièrement en ce qui concerne la version compatible de Elasticsearch. - Configurez comme cela est indiqué.
- Fait – Accédez à Special:Version sur votre wiki pour vérifier que l'extension a bien été installée.
Autoriser les requêtes avec des expressions régulières
This is an optional step. You will need to install the search-extra plugin for this. Do so by following these steps:
- execute the following command:
/usr/share/elasticsearch/bin/elasticsearch-plugin/elasticsearch-plugin install org.wikimedia.search:extra:7.10.2-wmf12
- add the following line to your
LocalSettings.php
file:$wgCirrusSearchWikimediaExtraPlugin[ 'regex' ] = [ 'build', 'use', 'max_inspect' => 10000 ];
- restart Elasticsearch with the following command:
systemctl restart elasticsearch
- recreate the search index by executing the following commands:
php path/to/extensions/CirrusSearch/maintenance/UpdateSearchIndexConfig.php --startOver
php path/to/extensions/CirrusSearch/maintenance/ForceSearchIndex.php
Mise à jour
Veuillez suivre les instructions de mise à jour conenues dans le fichier CirrusSearch UPGRADE .
Configuration
Les paramètres de configuration CirrusSearch sont documentés dans le fichiers "settings.txt". Voir aussi la documentation sur les profils de configuration CirrusSearch.
$wgCirrusSearchIndexBaseName
qui doit être initialisé, par exemple $wgCirrusSearchIndexBaseName = 'mywikidatabasename';
.
Accroches
L'extension CirrusSearch définit un nombre d'accroches que les autres extensions peuvent réutiliser pour étendre le schéma du noyau et pour modifier les documents. Les accroches suivantes sont utilisables :
- CirrusSearchAnalysisConfig - permet de s'accocher à la configuration pour des besoins d'analyse
- CirrusSearchMappingConfig - permet le paramètrage de la correspondance des champs
- CirrusSearchBuildDocumentParse - permet aux extensions de modifer le document ElasticSearch produit à partir d'une page
- CirrusSearchBuildDocumentLinks - permet aux extensions de traiter les liens entrants et sortants pour le document
- CirrusSearchBuildDocumentFinishBatch - appelé lorsqu'un lot de pages a été indexé
- CirrusSearchAddQueryFeatures - permet aux extensions d'ajouter des fonctionnalités à l'analyseur syntaxique des requêtes
- CirrusSearchScoreBuilder - permet aux extensions de définir des fonctions de rescore au build
- CirrusSearchProfileService - permet aux extensions de déclarer et configurer différents composants de recherche
API
Les fonctionnalités de CirrusSearch peuvent être utilisées dans les requêtes d'API.
La recherche se fait en utilisant l'API search, action=query&list=search
; vous pouvez utiliser les fonctionnalités spécifiques de CirrusSearch, telles que le préfixe spécial morelike:
pour trouver les pages relatives à Marie Curie et au radium:
api.php?action=query&list=search&srsearch=morelike:Marie_Curie%7Cradium&srlimit=10&srprop=size&formatversion=2
Les APIs personnalisées et les paramètres sont fournis pour interroger la configuration CirrusSearch et les informations de débogage :
action=cirrusdump
module: 2014?action=cirrusdump- paramètre
cirrusDumpQuery
de Special:Search ou requêtes API search: https://en.wikipedia.org/wiki/Special:Search/cat%20dog%20chicken?cirrusDumpQuery - paramètre
cirrusDumpResult
de Special:Search ou requêtes API search : https://en.wikipedia.org/wiki/Special:Search/cat%20dog%20chicken?cirrusDumpResult - Un paramètre supplémentaire,
cirrusExplain
, peut être passé aveccirrusDumpResult
pour obtenir l'explication Lucene du noyau inclus avec la liste des résultats: https://en.wikipedia.org/wiki/Special:Search/cat%20dog%20chicken?cirrusDumpResult&cirrusExplain Il peut aussi être utilisé pour obtenir l'explication dans un format lisible par un humain, en lui donnant une des valeurs suivantes :verbose
,pretty
orhot
, comme pour : https://en.wikipedia.org/wiki/Special:Search/cat%20dog%20chicken?cirrusDumpResult&cirrusExplain=pretty - Les modules
cirrus-config-dump
,cirrus-settings-dump
,cirrus-mapping-dump
,cirrus-profiles-dump
permettent d'obtenir les paramètres CirrusSearch de configuration : api.php?action=cirrus-config-dump&formatversion=2
Voir aussi
- Liens généraux
- Page d'aide sur l'utilisation - Documentation sur l'utilisation de CirrusSearch (nécessaire après l'installation)
- Page du projet
- Informations concernant les paramètres Wikimedia Cirrus/Elastic
- Page d'aide à la configuration - ensembles de paramètres adaptables qui influencent différents aspects de l'indexation
- Extension:WikiSearch - fournit une API de recherche adaptée pour Semantic MediaWiki en utilisant ElasticSearch.
- Extension:AdvancedSearch - Etend Special:Search en fournissant des paramètres avancés
- Débogage
Développement local
Le service Elastic Search peut être exécuté avec les rôles Vagrant (cirrussearch
) et MediaWiki Vagrant.
Pour Docker, vous pouvez utiliser une commande telle que docker run -d --name elasticsearch -p 9200:9200 -p 9300:9300 -e "discovery.type=single-node" elasticsearch:6.8.2
.
Ensuite suivez les instructions pour l'installation et la configuration.
Si l'hôte pour votre web se trouve dans un conteneur, assurez vous que le conteneur se trouve sur le même réseau, et dans le fichier LocalSettings.php
référencez elasticsearch
comme nom de l'hôte.
Ceci ne prendra pas en compte les plugins WMF mais peut être suffisant pour les tests de base.
Cette extension est utilisée par au moins un des projets Wikimédia. Cela signifie probablement que l’extension est assez stable et fonctionnelle pour être utilisée sur des sites à fort trafic. Recherchez le nom de cette extension dans le CommonSettings.php de Wikimédia et dans le fichier de configuration InitialiseSettings.php pour situer les endroits où elle est installée. Une liste complète des extensions installées sur un Wiki donné peut être visualisée sur la page Special:Version de ce wiki. |
Cette extension est incluse dans les fermes de wikis ou les hôtes suivants et / ou les paquets : Cette liste ne fait pas autorité. Certaines fermes de wikis ou hôtes et / ou paquets peuvent contenir cette extension même s'ils ne sont pas listés ici. Vérifiez toujours cela avec votre ferme de wikis ou votre hôte ou votre paquet avant de confirmer. |