Extension:ORES
L'extension ORES intègre les données d'un service ORES dans la vue RecentChanges.
Actuellement, le service ORES n'est configuré que pour les wikis Wikimédia. Un travail important serait nécessaire pour le configurer pour les installations MediaWiki tierces.
Il est installé sur plusieurs sites Wikimédia mais n'est plus déployé sur les nouveaux. For newer work on machine learning in Wikimedia, see Machine Learning/Modernization .
Captures d'écran
Installation
- Téléchargez et placez le(s) fichier(s) dans un répertoire appelé
ORES
dans votre dossierextensions/
.
Les développeurs et les contributeurs au code doivent à la place installer l'extension à partir de Git en utilisant:cd extensions/
git clone https://gerrit.wikimedia.org/r/mediawiki/extensions/ORES - Ajoutez le code suivant à la fin de votre fichier LocalSettings.php :
wfLoadExtension( 'ORES' );
- Fait – Accédez à Special:Version sur votre wiki pour vérifier que l'extension a bien été installée.
Vous devez exécuter le script de maintenance CheckModelVersions.php une fois qu'il est déployé (et après cela, vous pouvez également exécuter PopulateDatabase.php).
If you want to setup a local development environment for MediaWiki + ORES extension using the following ORES extension local development guide :
Variables de configuration
Voici les variables de configuration et leurs valeurs par défaut ainsi qu'une petite description à leur sujet.
// URL of the ORES service
$wgOresBaseUrl = 'https://ores.wikimedia.org/';
// Either to exclude edits made by bot to score
$wgOresExcludeBots = true;
// Models to score
$wgOresModels = [
'damaging' => [ 'enabled' => true ],
'goodfaith' => [ 'enabled' => true ],
'reverted' => [ 'enabled' => false ],
'articlequality' => [
'enabled' => false,
'namespaces' => [ 0 ],
'cleanParent' => true,
'keepForever'=> true
],
'wp10' => [
'enabled' => false,
'namespaces' => [ 0 ],
'cleanParent' => true,
'keepForever'=> true
],
'draftquality' => [
'enabled' => false,
'namespaces' => [ 0 ],
'types' => [ 1 ],
],
];
// Will replace ORES with Lift Wing for fetching scores
$wgOresUseLiftwing = false;
// URL for Lift Wing - Skippeed if null
$wgOresLiftWingBaseUrl = null;
// Thresholds of different sensitivies in ORES
$wgOresDamagingThresholds = [ 'soft' => 0.7, 'hard' => 0.5 ];
// Namespaces the ORES should score. Empty array means all namespaces.
// If not empty, it will only works on the given namespaces.
// Determine namespaces like [ 0 => true, 120 => true ].
$wgOresEnabledNamespaces = [];
// Database id for ORES service. If not determined, it'll use database name.
// You can choose 'testwiki' that ORES service sends last two digits of rev_id flipped.
// For example: https://ores.wikimedia.org/v1/scores/testwiki/damaging/12345
$wgOresWikiId = null;
Débogage d'un déploiement de l'extension ORES
After we deploy the extension with either ORES or Lift Wing as a backend we can use the steps in the ORES extension debugging guide to make sure it is working fine.
Réponses du service ORES
ORES extension is merely more than an interface to the ORES service. The service returns a probability score of edits being damaging like this (API v1):
{
"724030089": {
"damaging": {
"prediction": false,
"probability": {
"false": 0.8917716518085119,
"true": 0.10822834819148802
}
}
}
}
It means this edit (diff=724030089
) is 10% likely to have caused damage. Note that 90% likely doesn't mean 9 out of ten cases will be vandalism. Choosing thresholds should be done via analysing recall (percentage of vandalism it can catch) or false positive rate. In ORES the "soft" threshold is when recall is 75% (meaning it will include 75% of all damaging edits) and the "hard" threshold is when recall is 90%. You can get the thresholds from model info (an example).
Schéma de la base de données
ORES extension introduces two new tables: ores_model and ores_classification. See the full database schema description.
Flux de travail de l'extension
Scores
Once an edit is made the extension triggers a job to hit the service and store the results in the ores_classification table. It means it will not include scores for edits made before the deployment. In order to fill the database you can run the maintenance script PopulateDatabase.php. It will hits the service and keeps the score for the last 5,000 edits. You can run it several times if needed.
Once a model gets updated to a newer version CheckModelVersions.php maintenance script needs to be ran to update the ores_model table which will cause to scores stored in the ores_classification table become deprecated. You can clean these obsolete scores by running PurgeScoreCache.php maintenance script.
Interface
The extension won't show anything when deployed but it will add itself as a beta feature (Extension:BetaFeatures is a dependency of this extension) and once it's enabled by the user it will use hooks in ChangesList (RecentChanges, Watchlist, and RelatedChanges) in both old and enhanced mode and highlights when score exceeds the given threshold.
Cette extension est utilisée par au moins un des projets Wikimédia. Cela signifie probablement que l’extension est assez stable et fonctionnelle pour être utilisée sur des sites à fort trafic. Recherchez le nom de cette extension dans le CommonSettings.php de Wikimédia et dans le fichier de configuration InitialiseSettings.php pour situer les endroits où elle est installée. Une liste complète des extensions installées sur un Wiki donné peut être visualisée sur la page Special:Version de ce wiki. |