Aide:Traduction de contenu/Traduire/Traduction automatique initiale
Note : si vous modifiez cette page, vous acceptez de placer votre contribution sous licence CC0. Plus d’informations sont disponibles sur le projet Aide dans le domaine public. |
Lorsque vous ajoutez un nouveau paragraphe à la traduction, vous pouvez partir de zéro ou utiliser une traduction automatique comme point de départ. Lorsqu'elle est disponible, la traduction automatique est utilisée par défaut comme traduction initiale. Les différentes options, les détails de leur disponibilité et les considérations relatives à l'utilisation de la traduction automatique sont décrits ci-dessous.
Options pour la traduction initiale
Les options de "traduction initiale" dans la colonne des outils vous permettent de décider du contenu initial à utiliser comme point de départ pour chaque paragraphe. Les options disponibles sont les suivantes :
- Utiliser un service de traduction automatique. Ceci vous permet de commencer avec une version du paragraphe d'origine, traduite automatiquement. Le nombre et le nom de ces options peuvent varier. Des options telles que "Utiliser Apertium" ou "Utiliser Yandex" sont disponibles en fonction des langues prises en charge par ces services (pour en savoir plus, voir la section suivante).
- Copie du contenu original. Le paragraphe d'origine est repris intégralement dans la traduction. Bien que le contenu reste dans la langue originale, certains éléments sont adaptés au wiki ciblé. Par exemple, les liens pointeront vers l'article correspondant dans la langue cible, et les modèles seront convertis en modèles équivalents. Les traducteurs doivent néanmoins réécrire complètement le contenu, mais les éléments adaptés seront plus faciles à réutiliser.
- Commencer par un paragraphe vide. Commencer par un paragraphe vide peut être utile dans les cas où le nouveau contenu nécessite plus de travail que la simple saisie.
Vous pouvez rapidement passer d'une approche à l'autre indépendamment sur chaque paragraphe, car chacune d'entre elles peut fonctionner au mieux sur différents types de contenu. Le fait de passer d'une approche à l'autre préserve les modifications que vous avez apportées au paragraphe. De cette façon, vous pouvez essayer une approche différente même si vous avez commencé à modifier l'original, sans craindre de perdre vos modifications si vous décidez finalement de revenir à l'approche de départ. Deux autres options sont utiles dans ce contexte :
- L'option réinitialiser la traduction est disponible lorsque vous avez effectué des modifications sur le contenu proposé initialement. Il vous permet de restaurer le contenu initial en supprimant les modifications que vous avez apportées.
- L'option marquer par défaut est disponible lorsque pour un paragraphe, vous sélectionnez une approche qui n'est pas celle par défaut. Elle vous permet de définir l'approche par défaut pour les paragraphes suivants qui sont ajoutés à la traduction. Ceci peut être très pratique si vous avez constaté qu'un service de traduction particulier fonctionne généralement mieux que le service par défaut.
Disponibilité des traductions automatiques
La traduction de contenu intègre plusieurs services de traduction, et chaque service prend en charge un ensemble différent de langues. Les services disponibles sont énumérés ci-dessous avec un lien vers la liste des langues qu'ils prennent en charge :
- MinT (languages supported)
- Apertium (langues prises en charge)
- LingoCloud (langues prises en charge)
- Google Translate (langues prises en charge)
- Yandex (langues prises en charge)
- Elia (initialement connu comme Matxin) (langues prises en charge)
Les listes de langues ci-dessus indiquent le code de configuration pour s'assurer que les informations sont synchronisées avec le fonctionnement actuel de l'outil. Les listes indiquent le code de la langue source au niveau d'indentation initial et les codes de toutes les langues cibles prises en charge en dessous.
Vous pouvez également vérifier les services disponibles pour une paire donnée de langues en utilisant nos APIs. Dans cet exemple pour la paire espagnol-catalan, vous pouvez voir que Apertium est le service par défaut (premier de la liste) parmi les autres services disponibles.
Les langues sont autorisées progressivement, en fonction des résultats observés et des réactions de la communauté. Il est possible que la traduction automatique pour quelques langues ne soit pas encore activée, même si elle est prise en charge par les services concernés.
Amélioration des services de traduction existants
Lorsque vous publiez une traduction avec Content Translation, vous contribuez à l'amélioration des services de traduction. Toutes les corrections que vous apportez aux traductions automatiques initiales sont exposées via une API et des extractions de données et peuvent être potentiellement utilisées pour améliorer les services existants. En outre, certains des services de traduction énumérés ci-dessus offrent des moyens spécifiques pour contribuer à leurs projets.
MinT
The translations provided by MinT are based on translation models such as NLLB-200 and OpusMT. The training data compiled by the Opus project is resused by many translation models, and you can contribute to it in order to help improve the translation quality for your language.
OpusMT est un système open source de traduction automatique neuronale qui est entraîné à l'aide de documents multilingues disponibles en ligne et sous licence gratuite. Ce corpus ouvert est utilisé pour former le système de traduction, et l'élargissement du corpus permettra d'obtenir de meilleures traductions. Les contenus générés par la traduction de contenu sont automatiquement intégrés dans le corpus, mais vous pouvez contribuer à l'expansion du corpus :
- Proposez de nouvelles sources à intégrer dans le corpus ouvert. Vous pouvez contacter Jörg Tiedemann pour proposer une nouvelle source de données afin d'élargir le corpus.
- Soumettre directement des documents (encore à l'état de prototype). Vous pouvez télécharger des documents traduits dans différents formats, y compris des pages web traduites à intégrer au corpus.
- Essayez les modèles de langues localement avec OPUS-CAT (disponible sous Windows)
- Participez à d'autres projets qui contribuent avec leurs traductions à ce corpus ouvert tel que Tatoeba, une communauté en ligne ouverte qui recueille des traductions de phrases dans différentes langues.
OpusMT est basé sur MarianNMT qui est également un projet open source. Les personnes ayant des connaissances techniques et intéressées par l'apprentissage machine peuvent également contribuer à son amélioration.
Apertium
Apertium est un système de traduction open source basé sur des règles. Vous pouvez contribuer au projet en codant les règles de langage pour votre langue. Ce processus nécessite des connaissances linguistiques et techniques avancées, mais vous pouvez obtenir l'aide de l'équipe Apertium pour étendre le support de traduction d'une nouvelle paire de langues.
Google Translate
Google Translate n'est pas un projet open source, mais il existe pour les utilisateurs des moyens d'y contribuer:
- Rejoignez the Google Translate Community pour fournir des traductions qui aident à entraîner leur système.
- Rapportez les bogues lorsque le système de traduction présente un comportement inattendu lors du traitement de certains éléments tels que l'espacement, les nombres ou les marques de fin de phrase (voir la liste complète)..
Étendre la prise en charge linguistique avec de nouveaux services de traduction
La traduction de contenu a été conçue comme une plate-forme extensible. Il est donc possible de développer de nouveaux clients pour intégrer des services de traduction supplémentaires. Quelques considérations sur la manière dont les services de traduction sont intégrés :
- Les traductions automatiques et les corrections apportées par les utilisateurs sont publiées comme partie des données sur les traductions publiées, ce qui peut fournir une ressource utile pour créer ou améliorer votre service de traduction.
- Les services externes intégrés ne reçoivent que le contenu du wiki accessible au public, et renvoient une version traduite de ce contenu qui est compatible avec les licences utilisées dans le wiki. Aucune information personnelle n'est partagée avec les services de traduction.
Le retour d'information sur la prise en charge de chaque langue est très utile. Veuillez nous faire savoir si vous manquez de ressources pour certaines langues, ou si des options de meilleure qualité sont disponibles pour celles-ci. Vous pouvez donner ces informations sur la page de discussion du projet ou dans ce billet.
Considérations sur la traduction automatique
La traduction automatique est loin d'être parfaite lorsqu'elle est envisagée comme un résultat final. Cependant, de nombreux utilisateurs la trouvent très utile comme point de départ. Nous vous invitons à en examiner le contenu sous ces différents angles :
- Assurez-vous que le sens du texte d'origine est respecté.
- Vérifiez qu'il ne manque aucune information, en particulier pour les éléments tels que les liens, les références et les modèles qui contiennent des informations qui ne sont pas toujours visibles en surface.
- Relisez le contenu traduit pour vous assurer qu'il se lit naturellement comme une page indépendante.
Limitations avec des éléments complexes
Dans certains cas, le contenu peut ne pas apparaître comme prévu dans la traduction :
- Certains des services pris en charge ne fonctionnent qu'avec du texte simple. Cela signifie que le formatage et les éléments de contenu riche tels que les liens et les citations de l'article original, sont perdus dans la traduction, et la traduction de contenu doit deviner où ils se trouvent dans le texte traduit. Le rajout de ces éléments n'est pas toujours parfait et certains éléments peuvent être mal placés ou appliqués à la mauvaise partie du texte.
- Les éléments complexes tels que les références ou les modèles peuvent utiliser une structure différente dans chaque langue, ce qui rend difficile le transfert du contenu d'une langue à l'autre. Veillez à examiner le contenu de ces éléments pour vous assurer qu'aucune information importante ne manque.
Imposer la vérification de la traduction automatique
Plusieurs mécanismes automatiques existent pouraccroitre la vérification du contenu initial. De cette façon, l'outil s'assure que la traduction automatique initiale est suffisamment retravaillée avant que le contenu ne soit publié.