Ajuda:Tradução de Conteúdo/Tradução/Qualidade da Tradução

This page is a translated version of the page Help:Content translation/Translating/Translation quality and the translation is 95% complete.
PD Nota: Quando modificais esta página, estais a aceitar que a vossa contribuição se publique no marco de CC0. Olhem Páginas de ajuda de domínio público para mais informação. PD

Quando criar uma tradução, é essencial que reveja os conteúdos antes de os publicar. Você precisa garantir que o conteúdo produzido não esteja alterando o significado original e verifique se ele é natural no idioma de destino. A tradução automática inicial fornecida ajuda a acelerar o processo de tradução com um ponto de partida útil, mas a ferramenta incentiva os usuários a revisar e editar significativamente o conteúdo inicial.

Diferentes mecanismos garantem que os tradutores editem as traduções iniciais adequadamente. O editor de tradução rastreia quanto a tradução inicial é modificada pelo usuário e define limites diferentes para impedir a publicação ou avisar os usuários para incentivá-los a revisar mais o conteúdo.

Dessa maneira, a ferramenta possibilita que os usuários usem a tradução automática quando fizerem um bom uso, enquanto impede a criação de traduções de baixa qualidade levemente revisadas. Mais detalhes sobre como esses limites funcionam, como eles podem ser ajustados às necessidades de cada idioma e como medir a qualidade do conteúdo produzido com a ferramenta são fornecidos abaixo.

Limites para incentivar a revisão da tradução

A tradução de conteúdo mede a porcentagem de modificações que os usuários fazem na a tradução automática inicial fornecida. Dessa maneira, o sistema sabe quantas palavras foram adicionadas, removidas ou modificadas na tradução inicial. As medições são feitas em dois níveis diferentes: para cada parágrafo e para toda a tradução. Limites diferentes são aplicados em cada nível, conforme detalhado a seguir.

Limites para toda a tradução

 
Erro mostrado ao tentar publicar uma tradução com muitas traduções automáticas não modificadas. Esse limite foi ajustado para o indonésio com base no feedback de seus editores.

A publicação será bloqueada se 95% ou mais de todo o documento estiver com conteúdo não modificado, não revisionado e traduzido por máquina ou alguma aplicação semelhante. Este limite evita prováveis vandalizações evidentes do conteúdo, além de traduções automáticas quase cruas. Também evita que os usuários simplesmente adicionem conteúdo, sem editar a parte da tradução automática. Conforme detalhado abaixo, esse limite pode ser ajustado pelo idioma de sua preferência.

Limites para cada parágrafo

 
Aviso mostrado para um parágrafo específico onde a tradução automática não modificada ou revisada ultrapassa limites.

A porcentagem de modificações do usuário também é medida para cada parágrafo. Um parágrafo é considerado problemático quando contém mais de 85% da tradução automática inicial (ou, ao copiar o conteúdo do documento de origem, contém mais de 60% do conteúdo não modificado ou revisado).

O editor de tradução mostrará um aviso para cada parágrafo considerado problemático, incentivando futuras edições por parte do usuário. Em alguns casos, os usuários ainda podem publicar, mas a página resultante pode ser adicionada a uma categoria de rastreamento de traduções potencialmente não revisadas para a comunidade modificar ou atualizar. Em outros casos, os usuários podem não ter permissão para publicar.

A seguir estão alguns dos fatores considerados para determinar se os usuários podem publicar ou não (alguns dos quais ainda estão em desenvolvimento):

  • O número de parágrafos problemáticos. Os usuários são impedidos de publicar traduções com 50 ou mais parágrafos problemáticos. A publicação de traduções com menos de 50 parágrafos problemáticos é permitida, mas aqueles com 10 a 49 parágrafos problemáticos serão adicionados a uma categoria de rastreamento de traduções potencialmente não revisadas para a comunidade revisar.
  • Traduções anteriores excluídas. Para evitar problemas recorrentes, a ferramenta identifica os usuários cujas traduções publicadas foram excluídas nos últimos 30 dias e impõe limites muito mais rígidos aos esforços de tradução subsequentes. Para os usuários desta classe, traduções com 10 parágrafos problemáticos ou mais não podem ser publicadas, enquanto aquelas com 9 ou menos parágrafos problemáticos são adicionadas a uma categoria de rastreamento de traduções potencialmente não revisadas para a comunidade revisar.
  • Confirmação do usuário. Um limite menos estrito é considerado para os parágrafos que um usuário/a marca como resolvidos - tomado como um sinal de que o usuário/a revisou e confirmou o status da tradução. Para parágrafos onde o aviso de conteúdo não modificado é mostrado, mas o usuário o marca como resolvido, um limite menos estrito é aplicado (aceitando 95% da tradução automática ou 75% do conteúdo original). Isso fornecerá uma maneira de acomodar os casos em que a tradução automática foi excepcionalmente boa, mas ainda evitará um possível abuso do recurso (ou seja, não seguindo cegamente a confirmação do/a usuário/a).

Conteúdos não afetados pelos limites

Não se espera que alguns conteúdos sejam editados significativamente, e isso não é considerado ao aplicar os limites descritos acima. Títulos de seções muito curtos, citações ou a lista de referências são excluídos da revisão. Caso contrário, os usuários podem receber avisos enganosos sobre a tradução de conteúdo que não deveria, como exemplos títulos de livros que aparecem em referências ou outros nomes próprios.

Limits on the mobile experience

For the mobile experience the initial set of limits follow a simpler approach. At the moment, only the overall percentage of unmodified machine translation for the whole translation is considered. On mobile, the whole translation consist of just one section of the article.

In particular, a warning is shown when the percentage of unmodified machine translation is over 85% for the whole section, and publishing is prevented when the percentage of unmodified machine translation is over 95%.

O feedback sobre como o sistema de limites funciona no contexto móvel seria muito útil para determinar como evoluir essa abordagem inicial.

Publication of fast unreviewed translations

Campaigns and contests can result in spikes of translations where some user unfamiliar with the community policies may focus on making many translations and not pay enough attention to review their contents. In order to emphasize quality over quantity, a mechanism has been defined to limit the publication of fast unreviewed translations.

After a user translates a large article, the next translation can only be started after some time has passed. The waiting period estimation considers 1 minute per paragraph up to 10 minutes. That is:

  • For articles with 10 paragraphs or less, we want to make sure that users spent translating it at least N minutes (one minute per paragraph)
  • For articles with more than 10 paragraphs we want to make sure that users spent translating it at least 10 minutes.


This has been applied on mobile initially since it is a space with less activity, and after measuring the impact we'll consider expanding it to desktop too.


Ajustar os limites

Os limites descritos acima fornecem um conjunto de mecanismos gerais, mas eles podem precisar de ajustes dependendo das necessidades particulares de cada wiki. Com base na avaliação inicial, a quantidade de modificações necessárias para a tradução automática inicial pode variar de 10% a 70%, dependendo do par de idiomas. Em alguns wikis, os limites padrão podem ser muito rígidos, gerando ruído desnecessário ou impedindo a publicação de traduções perfeitamente válidas. Em outros wikis, os limites podem não ser rígidos o suficiente, permitindo a publicação de traduções que não foram editadas o suficiente.

Ajustar os diferentes limites permite que cada wiki ajuste os limites da ferramenta de acordo com suas necessidades particulares. O feedback dos falantes nativos é essencial para ajustar adequadamente os limites impostos. Se os limites atuais não parecem funcionar bem com base em sua experiência na criação ou revisão de traduções, por favor compartilhe seus comentários, e podemos explorar como melhor ajustá-los.

Ao fornecer feedback sobre o ajuste dos limites, recomendamos que você primeiro crie várias traduções de exemplo (certifique-se de verificar as opções de publicação se o seu teste não se destina a ser publicado como conteúdo normal). Ao testar como os limites funcionam para o seu idioma, é útil ter em mente o seguinte:

  • Verifique os dois casos. Certifique-se de verificar como os limites funcionam para ambos: traduções onde o conteúdo não foi editado o suficiente, versus onde foi editado o suficiente. Desta forma, você pode encontrar mais facilmente o equilíbrio certo para o recurso de limites de ferramentas. Verificar apenas um tipo de problema pode levar a mover os limites muito longe na direção oposta.
  • Verifique o conteúdo diferente. O conteúdo em nossos wikis é altamente diversificado e a tradução automática pode funcionar muito melhor em alguns casos do que em outros. Por exemplo, conteúdo que está cheio de dados numéricos ou nomes técnicos pode exigir menos edição pelos usuários do que conteúdo com texto mais descritivo. Certifique-se de fazer o teste traduzindo uma variedade de tipos de artigos diferentes, de comprimentos variados, com conteúdo ímpar.
  • Prepare-se para reiterar. Ajustar os limites é um processo repetitivo. Isso pode exigir ajustes personalizados para os limites ou que você melhore sua abordagem geral. Em qualquer caso, após cada alteração, mais testes podem ser necessários para verificar as melhorias feitas.

Ajustar os limites em colaboração com os editores prova ser eficaz. Por exemplo, os resultados iniciais mostram que a comunidade indonésia conseguiu reduzir significativamente o número de traduções problemáticas que recebia ao restringir a publicação de traduções com mais de 70% de conteúdo de tradução automática não modificado. Ajustes semelhantes foram feitos para os wikis dos idiomas telugu e assamês. Não existe ferramenta automática infalível e esses limites não são uma exceção.

O processo de revisão de conteúdo pela comunidade ainda é essencial, mas esses limites fornecem às comunidades uma ferramenta para reduzir o número de traduções em que devem se concentrar, tornando o processo de revisão muito mais eficaz. Por favor, compartilhe seus comentários e podemos explorar como melhor ajustá-los.

Rastreando traduções potencialmente não revisadas

Uma categoria de rastreamento com o nome "cx-unreviewed-translation-category" é fornecida para que as comunidades encontrem facilmente artigos que foram publicados com algum conteúdo excedendo os limites recomendados.

Você pode encontrar esta categoria na lista de categorias de rastreamento em cada wiki. Usando-o, você pode rastrear artigos que ultrapassaram os limites que impedem a publicação, mas que ainda tiveram alguns parágrafos que foram editados menos do que o esperado. Por exemplo, a categoria da Wikipedia Indonésia inclui artigos com menos de 40% de tradução automática em geral, mas que têm alguns parágrafos com mais de 80% de tradução automática não modificada.

Medindo a qualidade da tradução

Avaliar a qualidade do conteúdo automaticamente não é trivial. As taxas de exclusão fornecem uma medida útil para estimar se o conteúdo criado era bom o suficiente para que a comunidade envolvida não o excluísse. Com base na análise das taxas de exclusão, os artigos criados como traduções têm menos probabilidade de serem excluídos quando comparados com artigos criados do zero. Isso sugere que pode não ser prático definir os limites de participação por meio da tradução muito mais altos do que aqueles definidos para outras formas de criação de artigos.

Encontrar traduções publicadas

A tradução de conteúdo adiciona uma tag de edição contenttranslation às traduções publicadas. Isso permite que as comunidades usem as mudanças recentes e ferramentas semelhantes para se concentrarem nas páginas criadas com a ferramenta de tradução. Além disso, dados sobre traduções publicadas e as estatísticas para uso de tradução automática estão disponíveis para qualquer pessoa analisar.

Inspecione uma tradução específica

Exemplo de depuração de tradução

O Depurador de tradução é uma ferramenta que permite a inspeção de alguns metadados de uma determinada tradução, incluindo a porcentagem de tradução automática utilizada para todo o documento, e o serviço de tradução utilizado para cada parágrafo. Para tipos específicos de conteúdo, como modelos, a API do Servidor de Tradução de Conteúdo pode ser consultada para verificar como os modelos serão transferidos entre idiomas.

Outros limites com base na experiência do usuário

 
Erro ao mostrar uma restrição de publicação com base na experiência do usuário. Este exemplo é baseado na decisão da comunidade da Wikipédia em Inglês de limitar a publicação diretamente no espaço principal apenas para usuários autoconfirmados estendidos.

Alguns wikis implementaram outras restrições à tradução com base nos direitos do usuário, como forma de reduzir a criação de traduções de baixa qualidade. Por exemplo, , o que significa que eles precisam fazer 500 edições na Wikipedia em inglês antes de poderem publicar uma tradução como um artigo. Os editores mais recentes ainda podem publicar artigos traduzidos nos namespaces User: ou Draft: e, em seguida, mova o artigo para o espaço principal.

Esta restrição foi criada antes que o sistema de limites descrito nesta página estivesse disponível, e não é a abordagem recomendada para encorajar a criação de traduções de boa qualidade.

Antes de adicionar restrições que não levem em consideração o conteúdo criado, considere realizar o processo de ajuste dos limites do conteúdo não modificado conforme descrito acima. Os limites podem ser tão rígidos quanto necessário para evitar traduções de baixa qualidade, ao mesmo tempo que permitem a publicação por editores que fazem boas traduções.