Довідка:Переклад вмісту/Перекладання/Якість перекладу

This page is a translated version of the page Help:Content translation/Translating/Translation quality and the translation is 92% complete.
Outdated translations are marked like this.
PD Зверніть увагу! Коли Ви редагуєте цю сторінку, то погоджуєтесь робити свій внесок під ліцензією CC0. Детальніше про умови ліцензії можна дізнатися на сторінці довідки. PD

Під час створення перекладу важливо переглядати вміст перед його публікацією. Слід переконатися, що вироблений вміст не змінює початкового значення ненавмисно, та перевірити, що він читається природно мовою призначення. Початковий машинний переклад надає допомогу у пришвидшенні процесу перекладу корисною відправною точкою, але інструмент заохочує користувачів переглядати та суттєво редагувати початковий вміст.

Різні механізми гарантують, що перекладачі редагують початкові переклади відповідним чином. Редактор перекладу відстежує, в якій мірі початковий переклад змінено користувачем, і визначає різні обмеження для запобігання публікації чи попередження користувачів для їх заохочення до подальшого перегляду вмісту.

Таким чином, інструмент уможливлює використання користувачами машинного перекладу, коли вони добре використовують його, водночас запобігаючи створенню злегка переглянутих низькоякісних перекладів. Більше подробиць про роботу цих обмежень, їх підлаштування під потреби кожної мови та вимірювання якості вмісту, виробленого інструментом, надано нижче.

Обмеження для заохочення перегляду перекладу

Переклад вмісту вимірює відсоток змін, які користувачі зробили до наданого початкового машинного перекладу. Таким чином, система знає, скільки слів було додано, видалено чи змінено з початкового перекладу. Ці вимірювання зроблені на двох різних рівнях: для кожного абзацу та для всього перекладу. На кожному рівні застосовуються різні обмеження, як описано нижче.

Обмеження для всього перекладу

 
Помилка, що показується при спробі опублікувати переклад з завеликою кількістю незміненого машинного перекладу. Цей поріг пристосовано для індонезійської мови на основі зворотного відгуку від їхніх дописувачів.

Публікація перекладу неможлива, якщо 95% чи більше всього документу є незміненим, вмістом машинного перекладу. Це обмеження призначене для попередження майже сирого машинного перекладу та уникнення явного вандалізму. Це також запобігає простому додаванню користувачами вмісту без редагування частин, перекладених машинно. Як описано нижче, це обмеження може пристосовуватися від мови до мови.

Обмеження для кожного абзацу

 
Попередження показується для конкретного абзацу, де незмінений машинний переклад перевищує обмеження.

Для кожного абзацу також вимірюється відсоток користувацьких змін. Абзац вважається проблемним, коли він містить понад 85% початкового машинного перекладу (або, в разі копіювання вмісту з початкового документу, — понад 60% незміненого вмісту).

Редактор перекладу покаже попередження для кожного абзацу, який вважається проблемним, заохочуючи користувача редагувати його далі. У деяких випадках користувачі все ще здатні публікувати, але результатна сторінка може бути додана до категорії відстеження потенційних невичитаних перекладів для перегляду спільнотою. В інших випадках користувачам може не бути дозволено публікувати.

Для визначення того, чи дозволено користувачеві публікувати, чи ні, розглядаються деякі чинники (деякі з яких досі в розробці):

  • Кількість проблемних абзаців. Користувачам заважають публікувати переклади з 50 або більше проблемними абзацами. Користувачі все ще можуть опублікувати переклади з менш ніж 50 проблемними абзацами, але переклади з 10—49 проблемними абзацами будуть додані до категорії відстеження потенційно невичитаних перекладів для перегляду спільнотою.
  • Раніше вилучені переклади. Щоб попередити повторювані проблеми, інструмент визначає користувачів, чиї опубліковані переклади були вилучені за останні 30 днів, і накладає набагато суворіші обмеження на їхні подальші спроби перекладу. У таких випадках переклади з 10 проблемними абзацами або більше буде заборонено публікувати, тоді як з 9 або менше проблемними абзацами буде додано до категорії відстеження потенційно невичитаних перекладів для перегляду спільнотою.
  • Підтвердження користувача. Менш суворий поріг розглядається для абзаців, які користувачі позначили вирішеними, як сигнал того, що користувач переглянув і підтвердив статус перекладу. Для абзаців, для яких було показано попередження про незмінений вміст, але користувач позначив його вирішеним, ми застосовуємо менш суворий поріг (приймаючи 95% машинного перекладу чи 75% початкового вмісту). Це забезпечуватиме шлях до пристосування до випадків, коли автоматичний переклад був винятково добрим, але все ще уникатиме потенційного зловживання можливістю (тобто не слідувати сліпо підтвердженням користувача).

Вміст, на який не впливають обмеження

Деякий вміст не очікується суттєво редагувати, і він не розглядається при застосуванні вищеописаних обмежень. Закороткі заголовки розділів, цитування чи список виносок виключаються з перевірок. Інакше користувачі можуть отримати хибні попередження про потребу перекладати вміст, який насправді не має бути перекладеним, як-то заголовки книг у виносках чи інші власні назви.

Limits on the mobile experience

For the mobile experience the initial set of limits follow a simpler approach. At the moment, only the overall percentage of unmodified machine translation for the whole translation is considered. On mobile, the whole translation consist of just one section of the article.

In particular, a warning is shown when the percentage of unmodified machine translation is over 85% for the whole section, and publishing is prevented when the percentage of unmodified machine translation is over 95%.

Feedback on how the limits system work on the mobile context would be very useful to determine how to evolve this initial approach.

Publication of fast unreviewed translations

Campaigns and contests can result in spikes of translations where some user unfamiliar with the community policies may focus on making many translations and not pay enough attention to review their contents. In order to emphasize quality over quantity, a mechanism has been defined to limit the publication of fast unreviewed translations.

After a user translates a large article, the next translation can only be started after some time has passed. The waiting period estimation considers 1 minute per paragraph up to 10 minutes. That is:

  • For articles with 10 paragraphs or less, we want to make sure that users spent translating it at least N minutes (one minute per paragraph)
  • For articles with more than 10 paragraphs we want to make sure that users spent translating it at least 10 minutes.


This has been applied on mobile initially since it is a space with less activity, and after measuring the impact we'll consider expanding it to desktop too.


Пристосування обмежень

Обмеження, описані вище, надають набір загальних механізмів, але вони можуть потребувати пристосувань до конкретних потреб кожної вікі. На основі початкових оцінювань, кількість змін, необхідних початковому машинному перекладу, може бути в діапазоні від 10% до 70% залежно від мовної пари. В деяких вікі обмеження за замовчуванням також можуть бути суворими, генеруючи непотрібний шум або запобігаючи публікації досконало дійсних перекладів. В інших вікі обмеження можуть не бути достатньо суворими, дозволяючи публікацію перекладів, які не редагувалися достатньо.

Налаштування різних порогів дозволяє кожній вікі робити обмеження інструменту відповідними конкретним для кожної вікі потребам. Зворотний відгук від носіїв мов є важливим для належного пристосування обмежень. Якщо поточні обмеження не здаються такими, що добре працюють, на основі вашого досвіду створення чи перегляду перекладів, будь ласка, поділіться своїм відгуком і ми можемо дослідити, як краще їх пристосувати.

Надаючи зворотний відгук про пристосування порогів, ми рекомендуємо спробувати створити декілька прикладів перекладів (переконайтеся перевірити налаштування публікації, якщо ваші тести не призначені для публікації як звичайний вміст). Під час тестування роботи обмежень для своєї мови корисно тримати на думці наступне:

  • Перевіряйте обидва випадки. Впевніться, що перевірили роботу обмежень для перекладів, де вміст не редагувався достатньо, а також для тих, де початковий переклад редагувався достатньо. Таким способом ви можете легше знайти правильний баланс для обмежень. Перевірка лише одного типу обмежень може привести вас до пропозиції зсунути пороги задалеко у протилежному напрямку.
  • Перевіряйте різний вміст. Вміст у вікі дуже різноманітний, і машинний переклад може працювати набагато ліпше для деяких випадків порівняно з іншими. Наприклад, вміст, повний числових даних або технічних назв, може вимагати меншого редагування користувачами, ніж вміст з описовим текстом. Обов'язково протестуйте переклад на різних типах статей, різної довжини, з різними статтями, з несхожими типами вмісту.
  • Приготуйтеся ітерувати. Пристосування порогів — ітеративний процес. Він може вимагати custom пристосування порогів або поліпшення загального підходу. У будь-якому випадку, після кожної зміни подальше тестування може бути необхідним для верифікації поліпшень.

Було доведено ефективність пристосування обмежень у співпраці з редакторами. Наприклад, початкові результати показали, що індонезійська спільнота значно знизила кількість проблемних перекладів, обмеживши публікацію перекладів з понад 70% незміненого машинного перекладу. Подібні пристосування були зроблені для телугу й ассамської мов. Не існує безвідмовного автоматичного інструменту, і ці обмеження не є винятком.

Процес перегляду вмісту спільнотою все ще важливий, але ці обмеження забезпечують спільноти інструментами для зменшення кількості перекладів, на яких вони мають зосереджуватися, роблячи процес перегляду набагато ефективнішим. Будь ласка, поділіться своїм відгуком і ми можемо дослідити, як краще пристосувати їх.

Відстеження потенційно непереглянутих перекладів

Категорія відстеження з назвою «cx-unreviewed-translation-category» надається спільнотам для легшого пошуку статей, які були опубліковані з деяким вмістом, що перевищує рекомендовані обмеження.

Ви можете знайти цю категорію у списку категорій відстеження в кожній вікі. Там ви можете знайти статті, які пройшли обмеження, що запобігають публікації, але все ще мали деякі абзаци, які редагувалися менше за очікуване. Наприклад, індонезійська категорія містить статті з менш ніж 40% машинного перекладу загалом, але з деякими абзацами з понад 80% незміненого машинного перекладу.

Вимірювання якості перекладу

Автоматичне оцінювання якості вмісту не є тривіальним. Співвідношення видалення надає корисну оцінку того, чи був створений вміст достатньо добрим для спільноти дописувачів, аби не вилучати його. На основі аналізу співвідношень видалення статті, створені як перекладу, менш імовірно будуть вилучені порівняно з початковою версією статті, створеної з нуля. Це говорить про те, що може бути непрактично встановлювати обмеження на участь, перекладаючи набагато більше, ніж іншими способами створюючи статті.

Знайти опубліковані переклади

Переклад вмісту додає тег редагування contenttranslation до опублікованих перекладів, аби спільноти мали змогу зосередитися на перекладах, створених інструментом, за допомогою «Нещодавніх змін» і подібних інструментів. На додачу, дані в опублікованих перекладах і статистика використання машинного перекладу доступні для кожного для аналізу.

Перевірте конкретний переклад

Приклад налагоджувача перекладу

Налагоджувач перекладу — це інструмент, який дозволяє перевіряти деякі метадані для даного перекладу, включаючи відсоток машинного перекладу, що використовується для всього документа, і службу перекладу, яка використовується для кожного абзацу. For specific types of content such as templates, the Content Translation Server API can be queried to check how templates will be transferred across languages.

Інші обмеження на основі користувацького досвіду

 
Помилка, що показує обмеження публікації на основі користувацького досвіду. Цей приклад заснований на рішенні спільноти Англійської Вікіпедії обмежити публікацію прямо в основний простір тільки розширеним автопідтвердженим користувачам.

Деякі вікі реалізували інші обмеження на перекладання на основі прав користувачів як спосіб знизити створення низькоякісних перекладів. Наприклад, Англійська Вікіпедія вимагає від користувачів бути розширеними підтвердженими, що означає те, що їм потрібно зробити 500 редагувань в Англійській Вікіпедії до того, як їм буде дозволено публікувати переклад як статтю. Нові редактори все ще можуть публікувати перекладені статті у простори назв User: або Чернетка:, а потім перейменовувати статтю в основний простір.

Це обмеження було створене до того, як система обмежень, описана на цій сторінці, стала доступною, і не є рекомендованим підходом до заохочення створення добрих якісних перекладів.

Перед додаванням обмежень, які не беруть у рахунок створений вміст, розгляньте прохід через процес пристосування обмежень незміненого вмісту як описано вище. Обмеження можуть бути зроблені настільки суворими, наскільки потрібно для запобігання низькоякісним перекладам, у той же час дозволяючи редакторам публікувати добрі переклади.