Көмек:Контент аударма/aудару/аударма сапасы

This page is a translated version of the page Help:Content translation/Translating/Translation quality and the translation is 86% complete.
Outdated translations are marked like this.
PD Ескерту: бұл бетті өңдегенде, сіз өз үлесіңізді CC0 лицензиясы бойынша тапсыруға келісесіз. Қосымша ақпарат алу үшін Жария домен анықтама беттерін көріңіз. PD

Аударманы жасау кезінде оларды жарияламас бұрын мазмұнын қарап шығу қажет. Жасалған мазмұн бастапқы мағынаны күтпеген түрде өзгертпейтініне және оның тағайындалған тілде табиғи түрде оқылатынына көз жеткізуіңіз керек. Берілген бастапқы машина аудармасы пайдалы бастапқы нүкте арқылы аудару процесін жылдамдатуға көмектеседі, бірақ құрал пайдаланушыларды бастапқы мазмұнды қарап шығуға және елеулі түрде өңдеуге шақырады

Аудармашылардың бастапқы аудармаларды дұрыс өңдеуін қамтамасыз ету үшін әртүрлі механизмдер арналған. Аударма өңдегіші пайдаланушы бастапқы аударманың қанша бөлігін өзгерткенін қадағалайды және әртүрлі шектеулерді анықтайды: жариялауды болдырмайды немесе пайдаланушыларды мазмұнды одан әрі қарап шығуға ынталандыру үшін ескертеді

Осылайша, құрал пайдаланушыларға жеңіл қаралған, сапасы төмен нәтижелерді жасауға жол бермей, бастапқы машиналық аударманы жақсы пайдалануға мүмкіндік береді Бұл шектеулердің қалай жұмыс істейтіні, оларды әр тілдің қажеттіліктеріне қалай реттеуге болатыны және құралмен жасалған мазмұнның сапасын қалай өлшеуге болатыны туралы толығырақ төменде келтірілген.

Аударманы қарап шығуды ынталандыру үшін шектеулер

Мазмұнды аудару құралы [https://github.com/wikimedia/mediawiki-extensions-ContentTranslation/blob/master/doc/MTAbuseCalculation.md пайдаланушылар берілген бастапқы автоматты аудармаға енгізетін өзгертулердің пайызын өлшейді. Осылайша, жүйе бастапқы аудармадан қанша сөз қосылғанын, жойылғанын немесе өзгертілгенін біледі Өлшемдер екі түрлі деңгейде жүргізіледі: әрбір абзац үшін және бүкіл аударма үшін төменде егжей-тегжейлі берілгендей әр деңгейде әртүрлі шектеулер қолданылады.

Барлық аудармаға арналған шектеулер

Тым көп өзгертілмеген машиналық аудармасы бар аударманы жариялау әрекеті кезінде қате көрсетілді. Бұл шек индонезиялық тілі үшін олардың редакторларының пікірлері негізінде түзетілді.

Бүкіл құжаттың 95% немесе одан көп бөлігі өзгертілмеген, машинада аударылған мазмұннан тұрса, жарияланым бұғатталған. Бұл шектеу шикі машина аудармаларына жол бермейді және айқын вандализмді айналып өтеді. Сондай-ақ ол пайдаланушылардың машиналық аударма бөлігін өңдемей, жай ғана мазмұн қосуына жол бермейді. Төменде егжей-тегжейлі айтылғандай, бұл шектеуді әр тілге қарай реттеуге болады.

Әрбір абзац үшін шектеулер

Өзгертілмеген машиналық аударма шектен асатын арнайы абзац үшін көрсетілген ескерту.

Әр абзац үшін пайдаланушы өзгертулерінің пайызы да өлшенеді. Параграфта бастапқы машиналық аударманың 85%-дан астамы болса (немесе бастапқы құжаттан мазмұнды көшіру кезінде ол өзгертілмеген мазмұнның 60%-дан астамын қамтитын) абзац проблемалы болып саналады.

Аударма өңдегіші проблемалы деп саналатын әрбір абзац үшін ескерту көрсетіп, пайдаланушының одан әрі өңдеулерін ынталандырады. Кейбір жағдайларда пайдаланушылар әлі де жариялай алады, бірақ алынған бет қауымдастық қарауы үшін ықтимал қаралмаған аудармаларды бақылау санатына қосылуы мүмкін. Басқа жағдайларда пайдаланушыларға жариялауға мүлде рұқсат етілмеуі мүмкін.

Төменде пайдаланушыларға жариялауға рұқсат беру немесе бермеуді анықтау үшін қарастырылатын факторлардың кейбірі берілген (олардың кейбіреулері әлі әзірленуде):

  • Проблемалық абзацтардың саны. Пайдаланушылардың 50 немесе одан да көп проблемалық абзацтары бар аудармаларды жариялауына тыйым салынады. 50-ден аз проблемалық абзацтары бар аудармаларды жариялауға рұқсат етіледі, бірақ 10-нан 49-ға дейін проблемалық абзацтары барлар қауымдастықтың қарауы үшін ықтимал қаралмаған аудармаларды бақылау санатына қосылады.
  • Алдыңғы жойылған аудармалар. Қайталанатын мәселелердің алдын алу үшін құрал жарияланған аудармалары соңғы 30 күнде жойылған пайдаланушыларды анықтайды және олардың кейінгі аударма әрекеттеріне әлдеқайда қатаң шектеулер қояды. Осы сыныптағы пайдаланушылар үшін 10 немесе одан да көп проблемалық абзацтары бар аудармаларды жариялауға тыйым салынады, ал 9 немесе одан аз проблемалық абзацтары барлар қауымдастық қарауы үшін ықтимал қаралмаған аудармаларды бақылау санатына қосылады.
  • Пайдаланушыны растау. Пайдаланушы шешілді деп белгілейтін абзацтар үшін неғұрлым қатаң шек қарастырылады — пайдаланушы аударма күйін қарап шыққан және растаған сигнал ретінде қабылданады. Өзгертілмеген мазмұн ескертуі көрсетілетін, бірақ пайдаланушы оны шешілген деп белгілейтін абзацтар үшін неғұрлым қатаң шек қолданылады (машина аудармасының 95% немесе бастапқы мазмұнның 75% қабылдайды). Бұл автоматты аударма өте жақсы болған жағдайларды қанағаттандыру жолын қамтамасыз етеді, бірақ мүмкіндікті ықтимал теріс пайдалануды болдырмайды (яғни, пайдаланушының растауынан кейін соқыр емес).

Шектер әсер етпейтін мазмұн

Кейбір мазмұнды айтарлықтай өңдеу күтілмейді, сондықтан жоғарыда сипатталған шектеулерді қолдану кезінде ескерілмейді. Өте қысқа бөлім атаулары, дәйексөздер немесе әдебиеттер тізімі шолудан шығарылады. Әйтпесе, пайдаланушылар сілтемелерде пайда болатын кітап атаулары немесе басқа жалқы есімдер болмауы керек мазмұнды аудару туралы жаңылыстыратын ескертулер алуы мүмкін.

Limits on the mobile experience

For the mobile experience the initial set of limits follow a simpler approach. At the moment, only the overall percentage of unmodified machine translation for the whole translation is considered. On mobile, the whole translation consist of just one section of the article.

In particular, a warning is shown when the percentage of unmodified machine translation is over 85% for the whole section, and publishing is prevented when the percentage of unmodified machine translation is over 95%.

Feedback on how the limits system work on the mobile context would be very useful to determine how to evolve this initial approach.

Publication of fast unreviewed translations

Campaigns and contests can result in spikes of translations where some user unfamiliar with the community policies may focus on making many translations and not pay enough attention to review their contents. In order to emphasize quality over quantity, a mechanism has been defined to limit the publication of fast unreviewed translations.

After a user translates a large article, the next translation can only be started after some time has passed. The waiting period estimation considers 1 minute per paragraph up to 10 minutes. That is:

  • For articles with 10 paragraphs or less, we want to make sure that users spent translating it at least N minutes (one minute per paragraph)
  • For articles with more than 10 paragraphs we want to make sure that users spent translating it at least 10 minutes.


This has been applied on mobile initially since it is a space with less activity, and after measuring the impact we'll consider expanding it to desktop too.


= Шектеулерді түзету =

Жоғарыда сипатталған шектеулер жалпы механизмдердің жиынтығын қамтамасыз етеді, бірақ оларды әр викидің нақты қажеттіліктеріне қарай түзету қажет болуы мүмкін. Бастапқы бағалауға сүйене отырып, бастапқы машиналық аударма үшін қажетті өзгерістер көлемі тілдік жұпқа байланысты 10% - дан 70% - ға дейін өзгеруі мүмкін. Кейбір вики-сайттарда әдепкі шектеулер тым қатал болуы мүмкін, қажетсіз шу шығарады немесе мүлдем дұрыс аудармалардың жариялануына жол бермейді. Басқа викилерде шектеулер жеткілікті қатаң болмауы мүмкін, бұл жеткіліксіз өңделген аудармаларды жариялауға мүмкіндік береді.

Әр түрлі шекті мәндерді орнату әр викиге құралдың шектеулерін өзінің нақты қажеттіліктеріне сәйкес бейімдеуге мүмкіндік береді. Ана тілінде сөйлейтіндердің кері байланысы белгіленген шектеулерді дұрыс реттеу үшін өте маңызды. Егер сіз қазіргі шектеулер аудармаларды жасау немесе қарау тәжірибеңізге сүйене отырып, дұрыс жұмыс істемейтін сияқты сезінсеңіз, пікіріңізді бөлісіңіз және біз оларды қалай жақсы түзетуге болатынын біле аламыз.

When providing feedback about adjusting the thresholds, we recommend that you first create several example translations (make sure to check the publishing options if your test is not intended to be published as regular content). Шектеулердің сіздің тіліңіз үшін қалай жұмыс істейтінін тексерген кезде мыналарды есте ұстаған жөн:

  • "'Екі жағдайды да тексеріңіз."'Екеуіне де шектеулердің қалай қолданылатынын тексеріңіз: мазмұн жеткіліксіз өңделген аудармалар және ол жеткілікті түрде өңделген аудармалар. Осылайша, құралдың limits функциясы үшін дұрыс тепе-теңдікті табу оңайырақ болады. Мәселенің тек бір түрін тексеру шекті мәндердің қарама-қарсы бағытта тым көп орын ауыстыруына әкелуі мүмкін.
  • ""Басқа мазмұнды тексеріңіз". "Біздің викидегі мазмұн өте алуан түрлі және машиналық аударма кейбір жағдайларда басқалармен салыстырғанда әлдеқайда жақсы жұмыс істей алады. Мысалы, сандық деректерге немесе техникалық атауларға толы мазмұн пайдаланушылардан сипаттамалық мәтіні көп мазмұнға қарағанда аз өңдеуді қажет етуі мүмкін. Әртүрлі мазмұндағы әртүрлі ұзындықтағы мақалалардың көптеген түрлерін аудару арқылы сынауды ұмытпаңыз.
  • ""Қайталауға дайын болыңыз"."Шекті мәндерді орнату-бұл қайталанатын процесс. Бұл реттелетін шекті параметрлерді немесе жалпы көзқарасыңызды жақсартуды қажет етуі мүмкін. Қалай болғанда да, әрбір өзгерістен кейін енгізілген жақсартуларды тексеру үшін қосымша тестілеу қажет болуы мүмкін.

Редакторлармен бірлесіп лимиттерді түзету өзінің тиімділігін дәлелдеді. Мысалы, бастапқы нәтижелер Индонезия қауымдастығы машиналық аударманың өзгермеген мазмұнының 70% - дан астамын қамтитын аудармаларды жариялауды шектеу арқылы алған проблемалық аудармалардың санын айтарлықтай азайта алғанын көрсетеді. Осындай өзгерістер викиге телугу және Ассам тілдерінде енгізілді. Қатесіз болатын автоматты құрал жоқ және бұл шектеулер де ерекшелік емес.

Қауымдастықтың мазмұнды шолу процесі әлі де маңызды, бірақ бұл шектеулер қауымдастықтарға назар аударуға тура келетін аударымдар санын азайту құралын ұсынады, бұл шолу процесін әлдеқайда тиімді етеді. Please share your feedback and we can explore how to better adjust them.

= Ықтимал қаралмаған аудармаларды қадағалау =

Бақылау санаты "cx-unreviewed-translation-category" атауы бар қауымдастықтарға ұсынылған шектеулерден асатын кейбір мазмұнмен жарияланған мақалаларды оңай іздеу үшін беріледі.

Сіз бұл санатты әр викидегі бақылау санаттарының тізімінен таба аласыз. Оны пайдалану арқылы сіз жариялауға кедергі келтіретін шектеулерден асқан, бірақ әлі де күтілгеннен аз өңделген кейбір абзацтары бар мақалаларды бақылай аласыз. Мысалы идентификатор: санат: Halaman_dengan_terjemahan_tak_tertinjau / Индонезиялық Википедия санаты жалпы машиналық аударманың 40% - дан азын қамтитын, бірақ кейбір абзацтарда өзгермеген машиналық аударманың 80% - дан астамы бар мақалаларды қамтиды

= Аударма сапасын өлшеу =

Мазмұнның сапасын автоматты түрде бағалау маңызды емес. Жою коэффициенттері жасалған мазмұнның қатысушы қауымдастық оны жоймауы үшін жеткілікті жақсы болғанын бағалау үшін пайдалы көрсеткіш болып табылады. Based on the analysis of deletion ratios, articles that are created as translations are less likely to be deleted when compared with articles created from scratch. Бұл аударма арқылы қатысуға шектеулер қою басқа мақалалар жасау әдістеріне қарағанда әлдеқайда жоғары болуы мүмкін екенін көрсетеді.

= = Жарияланған аудармаларды табыңыз ==

Мазмұнды аудару жарияланған аудармаларға "мазмұнды аудару" өңдеу тегін қосады. Бұл қауымдастықтарға аударма құралымен жасалған беттерге назар аудару үшін соңғы өзгертулер мен ұқсас құралдарды пайдалануға мүмкіндік береді. In addition, data on published translations and the statistics for machine translation use are available for anyone to analyze.

= = Нақты аударманы тексеріңіз = =

Аударма отладчигінің мысалы

The Translation debugger is a tool that allows the inspection of some metadata for a given translation, including the percentage of machine translation used for the whole document, and the translation service used for each paragraph. For specific types of content such as templates, the Content Translation Server API can be queried to check how templates will be transferred across languages.

= Пайдаланушы тәжірибесіне негізделген басқа шектеулер =

 
Пайдаланушының тәжірибесіне негізделген жариялау шегін көрсететін қате. Бұл мысал ағылшын Уикипедия қауымдастығының тек АВТО растауы бар кеңейтілген пайдаланушылар үшін негізгі кеңістікте жариялауды шектеу туралы шешіміне негізделген.

Кейбір викилер сапасыз аударымдарды азайту үшін пайдаланушының құқықтарына негізделген басқа аударым шектеулерін енгізді. Мысалы, ағылшын Уикипедиясы пайдаланушылардан кеңейтуді растауды талап етеді, яғни аударманы мақала ретінде жариялауға рұқсат бермес бұрын ағылшын Уикипедиясына 500 түзету енгізу керек. Жаңа редакторлар аударылған мақалаларды имен кеңістігінде жариялай алады <код>User: немесе <код>жоба:, содан кейін мақаланы жылжыту негізгі кеңістікке.

Бұл шектеу осы бетте сипатталған шектеулер жүйесі қол жетімді болғанға дейін енгізілді және бұл сапалы аудармаларды құруды ынталандыру үшін ұсынылатын тәсіл емес.

Жасалған мазмұнға әсер етпейтін шектеулерді қоспас бұрын, жоғарыда сипатталғандай өзгертілмеген мазмұнның шектерін түзету процесін қарастырыңыз. Төмен сапалы аудармалардың алдын алу үшін шектеулер қажет болғанша қатаң болуы мүмкін, сонымен бірге жақсы аудармалар жасайтын редакторларға жариялауға мүмкіндік береді.