Trợ giúp:Biên dịch nội dung/Dịch thuật/Chất lượng dịch thuật

This page is a translated version of the page Help:Content translation/Translating/Translation quality and the translation is 93% complete.
PD Lưu ý: Khi bạn sửa đổi trang này, bạn đồng ý phát hành đóng góp của bạn theo giấy phép CC0. Xem trang trợ giúp cộng đồng để biết thêm. PD

Khi tạo một bản dịch, nội dung của bản dịch cần được xem lại trước khi xuất bản. Bạn cần phải đảm bảo nội dung tạo ra không thay đổi ý nghĩa ban đầu, và tự nhiên trong ngôn ngữ đích. Công cụ dịch máy ban đầu giúp đẩy nhanh quá trình dịch thuật bằng một khởi điểm hết sức có ích, nhưng cũng khuyến khích người dùng xem lại và sửa đổi đáng kể nội dung chưa biên tập.

Có những cơ chế khác nhau giúp đảm bảo rằng người dịch sửa đổi bản dịch ban đầu một cách thích hợp. Biên tập dịch thuật theo dõi xem bản dịch ban đầu được người dùng thay đổi bao nhiêu, và quyết định những giới hạn khác nhau để hoặc là ngăn chặn việc xuất bản, hoặc là cảnh báo người dùng để khuyến khích họ xem lại thêm nữa nội dung bản dịch.

Bằng cách này, công cụ giúp người dùng có thể sử dụng dịch máy khi họ biết cách tận dụng nó, trong khi đó ngăn chặn việc tạo ra những bản dịch chất lượng thấp được xem lại một cách cẩu thả. Chi tiết thêm về cách những giới hạn này hoạt động, cách chúng có thể được điều chỉnh theo từng ngôn ngữ, và cách để đo đếm chất lượng nội dung được sinh ra bởi công cụ thì được trình bày ở bên dưới.

Giới hạn giúp khuyến khích xem lại bản dịch

Biên dịch nội dung tính toán phần trăm sửa đổi của người dụng đối với bản dịch máy được cung cấp ban đầu. Theo cách này, hệ thống biết xem có bao nhiêu từ đã được thêm vào, xóa đi hoặc thay đổi trong bản dịch ban đầu. Những biện pháp này được thực hiện ở hai cấp bậc: đối với mỗi đoạn văn hoặc đối với cả bản dịch. Có những giới hạn khác nhau được áp dụng cho mỗi cấp bậc, được nêu chi tiết dưới đây.

Giới hạn cho toàn bộ bản dịch

 
Sẽ hiện lên lỗi khi cố xuất bản một bản dịch có quá nhiều phần dịch máy chưa chỉnh sửa. Ngưỡng này sẽ được điều chỉnh cho người Indonesia dựa trên các phản hồi từ biên tập viên của họ.

Việc xuất bản bị chặn nếu như 95% toàn bộ văn bản hoặc hơn chứa nội dung dịch máy chưa chỉnh sửa. Giới hạn này nhằm để ngăn chặn những bản dịch máy gần như còn nguyên và né tránh những phá hoại rõ ràng. Nó cũng ngăn người dùng cứ thế thêm những đoạn văn vào bản dịch mà không sửa đổi những đoạn dịch máy. Giới hạn này có thể được điều chỉnh tùy theo từng ngôn ngữ, như là được trình bày chi tiết dưới đây.

Giới hạn cho từng đoạn văn

 
Sẽ có cảnh báo khi một đoạn văn nhất định có lượng dịch máy không chỉnh sửa vượt quá giới hạn.

Đối với mỗi đoạn văn, phần trăm sửa đổi của người dùng cũng sẽ được tính toán. Một đoạn văn được coi là có vấn đề khi đoạn văn đó chứa hơn 85% dịch máy ban đầu (hoặc, khi copy nội dung từ văn bản nguồn mà chứa trên 60% nội dung không chỉnh sửa).

Biên tập dịch thuật sẽ cho hiện một cảnh báo đối với mỗi đoạn văn được coi là có vấn đề, khuyến khích người dùng sửa đổi nó thêm. Trong một vài trường hợp người dùng vẫn sẽ có thể xuất bản, nhưng trang thành phẩm có thể được thêm một thể loại theo dõi là bản dịch có khả năng chưa được xem lại để cộng đồng có thể xem lại. Trong các trường hợp khác, người dùng có thể không được cho phép xuất bản.

Dưới đây là một trong những yếu tố cần cân nhắc khi quyết định liệu cho nên cho phép người dùng xuất bản hay không (một vài trong số đó vẫn đang trong quá trình phát triển):

  • Số lượng đoạn văn có vấn đề. Người dùng sẽ không được xuất bản bản dịch có hơn 50 hoặc hơn số đoạn văn có vấn đề. Người dùng vẫn có thể xuất bản bản dịch có ít hơn 50 đoạn văn có vấn đề, nhưng những bản dịch với 10-49 đoạn văn có vẫn đề vẫn sẽ được thêm thể loại theo dõi là bản dịch có khả năng chưa được xem lại để cộng đồng xem lại.
  • Bản dịch trước đó đã bị xóa. Để ngăn các sự cố lặp lại, công cụ xác định người dùng có các bản dịch đã xuất bản đã bị xóa trong 30 ngày qua và áp đặt các giới hạn nghiêm ngặt hơn nhiều đối với các nỗ lực dịch tiếp theo của họ. Trong trường hợp đó, các bản dịch với 10 đoạn văn có vấn đề hoặc hơn thì sẽ không được xuất bản, trong khi đó có ít hơn 9 đoạn văn có vấn đề thì sẽ được thêm thể loại theo dõi là bản dịch có khả năng chưa được xem lại để cộng đồng xem lại.
  • Xác nhận từ người dùng. Một ngưỡng ít nghiêm khắc hơn sẽ được cân nhắc đối với những đoạn văn mà người dùng đánh dấu là đã giải quyết, như là một tín hiệu thông báo rằng người dùng đã xem lại và xác nhận tình trạng của bản dịch. Đối với những đoạn văn mà cảnh báo nội dung chưa chỉnh sửa hiện lên nhưng người dùng lại đánh dấu là đã giải quyết thì chúng tôi áp dụng một ngưỡng ít nghiêm khắc hơn (chấp nhận 95% Dịch máy hoặc 75% nội dung nguồn). Điều này sẽ cung cấp một cách để điều tiết các trường hợp mà dịch tự động tốt một cách cá biệt, nhưng vẫn ngăn chặn được khả năng lạm dụng tính năng này (ví dụ như không theo xác nhận của người dùng một cách mù quáng).

Những nội dung không bị ảnh hưởng bởi các giới hạn

Sẽ có những nội dung không cần phải sửa đổi một cách đáng kể, và chúng sẽ không được cân nhắc khi áp dụng các giới hạn được mô tả ở trên. Những tiêu đề đoạn cực ngắn, trích dẫn, hoặc danh sách tham khảo sẽ được loại bỏ khỏi cuộc kiểm tra. Nếu không, người dùng có thể nhận được cảnh báo gây hiểu lầm về việc dịch nội dung không nên, chẳng hạn như tên sách xuất hiện trong tài liệu tham khảo hoặc danh từ riêng khác.

Limits on the mobile experience

For the mobile experience the initial set of limits follow a simpler approach. At the moment, only the overall percentage of unmodified machine translation for the whole translation is considered. On mobile, the whole translation consist of just one section of the article.

In particular, a warning is shown when the percentage of unmodified machine translation is over 85% for the whole section, and publishing is prevented when the percentage of unmodified machine translation is over 95%.

Feedback on how the limits system work on the mobile context would be very useful to determine how to evolve this initial approach.

Publication of fast unreviewed translations

Campaigns and contests can result in spikes of translations where some user unfamiliar with the community policies may focus on making many translations and not pay enough attention to review their contents. In order to emphasize quality over quantity, a mechanism has been defined to limit the publication of fast unreviewed translations.

After a user translates a large article, the next translation can only be started after some time has passed. The waiting period estimation considers 1 minute per paragraph up to 10 minutes. That is:

  • For articles with 10 paragraphs or less, we want to make sure that users spent translating it at least N minutes (one minute per paragraph)
  • For articles with more than 10 paragraphs we want to make sure that users spent translating it at least 10 minutes.


This has been applied on mobile initially since it is a space with less activity, and after measuring the impact we'll consider expanding it to desktop too.


Điều chỉnh các giới hạn

Những giới hạn mô tả ở trên cung cấp một bộ cơ chế chung, nhưng chúng có thể sẽ cần điều chỉnh để phù hợp với từng wiki. Dựa trên những đánh giá ban đầu, lượng sửa đổi cần đối với bản dịch máy ban đầu có thể dao động từ 10% đến 70% tùy thuộc vào cặp ngôn ngữ. Trên một số wiki, giới hạn mặc định có thể quá nghiêm khắc, gây ra những khó chịu không cần thiết hoặc ngăn cản việc xuất bản những bản dịch đúng nghĩa. Tại những wiki khác, giới hạn có thể lại không đủ nghiêm khắc, cho phép việc xuất bản những bạn dịch chưa được sửa đổi đủ.

Việc điều chỉnh các ngưỡng khác nhau cho phép mỗi wiki điều chỉnh các giới hạn của công cụ theo nhu cầu cụ thể của mình. Phản hồi từ người bản địa là cần thiết trong việc điều chỉnh những giới hạn một cách thích đáng. Nếu các giới hạn hiện tại dường như không hoạt động tốt dựa trên kinh nghiệm của bạn khi tạo hoặc xem xét bản dịch, vui lòng chia sẻ phản hồi của bạn và chúng tôi có thể khám phá cách điều chỉnh chúng tốt hơn.

Khi cung cấp phản hồi về việc điều chỉnh, chúng tôi khuyên bạn nên thử tạo một số bản dịch mẫu (đảm bảo kiểm tra các tùy chọn xuất bản nếu thử nghiệm của bạn không có ý định xuất bản dưới dạng nội dung thông thường). Khi kiểm tra cách các giới hạn hoạt động cho ngôn ngữ của bạn, sẽ hữu ích khi ghi nhớ những điều sau:

  • Kiểm tra cả hai trường hợp. Nhớ kiểm tra xem giới hạn hoạt động như thế nào cho các bản dịch mà nội dung chưa được sửa đổi đủ và đồng thời cả những bản dịch mà phần dịch ban đầu đã được sửa đổi đủ. Bằng cách này bạn có thể dễ dàng tìm ra được điểm cân bằng đúng cho các giới hạn. Chỉ kiểm tra một loại vấn đề có thể dẫn tới việc di chuyển ngưỡng ra quá xa về hướng ngược lại.
  • Kiểm tra những nội dung khác nhau. Nội dung trên một wiki thì rất đa dạng, và dịch máy có thể tốt hơn trong trường hợp này so với trường hợp khác. Ví dụ, nội dung có nhiều dữ liệu số hoặc tên kĩ thuật có thể sẽ cần ít đổi của người dùng hơn là những nội dung có nhiều đoạn mô tả. Đảm bảo kiểm tra bằng cách dịch nhiều loại bài viết khác nhau, có độ dài khác nhau, với nội dung khác nhau.
  • Sẵn sàng làm lại. Điều chỉnh các ngưỡng là một quá trình lặp đi lặp lại. Có thể sẽ cần phải có một sự điều chỉnh tùy chỉnh đối với các ngưỡng hoặc là cần phải cải thiện cách tiếp cận chung. Dù thế nào thì cứ sau mỗi thay đổi thì sẽ cần những sự thử nghiệm thêm nữa để xác minh xem có cải thiện gì hay không.

Cộng tác với các biên tập viên trong việc điều chỉnh các giới hạn thì đã được chứng minh là có hiệu quả. Ví dụ, kết quả ban đầu cho thấy cộng đồng Tiếng Indonesia đã giảm đáng kệ lượng bản dịch có vấn đề bằng cách giới hạn xuất bản bản dịch có hơn 40% phần dịch máy chưa chỉnh sửa. Những điều chỉnh tương tự đã được thực hiện cho tiếng Telugu và tiếng Assam Không có loại công cụ tự động nào mà luôn đúng, và những giới hạn này cũng không phải ngoại lệ.

Quá trình cộng đồng xem xét lại nội dung thì vẫn cần thiết, nhưng những gì hạn này cung cấp cho các cộng đồng một công cụ để làm giảm lượng bản dịch mà họ phải tập trung vào, khiến cho quá trình xem lại trở nên hiệu quả hơn. Hãy chia sẻ phản hồi của bạn và chúng ta có thể tìm hiểu cách để điều chỉnh chúng một cách tốt hơn.

Theo dõi các bản dịch có khả năng chưa được xem xét

Một thể loại theo dõi với tên "cx-unreviewed-translation-category" được cung cấp nhằm giúp cộng đồng dễ dàng tìm thấy các bài viết được xuất bản với một số nội dung vượt quá giới hạn được đề xuất.

Bạn có thể tìm thấy thể loại này trong danh sách các thể loại theo dõi trên mỗi wiki. Ở đó bạn có thể tìn thấy đã vượt qua giới hạn để được xuất bản nhưng vẫn còn một số đoạn đã được chỉnh sửa ít hơn mong đợi. Ví dụ, thể loại tiếng Indonesia bao gồm các bài viết có ít hơn 40% là dịch máy nói chung nhưng có một số đoạn với hơn 80% là dịch máy chưa sửa đổi.

Đánh giá chất lượng dịch thuật

Đánh giá chất lượng nội dung tự động không phải là nhỏ. Tỉ lệ xóa cung cấp ước tính hữu ích về việc nội dung được tạo ra có đủ tốt để các biên tập viên và công đồng không xóa nó. Dựa trên báo cáo phân tích tỉ lệ xóa, bài viết được tạo dưới dạng bản dịch ít khả năng bị xóa hơn là phiên bản đầu tiên của bài viết được tạo từ đầu. Điều này cho thấy rằng có thể không thực tế khi đặt giới hạn tham gia bằng cách dịch thuật cao hơn nhiều so với việc đặt thiết lập cho những cách khác để tạo ra bài viết.

Tìm kiếm bản dịch đã xuất bản

Biên dịch nội dung thêm thẻ sửa đổi contenttranslation vào các bản dịch được xuất bản. Điều này cho phép cộng đồng khả năng sử dụng Các thay đổi gần đây và các công cụ tương tự để tập trung vào các trang được tạo bằng công cụ dịch. Ngoài ra, dữ liệu về các bản dịch đã được xuất bảnsố liệu thống kê sử dụng dịch máy có sẵn cho bất cứ ai để phân tích.

Kiểm tra một bản dịch cụ thể

Ví dụ về trình gỡ lỗi dịch thuật

Trình gỡ lỗi Translation là một công cụ cho phép kiểm tra một số siêu dữ liệu cho một bản dịch nhất định, bao gồm tỷ lệ phần trăm dịch máy được sử dụng cho toàn bộ tài liệu hoặc dịch vụ dịch được sử dụng cho mỗi đoạn văn. For specific types of content such as templates, the Content Translation Server API can be queried to check how templates will be transferred across languages.

Các giới hạn khác dựa trên kinh nghiệm của người dùng

 
Lỗi giới hạn xuất bản hiện ra khi dựa trên kinh nghiệm của người dùng Ví dụ này dựa trên quyết định của cộng đồng Wikipedia tiếng Anh về việc giới hạn chỉ cho phép người dùng được xác nhận mở rộng (30/500) tự động được phép xuất bản trực tiếp các bản dịch lên không gian chính

Một số Wiki sử dụng các giới hạn dịch thuật khác dựa trên quyền hạn của người dùng như một cách nhầm ngăn chặn việc tạo ra các bản dịch thuật chất lượng thấp. Ví dụ, Wikipedia Tiếng Anh yêu cầu người dùng phải có quyền xác nhận mở rộng, có nghĩa là họ cần đã thực hiện ít nhất 500 sửa đổi tại Wikipedia Tiếng Anh trước khi được phép xuất bản bản dịch thuật thành bài viết Người dùng mới vẫn có thể xuất bản bản bài viết dịch thuật trong User: hoặc không gian Nháp: (nếu có sẫn trên wiki của bạn), sau đó di chuyển bài viết lên không gian chính.

Hạn chế này được tạo trước khi giới hạn của hệ thống được mô tả trong trang này có sẵn và đó không phải là phương pháp được khuyến nghị để khuyến khích tạo ra các bản dịch tốt.

Trước khi thêm các hạn chế không tính đến nội dung do người dùng tạo ra, cân nhắc xem xét điều chỉnh giới hạn nội dung không sửa đổi được miêu tả ở trên. Các giới hạn có thể được sử dụng nghiêm ngặt khi cần thiết để ngăn chặn các bản dịch thuật chất lượng thấp, trong khi vẫn cho phép biên tập viên tạo ra các bản dịch thuật tốt để xuất bản.