Překlad obsahu/strojový překlad/Matxin

This page is a translated version of the page Content translation/Machine Translation/Matxin and the translation is 42% complete.
Other languages:
English • ‎Türkçe • ‎dansk • ‎français • ‎čeština • ‎русский • ‎日本語 • ‎한국어

Podpora strojového překladu pro Content Translation byla nyní dále rozšířena. Kromě Apertium, Yandex a Youdao nyní přidáváme Matxin do seznamu systémů strojového překladu (MT) dostupných pro uživatele Content Translation. This will result in additional machine translation support for a few languages.

Matxin poskytuje tým z University of Basque Country ve spolupráci s Elhuyar Foundation. This machine translation system was created by this team primarily for their own use for writing Wikipedia articles in Basque, and Spanish. Various teams inside Wikimedia Foundation have collaborated with the Matxin team to work out an agreement that will allow the use of Matxin without compromising Wikipedia's policy of attribution of rights, privacy of our users, and brand representation. Matxin is an open source software. For ease of use we are using the more convenient machine translation API to access the service hosted by the team. Please find more details of the agreement below and we are happy to hear any questions you may have about this service.

Klíčové vlastnosti

  • Do Matxinu nejsou zasílány žádné osobní informace. The MT system will be accessed via an API key. Article content (freely licensed) is sent to the Matxin server from Wikimedia Foundation servers. No direct communication is happening between the user and external services and no personal information (IP, username) is sent to the Matxin service. The client contacting Matxin is open source and you can check it here. No part of Matxin’s service or code will be part of Wikimedia infrastructure or Content Translation codebase. Please also see a diagram of this technical setup at the end of the section.
  • Informace jsou vráceny z Matxinu na základě bezplatné licence. When Matxin is used, a translated version of Wikipedia content under a free license is obtained. Users can modify it and publish it as part of Wikipedia without conflicts with existing policies. The resulting content translated by Matxin and the user modifications will be available under the same license that is used for the rest of the articles in Wikipedia.
  • Výhody širší otevřené překladatelské komunity. Translations obtained from Matxin and user modifications will be publicly available. The post-edited translations are of special interest for the translation research community (including the Matxin team) who can use this resource to create new translation services to support languages for which open source machine translation is not available yet. This will help developers create and improve machine translation systems.
  • Uživatelé to mohou zakázat. Automatický překlad je volitelný nástroj v překladu obsahu. Users have an option to disable it if they don't find it useful for some reason. Although many Content Translation users have requested for this translation service, each individual user eventually decides whether they would like to use it or not.

 

Shrnutí naší dohody s Matxinem

Povinnosti Matxinu

  • Umožnit bezplatné použití jejich klíče strojového překladu API do nadace Wikimedia Foundation, aby dobrovolníci na stránkách Wikimedia mohli překládat články a podporovat nejméně 10 milionů znaků obsahu překladu denně.

Povinnosti nadace Wikimedia Foundation

  • Poskytovat dobrovolně upravené verze textu přeloženého překladatelským nástrojem, aby Matxin mohl vylepšovat svůj nástroj
  • No personal data of translators will be shared.
  • Just the original content to translate, its language, and translation target language will be sent in the request to Matxin.
  • The translations published by translators, with or without the help of machine translation services, will be provided in the form of parallel corpora by the Content Translation APIs. These APIs will be developed incrementally and results will be freely available for everyone, not just Matxin.

Důležité poznámky

  • Veškerý obsah bude nadále licencován podle CC BY-SA 3.0
  • Matxin is not requiring any "branding" on Wikimedia Sites outside of listing Matxin as a translation tool option in the translation interface drop-down menu
  • There is no exchange of personal information of volunteers
  • The agreement is limited to 1 year, at which time we can reevaluate our needs
  • We are free to terminate the agreement for any reason, at any time (with 30 days notice)
  • Agreement is governed by US law

Otázky k této službě

V této sekci jsme se zabývali několika okamžitými otázkami o matxinu. This is also available in the Content Translation FAQ page.

Které jazyky ovládá Matxin? Plánujete přidat další?

Matxin lze použít k překladu ze španělštiny do baskičtiny. As more languages are added to the service by the developers of the Matxin team, we will include them.

Jak se liší používání Matxinu než jiných služeb strojového překladu?

Jako uživatel obsahu překladu nebudete cítit žádný rozdíl v překladovém rozhraní, protože Matxin zobrazí přeložený obsah stejným způsobem jako ostatní služby, které v současné době pro podporované jazykové páry pracují.

Jak se provádí strojový překlad, když zvolím Matxin?

Matxin poskytuje klíč API, který umožňuje webům a dalším službám používat jejich překladový systém. Content Translation also uses that unique API key to access Matxin. When a user starts translating an article, the HTML content of each section of the source article is sent to Matxin and a translated version is obtained and displayed on the respective translation column of Content Translation. Links and references are adapted as usual and users can modify the content as required.

Tento proces pokračuje u všech částí přeloženého článku. For better performance, the translations for consecutive sections are pre-fetched. The user can save the unpublished translation (to work on it again at a later time) or publish the article in the usual manner. The article is published on Wikipedia like any other normal article with appropriate attribution and licenses.

Zde je schéma procesu.

Je Matxin založen na open source softwaru?

Ano! Jedná se o software s otevřeným zdrojovým kódem, podobný programu Apertium. It has been developed by a small team from the University of Basque country who developed this tool for their own need to translate Wikipedia articles. They are very much part of the Wikimedia community and we are happy to partner with them.

Měl bych se bát o své osobní údaje při používání Matxinu?

Bez ohledu na používanou službu si můžete být jisti, že bude odeslán pouze obsah z existujících článků z Wikipedie a do překladu bude přidán pouze volně licencovaný obsah. No personal information is sent and communication with those services happen at the server side, so they are isolated from the user device. Please refer to this diagram for more details.

Co když je Matxin jediný dostupný strojový překladový nástroj a já ho nechci používat?

Strojový překlad je volitelná funkce v překladu obsahu, kterou můžete snadno libovolně zakázat. If more machine translation systems are added for your languages, you can choose to enable MT again and select the MT service of your choice.

Bude obsah přeložený Matxinem zdarma pro použití na Wikipedii?

Ano. Obsah přijatý od Matxinu je jinak volně dostupný na platformě webového překladu. It is an open source software. For ease of use Content Translation receives it via an API key to make it seamlessly available on the translation interface. This content can be modified by the users (if necessary) and used in Wikipedia articles under free licenses.

Lze tento obsah použít ke zlepšení systémů strojového překladu obecně?

Ano. Překlady provedené v překladu obsahu jsou uloženy v naší databázi. This information will be made publicly available for anyone to use as translation examples to improve their translation services (from University research groups, open source projects to commercial companies, anyone!). The content can be accessed via the Content Translation API. Please note, only information related to translated text is publicly available. This includes – source and translated text, source and target language information and an identifier for the segment of text.