Content translation/Machine Translation/Youdao/nl

This page is a translated version of the page Content translation/Machine Translation/Youdao and the translation is 100% complete.

Vanaf 31 oktober 2016 is het Youdao machine vertaalsysteem beschikbaar en kan het worden gebruikt bij het vertalen van Wikipedia-pagina's met behulp van Content Translation.

Youdao wordt geleverd door NetEase – een internetservicebedrijf uit China. Het juridische team van de Wikimedia Foundation en NetEase hebben samen gewerkt om een overeenkomst uit te werken die het gebruik van Youdao zal toestaan zonder het beleid van Wikipedia inzake het toewijzen van rechten, de privacy van onze gebruikers en de vertegenwoordiging van het merk te schaden. De samenvatting van de voorwaarden van de overeenkomst is hieronder en wij zijn verheugd om eventuele vragen over deze service te horen. Dit wordt ook ondersteund door de Chinese Wikipedia-gemeenschap.

Belangrijkste functies

  • Er worden geen persoonlijke gegevens verzameld door Youdao. Het MT-systeem is toegankelijk via een openbaar toegankelijke API-sleutel (de inhoud van de gelinkte pagina is in het Chinees geschreven). Artikel inhoud (vrij gelicentieerd) wordt naar Youdao-servers verzonden vanaf de servers van de Wikimedia Foundation. Er is geen directe communicatie tussen de gebruiker en externe services en er worden geen persoonlijke informatie (IP, gebruikersnaam) verzonden naar de servers van Youdao samen met de inhoud van Wikipedia. De cliënt die contact opneemt met Youdao-servers is open source en u kunt de code bekijken. Geen enkel deel van de service of code van Youdao zal deel uitmaken van de Wikimedia-infrastructuur of de contenttranslatie-codebasis
  • De informatie die wordt geretourneerd door Youdao is onder een vrije licentie. Wanneer de dienst van Youdao wordt gebruikt, bieden ze een vertaalde versie van de Wikipedia-inhoud die de gratis licentie behoudt. Gebruikers kunnen het wijzigen en publiceren als onderdeel van Wikipedia zonder conflicten met bestaande beleid. De inhoud die wordt vertaald door Youdao en de gebruikerswijzigingen zullen beschikbaar zijn onder dezelfde licentie die wordt gebruikt voor de rest van de artikelen in Wikipedia.
  • Komt ten goede aan de bredere open source-vertaalgemeenschap. De vertalingen die bij Youdao zijn verkregen en de wijzigingen die door de gebruikers zijn aangebracht, zullen openbaar beschikbaar zijn. De post-gecorrigeerde vertalingen zijn van bijzonder belang voor de vertaalonderzoeksgemeenschap die deze hulpbron kan gebruiken om nieuwe vertaaldiensten te creëren die talen ondersteunen waarvoor open source machinevertaling nog niet beschikbaar is. Dit zal de ontwikkelaars helpen om machinevertalingssystemen te creëren en te verbeteren.
  • Automatische vertaling is een optioneel hulpmiddel bij het gebruik van Content Translation. Gebruikers hebben de mogelijkheid om het te deactiveren als ze het om een of andere reden niet nuttig vinden. De gebruikers kunnen via de voorkeuren beslissen of zij deze service of een andere service voor hun taal willen gebruiken of geen machinevertalingen willen gebruiken.

 

Bekende problemen

De vertaalservice van Youdao vertaalt geen rijke tekst zoals HTML. Het accepteert als invoer platte tekst en produceert platte tekst. Content translation meestal past markup opnieuw toe bovenop dit soort uitvoer, maar voor Chinees is dit niet mogelijk vanwege niet-triviale tokenization van zin naar woorden. De vertalers zullen de vertalingen dus alleen in tekst ontvangen en alle links, referenties, enz. moeten tijdens de vertaling handmatig worden toegevoegd.

Samenvatting van de voorwaarden van de overeenkomst

Verplichtingen van Youdao

  • Om hun API-sleutel gratis te laten licentieren aan de Wikimedia Foundation om vrijwilligers op Wikimedia-sites artikelen te laten vertalen
  • Om vrijwilligers in staat te stellen tot vierduizend tekens per verzoek en tien miljoen tekens per dag te vertalen (veel meer dan hun openbare mogelijkheid)
  • Om Wikimedia statistische gegevens te geven over de hoeveelheid tekens in de verzonden verzoeken

Verplichtingen van de Wikimedia Foundation

  • De door de vrijwilliger gemaakte versie van de door het vertaalhulpmiddel vertaalde tekst te leveren zodat Youdao hun hulpmiddel kan verbeteren
    • Er worden geen persoonsgegevens van vertalers gedeeld.
    • Nu worden alleen de originele inhoud om te vertalen, de taal en de vertaaldoeltaal in het verzoek naar Youdao gestuurd.
    • De vertalingen die door vertalers worden gepubliceerd, met of zonder de hulp van automatische vertaaldiensten, worden geleverd in de vorm van parallelle corpora door de API's voor inhoudsvertaling. Deze API's zullen geleidelijk worden ontwikkeld en de resultaten zullen vrij beschikbaar zijn voor iedereen, niet alleen voor Youdao.

Belangrijke notities

  • Alle inhoud blijft onder licentie CC BY-SA 3.0
  • Youdao vereist geen "branding" op Wikimedia-sites buiten het vermelden van Youdao als een vertaalhulpmiddel optie in het drop-down menu van het vertaalinterface
  • Er is geen uitwisseling van persoonlijke gegevens van gebruikers
  • De overeenkomst is beperkt tot 1 jaar, en dan kunnen we onze behoeften opnieuw beoordelen.
  • Wij zijn vrij om de overeenkomst om welke reden dan ook, te allen tijde (met 30 dagen voorafgaande kennisgeving) te beëindigen.
  • Overeenkomst is onderworpen aan het Amerikaanse recht

Vragen over deze service

We hebben in deze sectie enkele directe vragen over Youdao behandeld. Dit staan ook bij de Veelgestelde vragen over contentvertaling.

Welke talen worden door Youdao behandeld? Zijn er plannen om er meer toe te voegen?

Youdao is nu alleen beschikbaar voor Chinese en Engelse, Franse, Japanse, Koreaanse, Portugese, Russische en Spaanse vertalingen, voor gebruikers die pagina's zullen maken via Content Translation. Als er talen bijkomen, zullen we overwegen om deze te gebruiken voor Content Translation. Let op: bij het maken van pagina's van Chinees naar Engels is een machinevertaling van Youdao niet beschikbaar.

Is het gebruik van Youdao anders dan bij een ander machinevertalingssysteem?

Als gebruiker van Content Translation zult u geen verschil voelen op de vertaalinterface, omdat het automatische vertaalsysteem van Youdao de vertaalde inhoud op dezelfde manier weergeeft als Apertium of Yandex nu doet. Echter, vanwege Youdao's huidige beperking van het niet ondersteunen van 'rijke tekst', zullen links, referenties etc. handmatig moeten worden aangepast.

Hoe wordt de machinevertaling uitgevoerd als ik voor Youdao kies?

Youdao biedt een fvrij te gebruiken API key aan waarmee websites en andere diensten hun vertaalsysteem kunnen gebruiken. Content Translation gebruikt ook een unieke API-sleutel om toegang te krijgen tot deze dienst op de server van Youdao. Wanneer een gebruiker een artikel begint te vertalen, wordt de HTML-inhoud van elk deel van het bronartikel naar de Youdao-server verzonden en wordt een vertaalde versie verkregen en weergegeven in de respectieve vertalingskolom van Content Translation. De links en verwijzingen worden zoals gewoonlijk aangepast en de gebruikers kunnen de inhoud zo nodig wijzigen.

Dit proces gaat door voor alle delen van het artikel die worden vertaald. Voor een betere prestatie worden de vertalingen voor opeenvolgende delen vooraf al gelezen door de extensie. De gebruiker kan de ongepubliceerde vertaling opslaan (om later opnieuw aan deze vertaling te werken) of het artikel op de gebruikelijke manier publiceren. Het artikel wordt op Wikipedia gepubliceerd zoals elk ander normaal artikel met passende toeschrijving en licenties.

Een diagram van het proces.

Youdao is niet gebaseerd op open source software. Waarom gebruiken we het?

Content Translation is ontstaan uit een langdurige behoefte om de kloof in de hoeveelheid inhoud tussen Wikipedia's in verschillende talen te overbruggen.

Net als alle andere software die op Wikimedia-sites wordt gebruikt, is Content Translation ook open source. Ook in dit specifieke geval gebruiken we een open source client om te communiceren met de externe dienst en om vrij gelicentieerde content te importeren om gebruikers te helpen onze vrije kennis uit te breiden.

Net als Yandex, voegen we met het machinevertalingsysteem van Youdao geen eigen software toe in de Content Translation code, of op de Wikimedia-websites en servers. De dienst is gratis en beschikbaar voor iedereen.

Alleen de vrij beschikbare Wikipedia-artikelinhoud (in segmenten) wordt naar de Youdao-service gestuurd en de verkregen vertaalde inhoud is ook vrij te gebruiken op Wikipedia-pagina's. De vertaalde inhoud kan door gebruikers worden gewijzigd en deze gegevens behouden ook hun vrije licentie en zijn openbaar beschikbaar via de Content Translation API. Dit is een waardevolle bron die beschikbaar is gesteld voor de gemeenschap om open source vertaaldiensten te ontwikkelen voor talen waar ze nog niet bestaan.

Na zorgvuldig onderzoek van de implicaties, ontdekten we dat het feit dat de inhoud eerder in een gesloten brondienst werd opgeslagen, de vrijheid van onze kennis of onze software in het heden of de toekomst niet beperkt. We hebben speciale zorg genomen om ervoor te zorgen dat de vertaalde inhoud haar vrije licentie behoudt om ervoor te verzekeren dat het voldoet aan de Wikipedia-beleid. Dit omvat een langdurig proces voor juridische en technische evaluatie en naleving. De samenvatting van de gebruiksvoorwaarden is ook beschikbaar.

Uit de feedback van de gebruikers hebben we gezien dat machinevertalingsondersteuning echt nuttig is voor gebruikers en dat we alle talen op de beste manier willen ondersteunen. Gegeven door de principes van de resolutie van de Wikimedia Foundation om gratis en open source software te ondersteunen, zullen we de integratie van open source services prioriteren wanneer ze voor een taal beschikbaar zijn. Apertium is sinds de oprichting een belangrijk onderdeel van Content Translation en biedt momenteel machinevertalingen voor bijna 70 van de talrijke mogelijke taalcombinaties die Wikipedia kan ondersteunen. Door Yandex in november 2015 toe te voegen, is een grote groep gebruikers in bijna 70 talen geholpen die voorheen niet in staat waren om deze faciliteit te gebruiken met Content Translation.

Moet ik me zorgen maken over mijn persoonlijke gegevens bij het gebruik van Youdao?

Ongeacht welke dienst u gebruikt, u kunt er zeker van zijn dat alleen Wikipedia-inhoud uit bestaande artikelen wordt verzonden en alleen vrij gelicentieerde content zal worden toegevoegd aan de vertaling. Er wordt geen persoonlijke informatie verzonden en de communicatie met die diensten vindt plaats aan de serverzijde, dus deze worden geïsoleerd van het gebruikersapparaat. Zie dit diagram voor meer details.

Wat als Youdao het enige beschikbare hulpmiddel voor automatische vertaling is en ik het niet wil gebruiken?

Machine Translation is een optionele functie in Content Translation die u gemakkelijk kunt uitschakelen. Als er voor uw talen meer machinevertalingssystemen worden toegevoegd, kunt u ervoor kiezen om MT opnieuw in te schakelen en de MT-service van uw keuze te selecteren.

Is de door Youdao vertaalde inhoud vrij voor gebruik in Wikipedia?

Ja. Ja, dat is het. De inhoud die van Youdao wordt ontvangen is ook vrij beschikbaar op het webvertalingsplatform van Youdao. Content Translation ontvangt het via een API-sleutel om het naadloos beschikbaar te maken op de vertaalinterface. Deze inhoud kan door de gebruikers worden gewijzigd (indien nodig) en gebruikt in Wikipedia-artikelen onder vrije licenties.

Kan deze inhoud worden gebruikt voor het verbeteren van automatische vertaalsystemen in het algemeen?

Ja, dat is het. Vertalingen die in Content Translation zijn gemaakt, worden opgeslagen in onze database. Deze informatie zal openbaar beschikbaar worden gemaakt zodat iedereen deze kan gebruiken als vertaalvoorbeelden om hun vertaaldiensten te verbeteren (van universitaire onderzoeksgroepen, open source-projecten tot commerciële bedrijven, wie dan ook!) De inhoud is toegankelijk via de Content Translation API. Let op: alleen informatie met betrekking tot vertaalde tekst is openbaar. Dit omvat - bron- en vertaalde tekst, bron- en doeltaalinformatie en een identificatiecode voor het tekstsegment.