Content translation/Machine Translation/Google Translate/nl
De ondersteuning van machinevertaling voor Content Translation is nu verder uitgebreid. Naast Apertium, LingoCloud, Matxin, Yandex en Youdao voegen we nu Google Translate toe aan de lijst met systemen voor automatische vertaling (MT) die beschikbaar zijn voor gebruikers van Content Translation. Dit zal de ondersteuning van machinevertaling voor meer dan 100 talen toevoegen, waaronder vele nieuwe talen die niet eerder werden bediend door de bestaande systemen.
Google Translate wordt geleverd door Google – een in de VS gevestigd multinationaal technologiebedrijf. Verschillende teams binnen de Wikimedia Foundation en Google hebben samen gewerkt om een overeenkomst uit te werken die het gebruik van Google Translate zal toestaan zonder het beleid van Wikipedia over het toewijzen van rechten, de privacy van onze gebruikers en de vertegenwoordiging van het merk te schaden. Meer informatie over de overeenkomst vindt u hieronder en we horen graag al uw vragen over deze service.
Belangrijkste functies
- Er wordt geen persoonlijke informatie naar Google Translate verzonden. Het MT-systeem wordt via Google-clouddiensten bereikt. Artikel inhoud (vrij gelicentieerd) wordt naar Google-servers verzonden vanaf de servers van de Wikimedia Foundation. Er is geen directe communicatie tussen de gebruiker en externe diensten en er worden geen persoonlijke gegevens (IP, gebruikersnaam) naar de Google-servers verzonden. De client die contact opneemt met Google-servers is open source en u kunt dit hier controleren. Geen enkel deel van de service of code van Google zal deel uitmaken van de Wikimedia-infrastructuur of de codebasis van Content Translation. Voor meer informatie zie een diagram van de technische opstelling aan het eind van het gedeelte.
- Informatie wordt teruggestuurd van Google Translate onder een vrije licentie. Wanneer Google Translate wordt gebruikt, wordt een vertaalde versie van de Wikipedia-inhoud onder een vrije licentie verkregen. Gebruikers kunnen het wijzigen en publiceren als onderdeel van Wikipedia zonder conflicten met bestaande beleid. De inhoud die wordt vertaald door Google Translate en de gebruikerswijzigingen zullen beschikbaar zijn onder dezelfde licentie die wordt gebruikt voor de rest van de artikelen in Wikipedia.
- Het is een voordeel voor de bredere open source vertalingsgemeenschap. Vertalingen die zijn verkregen bij Google Translate en gebruikerswijzigingen zullen openbaar beschikbaar zijn. De post-gecorrigeerde vertalingen zijn van bijzonder belang voor de vertaalonderzoeksgemeenschap die deze hulpbron kan gebruiken om nieuwe vertaaldiensten te creëren die talen ondersteunen waarvoor open source machinevertaling nog niet beschikbaar is. Dit zal de ontwikkelaars helpen om machinevertalingssystemen te creëren en te verbeteren.
- Gebruikers kunnen het uitschakelen. Automatische vertaling is een optioneel hulpmiddel in Content Translation. Gebruikers hebben de mogelijkheid om het te deactiveren als ze het om een of andere reden niet nuttig vinden. Hoewel veel Content Translation-gebruikers deze vertalingsdienst hebben aangevraagd, kan elke gebruiker zelf beslissen of hij of zij deze wil gebruiken.
Samenvatting van onze overeenkomst met Google
Verplichtingen van Google
- Gebruik van hun vertaal API-sleutel zonder kosten voor de Wikimedia Foundation om vrijwilligers op Wikimedia-sites artikelen te laten vertalen met zoveel karakters als nodig.
Verplichtingen van de Wikimedia Foundation
- Om de door vrijwilligers bewerkte versies van de tekst te leveren die door het vertaalhulpmiddel zijn vertaald, zodat Google hun hulpmiddel kan verbeteren
- Er worden geen persoonsgegevens van vertalers gedeeld.
- Alleen de originele inhoud die moet worden vertaald, de taal en de vertaaldoeltaal worden in het verzoek aan Google verzonden.
- De vertalingen die door vertalers worden gepubliceerd, met of zonder de hulp van automatische vertaaldiensten, worden geleverd in de vorm van parallelle corpora door de API's van Content Translation. Deze API's zullen geleidelijk worden ontwikkeld en de resultaten zullen vrij beschikbaar zijn voor iedereen, niet alleen voor Google.
Belangrijke notities
- Alle inhoud blijft onder licentie CC BY-SA 3.0
- Google vereist geen "branding" op Wikimedia-sites buiten het vermelden van Google Translate als een vertaalhulpmiddel optie in het drop-down menu van het vertaalinterface
- Er is geen uitwisseling van persoonlijke informatie van vrijwilligers
- De overeenkomst is beperkt tot 1 jaar, waarop we onze behoeften kunnen herzien
- Wij zijn vrij om de overeenkomst om welke reden dan ook en op elk moment te beëindigen
- Overeenkomst is onderworpen aan het Amerikaanse recht
Vragen over deze service
We hebben enkele vragen over Google in dit gedeelte al behandeld. Dit is ook beschikbaar op de pagina veelgestelde vragen over Content Translation.
Welke talen worden door Google Translate behandeld? Zijn er plannen om er meer toe te voegen?
Google Translate kan worden gebruikt om in alle beschikbare talen te vertalen, behalve Engels, dat nu niet is ingeschakeld om machinevertaling van welke aard dan ook te gebruiken.
Wat is het verschil tussen het gebruik van Google Translate en het gebruik van Apertium?
Als gebruiker van Content Translation zult u geen verschil voelen op de vertaalinterface, omdat Google Translate de vertaalde inhoud weergeeft op dezelfde manier als Apertium het doet voor de ondersteunde taalparen.
Hoe wordt de machinevertaling uitgevoerd als ik voor Google Translate kies?
Google Translate biedt een API-sleutel waarmee websites en andere diensten hun vertaalsysteem kunnen gebruiken. Content Translation gebruikt ook die unieke API-sleutel om toegang te krijgen tot Google Cloud-diensten voor Google Translate. Wanneer een gebruiker een artikel begint te vertalen, wordt de HTML-inhoud van elk deel van het bronartikel naar Google Translate gestuurd en wordt een vertaalde versie verkregen en weergegeven in de respectieve vertalingskolom van Content Translation. De links en verwijzingen worden zoals gewoonlijk aangepast en de gebruikers kunnen de inhoud zo nodig wijzigen.
Dit proces gaat door voor alle delen van het artikel die worden vertaald. Voor een betere prestatie worden de vertalingen voor opeenvolgende delen vooraf gelezen. De gebruiker kan de ongepubliceerde vertaling opslaan (om later opnieuw aan deze vertaling te werken) of het artikel op de gebruikelijke manier publiceren. Het artikel wordt op Wikipedia gepubliceerd zoals elk ander normaal artikel met passende toeschrijving en licenties.
Google Translate is niet gebaseerd op open source software. Waarom gebruiken we het?
Content Translation is ontstaan uit een langdurige behoefte om de kloof in de hoeveelheid inhoud tussen Wikipedia's in verschillende talen te overbruggen. Net als alle andere software die op Wikimedia-sites wordt gebruikt, is Content Translation ook open source. Ook in dit specifieke geval gebruiken we een open source client om te communiceren met de externe service en om inhoud met een vrije licentie te importeren om gebruikers te helpen onze gratis kennis uit te breiden.
Om Google Translate te gebruiken voegen we geen software toe in de Content Translation code, of op de Wikimedia-websites en servers. De service is gratis als onderdeel van het aanbod van Google aan de Wikimedia Foundation.
Alleen de vrij beschikbare Wikipedia-artikelinhoud (in segmenten) wordt naar de Google Translate verzonden en de verkregen vertaalde inhoud is vrij te gebruiken op Wikipedia-pagina's. De vertaalde inhoud kan door gebruikers worden gewijzigd en deze gegevens zijn ook openbaar beschikbaar onder een gratis licentie via de Content Translation API. Dit is een waardevolle bron die beschikbaar is gesteld voor de gemeenschap om open source vertaaldiensten te ontwikkelen voor talen waar ze nog niet bestaan.
Na zorgvuldig onderzoek van de implicaties, ontdekten we dat het feit dat de inhoud eerder in een gesloten bronservice werd opgeslagen, de vrijheid van onze kennis of onze software in het heden of de toekomst niet beperkt. We hebben er speciale zorg voor genomen om ervoor te zorgen dat de inhoud die wordt verstrekt, vrij is gelicentieerd om ervoor te zorgen dat het voldoet aan het Wikipedia-beleid. Dit omvat een langdurig proces voor juridische en technische evaluatie en naleving. De samenvatting van onze overeenkomst is hierboven beschikbaar.
Uit de feedback van gebruikers hebben we gezien dat machinevertalingsondersteuning echt nuttig is voor gebruikers en we willen alle talen op de beste manier ondersteunen. Gegeven door de [$url principes van de resolutie van de Wikimedia Foundation] om vrije en open source software te ondersteunen, zullen we de integratie van open source services prioriteren wanneer ze voor een taal beschikbaar zijn. Apertium is vanaf het begin een cruciaal onderdeel geweest van Content Translation, maar nu biedt het alleen machinevertalingen aan voor ongeveer 30 van de vele mogelijke talencombinaties die Wikipedia kan ondersteunen.
Moet ik me zorgen maken over mijn persoonlijke gegevens bij het gebruik van Google Translate?
Ongeacht welke dienst u gebruikt, u kunt er zeker van zijn dat alleen Wikipedia-inhoud uit bestaande artikelen wordt verzonden en alleen vrij gelicentieerde content zal worden toegevoegd aan de vertaling. Er wordt geen persoonlijke informatie verzonden en de communicatie met die diensten vindt plaats aan de serverzijde, dus deze worden geïsoleerd van het gebruikersapparaat. Raadpleeg dit diagram voor meer details.
Wat als Google Translate het enige beschikbare hulpmiddel voor machinevertaling is en ik het niet wil gebruiken?
Machine Translation is een optionele functie in Content Translation die u gemakkelijk kunt uitschakelen. Als er voor uw talen meer machinevertalingssystemen worden toegevoegd, kunt u ervoor kiezen om MT opnieuw in te schakelen en de MT-service van uw keuze te selecteren.
Is de door Google Translate vertaalde inhoud vrij voor gebruik in Wikipedia?
Ja, dat is het. De inhoud die van Google Translate wordt ontvangen is vrij beschikbaar op het webvertalingsplatform. Content Translation ontvangt het via een API-sleutel om het naadloos beschikbaar te maken op de vertaalinterface. Deze inhoud kan door de gebruikers worden gewijzigd (indien nodig) en gebruikt in Wikipedia-artikelen onder vrije licenties.
Kan deze inhoud worden gebruikt voor het verbeteren van automatische vertaalsystemen in het algemeen?
Ja, dat is het. Vertalingen die in Content Translation zijn gemaakt, worden opgeslagen in onze database. Deze informatie zal openbaar worden gemaakt voor iedereen om als vertaalvoorbeelden te gebruiken om hun vertaaldiensten te verbeteren (voor universitaire onderzoeksgroepen, open sourceprojecten tot commerciële bedrijven, iedereen!). De inhoud is toegankelijk via de Content Translation API. Let op: alleen informatie met betrekking tot vertaalde tekst is openbaar. Dit omvat - bron- en vertaalde tekst, bron- en doeltaalinformatie en een identificatiecode voor het tekstsegment.
Zie ook
- Project Glow Veelgestelde vragen - Partnerschap met Google
- Ondersteuning van het Wikipedia-programma in de Indiase taal - Wikimedia Foundation en Google werken samen met het Centre for Internet and Society (CIS), Wikimedia India chapter (WMIN) en gebruikersgroepen in een pilot programma dat Wikipedia-gemeenschappen aanmoedigt om lokaal relevante en hoogwaardige inhoud in Indiase talen te creëren. (ook wel Project Tiger)
- Veelgestelde vragen over hulpmiddelen van Content Translation
- Volgen Phabricator taak voor het toevoegen van meer automatische vertaaldiensten