Inhaltsübersetzung/Maschinenübersetzung/Google Translate
Die maschinelle Übersetzungsunterstützung für Inhaltsübersetzung wurde jetzt erweitert. Zusätzlich zu Apertium, LingoCloud, Matxin, Yandex und Youdao fügen wir jetzt Google Translate der Liste der für Benutzer von Content Translation verfügbaren maschinellen Übersetzungssysteme (MÜ) hinzu. Dadurch wird die maschinelle Übersetzungsunterstützung für mehr als 100 Sprachen erweitert, einschließlich vieler neuer Sprachen, die von den vorhandenen Systemen noch nicht unterstützt wurden.
Google Translate wird von Google bereitgestellt - einem multinationalen Technologieunternehmen mit Sitz in den USA. Verschiedene Teams von Wikimedia Foundation und Google haben in Zusammenarbeit eine Vereinbarung ausgearbeitet, die die Verwendung von Google Translate ermöglicht, ohne die Richtlinien von Wikipedia in Bezug auf die Zuweisung von Rechten, die Privatsphäre unserer Benutzer und die Repräsentation von Marken zu beeinträchtigen. Weitere Einzelheiten zur Vereinbarung siehe unten . Wir freuen uns über Deine Fragen zu diesem Service.
Hauptfunktionen
- Es werden keine persönlichen Daten an Google Übersetzer gesendet. Der Zugriff auf das MÜ-System erfolgt über Google Cloud Services. Artikelinhalt (frei lizenziert) wird von den Wikimedia Foundation-Servern an die Google-Server gesendet. Es findet keine direkte Kommunikation zwischen dem Nutzer und externen Diensten statt und es werden keine persönlichen Informationen (IP, Nutzername) an die Google-Server gesendet. Der Client, der mit Google-Servern Kontakt aufnimmt, ist Open Source und kann hier überprüft werden. Kein Teil des Dienstes oder Codes von Google wird Teil der Wikimedia-Infrastruktur oder der Codebasis für Inhaltsübersetzung sein. Weitere Einzelheiten findest Du in einem Diagramm des technischen Set-ups am Ende des Abschnitts.
- Die Daten werden von Google Translate unter einer freien Lizenz zurückgesendet. Bei Verwendung von Google Translate wird eine übersetzte Version von Wikipedia-Inhalten unter einer freien Lizenz bezogen. Benutzer können es ändern und als Teil von Wikipedia veröffentlichen, ohne dass Konflikte mit vorhandenen Regeln auftreten. Der resultierende Inhalt, der von Google Translate übersetzt wurde, und die Benutzeränderungen werden unter derselben Lizenz zur Verfügung gestellt, die auch für die übrigen Artikel in Wikipedia verwendet wird.
- Die erweiterte Open Source-Übersetzungs-Community profitiert davon. Übersetzungen, die von Google Translate bezogen wurden, und deren Benutzeränderungen werden öffentlich verfügbar sein. Die nachbearbeiteten Übersetzungen sind von besonderem Interesse für die Community der Übersetzungsentwickler, die diese Ressource verwenden können, um neue Übersetzungsdienste für Sprachen zu erstellen, für die noch keine Open-Source-maschinelle Übersetzung verfügbar ist. Dies wird Entwicklern helfen, maschinelle Übersetzungssysteme zu erstellen und zu verbessern.
- Benutzer können es deaktivieren. Die automatische Übersetzung ist ein optionales Tool für die Inhaltsübersetzung. Benutzer haben die Möglichkeit, es zu deaktivieren, wenn sie es aus irgendeinem Grund nicht nützlich finden. Obwohl viele Übersetzer diesen Übersetzungsdienst angefordert haben, kann jeder einzelne Benutzer entscheiden, ob er ihn verwenden möchte oder nicht.
Zusammenfassung unserer Vereinbarung mit Google
Googles Verpflichtungen
- Kostenlose Verwendung des Übersetzungs-API-Schlüssels durch die Wikimedia Foundation, damit Freiwillige auf Wikimedia-Websites Artikel und so viele Zeichen wie nötig übersetzen können.
Verpflichtungen der Wikimedia Foundation
- Bereitstellung der von Freiwilligen bearbeiteten Versionen des vom Übersetzungstool übersetzten Texts, damit Google sein Tool verbessern kann
- Es werden keine persönlichen Daten von Übersetzern weitergegeben.
- Nur der zu übersetzende Originalinhalt, seine Sprache und die Übersetzungszielsprache werden in der Anfrage an Google gesendet.
- Die von Übersetzern mit oder ohne Hilfe von maschinellen Übersetzungsdiensten veröffentlichten Übersetzungen werden von den Inhaltsübersetzungs-APIs in Form von Parallel text bereitgestellt. Diese APIs werden inkrementell entwickelt und die Ergebnisse werden nicht nur für Google, sondern für alle Nutzer frei verfügbar sein.
Wichtige Hinweise
- Alle Inhalte bleiben unter CC BY-SA 3.0 lizenziert
- Für Google ist kein "Branding" auf Wikimedia-Websites erforderlich, wenn Google Translate nicht als Übersetzungswerkzeugoption im Dropdown-Menü der Übersetzungsoberfläche aufgeführt ist
- Es findet kein Austausch personenbezogener Daten von freiwilligen Helfern statt
- Die Vereinbarung ist auf ein Jahr befristet. Zu diesem Zeitpunkt können wir unsere Anforderungen neu bewerten
- Es steht uns frei, den Vertrag jederzeit, aus welchem Grund auch immer, zu kündigen
- Die Vereinbarung unterliegt US-amerikanischem Recht
Fragen zu diesem Dienst
In diesem Abschnitt haben wir einige unmittelbare Fragen zu Google beantwortet. Dies ist auch auf der Seite mit den häufig gestellten Fragen (FAQs) zur Inhaltsübersetzung verfügbar.
Welche Sprachen werden von Google Translate zur Verfügung gestellt? Gibt es Pläne, weitere hinzuzufügen?
Mit Google Translate kann man in alle verfügbaren Sprachen übersetzen, mit Ausnahme von Englisch, für das derzeit keine maschinelle Übersetzung möglich ist.
Inwiefern unterscheidet sich die Verwendung von Google Translate von der Verwendung von Apertium?
Als Benutzer der Inhaltsübersetzung bemerkt man keinen Unterschied auf der Übersetzungsoberfläche, da Google Translate den übersetzten Inhalt auf dieselbe Weise anzeigt, wie es Apertium derzeit für die unterstützten Sprachpaare tut.
Wie erfolgt die maschinelle Übersetzung, wenn ich Google Translate dafür wähle?
Google Translate bietet einen API-Schlüssel, mit dem Websites und andere Dienste dessen Übersetzungssystem verwenden können. Die Inhaltsübersetzung verwendet diesen eindeutigen API-Schlüssel auch für den Zugriff auf Google Cloud-Dienste für Google Translate. Wenn ein Benutzer mit der Übersetzung eines Artikels beginnt, wird der HTML-Inhalt jedes Abschnitts des Quellartikels an Google Translate gesendet, und eine übersetzte Version wird abgerufen und in der entsprechenden Übersetzungsspalte von Content Translation angezeigt. Links und Verweise werden wie gewohnt angepasst und Benutzer können den Inhalt nach Bedarf ändern.
Dieser Vorgang wird für alle Abschnitte des zu übersetzenden Artikels beibehalten. Für eine schnellere Ausführung werden die Übersetzungen für nachfolgende Abschnitte vorab abgerufen. Der Benutzer kann die unveröffentlichte Übersetzung speichern (um sie zu einem späteren Zeitpunkt weiter zu bearbeiten) oder den Artikel auf die übliche Weise veröffentlichen. Der Artikel wird auf Wikipedia wie jeder andere normale Artikel mit entsprechender Namensnennung und Lizenz veröffentlicht.
Hier ist ein Diagramm des Vorgangs.
Google Translate basiert nicht auf Open-Source-Software. Warum benutzen wir es?
Die Übersetzung von Inhalten entstand aus dem langjährigen Bedürfnis heraus, die Lücke in der Menge an Inhalten zwischen Wikipedias in verschiedenen Sprachen zu schließen. Wie alle anderen auf Wikimedia-Websites verwendeten Programme ist auch die Inhaltsübersetzung Open Source. Auch in diesem speziellen Fall verwenden wir einen Open Source Client, um mit dem externen Dienst zu interagieren und frei lizenzierte Inhalte zu importieren, um den Benutzern dabei zu helfen, unser freies Wissen zu erweitern.
Um Google Translate zu verwenden, fügen wir keine proprietäre Software in den Inhaltsübersetzungscode oder auf den Wikimedia-Websites und -Servern ein. "Der Service ist im Rahmen des Angebots von Google an die Wikimedia Foundation kostenlos." The service is free of charge as part of Google’s offering to the Wikimedia Foundation.
Nur der frei verfügbare Wikipedia-Artikelinhalt (in Segmenten) wird an Google Translate gesendet, und der erhaltene übersetzte Inhalt kann auf Wikipedia-Seiten frei verwendet werden. Der übersetzte Inhalt kann von den Benutzern geändert werden. Diese Daten sind auch unter einer kostenlosen Lizenz über die Inhaltsübersetzungs-API öffentlich verfügbar. Dies ist eine wertvolle Ressource, die der Community zur Verfügung gestellt wird, um Open Source-Übersetzungsdienste für die Sprachen zu entwickeln, in denen sie noch nicht existieren.
Nach sorgfältiger Prüfung der Auswirkungen stellten wir fest, dass die Tatsache, dass die Inhalte zuvor in einem Closed Source-Dienst gespeichert wurden, die Freiheit unseres Wissens oder unserer Software in der Gegenwart oder Zukunft nicht einschränkt. Wir haben besonders darauf geachtet, dass die bereitgestellten Inhalte frei lizenziert werden, um sicherzustellen, dass sie den Wikipedia-Richtlinien entsprechen. Dies beinhaltete einen langen Prozess für die rechtliche und technische Bewertung und Einhaltung. Die Zusammenfassung unserer Vereinbarung findest Du ebenfalls oben.
From user feedback, we have seen that machine translation support is really helpful for users and we want to support all languages in the best way. Guided by the principles of Wikimedia Foundation's resolution to support free and open source software, we will prioritize the integration of open source services whenever they are available for a language. Apertium has been a critical part of Content Translation since its inception, but currently, it only provides machine translations for about 30 of the numerous possible language combination that Wikipedia can support.
Muss ich mir bei der Verwendung von Google Translate Sorgen um meine persönlichen Daten machen?
Unabhängig davon, welcher Dienst verwendet wird, kannst Du sicher sein, dass nur Wikipedia-Inhalte aus vorhandenen Artikeln gesendet werden und nur frei lizenzierte Inhalte zur Übersetzung hinzugefügt werden. Es werden keine persönlichen Informationen gesendet und die Kommunikation mit diesen Diensten findet auf der Serverseite statt, sodass sie vom Benutzergerät isoliert ist. Weitere Informationen findest Du in diesem Diagramm.
Was ist, wenn Google Translate das einzige verfügbare maschinelle Übersetzungstool ist aber ich es nicht verwenden möchte?
Die maschinelle Übersetzung ist eine optionale Funktion in der Inhaltsübersetzung, die Du problemlos nach Belieben deaktivieren kannst. Wenn für Deine Sprachen weitere maschinelle Übersetzungssysteme hinzugefügt werden, kannst Du MÜ erneut aktivieren und den MÜ-Dienst Deiner Wahl auswählen.
Sind die von Google Translate übersetzten Inhalte frei für die Verwendung in Wikipedia?
Ja. Der von Google Translate erhaltene Inhalt ist ansonsten auf der Webübersetzungsplattform frei verfügbar. Die Inhaltsübersetzung erhält sie über einen API-Schlüssel, um sie nahtlos auf der Übersetzungsoberfläche verfügbar zu machen. Dieser Inhalt kann von den Benutzern geändert werden (falls erforderlich) und in Wikipedia-Artikeln unter freien Lizenzen verwendet werden.
Kann dieser Inhalt zur Verbesserung von maschinellen Übersetzungssystemen generell verwendet werden?
Ja. Übersetzungen, die in Content Translation erstellt wurden, werden in unserer Datenbank gespeichert. Diese Informationen werden öffentlich zugänglich gemacht, damit jeder sie als Übersetzungsbeispiele zur Verbesserung seiner Übersetzungsdienste verwenden kann (von universitären Forschungsgruppen über Open-Source-Projekte bis hin zu kommerziellen Unternehmen!). Auf den Inhalt kann über die Content Translation API zugegriffen werden. Bitte beachte, dass nur Informationen zu übersetzten Texten öffentlich zugänglich sind. Dazu gehören - Quelltext und übersetzter Text, Informationen zur Quell- und Zielsprache sowie eine Kennung für das Textsegment.
Siehe auch
- Projekt Glow FAQ - Wikimedia Foundation Partnerschafts-FAQs in Google Partnerschaft
- Unterstützung des Wikipedias-Programms für die indische Sprache - Wikimedia Foundation und Google kooperieren mit dem Centre for Internet and Society (CIS), Wikimedia India Chapter (WMIN) und Benutzergruppen in einem Pilotprogramm, um Wikipedia-Communities zu ermutigen, lokal relevante und qualitativ hochwertige Inhalte in indischen Sprachen zu erstellen. Auch bekannt als Projekt Tiger
- Häufig gestellte Fragen zu den Tools für die Inhaltsübersetzung
- Verfolgung der Phabricator-Aufgaben zum Hinzufügen weiterer maschineller Übersetzungsdienste