Strukturierte Daten in Wikimedia

This page is a translated version of the page Structured Data Across Wikimedia and the translation is 100% complete.

SDAW[1] war ein Projekt, das dazu beitragen sollte, Inhalte auf Wikitext-Seiten so zu strukturieren, dass sie maschinell lesbar und zuordenbar sind, um das Lesen, Bearbeiten und Durchsuchen projektübergreifend und im Internet einfacher und zugänglicher zu machen.

Ziel war es, Benutzern dabei zu helfen, Inhalte zwischen Wikimedia-Projekten zu verknüpfen, Lesern dabei zu helfen, tiefer in das Wikimedia-Wissensökosystem einzutauchen und Beitragenden dabei zu helfen, Informationen auf Wikidata-ähnliche Weise zwischen Projekten und darüber hinaus zu verbreiten. Das Projekt wurde ins Leben gerufen, um eine Plattform zum Experimentieren mit computergestützten Bearbeitungswerkzeugen zu bieten, um das Bearbeiten für mehr Autoren auf der ganzen Welt einfacher und zugänglicher zu machen.

Das Projekt lief vom 1. Februar 2021 bis zum 30. Juni 2023.

Hintergrund

Bei diesem Projekt handelte es sich um eine Fortsetzung einer ähnlichen Entwicklung, die bei Commons im Rahmen der vorherigen SDC[2]-Förderung abgeschlossen wurde, und sie wurde teilweise durch eine dreijährige Förderung der Sloan Foundation finanziert. Durch die Arbeit an SDC wurde uns bewusst, dass wir erweiterte Metadaten für alle Inhalte und APIs benötigen, um bessere Suchergebnisse zu liefern und die Inhalte dadurch leichter zugänglich, auffindbar, übersetzbar und für andere Zwecke nutzbar zu machen.

Das Projekt verfolgte drei übergeordnete Ziele:

  1. Es Maschinen zu ermöglichen, Wikimedia-Inhalte zu erkennen und Beziehungen zu anderen Wikimedia-Inhalten vorzuschlagen. Wir haben dies zuerst über das Projekt Bildvorschläge erkundet.
  2. Eine Möglichkeit zur Strukturierung von Artikeln und Seiten zu entwickeln, um neue Inhaltsformate zu ermöglichen – etwa Inhalte, die in kleineren, leicht verdaulichen Häppchen präsentiert werden, sodass sie für die Leser leichter nutzbar und teilbar sind.
  3. Wikimedia-Benutzern eine ansprechendere und effizientere Möglichkeit zum Suchen und Finden von Inhalten zu bieten, aufbauend auf der Mediensuche und um neue Wege zu erkunden, die Suche in Wikipedias mithilfe Strukturierter Daten zu verbessern.

Was sich ändert

Das Ziel des Projekts besteht darin, ein neues System zu entwerfen, das flexibel genug ist, um alle Arten von Metadaten zu verarbeiten, die wir in naher Zukunft möglicherweise unterstützen müssen, und einen Prototyp dafür zu erstellen.

Wir haben drei Hauptprojekte identifiziert, die wir im Rahmen unserer Arbeit entwickeln werden:

  1. Bildvorschlag, eine Funktion für erfahrene Benutzer zur Illustration von Wikipedia-Artikeln;
  2. Abschnittsmetadaten, auch als Abschnittsthemen bekannt, um zu beschreiben, worum es in einem Abschnitt eines Wikipedia-Artikels geht;
  3. Suchverbesserungen, die strukturierte Inhalte verwenden, um den Benutzern eine ansprechendere und effizientere Möglichkeit zum Suchen und Finden von Inhalten in den Wikipedias zu bieten.

Bildvorschlag

Siehe auch: Bildervorschläge

Die Bildvorschlag-UI zielt darauf ab, Systeme für strukturierte Daten in allen Wikimedia-Projekten zu entwickeln.

Diese Arbeit baut auf der Arbeit auf, die bereits im Rahmen des Projekts der strukturierten Aufgabe “Bild hinzufügen” begonnen wurde. Der Schwerpunkt wird jedoch auf die Verbesserung der Prozesse für erfahrene Beitragende verlagert. Wir werden insbesondere Benutzer ansprechen, die einen bestimmten Artikel oder eine Reihe von Artikeln bearbeitet oder beobachtet haben, da diese wahrscheinlich Experten auf dem Gebiet sind und Interesse an der Verbesserung dieses Artikels oder dieser Artikel haben.

Abschnittsthemen

Das Projekt Abschnittsthemen identifiziert Abschnitte in einem Artikel und erstellt entsprechende Themen für diese Abschnitte. Dabei greift es auf verschiedene Elemente zurück, beispielsweise:

  • Ein Algorithmus, der Wikidata-Datenobjekte anhand der Blaulinks des Abschnitts erkennt (der in Zusammenarbeit mit den Teams Strukturierte Daten, Forschung und Datenplattform entwickelt wird);
  • Die Möglichkeit, Abschnitte in einem Artikel automatisch zu identifizieren (die in Zusammenarbeit mit den Teams Strukturierte Daten und Datenplattform entwickelt wird).

Einer der ersten Anwendungsfälle, die wir uns für Abschnittsthemen vorgestellt haben, werden Bildvorschläge auf Abschnittsebene sein. Dabei werden der Blaulink-Algorithmus und die oben beschriebene Infrastruktur zur Abschnittsidentifizierung verwendet und sowohl über die Benutzeroberfläche für Neulinge als auch über Benachrichtigungen für erfahrene Beitragende bereitgestellt. Dies baut auf der Arbeit an Bildvorschlägen auf und wird in Zusammenarbeit mit den Teams Strukturierte Daten, Datenplattform, Forschung, Suche, Android und Growth entwickelt.

Diese Elemente werden sich nicht ändern und haben auch keine Auswirkungen auf das aktuelle Bearbeitungserlebnis der Benutzer. Alle diese Aktivitäten erfolgen automatisch und sind nicht von Aktionen der Autoren abhängig. Dieses Projekt befindet sich derzeit in der Entwicklungsphase und es gibt noch Aspekte, die möglicherweise weiterer Untersuchung und/oder Rückmeldungen von Benutzern erfordern.

Suchverbesserungen

Das Projekt Suchverbesserungen nutzt strukturierte Inhalte, um den Benutzern eine ansprechendere und effizientere Möglichkeit zum Suchen und Finden von Inhalten in den Wikipedias zu bieten. Durch die Verbesserung von Spezial:Suche möchten wir es Benutzern ermöglichen, die Informationen zu finden, nach denen sie suchen oder die ihnen möglicherweise entgangen sind oder auf die sie zuvor bei der vorhandenen Suche gestoßen sind.

Unser Ziel ist es, schrittweise Verbesserungen der “Spezialsuche” zu identifizieren und zu definieren, die strukturierte Inhalte verwenden, um Benutzern das Auffinden der gesuchten Inhalte zu erleichtern, insbesondere in den Sprachversionen mit weniger Artikeln.

Was wollen wir nicht tun?

  1. Benutzer aus dem Prozess ausschließen
  2. Benutzer mit zu vielen neuen Inhalten überfordern, die sie moderieren müssen
  3. Zusätzliche Voreingenommenheit zu Wikimedia-Projekten hinzufügen
  4. Zusätzliche Vektoren für Vandalismus hinzufügen
  5. Zu viel Komplexität in unsere Systeme einbringen

Status-Updates

  • Suchvorschau wird in der katalanischen, niederländischen, ungarischen, norwegischen und ukrainischen Wikipedia eingeführt.
  • Bildvorschläge auf Abschnittsebene werden in der portugiesischen, russischen, indonesischen, katalanischen, finnischen, ungarischen und norwegischen Wikipedia eingeführt.

  • Der Abschlussbericht des von SDAW[1] finanzierten DPLA[3]-Projekts zur Förderung der Wiederverwendung beschriebener und zugeschriebener Bilder wurde veröffentlicht.

  • Umfrage über Benachrichtigungen zu Bildvorschlägen, die in der portugiesischen, russischen und indonesischen Wikipedia eingeführt wurden.

  • Die Testphase für Bildvorschläge in der katalanischen, finnischen, ungarischen und norwegischen Wikipedia hat begonnen.

  • Erste Testrunde für Bildvorschläge in der portugiesischen, russischen und indonesischen Wikipedia erfolgreich abgeschlossen.
  • Die Projektseiten wurden aktualisiert, um den neuen aktuellen Status der Initiative widerzuspiegeln.

  • Die Projektseiten wurden aktualisiert, um den neuen aktuellen Status der Initiative und die drei wichtigsten zu entwickelnden Projekte widerzuspiegeln.
  • Die indonesische Wikipedia nimmt als dritte Test-Community teil.

  • Kontaktherstellung zur portugiesischen und russischen Wikipedia-Community als erste Test-Communitys für Bildvorschläge.

  • Das Projekt geht in eine erste Testphase über, in der mit der Verwendung von Benachrichtigungen experimentiert wird, um Benutzer auf potenziell nützliche Bilder für Wikipedia-Artikel aufmerksam zu machen.

Mai-August 2021

  • Suche nach Rückmeldungen zu diesen Ideen.
  • Arbeit an groben Modellen und Entwürfen, um diese Ideen zu erkunden.
  • Erkundung der Infrastruktur zur Unterstützung dieser Arbeit über den Prozess des Forums zur Technischen Entscheidungsfindung. Siehe T274181.

Zweites Halbjahr 2020

Rückmeldung

Rückmeldungen zum Projekt sind und bleiben immer willkommen. Besonders interessieren uns deine Ideen dazu, inwieweit du den Menschen während des gesamten Prozesses zur Erstellung themenbezogener Metadaten einbeziehen möchtest. Wir freuen uns, deine Meinung zu folgenden offenen Fragen zu hören:

  1. Deine Erwartungen an das Projekt
    1. Welche Erwartungen haben die Benutzer an das Projekt? Welche Maßnahmen sind dafür notwendig?
    2. Wie stellst du dir die Verwendung dieser Metadaten vor? Kannst du dir vorstellen, wie sie deine Arbeitsabläufe unterstützen könnten?
  2. Metadaten-Moderation
    1. Ist Moderation notwendig, um Vandalismus und/oder Voreingenommenheit zu vermeiden?
    2. Wenn Moderation notwendig ist, wie kann sie wirksam umgesetzt werden?
  3. Hinzufügen und Bestätigen von Metadaten
    1. Möchten Benutzer die Möglichkeit haben, vom automatisierten System vorgeschlagene Metadaten zu genehmigen oder abzulehnen?
    2. Möchten Benutzer die Möglichkeit haben, über die Vorschläge des automatisierten Systems hinaus zusätzliche Metadaten hinzuzufügen?
    3. Ist es deiner Meinung nach ausreichend, den Benutzern die Möglichkeit zu geben, bei Bedarf Rückmeldungen mit Verbesserungsvorschlägen für die maschinengenerierten Metadaten zu senden?
  4. Berechtigungen zum Visualisieren und Bearbeiten
    1. Möchten wir, dass Metadaten für alle Benutzer oder nur für bestimmte Benutzerklassen sichtbar sind?
    2. Möchten wir, dass Metadaten für alle Benutzer oder nur für bestimmte Benutzerklassen bearbeitbar sind?

Außerdem können spezifischere Rückmeldungen zu verwandten Projekten grundsätzlich auf den Diskussionsseiten der Projekte hinterlassen werden:

Finanzierung

Diese Arbeit wird teilweise durch eine beschränkte Folgeförderung der Alfred P. Sloan Foundation finanziert, um die in der ersten Finanzierungsrunde geleistete Arbeit zur Entwicklung von SDC[2] fortzusetzen.

Einzelnachweise

  1. 1.0 1.1 1.2 SDAW — Structured Data Across Wikimedia
  2. 2.0 2.1 SDC — Structured Data on Commons
  3. 3.0 3.1 DPLA — Digital Public Library of America