Structured Data Across Wikimedia

This page is a translated version of the page Structured Data Across Wikimedia and the translation is 45% complete.
Outdated translations are marked like this.

SDAW[1] è un progetto che ci aiuterà a strutturare il contenuto delle pagine wiki, in modo che esso sia leggibile e riconoscibile anche da una macchina, per rendere la lettura, la modifica e la ricerca di contenuti più facile e più accessibile fra progetti e più in generale sulla rete.

Questo progetto aiuterà gli utenti ad associare i contenuti tra i progetti Wikimedia, aiuterà i lettori a immergersi più a fondo nell'ecosistema della conoscenza di Wikimedia e aiuterà i collaboratori a diffondere le informazioni tra i progetti e oltre essi in un modo simile a quanto oggi avviene con Wikidata. Il progetto sarà anche un luogo per la sperimentazione di strumenti di modifica da computer assistita, per rendere il processo di modifica più facile e più accessibile a un maggior numero di utenti in tutto il mondo.

The project ran from February 1, 2021 to June 30, 2023.

Contesto

Questo progetto è il seguito di quanto già completato su Wikimedia Commons, nell'ambito del progetto Structured Data on Commons (SDC), e sarà parzialmente finanziato da un grant triennale della Sloan Foundation. Il lavoro su SDC ci ha reso consapevoli della necessità di avere metadati migliori per tutti i contenuti e per permettere alle API di fornire migliori risultati di ricerca, per rendere a loro volta i contenuti più accessibili, ricercabili, traducibili e utilizzabili per altre esigenze. Work on SDC made us aware of the need for more advanced metadata for all content and APIs to provide better search results, which would make in turn content more accessible, discoverable, translatable and usable for other needs.

Questo progetto ha tre obbiettivi fondamentali:

  1. permettere alle macchine di riconoscere i contenuti di Wikimedia e suggerire relazioni con altri contenuti di Wikimedia. Stiamo esplorando questo punto attraverso il progetto di suggerimento delle immagini. We explored this first via the image suggestion project.
  2. immaginare nuove modalità di strutturazione delle voci e delle pagine per abilitare nuovi formati di contenuto - come contenuti forniti in formati più piccoli, più accessibili e più facilmente condivisibili per i lettori.
  3. fornire agli utenti di Wikimedia un modo più invitante e più efficiente per cercare e trovare contenuti, partendo dal nuovo MediaSearch ed esplorando nuovi modi per migliorare la ricerca tra le versioni di Wikipedia, usando i dati strutturati.

Cosa sta cambiando

L'obiettivo del progetto è quello di progettare un prototipo di nuovo sistema sufficientemente flessibile, in modo da servire tutti i tipi di metadati che potremmo aver bisogno di supportare nel prossimo futuro.

Abbiamo identificato tre grandi progetti da sviluppare, come parte del nostro lavoro:

  1. Suggerimento immagini (Image suggestion), una funzione per utenti esperti per aiutare a illustrare le voci di Wikipedia;
  2. Metadati delle sezioni (Sectional metadata o Section topics), per descrivere meglio l'argomento di una data sezione di una voce di Wikipedia;
  3. Miglioramenti di ricerca (Search improvements), che partirà dal contenuto strutturato per dare agli utenti una modalità più invitante ed efficiente di cercare e trovare contenuti su Wikipedia.

Suggerimento immagini

L'interfaccia di suggerimento delle immagini intende sviluppare un sistema di dati strutturati attraverso tutti i progetti Wikimedia.

Questo lavoro si baserà sul lavoro già svolto per il task "aggiungi un'immagine". Tuttavia, la sua attenzione sarà maggiormente volta al miglioramento dei processi per gli utenti esperti. In particolare, ci rivolgeremo agli utenti che hanno curato o messo nei propri osservati speciali una particolare voce o un gruppo di voci, poiché è probabile che siano esperti nell'argomento e che abbiano interesse a vedere quella voce o quelle voci migliorare. However, its focus will be shifted towards improving the processes for experienced contributors. In particular, we will target users who have edited or watched a particular article or set of articles, since they are likely to be experts in the topic and to have interest in seeing that article(s) improve.

Metadati delle sezioni

Il progetto per i metadati delle sezioni identificherà le singole suddivisioni di una voce e gli argomenti di ciascuna sezione, facendo leva su vari elementi:

  • un algoritmo che indentifica gli elementi di Wikidata basandosi sui link blu di una sezione (che verrà sviluppato in partnership con i team di Structured Data, Research, Machine Learning e Data Platform);
  • la possibilità di identificare automaticamente delle sezioni in una voce (che verrà sviluppata in partnership con i team di Structured Data e Data Platform);

In particolare l'ultimo punto verrà sviluppato a partire dal lavoro sul suggerimento delle immagini e sarà sviluppato in partnership con i team di Structured Data, Machine Learning, Data Platform, Research, Search e Growth. This will build upon the work done on image suggestions and will be developed in partnership with the Structured Data, Data Platform, Research, Search, Android, and Growth teams.

Questi elementi non cambieranno, né avranno un impatto sul modo in cui attualmente vengono modificate le voci. Queste attività saranno totalmente automatiche e non dipenderanno da alcuna azione di un utente che modifichi una voce. Allo stato, questo progetto è ancora nella sua fase iniziale e ci sono ancora aspetti che richiederanno studi maggiori e/o feedback dagli utenti. All these activities will be automatic and will not depend on any action from editors. Currently, this project is in its development phase, and there are still aspects that may require further investigation and/or feedback from users.

Miglioramenti di ricerca

Il progetto di miglioramenti di ricerca partirà dal contenuto strutturato per dare agli utenti una modalità più invitante ed efficiente di cercare e trovare contenuti su Wikipedia. By improving Special:Search, we want to enable users to find the information they are looking for, or that they may not have noticed, or previously come across through existing search.

Il nostro scopo è di identificare e definire dei miglioramenti incrementali nelle "ricerche speciali" che usano contenuti strutturati, per assistere gli utenti nel trovare ciò che cercano, specialmente in quelle lingue che hanno meno voci a disposizione.

Cosa non vogliamo fare?

  1. Escludere gli utenti dal processo
  2. Travolgere gli utenti con troppi nuovi contenuti da valutare
  3. Aggiungere ulteriori bias nei progetti Wikimedia
  4. Aggiungere potenziali nuovi vettori per vandalismi
  5. Introdurre maggiore complessità nel nostro sistema

Aggiornamenti sul progetto

  • The final report of DPLA[2] project funded by SDAW[1] to drive the reuse of described and attributed images was published.

  • Survey about Image Suggestions notifications run on Portuguese, Russian and Indonesian Wikipedia.

  • Image Suggestions testing phase started on Catalan, Finnish, Hungarian and Norwegian Wikipedia.

  • First round of Image Suggestions testing on Portuguese, Russian and Indonesian Wikipedia successfully concluded.
  • Project pages updated to reflect the new current status of the initiative.

  • Aggiornamento delle pagine di progetto per riflettere il nuovo status di aggiornamento dell'iniziativa nel complesso e dei tre progetti individuati da sviluppare.
  • Indonesian Wikipedia joins in as the third tester community.

  • Stabilito un contatto con le comunità portoghese e russa di Wikipedia come prime comunità di testing per il suggerimento delle immagini.

  • Il progetto sta passando a una prima fase di test, che prevede la sperimentazione di notifiche per avvisare gli utenti di potenziali immagini utili per le voci di Wikipedia.

maggio-agosto 2021

  • Abbiamo richiesto feedback sul progetto di suggerimento delle immagini, attraverso inviti individuali e una richiesta di pareri della durata di un mese, rivolta specificamente a quattro versioni linguistiche di Wikipedia e a Wikimedia Commons

  • Abbiamo richiesto feedback riguardo queste domande.
  • Abbiamo lavorato su wireframes e mockups per aiutare a esplorare queste idee
  • Esplorata l'infrastruttura per sostenere questo lavoro attraverso il processo del Technical Decision Making Forum. Vedi anche task T274181.

seconda metà del 2020

Feedback

I feedback sul progetto sono e saranno sempre il benvenuto. Siamo particolarmente interessati alle vostre idee sul grado di coinvolgimento degli utenti nel processo di creazione dei metadati delle sezioni. Speriamo di ascoltare le vostre risposte riguardo le seguenti domande: We are especially interested in your ideas about the extent to which you want to keep the “human-in-the-loop” throughout the topical metadata creation process. We are looking forward to hearing from you about the following open questions:

  1. Le vostre aspettative sul progetto
    1. Che cosa si aspettano gli utenti da questo progetto? Quali sono le azioni necessarie da affrontare?
    2. Come immaginate di utilizzare questi metadati? Riuscite a pensare a come potrebbe aiutare i vostri flussi di lavoro?
  2. Validazione dei metadati
    1. È necessaria una forma di moderazione per evitare vandalismi e/o bias?
    2. Qualora fosse necessaria la moderazione, come può essere gestita efficacemente?
  3. Aggiungere e confermare i metadati
    1. Volete essere in grado di approvare o respingere i metadati suggeriti dal sistema automatico?
    2. Volete essere in grado di aggiungere ulteriori metadati rispetto a quelli suggeriti dal sistema automatico?
    3. Pensi che possa essere sufficiente che gli utenti abbiano la possibilità di inviare un feedback con suggerimenti su come migliorare i metadati suggeriti automaticamente, quando necessario?
  4. Privilegi per visualizzare e modificare i metadati
    1. Vogliamo che i metadati siano visibili a tutti gli utenti o solo per certe classi di utenti?
    2. Vogliamo che i metadati siano modificabili da tutti gli utenti o solo da certe classi di utenti?

Infine, feedback più specifici sui progetti correlati possono generalmente essere lasciati sulle pagine di discussione dei progetti:

Finanziamento

Un parziale finanziamento per questo lavoro è fornito da un grant ristretto della Alfred P. Sloan Foundation, per portare avanti il lavoro fatto nel primo round di finanziamento per sviluppare Structured Data on Commons.

References

  1. 1.0 1.1 1.2 SDAW — Structured Data Across Wikimedia
  2. 2.0 2.1 DPLA — Digital Public Library of America