Dados Estruturados na Wikimedia

This page is a translated version of the page Structured Data Across Wikimedia and the translation is 100% complete.

Dados Estruturados na Wikimedia (DEW) é um projeto que nos ajudará a estruturar conteúdo em páginas de wikitexto de uma maneira que ele seja reconhecível e relacionável por máquina, de maneira a tornar a leitura, edição e pesquisa mais fáceis e acessíveis entre projetos e na internet.

Eles vão ajudar os usuários a associarem o conteúdo entre os projetos da Wikimedia, os leitores a mergulharem mais fundo no ecossistema de conhecimento da Wikimedia; e a quem contribui a disseminar informações entre projetos e além deles de maneira semelhante à Wikidata. O DEW também fornecerá um local para experimentação com ferramentas de edição assistida por computador, para tornar a edição mais fácil e acessível a mais wikimedistas em todo o mundo.

Antecedentes

Esse projeto é a continuidade de um desenvolvimento semelhante que foi concluído no Commons, como parte da concessão anterior de Dados Estruturados no Commons (DEC); e será parcialmente financiado por uma bolsa de três anos da Sloan Foundation. O trabalho no DEC nos conscientizou da necessidade de metadados mais avançados para todo o conteúdo e APIs (Interfaces de Programação de Aplicações) para fornecer melhores resultados de pesquisa, o que tornaria o conteúdo mais acessível, detectável, traduzível e utilizável para outros fins.

O projeto tem três objetivos fundamentais:

  1. Permitir que as máquinas reconheçam o conteúdo da Wikimedia e façam sugestões relacionadas com outros conteúdos da plataforma. Estamos explorando isso primeiro através do projeto de Sugestão de Imagem.
  2. Desenvolver uma maneira de estruturar artigos e páginas para permitir novos formatos de conteúdo – como conteúdo apresentado em doses menores e de fácil digestão, mais acessível para leitores usarem e compartilharem.
  3. Oferecer aos usuários da Wikimedia uma maneira mais convidativa e eficiente de pesquisar e encontrar conteúdo , aproveitando o MediaSearch e explorando novas maneiras de melhorar a pesquisa nas Wikipédias, usando dados estruturados.

O que está mudando

O objetivo do projeto é planejar e prototipar um novo sistema que visa ser flexível o suficiente para atender a todos os tipos de metadados que possamos precisar suportar em um futuro próximo.

Identificamos três projetos principais que vamos desenvolver, como parte do nosso trabalho:

  1. Sugestão de Imagem, um recurso para usuários experientes para ajudar a ilustrar artigos da Wikipédia;
  2. Metadados de Seção, também conhecidos como Tópicos de Seção, para descrever do que se trata uma seção de um artigo da Wikipédia;
  3. O projeto Aprimoramento de Pesquisa, que usarão conteúdo estruturado para dar aos usuários uma maneira mais convidativa e eficiente de pesquisar e encontrar conteúdo nas Wikipédias.

Sugestão de Imagem

A UI Sugestão de Imagem visa desenvolver sistemas para dados estruturados ao longo de todos os projetos da Wikimedia.

Este trabalho se baseará no trabalho já iniciado como parte do projeto de tarefa estruturada “Adicionar uma Imagem”. No entanto, seu foco será deslocado para melhorar os processos para colaboradores experientes. Em particular, segmentaremos usuários que editaram ou assistiram a um determinado artigo ou conjunto de artigos, pois provavelmente serão especialistas no tópico e terão interesse em ver o(s) artigo(s) melhorar.

Metadados de Seção

O projeto Metadados de Seção identificará seções em um artigo e criará tópicos de acordo com essas seções, com base em vários elementos:

  • um algoritmo que detecta itens do Wikidata com base nos links azuis da seção (que será desenvolvido em parceria com as equipes de Dados Estruturados, Pesquisa, Aprendizado de Máquina e Plataforma de Dados);
  • a capacidade de identificar automaticamente seções em um artigo (que será desenvolvido em parceria com as equipes de Dados Estruturados e Plataforma de Dados);
  • sugestões de imagens em nível de seção, que usarão o algoritmo de links azuis e a infraestrutura de identificação de seção acima, e serão entregues por meio da nova experiência e por meio de notificações para contribuidores experientes.

Este último ponto terá como base o trabalho de sugestões de imagens anteriores e será desenvolvido em parceria com as equipes de Dados Estruturados, Aprendizado de Máquina, Plataforma de Dados, Pesquisa, Pesquisa e Crescimento.

Esses elementos não serão alterados nem afetarão a experiência de edição atual dos usuários. Todas essas atividades serão automáticas e não dependerão de nenhuma ação dos usuários que editarem um artigo. Atualmente, este projeto ainda está em fase de investigação, e ainda existem aspectos que podem exigir mais investigação e/ou feedback dos usuários.

Com base na viabilidade dessas opções, o projeto também visa:

  • usar os metadados de seção para melhorar nosso alcance de SEO com mecanismos de pesquisa externos (em parceria com a equipe da Web)
  • estabelecer parcerias com a comunidade da Wikimedia em larga escala para mostrar o impacto de nossas novas ferramentas (em parceria com as equipes de Dados Estruturados, Crescimento e Programas Comunitários (GLAM/Campanhas)).

Aprimoramento de pesquisa

O projeto "Aprimoramento de Pesquisa" usará conteúdo estruturado para oferecer aos usuários uma maneira mais convidativa e eficiente de pesquisar e encontrar conteúdo nas Wikipédias.

Nosso objetivo é identificar e definir melhorias incrementais de “pesquisa especial” que usam conteúdo estruturado, para ajudar os usuários a encontrar o conteúdo que procuram, especialmente nas wikis de idiomas que possuem menos artigos.

O que não queremos fazer?

  1. Deixar os usuários de fora do processo
  2. Sobrecarregar os usuários com muito conteúdo novo para moderar
  3. Adicionar qualquer viés/preconceito adicional aos projetos da Wikimedia
  4. Acrescentar vetores adicionais para vandalismo
  5. Introduzir muita complexidade em nossos sistemas

Atualizações de status

(2022-03)

  • Páginas do projeto atualizadas para refletir o novo status atual da iniciativa e os três principais projetos a serem desenvolvidos.

(2022-02)

  • Estabelecendo contato com a comunidade da Wikipédia em português e russo como as primeiras comunidades de testadores para Sugestão de Imagem.

(2021-11)

  • O projeto está passando para um primeiro estágio de teste, que experimenta o uso de notificações para alertar os usuários sobre possíveis imagens úteis para artigos da Wikipédia.

Maio-Agosto 2021

(2021-02)

  • Procurando feedback sobre essas ideias.
  • Trabalhando em wireframes e maquetes para ajudar a explorar essas ideias.
  • Explorando a infraestrutura para apoiar este trabalho por meio do processo do Fórum de Tomada de Decisões Técnicas. Consulte a tarefa task T274181.

Segundo semestre de 2020

Comentários

Os feedbacks, comentários e opiniões sobre o projeto são e sempre serão bem-vindos. Estamos especialmente interessados ​​em suas ideias sobre até que ponto você deseja manter o “humano-no-circuito” durante todo o processo de criação de metadados tópicos. Estamos ansiosos para ouvir de você sobre as seguintes perguntas em aberto:

  1. Suas expectativas sobre o projeto
    1. O que os usuários esperam deste projeto? Quais são as ações necessárias a serem abordadas?
    2. Como você imagina que esses metadados sejam usados? Você pode pensar em maneiras de ajudar em seus fluxos de trabalho?
  2. Moderação de metadados
    1. A moderação é necessária para evitar vandalismo e/ou viés/preconceito?
    2. Se a moderação for necessária, como ela pode ser gerenciada de forma eficaz?
  3. Adicionando e confirmando metadados
    1. Os usuários desejam aprovar ou rejeitar metadados sugeridos pelo sistema automatizado?
    2. Os usuários desejam adicionar metadados adicionais além do sugerido pelo sistema automatizado?
    3. Você acha que pode ser suficiente para os usuários terem a oportunidade de enviar feedback com sugestões sobre como melhorar os metadados gerados por máquina, quando necessário?
  4. Privilégios para visualização e edição
    1. Queremos que os metadados sejam visíveis para todos os usuários ou apenas para determinadas classes de usuários?
    2. Queremos que os metadados sejam editáveis ​​para todos os usuários ou apenas para determinadas classes de usuários?

Além disso, comentários mais específicos sobre projetos relacionados geralmente podem ser deixados nas páginas de discussão dos projetos:

Financiamento

O financiamento parcial para este trabalho é fornecido por uma doação restrita da Alfred P. Sloan Foundation, afim de promover o trabalho realizado pela primeira rodada de financiamento para desenvolver Dados Estruturados em Commons.