Dados Estruturados na Wikimedia

This page is a translated version of the page Structured Data Across Wikimedia and the translation is 81% complete.
Outdated translations are marked like this.

Dados Estruturados na Wikimedia (SDAW[1]) é um projeto que nos ajudará a estruturar conteúdo em páginas de wikitexto de uma maneira que ele seja reconhecível e relacionável por máquina, de maneira a tornar a leitura, edição e pesquisa mais fáceis e acessíveis entre projetos e na internet.

Eles vão ajudar os usuários a associarem o conteúdo entre os projetos da Wikimedia, os leitores a mergulharem mais fundo no ecossistema de conhecimento da Wikimedia; e a quem contribui a disseminar informações entre projetos e além deles de maneira semelhante à Wikidata. O DEW também fornecerá um local para experimentação com ferramentas de edição assistida por computador, para tornar a edição mais fácil e acessível a mais wikimedistas em todo o mundo.

The project ran from February 1, 2021 to June 30, 2023.

Antecedentes

Esse projeto é uma continuação de um desenvolvimento semelhante que foi concluído no Commons, como parte da concessão anterior de SDC [2], e será parcialmente financiado por uma concessão de três anos da Fundação Sloan. O trabalho na DEC nos conscientizou da necessidade de metadados mais avançados para todo o conteúdo e APIs para fornecer melhores resultados de pesquisa, o que, por sua vez, tornaria o conteúdo mais acessível, descoberto, traduzível e utilizável para outras necessidades.

O projeto tem três objetivos fundamentais:

  1. Permitir que as máquinas reconheçam o conteúdo da Wikimedia e sugiram relações com outros conteúdos da Wikimedia. Estamos explorando isto primeiro através do projeto imgsugg|projeto de sugestão de imagens.
  2. Desenvolver uma maneira de estruturar artigos e páginas para permitir novos formatos de conteúdo – como conteúdo apresentado em doses menores e de fácil digestão, mais acessível para leitores usarem e compartilharem.
  3. Oferecer aos usuários da Wikimedia uma maneira mais convidativa e eficiente de pesquisar e encontrar conteúdo , aproveitando o MediaSearch e explorando novas maneiras de melhorar a pesquisa nas Wikipédias, usando dados estruturados.

O que está mudando

O objetivo do projeto é planejar e prototipar um novo sistema que visa ser flexível o suficiente para atender a todos os tipos de metadados que possamos precisar suportar em um futuro próximo.

Identificamos três projetos principais que vamos desenvolver, como parte do nosso trabalho:

  1. Sugestão de Imagem, um recurso para usuários experientes para ajudar a ilustrar artigos da Wikipédia;
  2. Metadados de Seção, também conhecidos como Tópicos de Seção, para descrever do que se trata uma seção de um artigo da Wikipédia;
  3. O projeto Aprimoramento de Pesquisa, que usarão conteúdo estruturado para dar aos usuários uma maneira mais convidativa e eficiente de pesquisar e encontrar conteúdo nas Wikipédias.

Sugestão de Imagem

A UI Sugestão de Imagem visa desenvolver sistemas para dados estruturados ao longo de todos os projetos da Wikimedia.

Este trabalho se baseará no trabalho já iniciado como parte do projeto de tarefa estruturada "Adicionar imagem". Entretanto, seu foco será deslocado para a melhoria dos processos para colaboradores experientes. Em particular, visaremos usuários que editaram ou assistiram a um determinado artigo ou conjunto de artigos, uma vez que eles provavelmente serão especialistas no assunto e terão interesse em ver esse(s) artigo(s) melhorar.

Metadados de Seção

O projeto Tópicos de Seção identificará seções em um artigo e criará tópicos de acordo com essas seções, baseando-se em vários elementos, como por exemplo:

  • um algoritmo que detecta itens do Wikidata com base nos links azuis da seção (que será desenvolvido em parceria com as equipes de Dados Estruturados, Pesquisa e Plataforma de Dados);
  • a capacidade de identificar automaticamente seções em um artigo (que será desenvolvido em parceria com as equipes de Dados Estruturados e Plataforma de Dados).

Um dos primeiros casos de uso que imaginamos para os tópicos de seção serão as sugestões de imagem a nível de seção, que usarão o algoritmo de links azuis e a infraestrutura de identificação de seção acima, e será fornecido por meio da experiência do recém-chegado e por meio de notificações para colaboradores experientes. Isto se baseará no trabalho trabalho feito com sugestões de imagem e será desenvolvido em parceria com as equipes de Dados Estruturados, Plataforma de Dados, Pesquisa, Pesquisa, Android e Crescimento.

Esses elementos não serão alterados nem afetarão a experiência de edição atual dos usuários. Todas estas atividades serão automáticas e não dependerão de nenhuma ação dos editores. Atualmente, este projeto está em fase de desenvolvimento, e ainda há aspectos que podem exigir mais investigação e/ou feedback dos usuários.

Aprimoramento de pesquisa

O projeto Aprimoramento de Pesquisas utilizará conteúdo estruturado para dar aos usuários uma forma mais convidativa e mais eficiente de pesquisar e encontrar conteúdo no Wikipedias. Ao melhorar Especial:Busca, queremos permitir que os usuários encontrem as informações que estão procurando, ou que eles podem não ter notado, ou que tenham se deparado anteriormente através da busca existente.

Nosso objetivo é identificar e definir melhorias incrementais de “pesquisa especial” que usam conteúdo estruturado, para ajudar os usuários a encontrar o conteúdo que procuram, especialmente nas wikis de idiomas que possuem menos artigos.

O que não queremos fazer?

  1. Deixar os usuários de fora do processo
  2. Sobrecarregar os usuários com muito conteúdo novo para moderar
  3. Adicionar qualquer viés/preconceito adicional aos projetos da Wikimedia
  4. Acrescentar vetores adicionais para vandalismo
  5. Introduzir muita complexidade em nossos sistemas

Atualizações de status

  • Foi publicado o relatório final do projeto DPLA[3] financiado pela SDAW[1] para promover a reutilização de imagens descritas e atribuídas.

  • Pesquisa sobre as notificações de Image Suggestions realizadas na Wikipédia em português, russo e indonésio.

  • Sigestão de Imagens A fase de testes na Wikipédia catalã, finlandesa, húngara e norueguesa foi iniciada.

  • A primeira rodada dos testes do Sugestão de Imagens na Wikipédia em português, russo e indonésio foi concluída com sucesso.
  • Páginas do projeto atualizadas para refletir o novo status atual da iniciativa.

  • Páginas do projeto atualizadas para refletir o novo status atual da iniciativa e os três principais projetos a serem desenvolvidos.
  • A Wikipédia indonésia entra como a terceira comunidade de testadores.

  • Estabelecendo contato com a comunidade da Wikipédia em português e russo como as primeiras comunidades de testadores para Sugestão de Imagem.

  • O projeto está passando para o primeiro estágio de teste, que está experimentando o uso de notificações para alertar os usuários sobre imagens potencialmente úteis para artigos da Wikipédia.

Maio-Agosto 2021

  • Procurando feedback sobre essas ideias.
  • Trabalhando em wireframes e maquetes para ajudar a explorar essas ideias.
  • Explorando a infraestrutura para apoiar este trabalho por meio do processo do Fórum de Tomada de Decisões Técnicas. Consulte task T274181.

Segundo semestre de 2020

Comentários

Os feedbacks, comentários e opiniões sobre o projeto são e sempre serão bem-vindos. Estamos especialmente interessados ​​em suas ideias sobre até que ponto você deseja manter o “humano-no-circuito” durante todo o processo de criação de metadados tópicos. Estamos ansiosos para ouvir de você sobre as seguintes perguntas em aberto:

  1. Suas expectativas sobre o projeto
    1. O que os usuários esperam deste projeto? Quais são as ações necessárias a serem abordadas?
    2. Como você imagina que esses metadados sejam usados? Você pode pensar em maneiras de ajudar em seus fluxos de trabalho?
  2. Moderação de metadados
    1. A moderação é necessária para evitar vandalismo e/ou viés/preconceito?
    2. Se a moderação for necessária, como ela pode ser gerenciada de forma eficaz?
  3. Adicionando e confirmando metadados
    1. Os usuários desejam aprovar ou rejeitar metadados sugeridos pelo sistema automatizado?
    2. Os usuários desejam adicionar metadados adicionais, além do sugerido pelo sistema automatizado?
    3. Você acha que pode ser suficiente para os usuários terem a oportunidade de enviar feedback com sugestões sobre como melhorar os metadados gerados por máquina, quando necessário?
  4. Privilégios para visualização e edição
    1. Queremos que os metadados sejam visíveis para todos os usuários ou apenas para determinadas classes de usuários?
    2. Queremos que os metadados sejam editáveis ​​para todos os usuários ou apenas para determinadas classes de usuários?

Além disso, comentários mais específicos sobre projetos relacionados geralmente podem ser deixados nas páginas de discussão dos projetos:

Financiamento

O financiamento parcial para este trabalho é fornecido por umsubsídio restrito de acompanhamento da Alfred P. Sloan Foundation, para aprofundar o trabalho realizado pela primeira rodada de financiamento para desenvolver SDC[2].

References

  1. 1.0 1.1 1.2 SDAW — Structured Data Across Wikimedia
  2. 2.0 2.1 SDC — Structured Data on Commons
  3. 3.0 3.1 DPLA — Digital Public Library of America