Melhorias aos Resultados das Pesquisas Globais
Uma nova meta
O departamento Discovery está examinando a possibilidade de fornecer resultados de pesquisa de outros projetos da Wikimedia com o mesmo idioma (comumente chamados de pesquisas globais).
Por exemplo, se você estivesse no Wikivoyage francês e pesquisasse por “leite”, seriam apresentados artigos correspondentes da Wikipédia francesa e de outros projetos da Wikimedia em francês (ex.: Wikcionário e Wikiquote).
Nesta página, tentaremos resumir algumas das nossas ideias. Convidamos todos os colaboradores a discutir abertamente na página de discussão sobre essa potencial mudança.
A justificativa
A maneira da qual a pesquisa funciona nos projetos da Wikimedia é esta: cada projeto tem um índice de pesquisa. Isso significa que atualmente não há como pesquisar através de todos os projetos por resultados relevantes ao mesmo tempo. No entanto, o idioma sempre será o mesmo numa pesquisa, e alguns visitantes podem estar interessados em informações que poderiam estar nos projetos irmãos de mesmo idioma.
O fornecimento de resultados de pesquisas globais (e no mesmo idioma) dará mais informações aos visitantes, maior visibilidade aos outros projetos e aumentará o número de resultados para visitantes, que inclui o potencial para pesquisas que sempre retornem resultados.
Exibir resultados de pesquisa a mais entre os projetos não apenas aumentará a visibilidade aos projetos irmãos como também aumentará o descobrimento de mais artigos de interesse, e possivelmente até trazer novos colaboradores.
Por que ainda não fizemos isso?
Por que não ter um só índice para pesquisar em todos os projetos e em todos os idiomas?
- Podemos responder como “tecnicamente complexo”: o tamanho do índice de resultados seria quase em terabytes. Por exemplo, o índice de artigos no banco de dados da Wikipédia inglesa tem cerca de 200 gigabytes. A rapidez no fornecimento de resultados seria impactada se usássemos um índice para todo o banco de dados.
- Outra razão para essa separação entre idiomas justifica-se por não ser muito útil pesquisar um tópico em todos os idiomas. Pesquisar por “Paris” e ver o mesmo artigo em português, inglês e francês não ajudaria muito na descoberta de informações.
Os projetos ingleses são bem grandes:
- O índice da Wikipédia inglesa para todos os artigos tem cerca de 200 GB
- O Wikinotícias inglês tem cerca de 15 GB
- O Wikisource inglês tem cerca de 6 GB
Isso poderá impactar vários fluxos de trabalho existentes, por exibir resultados de pesquisa adicionais.
- Isso possivelmente afetaria robôs, colaboradores, pesquisadores, leitores, etc.
O plano
No primeiro trimestre (julho – setembro de 2016), a equipe de Engenharia continuou a trabalhar nesses quatro passos:
Primeiro
- Combinar os índices de mesmo idioma (tarefa T139498) Parcialmente concluído
- Pedir ajuda da comunidade – incluindo o tema dessa página. (tarefa T137312) Concluído
- As equipes de Pesquisa e de Design da WMF criarão simulações de como os novos resultados serão exibidos. Concluído
Segundo
No final do próximo trimestre (outubro – dezembro de 2016), a equipe comparará a satisfação com a pesquisa. Isso será feito:
- após o índice global estar pronto para vários idiomas pré-selecionados (tarefa T121541) Concluído
- após testes A/B para coletar dados em tempo real com os quais serão analizados (tarefa T121546) Cancelado
- e concluir as simulações para testes front-end em Cross-wiki Search Result Improvements/Testing Concluído
- enquanto também criar uma instância no Labs para pré-testes. (tarefa T151344) Concluído
Terceiro
Neste trimestre (janeiro – março de 2017), iremos:
- começar os testes A/B para a front-end do novo recurso para análise e comentários da comunidade. (tarefa T145917) Em andamento
- continuar a desenvolver e melhorar o backend desse recurso Em andamento
- O primeiro teste A/B/C foi feito, mas não mostrou-se muito conclusivo (tarefa T149806) Concluído
- Um segundo teste A/B será executado, após a correção de um pequeno bug na interface e a adição de quatro outras Wikipédias ao teste, de um total de oito. (tarefa T160004) Parcialmente concluído
Quarto
Abril – junho de 2017:
- análise conclusiva do segundo teste A/B para os novos resultados da página de pesquisa (tarefa T160008) Parcialmente concluído
- lançar uma nota às esplanadas anunciando a implantação (tarefa T162276) Em andamento
- lançar uma postagem no blog sobre a pesquisa
- implantar em todas as Wikipédias
Exemplos atuais da pesquisa
Já há algumas soluções feitas pela comunidade que divulgam outros projetos da Wikimedia e artigos no mesmo idioma. Abaixo, uma pequena lista de exemplos:
Páginas de resultados de pesquisa para alguns idiomas:
- Crioulo haitiano:
- https://ht.wikipedia.org/wiki/Espesyal:Chache/Milk
- Os resultados no final da página são adicionados pela extensão ArticlePlaceholder
- Francês:
- https://fr.wikipedia.org/wiki/Spécial:Recherche/Milk
- Os resultados no final da página são adicionados pelo script WikidataInfo.js
- Italiano:
- https://it.wikipedia.org/w/index.php?title=Speciale:Ricerca/Milk&fulltext=1
- Os resultados no final da página são adicionados pelo script WikidataInfo.js
- A navecaixa no lado direito da página é adicionada pela mensagem MediaWiki:Search-interwiki-custom
Gadget External Search:
- mw:MediaWiki:Gadget-externalsearch.js
- Este gadget pesquisa numa lista personalizada de sites técnicos, fornecendo listas de resultados em guias. Para mais informações veja mw:Wikimedia technical search.
- Aqui há uma captura de tela para esta ação. (Infelizmente, buscar em “google.com/cse” pode trazer uma mensagem do filtro de spam de alguns navegadores.)
- Este gadget pesquisa numa lista personalizada de sites técnicos, fornecendo listas de resultados em guias. Para mais informações veja mw:Wikimedia technical search.
Como esses resultados adicionais seriam exibidos?
O surgimento destes resultados está aberto para discussão, e temos esboços suficientes abaixo com mais possibilidades de design. Abaixo há alguns exemplos de como os novos resultados poderiam parecer, baseando-se em soluções existentes em algumas wikis:
-
Exemplo de uma página wiki com adição de uma caixa no lado direito que mostra ligações aos projetos irmãos que poderiam ser de interesse e relacionadas à pesquisa original.
-
Exemplo de uma página wiki com adição de uma lista de ligações para artigos dos projetos irmãos que poderiam ser de interesse e relacionadas à pesquisa original (além de um histórico da página).
-
Exemplo de uma página de resultados de pesquisa com uma aba adicional para wikis.
-
Exemplo de interface com abas – veja mais em Design.
Ajude-nos a escolher a solução
Por favor, diga o que você acha!
- Dois trimestres serão necessários, pelo menos, para fazer a arquitetura e o design da implementação técnica.
- A equipe gostaria de fazer alguns testes e mostrá-los para a comunidade no final de 2016.
- Decidimos nas simulações em Cross-wiki Search Result Improvements/Testing que isso será testado no primeiro trimestre de 2017.
As perguntas
A equipe tem várias perguntas, e isto é o que gostaríamos de saber da comunidade:
- Como esses novos resultados de pesquisa devem ser exibidos?
- Exibir os resultados locais primeiro e então exibir uma opção para mostrar mais de outras wikis?
- Juntar os resultados adicionais com os locais?
- Exibir os resultados adicionais ao lado (ou ao final) da página?
- Ter uma opção para desativar esses outros resultados relevantes?
- Isso poderia ser uma keyword ou um botão para um visitante clicar.
- Ou algo semelhante à keyword
local:
, que pesquisa por imagens locais, não no Commons.
- Exibir os resultados adicionais como lista ou grade?
- Incluir metadados relevantes (imagens e/ou descrições curtas) com os resultados?
- Exibir o tamanho do arquivo (p. ex.
848 bytes (104 palavras)
) e a data de criação/modificação? - Indicar que clicar num resultado levaria o usuário a outra wiki?
- Quantos resultados interwiki devem ser mostrados – 1, 2, 3 ou mais?
- Limitar o método existente de exibir resultados da wiki local?
- Atualmente, até 10 000 resultados são exibidos de forma paginada, mas testes indicam que geralmente apenas os 3 primeiros são úteis.
- Should the results from whatever wiki you're on to be shown first and then have an option to show more from other wikis?
- Should the additional results be inter-mixed with the local wiki results?
- Should the additional results be displayed off to the side (or maybe the bottom) of the results page?
- Should we have the option to turn off these other relevant search results (a user and/or project opt-out)?
- This could be a keyword search term or maybe a button for a visitor to click
- This could also be similar to the
local:
keyword that will only search for images on the local wiki and not Commons files, for instance.
- This could also be similar to the
- Would the additional results be best displayed as a list or a grid design?
- Should we include relevant metadata (images and/or a short description) with the search results?
- Do the results need to have the size of the article (i.e.:
848 bytes (104 words)
) and the date it was created/modified?
- Do the results need to have the size of the article (i.e.:
- Should we indicate that clicking on a result will take you to another wiki project?
- How many results from other wikis should we show - 1, 2, 3, or more?
- Should we limit the existing method of displaying results from the wiki that you searched on?
- We currently show up to 10,000 results in a paginated manner, but testing shows that generally only the first 3 results are ever acted upon.
- Esses novos resultados de pesquisa devem funcionar em todos os projetos da Wikimedia?
- Por exemplo, se você estiver no Wikiquote, gostaria de ver resultados relevantes do Wikivoyage, da Wikipédia e do Wikinotícias?
- Ou, se na Wikipédia, apenas gostaria de ver resultados de outras wikis?
- Esses outros resultados relevantes seriam úteis e estimulariam uma exploração profunda ao tópico?
- É “chato” ver resultados de outras wikis?
- Reciprocamente, estimularia o usuário ter mais conhecimento?
- Quanto “peso” damos para os resultados interwiki?
- Contribuições serão estimuladas pela exibição de resultados adicionais de outras wikis?
- P. ex.: se pesquisar por
Piazza del Duomo
e não ver um artigo no Wikivoyage sobre a praça (digamos que você esteja no Wikiquote), isso estimularia você a começar um artigo sobre ela?
- P. ex.: se pesquisar por
- Devemos limitar o número de idiomas pesquisados?
- P. ex.: apenas usar os 50 idiomas principais para implementar o recurso?
- Ou, apenas usar os idiomas aos quais estamos detectando filas?
See also: Explore similar, Wiktionary widget, thumbnail icons in search results
- Melhorias aos Resultados das Pesquisas Globais/Design - Notas e ilustrações de design de como os resultados podem ser
- Explore Similar links on the search results page
- A/B testing information
- Self-guided testing step-by-step instructions
- Wiktionary widget on the search results page
- A/B testing information
- Self-guided testing step-by-step instructions
- Adding thumbnail icons to search results
- A/B testing information
Etiquetas no Phabricator:
- https://phabricator.wikimedia.org/T137312
- https://phabricator.wikimedia.org/T136639
- https://phabricator.wikimedia.org/T139310
Notas de discussão:
Após levar em consideração os comentários da comunidade e as recomendações da equipe de design, iremos iniciar os testes A/B. Veja esta página para mais informações.
Cross-wiki Search Result Improvements é mantido the Discovery department.
Para obter ajuda:
|
Esta página foi criada para encorajar usuários a testarem o recurso, através de uma página auto-guiada com exemplos para aqueles que não são tão técnicos e aqueles são um pouco mais experientes.