Покращення крос-вікі результатів пошуку

This page is a translated version of the page Cross-wiki Search Result Improvements and the translation is 100% complete.

Нова ціль

Відділ відкриттів шукає спосіб видавати результати пошуку з інших проєктів Вікімедіа тією ж мовою (що просто називають крос-вікі або інтер-вікі пошуком).

Наприклад, якщо б ви знаходилися у французьких Вікімандрах і шукаєте слово «milk», то отримали б очікувані статті зі співпадінням у французькій Вікіпедії та результати з інших французькомовних проєктів Вікімедіа (тобто fr.wiktionary та fr.wikiquote).

Ця сторінка — спроба підсумувати деякі наші думки і ми запрошуємо усіх дописувачів відкрито обговорити цю потенційну зміну на сторінці обговорення.

Ця ідея відмінна, але пов'язана з новою функцією, яку Команда пошуку відкриттів увімкнула у 2016 році. Нова функція показує результати рядом інших мовних розділів Вікіпедії, якщо схоже на те, що користувач використав іншу мову для написання запиту, бо локальних результатів менше, ніж два. Тема цієї сторінки — нове відображення результатів пошуку з інших вікі-проєктів тією ж мовою — буде додана до нової функції визначення мови, а не замінюватиме її.

Обґрунтування

Пошук у всіх проєктах Вікімедіа зараз працює так: кожен мовний проєкт має власний окремий індекс пошуку. Це означає, що є зараз неможливо здійснити пошук потрібних результатів у всіх вікіпроєктах одночасно. Однак, у бекенді мова запиту та сама (не залежно від проєкту) і відвідувачам може бути цікавою інформація з сестринського проєкту їхньою мовою.

Надання результатів пошуку з усіх проєктів (тією ж мовою) дасть відвідувачам більше інформації, зробить інші проєкти більш видимими і збільшить результативність пошуку для відвідувачів Вікімедіа, в тому числі, за рахунок меншої кількості нульових результатів.

Відображення додаткових результатів пошуку з проєктів не лише збільшить переходи у сестринські проєкти, але також дасть можливість відкривати для себе більше цікавих статей і, можливо, заохочить до більшого внеску.

Чому цього досі не зробили?

 
чинна сторінка результатів пошуку в enwiki

Чому немає одного гігантського індексу пошуку у всіх проєктах всіма мовами?

  • Одна з причин — технічна складність: розмір такого індексу складатиме сотні гігабайтів. Наприклад, індекс бази даних усіх статей англомовної Вікіпедії складає 200 гігабайтів. Якщо мати лише один величезний індекс бази даних, це негативно вплине на швидкість видачі результатів пошуку.
  • Інша причина «одномовного» підходу до результатів пошуку полягає в тому, що вірогідно, не буде корисно шукати одну тему усіма мовами. Якщо зробити пошук по словах «Paris, France» і отримати в загальному ту ж саму статтю французькою, німецькою й англійською, це навряд чи дуже допоможе в пошуку нової інформації.

Вікіпроєкти англійською мовою доволі великі:

  • індекс усіх сторінок англомовних статей англійської Вікіпедії складає близько 200 ГБ;
  • англійських Вікіновин — близько 15 ГБ;
  • англійських Вікіджерел — близько 6 ГБ.

Відображення додаткових результатів може вплинути на хід роботи багатьох наявних вікі.

  • Це може вірогідно вплинути на ботів, дописувачів, дослідників, читачів тощо.

План

Першої чверті (липень-вересень 2016 року) команда проєктування продовжить працювати над такими чотирма основними кроками:

Перший

  • Поєднати індекси однією й тією ж мовою. (task T139498)   Частково зроблено
  • Запитати допомоги у спільноти — що включає обговорення на цій сторінці. (task T137312)   Готово
  • Команди пошуку та дизайну у Фонді Вікімедіа створять макети того, як ці нові результати пошуку можуть відображатися.   Готово

Другий

До кінця наступної чверті (жовтень-грудень 2016) команда порівняє задовільність пошуку. Це буде зроблено:

  • після того, як крос-вікі індекс буде готовий для кількох попередньо вибраних мов; (task T121541)   Готово
  • після проведення A/B тестів для збору даних реального часу для аналізу. (task T121546)  N Не зроблено
  • і отримайте макети інтерфейсу користувача для тестування інтерфейсу тут: Cross-wiki Search Result Improvements/Testing   Готово
  • а також створюючи екземпляр Labs для раннього тестування. (task T151344)   Готово

Третій

У цьому кварталі (січень – березень 2017 р.) ми:

  • розпочати A/B-тестування передньої частини цієї нової функції для аналізу та зворотного зв’язку від спільноти. (task T145917)   У процесі
  • продовжуйте вдосконалювати та покращувати задню частину цієї функції   У процесі
  • Перший тест A/B/C був проведений, і він був не дуже переконливим (task T149806)   Готово
  • Після виправлення незначної помилки інтерфейсу користувача та додавання ще чотирьох Вікіпедій для тестування буде проведено другий тест A/B, загалом вісім. (task T160004)   Частково зроблено

Четвертий

Квітень – червень 2017 року:

  • завершити аналіз другого тесту A/B для фрагментів дочірніх проектів на сторінці результатів пошуку (task T160008)   Частково зроблено
  • випустити перекладену нотатку для Village Pumps, яка оголошує про розгортання виробництва (task T162276)   У процесі
  • випустити пост у блозі про пошук
  • випуск у виробництво у всіх Вікіпедіях

Поточні приклади пошуку

Уже є декілька рішень від спільноти, як надати додаткові відсилання до інших проєктів Вікімедіа та статей тією ж мовою. Невеликий набір прикладів:

Поточні сторінки результатів пошуку у вікі кількома мовами:

Додаток зовнішнього пошуку:

  • mw:MediaWiki:Gadget-externalsearch.js
    • Цей додаток шукає по власному списку технічних сайтів, видаючи багатовкладковий список результатів і пояснений більше на сторінці mw:Wikimedia technical search
      • Ось знімок екрана цієї дії (нажаль, пошук для «google.com/cse» може запустити повідомлення спам-фільтру у деяких браузерах)

Як ці додаткові результати пошуку можуть відображатися?

Вигляд результатів пошуку відкритий для обговорення і у нас є декілька грубих чернеток, які ви можете побачити нижче, і більше можливостей дизайну на сторінці «Дизайн». Тут є кілька прикладів того, як нова сторінка результатів пошуку може виглядати, що базуються на наявних рішеннях в інших вікі:

Допоможіть нам обрати рішення

Будь ласка, залиште зараз свій відгук!

  • Щоб розробити архітектуру і дизайн технічного рішення, треба щонайменше два квартали.
  • Команда хотіла б мати, що тестувати і що показувати спільноті наприкінці 2016 року.

Запитання

Команда має багато запитань, і це те, на що ми хочемо отримати відгуки від спільноти:

  1. Як ми хочемо, щоб ці нові, додаткові, релевантні результати пошуку відображалися?
    1. Чи слід спочатку показати результати з будь-якої вікі, на якій ви перебуваєте, а потім мати можливість показати більше з інших вікі?
    2. Чи слід поєднувати додаткові результати з результатами локальної вікі?
    3. Чи слід додаткові результати відображати збоку (або, можливо, внизу) сторінки результатів?
    4. Чи маємо ми мати можливість вимкнути ці інші релевантні результати пошуку (відмова користувача та/або проєкту)?
      • Це може бути пошуковий термін за ключовим словом або, можливо, кнопка, яку відвідувач натисне
      • Це також може бути подібним до ключового слова local:, яке шукатиме лише зображення на локальній вікі, а не файли Commons, наприклад.
    5. Чи краще відображати додаткові результати у вигляді списку чи сітки?
    6. Чи слід включати відповідні метадані (зображення та/або короткий опис) до результатів пошуку?
    7. Чи повинні результати мати розмір статті (тобто: 848 байт (104 слова)) і дату її створення/зміну?
    8. Чи слід вказувати, що натискання на результат перенесе вас до іншого вікі-проєкту?
    9. Скільки результатів з інших вікі ми маємо показати – 1, 2, 3 чи більше?
    10. Чи варто обмежувати існуючий метод відображення результатів із вікі, на якій ви шукали?
      • Наразі ми показуємо до 10 000 результатів із розбивкою на сторінки, але тестування показує, що зазвичай діють лише перші 3 результати.
  2. Чи ми хочемо, щоб ці нові результати пошуку працювали у всіх проєктах Вікімедіа?
    1. Наприклад, якщо я у Вікіцитатах, чи хочу я також бачить релевантні результати пошуку з Вікімандрів, Вікіпедії чи Вікіновин?
    2. Або, якщо я у Вікіпедії, просто показати мені результати з інших проєктів?
  3. Чи будуть ці інші релевантні результати пошуку корисними і заохотять до глибшого дослідження інших проєктів?
    1. Чи дратує бачити результати з інших вікі?
    2. І навпаки, чи заохочують вони користувача отримувати більше знань?
    3. Яку вагу треба надавати результатам з інших вікіпроєктів у результатах?
  4. Чи заохотить користувачів відображення додаткових результатів пошуку з інших вікі робити внесок?
    1. Тобто якщо ви шукаєте Piazza del Duomo і не бачите статті про неї у Вікімандрах (а я шукаю у Вікіцитатах), чи це заохотить вас започаткувати статтю?
  5. Чи треба обмежити кількість мов, якими проводити пошук?
    1. Тобто, чи запровадите це лише для топ-50?
    2. Або лише використовувати мови, де ми виявляємо запити іншою мовою ніж вікі, де знаходиться користувач?

Дивіться також: Досліджуйте схоже, віджет Вікісловника, значки ескізів у результатах пошуку

Завдання на Фабрикаторі:

Замітки з обговорень:

A/B-тестування

Після врахування відгуків спільноти та рекомендацій команди дизайнерів ми незабаром розпочнемо A/B-тестування. Перегляньте цю сторінку для отримання додаткової інформації.

Самостійне тестування

Ця сторінка була створена, щоб заохочувати користувачів проводити власне тестування через сторінку самостійного тестування з прикладами для тих, хто не дуже технічний, і тих, хто має обліковий запис у Вікіпедії і має трохи досвідченіше.