Структурированные Данные Викимедиа/Темы по разделам

This page is a translated version of the page Structured Data Across Wikimedia/Section Topics and the translation is 88% complete.

На этой странице описывается ход работы по разработке и созданию функции «Темы по разделам» для статей Википедии, который в настоящее время разрабатывается командой по Структурированным Данным Викимедиа.

Предыстория

Для more information about the current tool architecture, см.: Structured Data Across Wikimedia/Section Topics/Data Pipeline.

Проект «Темы по разделам» определит разделы в статье и создаст соответствующие темы для этих разделов, опираясь на несколько элементов, таких как:

  • алгоритм, который обнаружит элементы Викиданных на основе синих ссылок раздела (который будет разработан в сотрудничестве с командами по Структурированным Данным, Исследованиям и командой Платформа Данных);
  • возможность автоматического определения разделов в статье (которая будет разработана в сотрудничестве с командами по Структурированным Данным и Платформы Данных).

Одним из первых вариантов использования тем разделов, как мы предполагаем, станут предложения изображений на уровне разделов, которые будут использовать алгоритм синих ссылок и инфраструктуру идентификации разделов, описанную выше, и будут предоставляться как новичкам, так и опытным участникам через уведомления. This will build upon the work done on image suggestions and will be developed in partnership with the Structured Data, Data Platform, Research, Search, Android, and Growth teams.

Эти элементы не изменят и не повлияют на текущие возможности редактирования для пользователей. All these activities will be automatic and will not depend on any action from editors. Currently, this project is in its development phase, and there are still aspects that may require further investigation and/or feedback from users.

Примеры потенциальных «тем по разделам»

Ниже приведены примеры тем разделов, извлеченных из статей Википедии в ходе тестовой работы с английской и русской Википедиями. Currently, we are working on a way to determine the most relevant topics for any given section, through a custom TF-IDF weight function.

Пример 1 (Английская Википедия)
Статья: Campbell Island, New Zealand
Раздел: History
Пример «темы по разделам»World War II”, “Pinniped”, “Brig”, “Great Depression”, “Perseverance Harbour
Пример 2 (Английская Википедия)
Статья: Dorothy E. Smith
Раздел: Biography
Пример «темы по разделам»:Toronto”, “University of British Columbia”, “London School of Economics”, “Vancouver”, “University of California, Berkeley
Пример 3 (Английская Википедия)
Статья: Battle of Surabaya
Раздел: Background
Пример «темы по разделам»:Sukarno”, “Mohammad Hatta”, “Jakarta”, “Proclamation of Indonesian Independence”, “East Java
Пример 4 (Английская Википедия)
Статья: Tour of Greece
Раздел: Прошлые победители (примечание: весь раздел представляет собой таблицу)
Примеры «темы по разделам»: Имена победителей тура, упорядоченные по показателю соответствия: “Ioannis Tamouridis”, “Valeriy Dmitriyev”, “Henri Manders”, “Thomas Liese”, “Assan Bazayev”, etc.
Пример 5 (Русская Википедия)
Статья: Адлон (отель)
Раздел: История
Пример «темы по разделам»:Дитрих, Марлен”, “Вторая мировая война”, “Чаплин, Чарльз”, “Вильгельм II (император Германии)”, “Шинкель, Карл Фридрих”, “Первая мировая война
Пример 6 (Русская Википедия)
Статья: Военная стратегия
Раздел: История
Пример «темы по разделам»:Сунь-цзы”, “Наполеон I”, “Первая мировая война”, “Искусство войны”, “Блицкриг”, “Александр Македонский”, “Вторая мировая война

Дальнейшее планируемое развитие

Исходя из перспективности этих вариантов, в продолжение эксперимента, проведенного в задача T302735, в проекте также предполагается использовать темы разделов для улучшения охвата SEO[1] внешними поисковыми системами.

References

  1. SEO — Search Engine Optimization