Data Terstruktur Lintas Wikimedia/Topik subjudul

This page is a translated version of the page Structured Data Across Wikimedia/Section Topics and the translation is 77% complete.
Outdated translations are marked like this.

Halaman ini menjelaskan proyek yang sedang berlangsung yaitu topik subjudul oleh tim Data Terstruktur Lintas Wikimedia.

Latar belakang

Untuk more information about the current tool architecture, lihat: Structured Data Across Wikimedia/Section Topics/Data Pipeline.

Proyek ini bertujuan untuk mengenali subjudul yang ada pada artikel dan membuat topik berdasarkan subjudul tersebut. Terdapat beberapa elemen yang mendukung proyek ini:

  • algoritme yang dapat mendeteksi butir Wikidata berdasarkan pranala dalam di bagian subjudul (akan dikerjakan bersama-sama dengan tim Data Terstruktur, Penelitian, Pemelajaran Mesin, dan Platform Data);
  • kemampuan untuk secara otomatis dalam mendeteksi subjudul pada artikel (akan dikerjakan bersama-sama dengan tim Data Terstruktur dan Platform Data).

Untuk poin terakhir akan dirancang di atas proyek saran untuk gambar yang akan dikerjakan bersama oleh tim Pemelajaran Mesin, Platform Data, Penelitian, Pencarian, dan Growth. This will build upon the work done on image suggestions and will be developed in partnership with the Structured Data, Data Platform, Research, Search, Android, and Growth teams.

Terlepas dari otomatisasi yang akan diterapkan dari proyek ini, kami usahakan untuk tidak mengubah alur maupun memengaruhi kenyamanan pengguna dalam berkontribusi. Semua ini bersifat otomatis dan tidak akan mengganggu kontributor yang sekadar ingin menyunting artikel. Proyek ini masih dalam tahap pemeriksaan dan kami masih membutuhkan masukan dari kontributor. All these activities will be automatic and will not depend on any action from editors. Currently, this project is in its development phase, and there are still aspects that may require further investigation and/or feedback from users.

Examples of potential section topics

The following are some examples of section topics extracted from Wikipedia articles, during a test run on English and Russian Wikipedias. Currently, we are working on a way to determine the most relevant topics for any given section, through a custom TF-IDF weight function.

Contoh pertama (dari Wikipedia bahasa Inggris)
Artikel: Campbell Island, New Zealand
Subjudul: History
Contoh dari topik subjudul:World War II”, “Pinniped”, “Brig”, “Great Depression”, “Perseverance Harbour
Contoh kedua (dari Wikipedia bahasa Inggris)
Artikel: Dorothy E. Smith
Subjudul: Biography
Contoh dari topik subjudul:Toronto”, “University of British Columbia”, “London School of Economics”, “Vancouver”, “University of California, Berkeley
Contoh ketiga (dari Wikipedia bahasa Inggris)
Artikel: Battle of Surabaya
Subjudul: Background
Contoh dari topik subjudul:Sukarno”, “Mohammad Hatta”, “Jakarta”, “Proclamation of Indonesian Independence”, “East Java
Contoh keempat (dari Wikipedia bahasa Inggris)
Artikel: Tour of Greece
Subjudul: Pemenang sebelumnya (catatan: seluruh bagian dari subjudul adalah tabel)
Contoh dari topik subjudul:: Nama dari pemenang, diurutkan berdasarkan skor: “Ioannis Tamouridis”, “Valeriy Dmitriyev”, “Henri Manders”, “Thomas Liese”, “Assan Bazayev”, etc.
Contoh kelima (dari Wikipedia bahasa Rusia)
Artikel: Адлон (отель)
Subjudul: История
Contoh dari topik subjudul::Дитрих, Марлен”, “Вторая мировая война”, “Чаплин, Чарльз”, “Вильгельм II (император Германии)”, “Шинкель, Карл Фридрих”, “Первая мировая война
Contoh keenam (dari Wikipedia bahasa Rusia)
Artikel: Военная стратегия
Subjudul: История
Contoh dari topik subjudul:Сунь-цзы”, “Наполеон I”, “Первая мировая война”, “Искусство войны”, “Блицкриг”, “Александр Македонский”, “Вторая мировая война

Rencana selanjutnya

Based on the viability of those options, the project also aims at using section topics to improve our SEO[1] reach with outside search engines, as a follow up to the experiment conducted in task T302735.

References

  1. SEO — Search Engine Optimization