Extension:TextExtracts
Üretim ortamlarında özet almak için Page Content Service tavsiye edilir ve Wikimedia ürünleri tarafından kullanılır. |
TextExtracts Sürüm durumu: kararlı |
|
---|---|
Uygulama | API |
Açıklama | API'ye düz metin veya sayfa içeriğinin sınırlı HTML alıntıları sağlar |
Yazar(lar) | Max Semenik (MaxSemmesaj) |
Uyumluluk politikası | MediaWiki ile birlikte anlık görüntüler yayımlanır. Master geriye dönük olarak uyumlu değil. |
MediaWiki | >= 1.43 |
Veritabanı değişiklikleri | Hayır |
Lisans | GNU Genel Kamu Lisansı 2.0 veya üstü |
İndir | |
|
|
Quarterly downloads | 102 (Ranked 57th) |
Public wikis using | 2,046 (Ranked 189th) |
Translatewiki.net adresinde mevcutsa, TextExtracts uzantısını çevirin | |
Sorunlar | Açık görevler · Hata bildir |
TextExtracts uzantısı, düz metin veya sınırlı HTML (kaldırılan bazı CSS sınıfları için içerik içeren HTML) sayfa içeriğinin alınmasını sağlayan bir API sağlar.
Kurulum
- Dosyaları indirin ve
extensions/
klasörünüzdekiTextExtracts
adlı dizine yerleştirin.
Developers and code contributors should install the extension from Git instead, using:cd extensions/
git clone https://gerrit.wikimedia.org/r/mediawiki/extensions/TextExtracts - LocalSettings.php dosyanızın altına aşağıdaki kodu ekleyin:
wfLoadExtension( 'TextExtracts' );
- Yapıldı – Uzantının başarıyla yüklendiğini doğrulamak için vikinizde Special:Version seçeneğine gidin.
Yapılandırma ayarları
$wgExtractsRemoveClasses
, çıkarmadan hariç tutulacak olan <tag>, <tag>.class, .<class>, #<id> dizisidir.- Örneğin,
$wgExtractsRemoveClasses[] = 'dl';
, genellikle özetlerde istenmeyen şablonlanmamış hatnotlar için kullanılan girintili metni kaldırır.
- Örneğin,
- extension.json, "noexcerpt" sınıfının bir olduğu varsayılanları tanımlar. Bu, onu hariç tutmak için herhangi bir şablona eklenebilir.
$wgExtractsExtendOpenSearchXml
, TextExtracts'ın alıntılarını Opensearch API modülüne sağlayıp sağlamayacağını tanımlar. Varsayılanfalse
şeklindedir.
API
extracts | |
---|---|
Belirli sayfaların düz metin veya sınırlı HTML alıntılarını döndürür Bu modül jeneratör olarak kullanılamaz. | |
Önek | ex |
Gerekli haklar | hiçbiri |
Sadece gönderme mi? | Hayır |
Oluşturulan yardım | Şimdiki |
Aşağıdaki belgelendirme, bu sitede (MediaWiki.org) çalışan MediaWiki'nin sürüm öncesi sürümü tarafından otomatik olarak oluşturulan Special: |
prop=extracts (ex)
- This module requires read rights.
- Source: TextExtracts
- License: GPL-2.0-or-later
Returns plain-text or limited HTML extracts of the given pages.
- exchars
How many characters to return. Actual text returned might be slightly longer.
- Type: integer
- The value must be between 1 and 1,200.
- exsentences
How many sentences to return.
- Type: integer
- The value must be between 1 and 10.
- exlimit
How many extracts to return. (Multiple extracts can only be returned if exintro is set to true.)
- Type: integer or max
- The value must be between 1 and 20.
- Default: 20
- exintro
Return only content before the first section.
- Type: boolean (details)
- explaintext
Return extracts as plain text instead of limited HTML.
- Type: boolean (details)
- exsectionformat
How to format sections in plaintext mode:
- plain
- No formatting.
- wiki
- Wikitext-style formatting (== like this ==).
- raw
- This module's internal representation (section titles prefixed with <ASCII 1><ASCII 2><section level><ASCII 2><ASCII 1>).
- One of the following values: plain, raw, wiki
- Default: wiki
- excontinue
When more results are available, use this to continue. More detailed information on how to continue queries can be found on mediawiki.org.
- Type: integer
- Get a 175-character extract
- api.php?action=query&prop=extracts&exchars=175&titles=Therion [open in sandbox]
Sonuç |
---|
{
"query": {
"pages": {
"9228": {
"pageid": 9228,
"ns": 0,
"title": "Earth",
"extract": "Earth, also called the world and, less frequently, Gaia, (or Terra in some works of science fiction)..."
}
}
}
}
|
Caveatlar
API'yi veya API'yi kullanan yazılımı kullanırken dikkat edilmesi gereken çeşitli şeyler vardır, ör. Extension:Popups .
- `exsentences` kullanılmasını önermiyoruz. HTML özleri için çalışmaz ve mevcut olmadığı birçok kenar durumu vardır. Örneğin "Arm. Gen. Ing. John Smith bir askerdi." 4 cümle olarak değerlendirilecektir. Bunu düzeltmeyi planlamıyoruz.
- Satır içi görüntüler yanıttan çıkarılır (HTML modunda bile). Bu, Math uzantısı kullanıyorsanız ve potansiyel istemci bölümünüzde formüller kullanıyorsanız, özet çıkışında görünmeyebilecekleri anlamına gelir.
- HTML modunda iyi biçimlendirilmiş HTML'yi garanti edemeyiz. Sonuçta ortaya çıkan HTML geçersiz veya bozuk olabilir.
- Düz metin modunda:
- kaynakça çıkarılamayabilir (phab:T197266 sayfasına bakın)
- bir paragraf HTML etiketi ile bitiyorsa, ör. ref etiketi, yeni satırlar atılabilir (phab:T201946 sayfasına bakın)
- phab:T208132 listelerinden sonra yeni satırlar bırakılabilir
- Articles must begin with the lead paragraph for an extract to be generated. The use of any template, and/or unclosed or empty HTML element may result in no preview for the article. E.g. "<div></div>hello" will give an empty extract.
SSS
Bir sayfa önizlemesinden/alıntısından içeriği nasıl kaldırabilirim?
TextExtracts, .noexcerpt
sınıfıyla işaretlenmiş tüm ögeleri çıkarır.
Bu, $wgExtractsRemoveClasses
yapılandırma değişkeni tarafından sağlanır (bu, diğer bazı hariç tutulan ögeleri de tanımlar).
Ayrıca bakınız
Bu uzantı bir veya daha fazla Wikimedia projelerinde kullanılıyor. Bu, muhtemelen uzantının kararlı olduğu ve bu tür yüksek trafikli web siteleri tarafından kullanılacak kadar iyi çalıştığı anlamına gelir. Nerede kurulduğunu görmek için bu uzantının adını Wikimedia'nın CommonSettings.php ve InitialiseSettings.php yapılandırma dosyalarında arayın. Belirli bir vikide yüklü olan uzantılar listesinin tamamı vikinin Special:Version sayfasında görülebilir. |
This extension is included in the following wiki farms/hosts and/or packages: This is not an authoritative list. Some wiki farms/hosts and/or packages may contain this extension even if they are not listed here. Always check with your wiki farms/hosts or bundle to confirm. |