Návod: Boj proti spamu

This page is a translated version of the page Manual:Combating spam and the translation is 94% complete.
Outdated translations are marked like this.
Other languages:
Deutsch • ‎English • ‎Türkçe • ‎dansk • ‎français • ‎português do Brasil • ‎čeština • ‎русский • ‎中文 • ‎日本語 • ‎한국어

Stejně jako všechny současné dynamické webové stránky jsou wikis běžným cílem pro spammery, kteří chtějí propagovat produkty nebo webové stránky. MediaWiki nabízí řadu funkcí určených k boji proti vandalismu obecně. Na této stránce se zabýváme konkrétně wiki spam.

Přehled

Běžné nástroje používané v boji proti spamu wiki obvykle spadají do těchto kategorií:

  • Vyžadování přihlášení a / nebo CAPTCHA u určitých operací, jako jsou úpravy, přidávání externích odkazů nebo vytváření nových uživatelů
  • Blokování úprav ze známých IP adres ze seznamu zakázaných nebo z adres IP, na nichž běží otevřené servery proxy
  • Blokování úprav, které přidávají konkrétní nechtěná klíčová slova nebo externí odkazy
  • Blokování specifických vzorů uživatelského jména a názvu stránky, které spamboty běžně používají
  • Blokování úprav novými nebo anonymními uživateli na konkrétních často cílených stránkách
  • Whitelisting (seznam povolených) známých editorů (jako jsou administrátoři, pravidelní přispěvatelé) a zároveň omezení pro nové nebo anonymní uživatele
  • Vyčištění skriptů nebo hromadné mazání (Extension:Nuke ) stávajících příspěvků z nedávno zakázaných spambotů

Běžně se používá kombinace různých metod ve snaze udržet počet úprav spamu, robotů a otevřených proxy na minimu a zároveň omezit míru narušení způsobeného legitimním uživatelům webu.

Mnoho těchto funkcí není ve výchozím nastavení aktivováno. Pokud na serveru / hostiteli instalujete instalaci MediaWiki, pak jste jediný, kdo může provést potřebné změny konfigurace! V každém případě požádejte své uživatele o pomoc Pozor na spam Wiki (a udělejte to sami). V dnešní době může spam snadno přemoci malé komunity wiki. Pomáhá trochu zvýšit tlak. Také byste si měli uvědomit, že žádné z těchto řešení nelze považovat za zcela odolné proti spamu. Efektivní praxí je pravidelně kontrolovat „Poslední změny“ (Special:RecentChanges).

Nejrychlejší řešení nejprve vyzkoušejte

Boj proti spamu by neměl být příliš tvrdý. Pokud chcete rychle a výrazně omezit spam, zkuste nejprve tyto kroky.

Pokud problémy přetrvávají, přečtěte si další část této stránky, kde najdete další řešení, a pošlete zprávu na mediawiki-l.

Základy nastavení antispamu

CAPTCHA

Jednou z běžnějších metod vyřazování automatických podání je použití CAPTCHA. Systému, který se snaží odlišit lidi od automatizovaných systémů tím, že požádá uživatele, aby vyřešil úkol, který je pro stroje obtížný. Rozšíření ConfirmEdit pro MediaWiki poskytuje rozšiřitelný rámec CAPTCHA, který lze spustit na řadě událostí, včetně

  • všech úprav
  • úprav přidávajících nové, nerozpoznané externí odkazy
  • registrace uživatele

Rozšíření se dodává se standardním testem, jedná se však o referenční implementaci a není určeno k produkčnímu použití. Operátorům Wiki, kteří instalují ConfirmEdit na veřejné wiki, se doporučuje používat jeden z modulů CAPTCHA obsažených v rozšíření (celkem jich je pět).

Nejodolnější CAPTCHA, které jsou dnes k dispozici, jsou vaše vlastní otázky QuestyCaptcha, pokud je přizpůsobíte pevně publiku vaší wiki a pravidelně je aktualizujete. ReCaptcha je v současné době poražen většinou spammerů [1]; Asirra CAPTCHA, která žádá uživatele, aby rozlišil kočky a psy, je pro uživatele obzvláště nepříjemná, ale může být účinná.

Je důležité si uvědomit, že CAPTCHA mohou blokovat více než nežádoucí roboty. Pokud skript není schopen projít CAPTCHA, pak to také může být čtečka obrazovky nebo jiný software nebo pomoc používaná nevidomými nebo zrakově postiženými. Jednou z možností v CAPTCHA, widgetu „reCAPTCHA“, je v takových případech alternativní zvukový CAPTCHA - ale někteří uživatelé počítačů selhávají při testech slyšení a čtení, takže to není úplně dobré řešení. Měli byste zvážit důsledky takové překážky a případně poskytnout alternativní prostředky pro postižené uživatele k vytváření účtů a přispívání, což je v některých jurisdikcích zákonný požadavek.[2]

Also it will not completely spam-proof your wiki; according to Wikipedia "Spammers pay about $0.80 to $1.20 for each 1,000 solved CAPTCHAs to companies employing human solvers in Bangladesh, China, India, and many other developing nations." Z tohoto důvodu by měl být kombinován s jinými mechanismy.

rel="nofollow"

Ve výchozí konfiguraci MediaWiki přidává rel="nofollow" k externím odkazům na wiki stránkách, což znamená, že jsou dodávány uživatelem. Mohou obsahovat spam. Proto by neměly být používány k ovlivňování algoritmů pro hodnocení stránek. Tento atribut ctí oblíbené vyhledávací nástroje, například Google.

Toto chování můžete vypnout na celém webu pomocí $wgNoFollowLinks nebo na základě jmenného prostoru pomocí konfigurační proměnné $wgNoFollowNsExceptions .

Use of the rel="nofollow" attribute alone will not stop spammers attempting to add marketing to a page, but it will at least prevent them from benefiting through increased page rank; we know for sure that some check this. Nonetheless, it should never be relied upon as the primary method of controlling spam as its effectiveness is inherently limited. It does not keep spam off your site.

See NoIndexHistory. Note that putting it on all external links is a rather heavy handed anti-spam tactic, which you may decide not to use (switch off the rel=nofollow option). See Nofollow for a debate about this. It's good to have this as the installation default though. It means lazy administrators who are not thinking about spam problems, will tend to have this option enabled. For more information, see Manual:Costs and benefits of using nofollow.

Rutina antispamu: opatření na míru

Každý spammer je jiný. I když všichni vypadají nudně podobně. Pokud obecná protiopatření nestačí, použijte před extrémními kroky nástroje, které vám umožní řešit konkrétní problémy, které máte.

Ochrana jednotlivých stránek

Spamboty často často opakovaně zasáhnou stejnou stránku. Běžné vzory pozorované u pagenů vytvořených pomocí spambotů zahrnují diskusní stránku, často mimo hlavní prostor (např. Category_talk: jsou málo používány, takže si vytvoří společné cíle) a další diskusní stránky

Nejvíce zneužívají úpravy na wiki, které nevyžadují k úpravám registraci. Pocházejí z anonymních zdrojů. Blokováním úprav na těchto konkrétních stránkách komukoli jinému než zavedeným uživatelům může zabránit opětovnému vytvoření spamových výpisů. Typically, any page which is already a regular visitor to special:log/delete on an individual wiki is a good candidate for page protection.

  • Semi-protection of individual pages.
    • In addition, this can be combined with changing the minimum requirements for MediaWiki to identify users as 'autoconfirmed'.
  • One may apply cascading protection to one or more pages that have links to the most frequently spammed pages. One can also use this trick to set up a handy list for use by admins.

Filtr zneužívání

Rozšíření:AbuseFilter (filtr zneužití) umožňuje privilegovaným uživatelům vytvářet pravidla zacílená na konkrétní typ spamu, který vaše wiki přijímá. Může pomoci automaticky zabránit akci nebo blokovat uživatele.

Může prozkoumat mnoho vlastností úprav. Například uživatelské jméno, věk uživatele, přidaný text, přidané odkazy atd. Nejúčinnější je v případech, kdy máte jednoho nebo více kvalifikovaných administrátorů, kteří jsou ochotni vám pomoci v boji proti spamu. Filtr zneužití může být účinný i proti spammerům podporovaným člověkem, ale vyžaduje nepřetržitou údržbu, aby reagoval na nové typy útoků.

Příklady boje proti automatickému spamu lze nalézt v Návod: Příklady boje proti spamu / Příklady filtru zneužití.

Seznam spamů (SpamBlacklist)

Výše uvedený přístup bude příliš těžkopádný, pokud se pokusíte blokovat více než hrst spamových adres URL. Lepším přístupem je dlouhá černá listina identifikující mnoho známých spamových adres URL.

Populární rozšíření pro MediaWiki je rozšíření SpamBlacklist , které blokuje úpravy, které přidávají URL na stránky do černé listiny. Sestavení takového seznamu na wiki umožňuje za pomoci privilegovaných uživatelů. Využívá seznamů získaných z externích zdrojů (ve výchozím nastavení) Používá rozsáhlou Černou listinu spamů.

Rozšíření TitleBlacklist (̝černá listina spamů) může být také užitečné, jako prostředek k zabránění opětovného vytvoření konkrétních skupin stránek, které používají 'bots k výpisu odkazových spamů.

Otevřené proxy

Otevřený server proxy je nebezpečný zejména proto, že se používá jako způsob, jak obejít protiopatření zaměřená na konkrétního narušitele; viz také Žádné otevřené servery proxy.

Existují někteří roboti , např. na Wikimedia wikis, detekující a blokující otevřené IP proxy. Jejich kód není často veřejný. Většina takových bloků, když si všimnete zneužití, se provádí ručně. Je proto důležité vědět, zda zneužívající IP je otevřený proxy server nebo něco jiného, aby se rozhodlo, jak se s tím vypořádat. Zejména, pokud se jedná o adresu IP používanou registrovaným uživatelem, získanou pomocí rozšíření CheckUser .

Několik rozšíření, zejména rozšíření Tor block, blokuje řadu otevřených proxy serverů.

Od verze 1.22 $wgApplyIpBlocksToXff je k dispozici, aby bloky byly účinnější.

Tvrdá opatření

Následující opatření jsou určena pro technicky zdatnější sysadminy, kteří vědí, co dělají. Je obtížnější je správně nastavit a sledovat. Pokud jsou implementovány špatně, mohou být příliš staré na to, aby byly stále efektivní, nebo dokonce mohou být pro vaši wiki kontraproduktivní.

$wgSpamRegex

MediaWiki poskytuje prostředky k filtrování textu úprav za účelem blokování nežádoucích doplňků prostřednictvím konfigurační proměnné $wgSpamRegex . Můžete ji použít k blokování dalších úryvků textu nebo značek spojených s běžnými útoky na spam.

You can use this to block additional snippets of text or markup associated with common spam attacks.

Obvykle se používá k vyloučení adres URL (nebo částí adres URL), na které nechcete uživatele odkazovat. Uživatelé dostanou vysvětlující zprávu, která uvádí, která část jejich upravovaného textu není povolena. Extension:SpamRegex umožňuje editaci této proměnné na wiki.

$wgSpamRegex = "/online-casino|buy-viagra|adipex|phentermine|adult-website\.com|display:none|overflow:\s*auto;\s*height:\s*[0-4]px;/i";

Tím se zabrání jakékoli zmínce o „online kasinu“ nebo „buy-viagra“ nebo „adipex“ nebo „phentermine“. '/i' na konci způsobí, že na případné vyhledávání nebude citlivý. Blokuje také úpravy, které se pokouší přidat skryté nebo přetékající prvky, což je běžný „trik“ používaný při mnoha hromadných útocích, které se pokouší skrýt spam před diváky.

Změny konfigurace Apache

Pokud měníte konfiguraci své MediaWiki, používáte-li na Apache MediaWiki, můžete také provádět změny v konfiguraci webového serveru Apache, abyste zabránili spamu. Tato nastavení jsou obvykle umístěna do konfiguračního souboru virtuálního hostitele nebo do souboru s názvem .htaccess na stejném místě jako LocalSettings.php (Upozorňujeme, že pokud máte sdíleného webového hostitele, musí povolit AllowOverride, aby vám umožnil použití souboru .htaccess).

Filtrování podle agenta uživatele

Když na své wiki zablokujete nevyžádanou poštu, vyhledejte v protokolu přístupu k webu podle adresy IP a určete, který řetězec uživatelských agentů tato adresa IP poskytla. Například

grep ^195.230.18.188 /var/log/apache2/access.log

The access log location for your virtual host is generally set using the CustomLog directive. Once you find the accesses, you'll see some lines like this:

195.230.18.188 - - [16/Apr/2012:16:50:44 +0000] "POST /index.php?title=FlemmingCoakley601&action=submit HTTP/1.1" 200 24093 "-" ""

The user agent is the last quoted string on the line, in this case an empty string. Some spammers will use user agent strings used by real browsers, while others will use malformed or blank user agent strings. If they are in the latter category, you can block them by adding this to your .htaccess file (adapted from this page):

SetEnvIf User-Agent ^regular expression matching user agent string goes here$ spammer=yes

Order allow,deny
allow from all           
deny from env=spammer

Tím se vrátí chyba 403 Zakázané na jakoukoli adresu IP s uživatelským agentem, který odpovídá zadanému regulárnímu výrazu. Dejte pozor, abyste unikli všem potřebným znakům regexpu v řetězci uživatelského agenta, například. () - se zpětným lomítkem (\). Chcete-li porovnat prázdné uživatelské agenty, použijte pouze znak „^$“.

I když je řetězec agenta spammeru používán skutečnými prohlížeči, pokud je starý nebo málokdy se vyskytující, můžete použít pravidla přepsání k přesměrování uživatelů na chybovou stránku a doporučit jim, aby upgradovali svůj prohlížeč:

RewriteCond %{HTTP_USER_AGENT} "Mozilla/5\.0 \(Windows; U; Windows NT 5\.1; en\-US; rv:1\.9\.0\.14\) Gecko/2009082707 Firefox/3\.0\.14 \(\.NET CLR 3\.5\.30729\)"
RewriteCond %{REQUEST_URI} !^/forbidden/pleaseupgrade.html
RewriteRule ^(.*)$ /forbidden/pleaseupgrade.html [L]

Zamezení blokování spammerů ve spotřebě zdrojů

Trvalý spammer nebo spam s poškozeným skriptem se může i nadále pokoušet spamovat vaši wiki poté, co byl zablokován, zbytečně náročnými zdroji. Přidáním pragmy deny from pragma, jako je následující, do souboru .htaccess, můžete jim zabránit v načítání stránek vůbec a místo toho vrátit 403 zakázanou chybu:

Order allow,deny
allow from all
deny from 195.230.18.188

Černé seznamy adres IP

Většina nejproblematičtějších spamů přijímaných na webech MediaWiki pochází z adres, které ostatní webmasteři dlouho nazývají bot nebo otevřené proxy servery, ačkoli pro to existují pouze neoficiální důkazy. Tito roboti obvykle generují velké množství automatických registrací na webech fóra, komentují spam na blogu a vandalismus na stránkách wikis: nejčastěji linkspam, ačkoli existující obsah je někdy prázdný, doplněný náhodnými blábolícími znaky nebo upravován takovým způsobem, aby rozbil stávající Unicode text.

Poměrně jednoduchý CAPTCHA může problém významně snížit, protože může blokovat vytvoření určitých často nevyžádaných stránek. Tato opatření však problém nevylučují a zpřísnění bezpečnosti pro všechny uživatele v určitém okamžiku způsobí nepohodlí legitimních přispěvatelů.

Může být vhodnější namísto spoléhání se výhradně na CAPTCHA nebo jiná preventivní opatření, která ovlivňují všechny uživatele, zaměřit se konkrétně na IP adresy, o nichž již ostatní mistři stránek vědí, že jsou útočištěm net.abuse. Mnoho seznamů je již k dispozici, například stopforumspam.com obsahuje seznam "All IPs in CSV" (všech IP v CSV), který (od února 2012) obsahuje asi 200 000 IP známých spambotů.

Využití procesoru CPU a přetížení

Uvědomte si, že když se při pokusech o úpravy nebo zobrazení stránek provádí mnoho kontrol, roboti mohou snadno přetížit vaši wiki a narušit ji více, než pokud by nebyla chráněna. Sledujte náklady na ochranu svých zdrojů.

DNSBL

Můžete nastavit MediaWiki, aby zkontroloval každou editovací IP adresu proti jednomu nebo více DNSBL (blacklistům založeným na DNS), což nevyžaduje žádnou údržbu, ale mírně zvyšuje latenci úprav. Například můžete přidat tento řádek do LocalSettings.php a blokovat tak mnoho otevřených proxy serverů a známých spammerů:

$wgEnableDnsBlacklist = true;
$wgDnsBlacklistUrls = array( 'xbl.spamhaus.org', 'dnsbl.tornevall.org' );

For details of these DNSBLs, see Spamhaus: XBL and dnsbl.tornevall.org. For a list of DNSBLs, see Comparison of DNS blacklists. See also Manual:$wgEnableDnsBlacklist , Manual:$wgDnsBlacklistUrls .

Špatné chování a projekt HoneyPot

Špatné chování je první obranná linie blokující všechny požadavky známých spammerů identifikovaných pomocí HTTP hlaviček, IP adresy a dalších metadat; je k dispozici jako rozšíření MediaWiki, viz Extension:Bad Behavior .

Pro maximální účinnost by měla být kombinována s http:BL API Key, které můžete získat na signing up for Project Honey Pot, distribuovaného projektu sledování spamu. Chcete-li se připojit k projektu HoneyPot, musíte do svého webového serveru přidat veřejně přístupný soubor a pomocí následujícího kódu rozšíření ve vašem LocalSettings.php (nebo přiloženém souboru PHP) vložit odkaz na každou stránku:

  Varování: This is known to break LiquidThreads. Do not use them together.
$wgHooks['ParserAfterTidy'][] = 'fnInsertLinksToHoneyPot';
$wgHoneyPotPath = '/ciralix.php';

function fnInsertLinksToHoneyPot( &$parser, &$text ) {
    global $wgHoneyPotPath;
    $text .= "<a href=\"$wgHoneyPotPath\"><!-- hijacker --></a>";
    return true;
}

Nastavte $wgHoneyPotPath na cestu stránky honeypot v LocalSettings.php (např. "/ciralix.php"). Můžete změnit podobu výše uvedeného odkazu na kteroukoli z alternativ navržených v Project HoneyPot. Možná se budete muset přihlásit do Project HoneyPot, abyste viděli tyto alternativní způsoby, jak učinit odkazy honeypot neviditelné pro člověka.[1][2]

Jakmile se zaregistrujete, zvolte Services→HTTP Blacklist, abyste získali http:BL API Key, a vložte svůj klíč do nastavení Bad Behavior's.ini.

$wgProxyList

  Varování: Tato konkrétní technika podstatně zvýší dobu načítání stránky a zatížení serveru, pokud je seznam IP velký. Používejte ji opatrně.

Proměnnou $wgProxyList můžete nastavit na seznamu IP, které chcete zakázat. Tento lze pravidelně naplňovat z externího zdroje pomocí skriptu cron, jako je například následující:

#!/bin/bash
cd /your/web/root
wget https://www.stopforumspam.com/downloads/listed_ip_30_ipv46.gz
gzip -d listed_ip_30_ipv46.gz
cat > bannedips.php << 'EOF'
<?php
$wgProxyList = array(
EOF
sed -e 's/^/  "/; s/$/",/' < listed_ip_30_ipv46 >> bannedips.php
printf '%s\n' '");' >> bannedips.php
rm -f listed_ip_30_ipv46

Poté nastavíte v LocalSettings.php:

require_once "$IP/bannedips.php";

Možná budete chtít uložit tyto příkazy do souboru nazvaného např. updateBannedIPs.sh, takže jej můžete spouštět pravidelně.

Můžete také použít řešení pouze pro PHP (PHP-only) a stáhnout ip-list ze stopforumspamu. Za tímto účelem zkontrolujte dostupný skript PHP here.

Pokud tak učiníte a pro ukládání do mezipaměti používáte mezipaměť APC, možná budete muset zvýšit velikost apc.shm_size ve vašem php.ini, abyste se přizpůsobili tak velkému seznamu.

Právě jste zakázali sto čtyřicet tisíc spammerů. Doufejme, že to nebude mít žádný rušivý účinek na vaše legitimní uživatele. Řekl jste „adieu“ mnoha nejhorším známým spammerům na internetu. Dobrý riddance! To by mělo problém trochu utišit, alespoň na chvíli…

Honeypots, DNS BL's and HTTP BL's

140 000 mrtvých spammerů. Není to špatné, ale jakýkoli správný BOFH by se v tuto chvíli nudil a dychtivě by hledal 140 001 IP spamů, který by se náhodně zablokoval. A proč ne?

Naštěstí jsou k dispozici dynamicky aktualizované seznamy spambotů, otevřených proxy serverů a dalších problémových IP adres. Mnohé také umožňují automatickou kontrolu uživatelských jmen nebo e-mailových adres (pro přihlášené uživatele) proti stejným blacklistům.

Jednou formou černé listiny, kterou mohou správci MediaWiki znát, je DNS BL. Seznam serverů DNS hostovaný na serveru doménových jmen je databáze adres IP. Hledání adresy určuje, zda IP, která se pokouší zaregistrovat nebo upravit, je již známým zdrojem zneužití sítě.

Možnosti $wgEnableDnsBlacklist a $wgDnsBlacklistUrls v MediaWiki poskytují primitivní příklad přístupu k černé listině DNS. Nastavte $code v LocalSettings.php a IP adresy uvedené jako HTTP spam jsou blokovány.

Set

$wgEnableDnsBlacklist = true;
$wgDnsBlacklistUrls = array( 'xbl.spamhaus.org', 'opm.tornevall.org' );

in LocalSettings.php and IP addresses listed as HTTP spam are blocked.

Černá listina DNS funguje takto:

  • Wiki obdrží žádost o úpravu nebo registraci nového uživatele z nějaké náhodné adresy IP (například ve formátu „123.45.67.89“)
  • Čtyři bajty IP adresy jsou umístěny v obráceném pořadí, poté následuje název požadovaného serveru černé listiny DNS
  • Výsledná adresa je vyžadována ze serveru pro doménové jméno (v tomto příkladu '89.67.45.123.zen.spamhaus.org.' a '89.67.45.123.dnsbl.tornevall.org.')
  • Server není nalezen (NXDOMAIN), pokud adresa není na černé listině. Pokud je na některém z blacklistů, je úprava blokována.

Vyhledávání v externě hostované černé listině obvykle přidává ne více než několik sekund k času potřebnému k uložení úprav. Na rozdíl od nastavení $wgProxyKey, které musí být načteno na každé stránce čtené nebo zapisované, se použití černé listiny DNS provádí pouze během registrace nebo úprav stránek. Tím není ovlivněna rychlost, jakou může systém obsluhovat požadavky na čtení stránky (většinu vašeho provozu).

Zatímco původní SORBS byl primárně určen pro řešení otevřených webových proxy a e-mailového spamu, existují i ​​jiné seznamy specifické pro webový spam (fóra, komentáře k blogům, úpravy wiki), které mohou být proto vhodnější:

  • .opm.tornevall.org. funguje velmi podobným způsobem jako SORBS DNSBL, ale zacílí na otevřené proxy a spam ve webové podobě. Většina jeho obsahu je konsolidována z jiných existujících seznamů zneužívajících IP.
  • .dnsbl.httpbl.org. se konkrétně zaměřuje na roboty, kteří shromažďují e-mailové adresy z webových stránek pro hromadné seznamy e-mailů, zanechávají komentářový spam nebo se pokoušejí ukrást hesla pomocí útoků ze slovníku. Vyžaduje uživatelský registr u projecthoneypot.org pro 12místný klíč API. Pokud by tento klíč (například) byl 'myapitestkey', vyhledávání by jinak vypadalo jako '89.67.45.123.http.dnsbl.sorbs.net.' nebo '89.67.45.123.opm.tornevall.org.' bude muset být 'myapitestkey.89.67.45.123.dnsbl.httpbl.org.'
  • Seznamy povolených webů mohou identifikovat e-mailové adresy a informace o uživateli spamu i přes jednoduchou adresu IP, ale neexistuje standardní formát pro odpověď ze serveru se seznamem HTTP. Například žádost o http://botscout.com/test/?ip=123.45.67.89 by vrátila "Y|IP|4", pokud je adresa na černé listině ('N' nebo prázdná, pokud je v pořádku), zatímco webová žádost o http://www.stopforumspam.com/api?ip=123.45.67.89 by vrátila "ip yes 2009-04-16 23:11:19 41" pokud je adresa na blacklistu (čas, datum a počet lze ignorovat) nebo prázdná, pokud je adresa v pořáku.

Bez jediného standardního formátu, kterým server černé listiny odpovídá na dotaz, neexistuje v balíčku MediaWiki integrovaná podpora pro většinu online seznamů známých spambotů. Neschopnost určit více než jeden server černé listiny dále omezuje užitečnost vestavěných možností $wgEnableDnsBlacklist a $wgDnsBlacklistUrls. Od rev:58061 bylo MediaWiki schopno kontrolovat více DNSBL definováním $wgDnsBlacklistUrls jako pole.

Většina operátorů černých listin poskytuje velmi omezenou softwarovou podporu (často cílenou na aplikace jiné než wiki, jako je phpBB nebo Wordpress). Protože stejné spamboty vytvářejí podobné problémy na většině webů s otevřeným obsahem, nejhorší pachatelé útočící na weby MediaWiki budou také usilovně cílit na tisíce webů bez wiki se spamem v komentářích blogu, příspěvcích na fóru a v knihách návštěv.

Automatický dotaz na více webů na černé listině je proto již široce používán při ochraně různých jiných forem webů s otevřeným obsahem a jména spambotů, řad a IP adres jsou již nyní příliš dobře známá. Zdá se, že za velkým procentem celkového problému je relativně malý počet spambotů. I v případě, že administrátoři nepřijímají vězně, existuje vzor, ve kterém stejná spambotová IP, která před sekundou zveřejnila linkspam na wiki, spamuje blogové komentáře někde jinde a bude mít spamovací příspěvky na fóru pár sekund od nynějška na místě vzdáleném půl světa. To si pořádně zapamatujte. Jeden sdílený externí záznam na černé listině může umlčet jednoho problematického „robota“ od zveřejnění na tisících webech.

Tím se výrazně snižuje počet jednotlivých IP adres, které je třeba ručně blokovat a to vždy na jedné wiki a na jednom fóru, místními administrátory.

Ale co je to s honeypoty?

Některé weby zabývající se nevyžádanou poštou, například projecthoneypot.org, poskytují kód, kterým jste vyzváni k zahrnutí na své vlastní webové stránky.

Stránky obvykle obsahují jednu nebo více jedinečných, náhodných a skrytých e-mailových adres nebo odkazů, které nejsou určeny pro vaše lidské návštěvníky, ale pro spamboty. Při každém zobrazení stránky se vložené adresy automaticky změní, což umožňuje, aby jednotlivé kusy spamu byly přímo a přesvědčivě přiřazeny k IP adrese robotů, kteří získávali adresy z vašich stránek. IP adresa, kterou robot použil k prohlížení vašich stránek, je automaticky předána provozovatelům černé listiny. Odkaz na falešný „komentář“ nebo „knihu návštěv“ je často skrytý jako past do robotů, kteří odesílají spam do webových formulářů. Viz Honeypot (computing).

Jakmile bude adresa spammeru známa, bude přidána na černé listiny (viz výše), takže vy i ostatní budete mít v budoucnu na svých stránkách o jednoho nežádoucího robotického návštěvníka méně.

Zatímco skripty a servery černé listiny mohou automatizovat většinu úkolů identifikace a řešení spambotových IP adres, většina webů na černé listině poskytuje odkazy na webové stránky, na kterých lze ručně vyhledat informace o IP adrese nebo nahlásit zneužívající IP jako spamboty. Může být vhodné zahrnout některé z těchto odkazů na speciální: blokové stránky vaší wiki pro pohodlí administrátorů vašeho webu.

Další seznamy proxy a spambotů IPs

Zpravidla zadáním adresy libovolného robota nebo otevřeného serveru proxy do vyhledávače se vrátí mnoho seznamů, na kterých byly tyto zneužívající adresy IP již nahlášeny.

V některých případech budou tyto seznamy součástí antispamových webů. V jiných bude web obhajující používání otevřených proxy obsahovat nejen proxy, který byl zneužíván k spamování vaší instalace wiki, ale stovky dalších proxy serverů, také otevřených pro zneužití. Je také možné blokovat registrace wiki z anonymizovaných zdrojů, jako je Tor proxy (Tor Project - torproject.org), od uživatelů bugmenotů nebo z e-mailových adres (uvedených na undisposable.net) určených pouze pro jednorázové použití.

Seznamy blacklistů najdete také v Blacklists Compared - 1 March 2008 a spamfaq.net. Nezapomeňte, že seznamy určené ke snižování množství nevyžádaných e-mailů, pokud jsou nainstalovány, aby blokovaly spam na wiki nebo jiných webových formulářích, generují mnoho falešných poplachů. Automatické použití seznamu, který například zablokuje všechny známé bloky IP adres dynamického uživatele, může způsobit, že vaše wiki nebude použitelná.

Propojení na blacklistové weby IP ze stránky Special:Blockip vaší wiki (jako výhodu pro administrátory, kteří chtějí ručně zkontrolovat, zda je problémová adresa již známým 'botem'):

  1. Přidejte jeden řádek do LocalSettings.php a nastavte: $wgNamespacesWithSubpages $code $wgNamespacesWithSubpages [NS_SPECIAL] = true;
  2. Přidejte následující text do MediaWiki:Blockiptext, který chcete zobrazit: "Check this IP at [http://whois.domaintools.com/{{SUBPAGENAME}} Domain Tools], [http://openrbl.org/?i={{SUBPAGENAME}} OpenRBL], [http://www.projecthoneypot.org/ip_{{SUBPAGENAME}} Project Honeypot], [http://www.spamcop.net/w3m?action=checkblock&ip={{SUBPAGENAME}} Spam Cop], [http://www.spamhaus.org/query/bl?ip={{SUBPAGENAME}} Spamhaus], [http://www.stopforumspam.com/ipcheck/{{SUBPAGENAME}} Stop Forum Spam]."

Na stránku, ze které administrátoři žádají o zablokování IP, přidá pozvánku na „zkontrolovat tuto IP adresu: Domain Tools, OpenRBL, Project Honeypot, Spam Cop, Spamhaus, Stop Spam Forum“. IP adresa je dostačující informace pro komentáře k Project Honeypot proti spambotům. Stop Forum Spam je méně vhodný pro hlášení problémů anon-IP, protože vyžaduje uživatelské jméno, IP a e-mail, pod kterým se problémový robot pokouší zaregistrovat na vašich stránkách. Zásady a možnosti jiných webů souvisejících s černými listinami se mohou lišit.

Upozorňujeme, že blokování adresy odesílání spamu na váš web není stejné jako blokování adres URL specifickými externími odkazy, které jsou spammed v upraveném textu. Udělejte obojí. Oba přístupy se používají v kombinaci, jako prostředek k doplnění (ale nikoli nahrazení) dalších nástrojů proti spamu, jako jsou titul nebo blacklisty uživatelských jmen a testy, které se pokoušejí určit, zda je editace prováděná člověkem nebo robotem (captchas, Bad Behavior nebo Akismet) mohou být velmi efektivní prostředky k oddělení spambotů od skutečných, živých lidských návštěvníků.

Pokud spam vyhrál bitvu

Stále můžete vyhrát válku! MediaWiki vám k tomu nabízí nástroje. Prostě upevněte své pozice, dokud nebudete připraveni znovu zaútočit. Viz Manual:Combating vandalism , a zejména Cleaning up, Restrict edit.

Další nástroje bez podpory MediaWiki najdete v části Externí odkazy.

Další nápady

Tato stránka obsahuje seznam funkcí, které jsou aktuálně zahrnuty nebo dostupné jako záplaty. Na diskusní stránce najdete mnoho dalších nápadů pro funkce, které by mohly být přidány MediaWiki nebo které jsou ve vývoji.

Viz též

Rozšíření

  • AbuseFilter — allows edit prevention and blocking based on a variety of criteria
  • Bad Behavior
  • A slimmed down ConfirmAccount can be used to moderate new user registrations, (doesn't require captchas).
  • CheckUser — allows, among other things, the checking of the underlying IP addresses of account spammers to block them. Allows mass-blocking of spammers from similar locations.
  • FlaggedRevs
  • SpamRegex — allows basic blocking of edits containing spam domains with a single regex
  • StopForumSpam — allows for checking edits against the StopForumSpam service and allows for submitting data back to it when blocking users.
  • Category:Spam management extensions — category exhaustively listing spam management extensions
  • Moderation — don't show edits to normal users until approved by a moderator. This extension has the advantage that spam links are never shown to the public, so not creating incentive to post spam.

Useful only on some wiki farms:

Commercial services:

Seskupené v instalačním programu

Standardní tarball dostupný pro download nyní obsahuje většinu hlavních anti-spam rozšíření, včetně následujících:

  • ConfirmEdit — adds various types of CAPTCHAs to your wiki
  • Nuke — removes all contributions by a user or IP
  • SpamBlacklist — prevents edits containing spam domains, list is editable on-wiki by privileged users

Nastavení

Externí odkazy

  1. Příklad: «Automaticky řeší captchas: GSA Captcha Breaker + Mega Ocr (řeší Recaptcha!)» Říká senukexcr.
  2. Například Section 508 Standards for Electronic and Information Technology