Příručka:Boj proti spamu
Podobně jako všechny současné dynamické webové stránky, jsou wiki běžným cílem pro spamery, kteří chtějí propagovat produkty nebo webové stránky. MediaWiki nabízí řadu funkcí určených k boji proti vandalismu obecně. Na této stránce se konkrétně zabýváme wiki spamem, který je často automatizovaný.
Přehled
Běžné nástroje používané v boji proti spamu wiki obvykle spadají do těchto kategorií:
- Vyžadování přihlášení a nebo CAPTCHA u určitých operací, jako jsou úpravy, přidávání externích odkazů nebo vytváření nových uživatelů
- Blokování úprav ze známých IP adres ze seznamu zakázaných nebo z adres IP, na nichž běží otevřené servery proxy
- Blokování úprav, které přidávají konkrétní nechtěná klíčová slova nebo externí odkazy
- Blokování specifických vzorů uživatelského jména a názvu stránky, které spamboty běžně používají
- Blokování úprav novými nebo anonymními uživateli na konkrétních často cílených stránkách
- Whitelisting (seznam povolených) známých editorů (jako jsou administrátoři, pravidelní přispěvatelé) a zároveň omezení pro nové nebo anonymní uživatele
- Vyčištění skriptů nebo hromadné mazání (Extension:Nuke ) stávajících příspěvků z nedávno zakázaných spambotů
Běžně se používá kombinace různých metod ve snaze udržet počet úprav spamu, robotů a otevřených proxy na minimu a zároveň omezit míru narušení způsobeného legitimním uživatelům webu.
Mnoho těchto funkcí není ve výchozím nastavení aktivováno. Pokud na serveru nebo hostiteli instalujete instalaci MediaWiki, pak jste jediný, kdo může provést potřebné změny konfigurace! V každém případě požádejte své uživatele, aby vám pomohli hlídat spam na wiki (a udělejte to sami), ale v dnešní době může spam snadno přemoci malé wiki komunity. Pomáhá trochu zvýšit tlak. Také byste si měli uvědomit, že žádné z těchto řešení nelze považovat za zcela odolné proti spamu. Efektivní praxí je pravidelně kontrolovat "Poslední změny" (Special:RecentChanges).
Nejrychlejší řešení nejprve vyzkoušejte
Boj proti spamu by neměl být příliš tvrdý. Pokud chcete rychle a výrazně omezit spam, zkuste nejprve tyto kroky.
- Nainstalujte rozšíření StopForumSpam a zablokujte známé adresy IP spamu.
- Nainstalujte a nastavte základní rozšíření antivandalismu (již bylo dodáno s poslední verzí). Zejména Rozšíření:ConfirmEdit .
- Nakonfigurujte QuestyCaptcha a v případě potřeby změňte výchozí nastavení pro vaši wiki.
- Zapněte $wgDnsBlacklistUrls , což může být použito pro blokování specifických akcí, jako editování či zakládání účtů, pro open proxy, servery sítě Tor či VPN.
Pokud problémy přetrvávají, přečtěte si další část této stránky, kde najdete další řešení, a pošlete zprávu na mediawiki-l.
Základy nastavení antispamu
CAPTCHA
Jednou z běžnějších metod vyřazování automatických podání je použití CAPTCHA. Systému, který se snaží odlišit lidi od automatizovaných systémů tím, že požádá uživatele, aby vyřešil úkol, který je pro stroje obtížný. Rozšíření ConfirmEdit pro MediaWiki poskytuje rozšiřitelný rámec CAPTCHA, který lze spustit na řadě událostí, včetně
- všech úprav
- úprav přidávajících nové, nerozpoznané externí odkazy
- registrace uživatele
Rozšíření se dodává se standardním testem, jedná se však o referenční implementaci a není určeno k produkčnímu použití. Operátorům wiki, kteří instalují ConfirmEdit na veřejné wiki, se doporučuje používat jeden z modulů CAPTCHA obsažených v rozšíření (celkem jich je pět).
Nejodolnější CAPTCHA, které jsou dnes k dispozici, jsou vaše vlastní otázky QuestyCaptcha. Přizpůsobte je přímo publiku vaší wiki a pravidelně je aktualizujete. ReCaptcha je v současné době poražen většinou spammerů [1]; Asirra CAPTCHA, která žádá uživatele, aby rozlišil kočky a psy, je pro uživatele obzvláště nepříjemná, ale může být účinná.
Je důležité si uvědomit, že CAPTCHA mohou blokovat nejenom nežádoucí roboty. Pokud skript není schopen projít CAPTCHA, pak to také může být čtečka obrazovky nebo jiný software nebo pomoc používaná nevidomými nebo zrakově postiženými. Jednou z možností v CAPTCHA, widgetu "reCAPTCHA", je v takových případech alternativní zvukový CAPTCHA - ale někteří uživatelé počítačů selhávají při testech poslechu a čtení, takže to není úplně dobré řešení. Měli byste zvážit důsledky takové překážky a případně poskytnout alternativní prostředky pro postižené uživatele k vytváření účtů a přispívání, což je v některých jurisdikcích zákonný požadavek.[2]
Vaše wiki také nebude zcela chráněna proti spamu. Spameři platí asi $0,80 až $1,20 za každých 1 000 vyřešených CAPTCHA společnostem zaměstnávajícím lidské řešitele v Bangladéši, Číně, Indii a mnoha dalších rozvojových zemích."[3] Z tohoto důvodu by měl být kombinován s jinými mechanismy.
rel="nofollow"
Ve výchozí konfiguraci MediaWiki přidává rel="nofollow"
k externím odkazům na stránkách wiki, což znamená, že jsou dodávány uživatelem. Mohou obsahovat spam. Proto by neměly být používány k ovlivňování algoritmů pro hodnocení stránek.
Populární vyhledávače jako Google tento atribut respektují.
Toto chování můžete vypnout na celém webu pomocí $wgNoFollowLinks nebo na základě jmenného prostoru pomocí konfigurační proměnné $wgNoFollowNsExceptions .
Samotné použití atributu rel="nofollow"
nezastaví spammery pokoušející se přidat marketing na stránku, ale alespoň jim zabrání v tom, aby těžili ze zvýšeného hodnocení stránky. Víme jistě, že to někteří kontrolují.
Nikdy by se však na něj nemělo spoléhat jako na primární metodu kontroly spamu, protože jeho účinnost je ze své podstaty omezená.
Nezadržuje spam mimo vaše stránky.
Viz NoIndexHistory. Všimněte si, že jeho umístění na všechny externí odkazy je poměrně těžká taktika proti spamu, kterou se můžete rozhodnout nepoužít (vypněte možnost rel=nofollow). Debatu o tom najdete na stránce Nofollow. Je však dobré mít toto jako výchozí instalaci. To znamená, že líní správci, kteří nepřemýšlejí o problémech se spamem, budou mít tendenci mít tuto možnost povolenou. Pro další informace navštivte Manual:nofollow
Rutina antispamu: opatření na míru
Každý spammer je jiný. I když všichni vypadají nudně podobně. Pokud obecná protiopatření nestačí, použijte před extrémními kroky nástroje, které vám umožní řešit konkrétní problémy, které máte.
Ochrana jednotlivých stránek
Spamboty často opakovaně zasáhnou stejnou stránku. Běžné vzory pozorované u pagenů vytvořených pomocí spambotů zahrnují diskusní stránku, často mimo hlavní prostor (např. Category_talk: jsou málo používány, takže si vytvoří společné cíle) a další diskusní stránky.
Nejvíce jsou zneužívány úpravy na wiki, které k úpravám nevyžadují registraci. Pocházejí z anonymních zdrojů. Blokováním úprav na těchto konkrétních stránkách, komukoli jinému než zavedeným uživatelům, může zabránit opětovnému vytvoření spamových výpisů. Obvykle je dobrým kandidátem na ochranu stránky jakákoli stránka, která je již pravidelným návštěvníkem special:log/delete na jednotlivé wiki.
- Poloochrana jednotlivých stránek.
- Navíc to lze zkombinovat se změnou minimálních požadavků pro MediaWiki, aby bylo možné identifikovat uživatele jako 'autoconfirmed' (automaticky potvrzené).
- Je možné použít kaskádovou ochranu na jednu nebo více stránek, které obsahují odkazy na nejčastěji spamované stránky. Tento trik lze také použít k vytvoření užitečného seznamu pro použití administrátory.
Filtr proti zneužívání
Rozšíření:AbuseFilter (filtr proti zneužití) umožňuje privilegovaným uživatelům vytvářet pravidla zacílená na konkrétní typ spamu, který vaše wiki přijímá. Může pomoci automaticky zabránit akci nebo blokovat uživatele.
Může prozkoumat mnoho vlastností úprav. Například uživatelské jméno, věk uživatele, přidaný text, přidané odkazy atd. Nejúčinnější je v případech, kdy máte jednoho nebo více kvalifikovaných administrátorů, kteří jsou ochotni vám pomoci v boji proti spamu. Filtr zneužití může být účinný i proti spammerům podporovaným člověkem, ale vyžaduje nepřetržitou údržbu, aby reagoval na nové typy útoků.
Příklady boje proti automatickému spamu lze nalézt v Manual:Combating spam/AbuseFilter examples .
Seznam spamů (SpamBlacklist)
Výše uvedený přístup bude příliš těžkopádný, pokud se pokusíte blokovat větší množství spamových adres URL. Lepším přístupem je dlouhá černá listina identifikující mnoho známých spamových adres URL.
Populární rozšíření pro MediaWiki je rozšíření SpamBlacklist , které blokuje úpravy, které přidávají na stránky adresy URL uvedené na černé listině: Umožňuje vytvoření takovéhoto seznamu na wiki s pomocí privilegovaných uživatelů a umožňuje použití seznamů získaných z externích zdrojů (ve výchozím nastavení , používá rozsáhlý m:Spam blacklist).
Rozšíření TitleBlacklist (̝černá listina spamů) může být také užitečné, jako prostředek k zabránění opětovného vytvoření konkrétních skupin stránek, které používají roboty k výpisu odkazových spamů.
Otevřené proxy
Otevřený server proxy je nebezpečný zejména proto, že se používá jako způsob, jak obejít protiopatření zaměřená na konkrétního narušitele. Viz také Žádné otevřené servery proxy.
Existují někteří roboti, např. na Wikimedia wikis, detekující a blokující otevřené IP proxy. Jejich kód často není veřejný. Většina takových bloků, když si všimnete zneužití, se provádí ručně. Je proto důležité vědět, zda zneužívající IP je otevřený proxy server nebo něco jiného, aby se rozhodlo, jak se s tím vypořádat. Zejména, pokud se jedná o adresu IP používanou registrovaným uživatelem, získanou pomocí rozšíření CheckUser .
Několik rozšíření, zejména rozšíření Tor block , blokuje řadu otevřených proxy serverů.
Od verze 1.22 je k dispozici $wgApplyIpBlocksToXff , pro zvýšení účinnosti bloků.
Tvrdá opatření
Následující opatření jsou určena pro technicky zdatnější systémové správce, kteří vědí, co dělají: Je těžší je správně nastavit a monitorovat. Pokud jsou implementovány špatně, mohou být příliš staré na to, aby byly stále účinné, nebo dokonce pro vaši wiki kontraproduktivní.
$wgSpamRegex
MediaWiki poskytuje prostředky k filtrování textu úprav za účelem blokování nežádoucích doplňků prostřednictvím konfigurační proměnné $wgSpamRegex
.
Můžete ji použít k blokování dalších úryvků textu nebo značek spojených s běžnými útoky na spam.
Obvykle se používá k vyloučení adres URL (nebo částí adres URL), na které nechcete uživatele odkazovat. Uživatelé dostanou vysvětlující zprávu uvádějící, která část jejich upravovaného textu není povolena. Rozšíření:SpamRegex umožňuje editaci této proměnné na wiki.
$wgSpamRegex = "/online-casino|buy-viagra|adipex|phentermine|adult-website\.com|display:none|overflow:\s*auto;\s*height:\s*[0-4]px;/i";
Tím se zabrání jakékoli zmínce o 'online kasinu' nebo 'buy-viagra' nebo 'adipex' nebo 'phentermine'. '/i' na konci způsobí, že na případné vyhledávání nebude citlivý. Blokuje také úpravy, které se pokouší přidat skryté nebo přetékající prvky, což je běžný "trik" používaný při mnoha hromadných útocích, které se pokouší skrýt spam před diváky.
Změny konfigurace Apache
Kromě změny konfigurace MediaWiki, pokud používáte MediaWiki na Apache, můžete provést změny v konfiguraci webového serveru Apache, abyste zabránili spamu. Tato nastavení jsou obvykle umístěna do konfiguračního souboru virtuálního hostitele nebo do souboru s názvem .htaccess na stejném místě jako LocalSettings.php (Upozorňujeme, že pokud máte sdíleného webového hostitele, musí povolit AllowOverride, aby vám umožnil použití souboru .htaccess).
Filtrování podle agenta uživatele
Když na své wiki zablokujete spamera, prohledejte protokol přístupu svého webu podle IP adresy a zjistěte, který řetězec uživatelského agenta daná IP adresa poskytla. Například:
grep ^195.230.18.188 /var/log/apache2/access.log
Umístění protokolu přístupu pro vašeho virtuálního hostitele se obecně nastavuje pomocí direktivy CustomLog. Jakmile najdete přístupy, uvidíte několik řádků, jako je tento:
195.230.18.188 - - [16/Apr/2012:16:50:44 +0000] "POST /index.php?title=FlemmingCoakley601&action=submit HTTP/1.1" 200 24093 "-" ""
Uživatelský agent je poslední řetězec v uvozovkách na řádku, v tomto případě prázdný řetězec.
Někteří odesílatelé spamu budou používat řetězce uživatelských agentů používané skutečnými prohlížeči, zatímco jiní budou používat chybně naformátované nebo prázdné řetězce uživatelských agentů.
Pokud spadají do druhé kategorie, můžete je zablokovat přidáním tohoto do souboru .htaccess
(upraveno z této stránky):
SetEnvIf User-Agent ^regular expression matching user agent string goes here$ spammer=yes Order allow,deny allow from all deny from env=spammer
Tím se vrátí chyba 403 Zakázané na jakoukoli adresu IP s uživatelským agentem, který odpovídá zadanému regulárnímu výrazu. Dbejte na to, abyste v řetězci uživatelského agenta vynechali všechny nezbytné znaky regulárního výrazu, například . ( ) - se zpětnými lomítky (\). Chcete-li spárovat prázdné uživatelské agenty, stačí použít "^$".
I když je řetězec agenta spammeru používán skutečnými prohlížeči, pokud je starý nebo málokdy se vyskytující, můžete použít pravidla přepsání k přesměrování uživatelů na chybovou stránku a doporučit jim, aby aktualizovali svůj prohlížeč:
RewriteCond %{HTTP_USER_AGENT} "Mozilla/5\.0 \(Windows; U; Windows NT 5\.1; en\-US; rv:1\.9\.0\.14\) Gecko/2009082707 Firefox/3\.0\.14 \(\.NET CLR 3\.5\.30729\)" RewriteCond %{REQUEST_URI} !^/forbidden/pleaseupgrade.html RewriteRule ^(.*)$ /forbidden/pleaseupgrade.html [L]
Zabránění blokovaným spammerům ve spotřebovávání zdrojů
Trvalý spammer nebo ten s poškozeným skriptem se může i nadále pokoušet spamovat vaši wiki poté, co byla zablokována, a zbytečně tak spotřebovávat zdroje. Přidáním pragmy deny from, jako je následující, do souboru .htaccess
, můžete jim zabránit v načítání stránek vůbec a místo toho vrátit 403 Zakázaná chyba:
Order allow,deny allow from all deny from 195.230.18.188
Černé seznamy adres IP
Většina nejproblematičtějších spamů přijímaných na webech MediaWiki pochází z adres, které ostatní webmasteři dlouho nazývají bot nebo otevřené proxy servery, ačkoli pro to existují pouze neoficiální důkazy. Tito roboti obvykle generují velké množství automatických registrací na webech fóra, komentují spam na blogu a vandalismus na stránkách wikin: Nejčastěji linkspam, ačkoli existující obsah je někdy prázdný, doplněný náhodnými blábolícími znaky nebo upravován takovým způsobem, aby rozbil stávající text Unicode.
Poměrně jednoduchý CAPTCHA může problém významně snížit, protože může blokovat vytvoření určitých často nevyžádaných stránek. Tato opatření však problém nevylučují a zpřísnění bezpečnosti pro všechny uživatele v určitém okamžiku způsobí nepohodlí legitimních přispěvatelů.
Může být vhodnější namísto spoléhání se výhradně na CAPTCHA nebo jiná preventivní opatření, která ovlivňují všechny uživatele, zaměřit se konkrétně na IP adresy, o nichž již ostatní mistři stránek vědí, že jsou útočištěm net.abuse. Mnoho seznamů je již k dispozici, například 200 000 obsahuje seznam "All IPs in CSV" (všech IP v CSV), který (od února 2012) obsahuje asi 200 000 IP známých spambotů.
Využití procesoru CPU a přetížení
Uvědomte si, že když se při pokusech o úpravy nebo zobrazení stránek provádí mnoho kontrol, roboti mohou snadno přetížit vaši wiki a narušit ji více, než pokud by nebyla chráněna. Sledujte náklady na ochranu svých zdrojů.
DNSBL
Můžete nastavit MediaWiki, aby zkontrolovala každou editovací IP adresu proti jednomu nebo více DNSBL (blacklistům založeným na DNS), což nevyžaduje žádnou údržbu, ale mírně zvyšuje latenci úprav. Například můžete přidat tento řádek do LocalSettings.php a blokovat tak mnoho otevřených proxy serverů a známých spammerů:
$wgEnableDnsBlacklist = true;
$wgDnsBlacklistUrls = array( 'xbl.spamhaus.org', 'dnsbl.tornevall.org' );
Podrobnosti o těchto DNSBL naleznete na stránce Spamhaus: XBL a dnsbl.tornevall.org. Seznam DNSBL naleznete na stránce Porovnání černých listin DNS. Více na stránce Příručka:$wgEnableDnsBlacklist , Příručka:$wgDnsBlacklistUrls .
$wgProxyList
Proměnnou $wgProxyList
můžete nastavit na seznamu IP, které chcete zakázat.
Tento lze pravidelně naplňovat z externího zdroje pomocí skriptu cron, jako je například následující:
#!/bin/bash
cd /your/web/root
wget https://www.stopforumspam.com/downloads/listed_ip_30_ipv46.gz
gzip -d listed_ip_30_ipv46.gz
cat > bannedips.php << 'EOF'
<?php
$wgProxyList = array(
EOF
sed -e 's/^/ "/; s/$/",/' < listed_ip_30_ipv46 >> bannedips.php
printf '%s\n' '");' >> bannedips.php
rm -f listed_ip_30_ipv46
Poté nastavíte v LocalSettings.php:
require_once "$IP/bannedips.php";
Možná budete chtít uložit tyto příkazy do souboru nazvaného např. updateBannedIPs.sh
, takže jej můžete spouštět pravidelně.
Můžete také použít řešení pouze pro PHP (PHP-only) a stáhnout ip-list ze stopforumspamu. Za tímto účelem zkontrolujte dostupný skript PHP zde.
Pokud tak učiníte a pro ukládání do mezipaměti používáte mezipaměť APC, možná budete muset zvýšit velikost apc.shm_size ve vašem php.ini, abyste se přizpůsobili tak velkému seznamu.
Právě jste zakázali sto čtyřicet tisíc spammerů. Doufejme, že to nebude mít žádný rušivý účinek na vaše legitimní uživatele. Řekli jste "adieu" mnoha nejhorším známým spammerům na internetu. Dobrý riddance! To by mělo problém trochu uklidnit. Alespoň na chvíli…
Honeypoty, DNS BLs a HTTP BLs
140 000 mrtvých spammerů. Není to špatné, ale jakýkoli správný Bastard Operator From Hell (BOFH) (bastard operátor z pekla) by se v tuto chvíli nudil a dychtivě by hledal 140 001 IP spamů, který by se náhodně zablokoval. A proč ne?
Naštěstí jsou k dispozici dynamicky aktualizované seznamy spambotů, otevřených proxy serverů a dalších problémových IP adres. Mnohé také umožňují automatickou kontrolu uživatelských jmen nebo emailových adres (pro přihlášené uživatele) proti stejným blacklistům.
Jednou formou černé listiny, kterou mohou správci MediaWiki znát, je DNS BL. Seznam serverů DNS hostovaný na serveru doménových jmen je databáze adres IP. Hledání adresy určuje, zda IP, která se pokouší zaregistrovat nebo upravit, je již známým zdrojem zneužití sítě.
Možnosti $wgEnableDnsBlacklist
a $wgDnsBlacklistUrls
v MediaWiki poskytují primitivní příklad přístupu k černé listině DNS.
Nastavte následující nastavení v LocalSettings.php a IP adresy uvedené jako HTTP spam jsou blokovány:
$wgEnableDnsBlacklist = true;
$wgDnsBlacklistUrls = array( 'xbl.spamhaus.org', 'opm.tornevall.org' );
Černá listina DNS funguje takto:
- Wiki obdrží žádost o úpravu nebo registraci nového uživatele z nějaké náhodné adresy IP (například ve formátu '123.45.67.89').
- Čtyři bajty IP adresy jsou umístěny v obráceném pořadí, poté následuje název požadovaného serveru černé listiny DNS.
- Výsledná adresa je vyžadována ze serveru pro doménové jméno (v tomto příkladu '89.67.45.123.zen.spamhaus.org.' a '89.67.45.123.dnsbl.tornevall.org.').
- Server není nalezen (NXDOMAIN), pokud adresa není na černé listině. Pokud je na některém z blacklistů, je úprava blokována.
Vyhledávání v externě hostované černé listině obvykle přidává ne více než několik sekund k času potřebnému k uložení úprav.
Na rozdíl od nastavení $wgProxyKey
, které musí být načteno na každé stránce čtené nebo zapisované, se použití černé listiny DNS provádí pouze během registrace nebo úprav stránek.
Tím není ovlivněna rychlost, jakou může systém obsluhovat požadavky na čtení stránky (většinu vašeho provozu).
Zatímco původní SORBS byl primárně určen pro řešení otevřených webových proxy a emailového spamu, existují i jiné seznamy specifické pro webový spam (fóra, komentáře k blogům, úpravy wiki), které mohou být proto vhodnější:
- .opm.tornevall.org. funguje velmi podobným způsobem jako SORBS DNSBL, ale zacílí na otevřené proxy a spam ve webové podobě. Většina jeho obsahu je konsolidována z jiných existujících seznamů zneužívajících IP.
- .dnsbl.httpbl.org. se konkrétně zaměřuje na roboty, kteří shromažďují emailové adresy z webových stránek pro hromadné seznamy emailů, zanechávají komentářový spam nebo se pokoušejí ukrást hesla pomocí útoků ze slovníku. Vyžaduje uživatelský registr u projecthoneypot.org pro 12místný klíč API. Pokud by tento klíč (například) byl 'myapitestkey', vyhledávání by jinak vypadalo jako '89.67.45.123.http.dnsbl.sorbs.net.' nebo '89.67.45.123.opm.tornevall.org.' bude muset být 'myapitestkey.89.67.45.123.dnsbl.httpbl.org.'.
- Seznamy povolených webů mohou identifikovat emailové adresy a informace o uživateli spamu i přes jednoduchou adresu IP, ale neexistuje standardní formát pro odpověď ze serveru se seznamem HTTP. Například žádost o http://botscout.com/test/?ip=123.45.67.89 by vrátila "Y|IP|4", pokud je adresa na černé listině ('N' nebo prázdná, pokud je v pořádku), zatímco webová žádost o http://www.stopforumspam.com/api?ip=123.45.67.89 by vrátila "ip yes 2009-04-16 23:11:19 41" pokud je adresa na blacklistu (čas, datum a počet lze ignorovat) nebo prázdná, pokud je adresa v pořádku.
Bez jediného standardního formátu, kterým server černé listiny odpovídá na dotaz, neexistuje v balíčku MediaWiki integrovaná podpora pro většinu online seznamů známých spambotů.
Od rev:58061 bylo MediaWiki schopno kontrolovat více DNSBL definováním $wgDnsBlacklistUrls
jako pole.
Většina operátorů černých listin poskytuje velmi omezenou softwarovou podporu (často cílenou na aplikace jiné než wiki, jako je phpBB nebo Wordpress). Protože stejné spamboty vytvářejí podobné problémy na většině webů s otevřeným obsahem, nejhorší pachatelé útočící na weby MediaWiki budou také usilovně cílit na tisíce webů bez wiki se spamem v komentářích blogu, příspěvcích na fóru a v knihách návštěv.
Automatický dotaz na více webů na černé listině je proto již široce používán při ochraně různých jiných forem webů s otevřeným obsahem a jména spambotů, řad a IP adres jsou již nyní příliš dobře známá. Zdá se, že za velkým procentem celkového problému je relativně malý počet spambotů. I v případě, že administrátoři nepřijímají zajatce, existuje vzor, ve kterém stejná spambotová IP, která před sekundou zveřejnila linkspam na wiki, spamuje blogové komentáře někde jinde a bude mít spamovací příspěvky na fóru pár sekund od nynějška na místě vzdáleném půl světa. To si pořádně zapamatujte. Jeden sdílený externí záznam na černé listině může umlčet jednoho problematického robota od zveřejnění na tisících webů.
Tím se výrazně snižuje počet jednotlivých IP adres, které je třeba ručně blokovat a to vždy na jedné wiki a na jednom fóru, místními administrátory.
Ale co je to s honeypoty?
Některé weby zabývající se nevyžádanou poštou, například projecthoneypot.org, poskytují kód, kterým jste vyzváni k zahrnutí na své vlastní webové stránky.
Stránky obvykle obsahují jednu nebo více jedinečných, náhodných a skrytých emailových adres nebo odkazů, které nejsou určeny pro vaše lidské návštěvníky, ale pro spamboty. Při každém zobrazení stránky se vložené adresy automaticky změní, což umožňuje, aby jednotlivé části spamu byly přímo a přesvědčivě přiřazeny k IP adrese robotů, kteří získávali adresy z vašich stránek. IP adresa, kterou robot použil k prohlížení vašich stránek, je automaticky předána provozovatelům černé listiny. Odkaz na falešný 'komentář' nebo 'knihu návštěv' je často skrytý jako past do robotů, kteří odesílají spam do webových formulářů. Viz Honeypot (počítačový).
Jakmile bude adresa spammeru známa, bude přidána na černé listiny (viz výše), takže vy i ostatní budete mít v budoucnu na svých stránkách o jednoho nežádoucího robotického návštěvníka méně.
Zatímco skripty a servery černé listiny mohou automatizovat většinu úkolů identifikace a řešení spambotových IP adres, většina webů na černé listině poskytuje odkazy na webové stránky, na kterých lze ručně vyhledat informace o IP adrese nebo nahlásit zneužívající IP jako spambot. Může být vhodné zahrnout některé z těchto odkazů na speciální: Blokové stránky vaší wiki pro pohodlí administrátorů vašeho webu.
Další seznamy proxy a spambotů IPs
Zpravidla zadáním adresy libovolného robota nebo otevřeného proxy serveru do vyhledávače se vrátí mnoho seznamů, na kterých byly tyto zneužívající adresy IP již nahlášeny.
V některých případech budou tyto seznamy součástí antispamových webů. V jiných bude web obhajující používání otevřených proxy obsahovat nejen proxy, který byl zneužíván k spamování vaší instalace wiki, ale stovky dalších proxy serverů, také otevřených pro zneužití. Je také možné blokovat registrace wiki z anonymizovaných zdrojů, jako je Tor proxy (Tor Project - torproject.org), falešný účet od uživatelů bugmenotů nebo z emailových adres (uvedených na undisposable.net) určených pouze pro jednorázové použití.
Seznamy blacklistů najdete také v Blacklists Compared - 1 March 2008 a spamfaq.net. Nezapomeňte, že seznamy určené ke snižování množství nevyžádaných emailů, pokud jsou nainstalovány, aby blokovaly spam na wikinách nebo jiných webových formulářích, generují mnoho falešných poplachů. Automatické použití seznamu, který například zablokuje všechny známé bloky IP adres dynamického uživatele, může způsobit, že vaše wiki nebude použitelná.
Propojení na blacklistové weby IP ze stránky Special:Blockip vaší wiki (jako výhodu pro administrátory, kteří chtějí ručně zkontrolovat, zda je problémová adresa již známým botem):
- Přidejte jeden řádek do LocalSettings.php a nastavte:
$wgNamespacesWithSubpages [NS_SPECIAL] = true;
- Přidejte následující text do MediaWiki:Blockiptext, který chcete zobrazit:
- "
Check this IP at [http://whois.domaintools.com/{{SUBPAGENAME}} Domain Tools], [http://openrbl.org/?i={{SUBPAGENAME}} OpenRBL], [http://www.projecthoneypot.org/ip_{{SUBPAGENAME}} Project Honeypot], [http://www.spamcop.net/w3m?action=checkblock&ip={{SUBPAGENAME}} Spam Cop], [http://www.spamhaus.org/query/bl?ip={{SUBPAGENAME}} Spamhaus], [http://www.stopforumspam.com/ipcheck/{{SUBPAGENAME}} Stop Forum Spam].
"
- "
Na stránku, ze které administrátoři žádají o zablokování IP, přidá pozvánku na "zkontrolovat tuto IP adresu: Domain Tools, OpenRBL, Project Honeypot, Spam Cop, Spamhaus, Stop Spam Forum". IP adresa je dostačující informace pro komentáře k Project Honeypot proti spambotům. Stop Forum Spam je méně vhodný pro hlášení problémů anon-IP, protože vyžaduje uživatelské jméno, IP a email, pod kterým se problémový robot pokouší zaregistrovat na vašich stránkách. Zásady a možnosti jiných webů souvisejících s černými listinami se mohou lišit.
Upozorňujeme, že blokování adresy odesílání spamu na váš web není stejné jako blokování adres URL specifickými externími odkazy, které jsou spammovány v upraveném textu. Udělejte obojí. Oba přístupy se používají v kombinaci, jako prostředek k doplnění (ale nikoli nahrazení) dalších nástrojů proti spamu, jako jsou titul nebo blacklisty uživatelských jmen a testy, které se pokoušejí určit, zda je editace prováděná člověkem nebo robotem (captchas nebo akismet) mohou být velmi efektivní prostředky k oddělení spambotů od skutečných, živých lidských návštěvníků.
Pokud spam vyhrál bitvu
Stále můžete vyhrát válku! MediaWiki vám k tomu nabízí nástroje. Prostě upevněte své pozice, dokud nebudete připraveni znovu zaútočit. Viz Příručka:Boj proti vandalismu , a zejména Čištění, Omezení úprav.
Další nástroje bez podpory MediaWiki najdete v části Externí odkazy.
Další nápady
Tato stránka obsahuje seznam funkcí, které jsou aktuálně zahrnuty nebo dostupné jako záplaty. Na diskusní stránce najdete mnoho dalších nápadů pro funkce, které by mohly být přidány MediaWiki nebo které jsou ve vývoji.
Související odkazy
- Manual:Combating vandalism obsahuje obecnější rady
- Manual:Preventing access
- Manual:User rights
- Spam Filter
- Manual:BlockedExternalDomains
- Zpráva na našem mailing listu o úspěšném nastavení, které zabraňuje spamu a umožňuje úpravy neregistrovaným uživatelům.
Rozšíření
- AbuseFilter — umožňuje prevenci a blokování úprav na základě různých kritérií
- Snížený ConfirmAccount lze použít k moderování registrací nových uživatelů (nevyžaduje captcha).
- CheckUser — umožňuje mimo jiné kontrolu základních IP adres spammerů účtů a jejich blokování. Umožňuje hromadné blokování spammerů z podobných míst.
- HoneyPot
- SpamRegex — umožňuje základní blokování úprav obsahujících spamové domény pomocí jediného regulárního výrazu
- StopForumSpam — umožňuje kontrolu úprav proti službě StopForumSpam a umožňuje do ní odesílat data zpět při blokování uživatelů.
- Category:Spam management extensions — kategorie vyčerpávajícím způsobem uvádějící rozšíření pro správu spamu
- Content approval extensions — nezobrazovat úpravy normálním uživatelům, dokud je neschválí moderátor.
Užitečné pouze na některých wiki farmách:
Komerční služby:
Seskupené v instalačním programu
Standardní tarball dostupný pro download nyní obsahuje většinu hlavních anti-spam rozšíření, včetně následujících:
- ConfirmEdit — přidává do vaší wiki různé typy CAPTCHA
- QuestyCaptcha — CAPTCHA na základě odpovědí na otázky
- Nuke — odstraní všechny příspěvky uživatele nebo IP
- SpamBlacklist — zabraňuje úpravám obsahujícím spamové domény, seznam je upravitelný na wiki pro privilegované uživatele
Nastavení
- Příručka:$wgDnsBlacklistUrls
- Příručka:$wgEmailConfirmToEdit
- Příručka:$wgEnableDnsBlacklist
- Příručka:$wgGroupPermissions
- Příručka:$wgProxyList
- Příručka:$wgSpamRegex
- Příručka:$wgApplyIpBlocksToXff
Externí odkazy
Poznámky pod čarou
- ↑ Příklad: «Automaticky řeší captchas: GSA Captcha Breaker + Mega Ocr (řeší Recaptcha!)» Říká user Senukexcr.
- ↑ Například Sekce 508 Standardy pro elektronické a informační technologie
- ↑ kdykoli od 25. dubna 2010 Spameři platí ostatním, aby odpovídali na bezpečnostní testy od Vikas Bajaj