Growth/Pozitivní posílení

This page is a translated version of the page Growth/Positive reinforcement and the translation is 90% complete.

Tato stránka popisuje práci týmu Growth na projektu "pozitivní posílení" jako součásti funkcí týmu Growth. Tato stránka obsahuje důležité podklady, návrhy rozhraní, otevřené otázky i rozhodnutí.

Více novinek týkající se práce týmu Growth najdete na obecné stránce s aktualizacemi. Závažné a větší aktuality pak budou vloženy i sem.

Současný stav

  • 2021-03-01: vytvoření projektové stránky
  • 2022-02-25: projekt zahájen, probíhá diskuse s členy týmu
  • 2022-03-01: rozšíření projektové stránky
  • 2022-05-11: diskuse s komunitou
  • 2022-08-12: dokončeno uživatelské testování
  • 2022-11-24: byly přidány aktuální návrhy a plán měření a experimentu
  • 2022-12-01: nový modul dopadu uvolněn do pilotních wikin
  • 2023-02-07: byla zahájena práce na zvyšování úrovně a přizpůsobení chvály a zahájena druhá komunitní diskuse
  • 2023-02-14: publikováno Nováčková úloha Milestone Analysis, která pomůže vést vyrovnávání práce
  • 2023-03-22: Vylepšení funkcí uvolněných jako A/B test na Growth pilotní wikiny
  • 2023-03-24: zveřejněno Děkujeme Analýza využití
  • 2023-05-25: uvolnil modul přizpůsobené chvály na pilotních wikinách Growth
  • 2023-10-01: vydala nový modul Impact na všech Wikipediích a zveřejnila Vyrovnání výsledků experimentu
  • Next: uvolněna personalizovaná chvála na všech Wikipediích

Shrnutí

Tým Growth se zaměřil na budování "soudržné zkušenosti pro nováčky", která nováčkům poskytuje "přístup" k prvkům, které jim pomáhají zapojit se do praktické komunity Wikipedie. Za pomocí editačních tipů jsme například nováčkům umožnili snadný přístup k přispívání do Wikipedie a pomocí mentorství jsme jim zpřístupnili možnost kontaktovat svého mentora. Editační tipy pomohly více nováčkům uložit svou první editaci. S tímto úspěchem v zádech jsme se rozhodli povzbudit nováčky, aby uložili ještě více editací. To vede naši pozornost k prvku, který je pro nováčky taktéž důležitý, a na kterém ještě nikdo nepracoval: Vyhodnocení úspěšnosti. Nazýváme tento projekt "pozitivní posílení".

Chceme, aby nováčci pochopili, že trvalé příspěvky na Wikipedii mají pokrok a hodnotu, čímž se zvýší zaháčkování pro ty uživatele, kteří udělali první krok při provádění úprav.

Jednou z otázek, kterou si klademe, je: Jakým způsobem můžeme povzbudit nováčky, kteří si vyzkoušeli svou Domovskou stránku, aby v editování neustávali a využít tak jejich energie?

Pozadí

Když byla Domovská stránka nováčka v roce 2019 poprvé nasazena, obsahovala základní verzi modulu Dopad, který zobrazuje počet návštěv článků upravených nováčkem. Toto je jediná část funkcí týmu Growth, které dávají nováčkovi jakoukoli zpětnou vazbu. Od té doby jsme tuto část Domovské stránky nijak nevylepšili.

 
Snímek obrazovky modulu Dopad na anglické Wikipedii

S tímto výchozím bodem jsme shromáždili několik důležitých poznatků o pozitivním posilování:

  • Od členů komunity jsme o modulu slyšeli dobrou zpětnou vazbu a zkušení redaktoři říkali, že je pro ně zajímavý a cenný.
  • Minulé výzkumy ukázaly, že ocenění od ostatních uživatelů zvyšují retenci uživatelů. Příkladem může být například děkování nováčkům za jejich editace (viz zde a zde). Dalším příkladem může být experiment, který proběhl na německé Wikipedii. Věříme, že ocenění od živých uživatelů budou mít větší účinek než ocenění odeslaná systémem.
  • Členové komunity vysvětlili, že je pro ně důležité, aby nováčci pokračovali se složitějšími úkoly, jakmile se naučí pracovat s těmi jednoduchými.
  • Další platformy, jako je Google, Duolingo nebo Github, používají několik metod pro pozitivní posílení, jako jsou odznaky či cíle.
  • Komunity se obávají toho, že by tento projekt mohl povzbudit nevhodné způsoby editování. Podobné chování jsme viděli v minulosti, když bylo v rámci editačních soutěží možné vyhrát finanční cenu, objevili se účastníci, kteří ukládali editace formálně vyhovující, ale i přesto problematické. Něco obdobného se také děje u rolí (například automatické schválení uživatele), které závisí pouze na počtu uložených editací.

Osobnost uživatele

 
Diagram cesty nováčka, který ukazuje příležitosti pro implementaci pozitivního posílení

Existuje mnoho částí cesty nováčka, ve kterých bychom se mohli pokusit zvýšit udržení. Mohli bychom se zaměřit na nováčky, kteří přestali upravovat po jedné nebo několika úpravách, nebo bychom se mohli zaměřit dále na nováčky, kteří přestali upravovat po týdnech aktivity. Pro tento projekt jsme se rozhodli zaměřit na ty nováčky, kteří dokončili svou první editační relaci a které chceme vrátit na druhou relaci. Diagram je znázorňuje žlutou hvězdou.

Chceme se soustředit na nováčky na tomto místě, protože to je nejbližší další místo, kde můžeme pomoci zvýšit retenci nováčků. Je to také místo, kde v současnosti pozorujeme významný úbytek nováčků. Pokud by se nám podařilo více nováčků na tomto místě udržet, mělo by to mít významný vliv na růst komunity wikipedistů.

Výzkum a vývoj

Provedli jsme výzkum různých mechanismů, které se na různých projektech používají k motivování uživatelů, aby přispívali. Toto jsou naše hlavní výzkumné poznatky:

  • Motivace wikimediánů je mnohostranná a s časem se mění. Noví wikipedisté jsou častěji motivováni zvědavostí a sociálními vazbami než ideologií.
  • Interní projekty se zaměřují na vnitřní pobídky, apelují na altruistické motivace a nejsou systematicky uplatňovány.
  • Rozšíření přitažlivosti mimo ideologické motivace může zlepšit rozmanitost udržovaných editorů na Wikipedii.
  • Pozitivně naladěné zprávy od zkušených wikipedistů a mentorů jsou prokazatelně efektivní ve zvýšení krátkodobé retence.

Pro shrnutí našich současných návrhů týkajících se pozitivního posílení se můžete podívat na náš Design Brief (stručný popis vývoje). Tak jak budou pokračovat komunitní konzultace a testy použitelnosti, naše návrhy se budou ještě měnit.

Myšlenky

Když mluvíme o pozitivním posílení, napadají nás tři hlavní myšlenky. U každé z nich nás napadá několik myšlenek, které by se daly realizovat.

Dopad

  • Dopad: Vylepšená verze modulu Dopadu, založená na statistikách, grafech a dalších informacích o příspěvcích uživatele. Nová verze modulu Dopad by nováčkům ukázala více informací o jejich vlivu na projekt Wikimedie. Nováčka by také mohla povzbudit k tomu, aby v editování pokračoval. Oblasti, které můžeme prozkoumat, zahrnují například:
    • Milník navrhovaných úprav, který pobízí uživatele, aby vyzkoušeli navrhované úpravy.
    • Statistiky o tom, jak uživatel editoval v průběhu času (podobné jako informace, které jsou dostupné v X Tools).
    • Počet "obdržených poděkování", abychom zvýraznili možnost získat od komunity ocenění.
    • Nedávná editační aktivita, včetně počtu dní v řadě, po které nováček editoval, za účelem povzbuzení pokračující aktivity na projektu.
    • Zobrazit aktivitu při čtení článků, které nově příchozí v průběhu času upravovali (podobně jako informace na en:Wikipedia:Pageview_statistics).

Zvýšení úrovně

  • Postup na vyšší úroveň: Pro komunity je důležité, aby nováčci postupovali k hodnotnějším úkolům. Ty, kteří dokončují mnoho jednoduchých editačních tipů, chceme přimět k tomu, aby vyzkoušeli i obtížnější úkoly. To se může stát poté, co dokončí určitý počet snadných úkolů, nebo povzbuzením na jejich domovské stránce. Oblasti, které můžeme prozkoumat, zahrnují např.:
    • Po uložení editace nováček uvidí zprávu, která jej motivuje uložit i nějakou další editaci.
    • V modulu Navrhované úpravy poskytneme příležitosti k provádění složitějších úprav, aby se nováčci mohli stát zkušenějšími editory.
    • V modulu Dopad bychom mohli zahrnout sekci věnovanou oceněním či milníkům.
    • Na domovskou stránku přidáme nový modul s nastavenými výzvami, aby získali nějakou odměnu (odznak/certifikát).
    • Využití notifikací k povzbuzení nováčků k tomu, aby vyzkoušeli i složitější úkoly.

Personalizovaná pochvala

  • Personalizovaná chvála: výzkum ukazuje, že chvála a povzbuzení od ostatních uživatelů zvyšují udržení nováčků. Chceme přemýšlet o tom, jak povzbudit zkušené uživatele, aby poděkovali a ocenili nováčky za dobré příspěvky. Možná by k tomu mohli být mentoři vyzváni, aby to udělali na svých panelech mentorů nebo prostřednictvím oznámení. Můžeme využít existujících komunikačních mechanismů, u kterých minulé studie prokázaly určitý pozitivní účinek. Oblasti, které můžeme prozkoumat, zahrnují například:
    • Osobní zpráva od mentora, která se zobrazí v Domovské stránce nováčka.
    • Echo notifikace zaslaná jménem mentora nováčka nebo týmem Growth nadace Wikimedie.
    • "Poděkování" zaslané za určitou editaci
    • Nový milník udělený mentorem nebo týmem Wikimedia Growth související s konkrétní úpravou.

Diskuse s komunitou

Diskutovali jsme o projektu Positive Reinforcement s členy komunity od Arabská Wikipedie, Bengálská Wikipedie, Česká Wikipedie a Francouzská Wikipedie a zde na mediawiki.org.

Obdrželi jsme přímou zpětnou vazbu o třech hlavních myšlenkách spolu s mnoha dalšími nápady na zlepšení udržení nových editorů.

Níže je uveden souhrn hlavních témat ze zpětné vazby spolu s tím, jak plánujeme iteraci na základě zpětné vazby.

Dopad

Slyšeli jsme... Plán opakování na základě zpětné vazby
😊 Vypadá dobře! Tato myšlenka se zdá nejméně kontroverzní a nejvíce podporovaná. Nejprve plánujeme zahájit vývoj na tomto a poskytneme více času na upřesnění dalších nápadů.
😐 Modul dopadu by byl efektivnější, kdyby se škáloval s editory, jak získávají zkušenosti. Plánujeme se nyní zaměřit na nováčky, ale nový modul dopadu bude postaven tak, aby byl rozšiřitelný, aby v budoucnu vyhovoval vylepšením.

Zvýšení úrovně

Slyšeli jsme... Plán opakování na základě zpětné vazby
😊 Zvyšování úrovně zajišťuje, že se nováčci "nezaseknou" na jednoduchých úkolech Jakmile budou mít uživatelé určitý počet nevrácených úprav jednoho typu, měli bychom jim navrhnout, aby vyzkoušeli složitější úkoly.
😊 Nováčci často touží po ocenění Pokud udělujeme ocenění, musí být nováčkům smysluplné a v ideálním případě je lze sdílet buď na wiki (na jejich uživatelské stránce) nebo mimo wiki.
❌ Pobídky založené na cíli mohou být problematické a mohou mít za následek nekvalitní úpravy Pobídky, které zahrnují prvek založený na čase (podobně jako service Awards), mohou být efektivním přístupem, protože zohledňují nejen počet úprav, ale i dobu registrace. Některé "kvalitní brány" by mohly pomoci zpomalit a vést nováčky, pokud provádějí úpravy, které se vracejí zpět. Plánujeme prozatím omezit rozsah na straně ocenění "Zvýšení úrovně" a více se zaměřit na povzbuzení uživatelů, aby zkoušeli obtížnější typy úkolů, protože jsou úspěšní s jednoduššími úkoly.
❌ Denní cíle mohou být pro některé lidi stresující a demotivující Tuto myšlenku dále přezkoumáme a pravděpodobně umožníme přizpůsobení cíle, pokud se budeme touto myšlenkou zabývat.

Personalizovaná pochvala

Slyšeli jsme... Plán opakování na základě zpětné vazby
😊 Šíření chvály a pozitivity může pomoci zvýšit udržení nováčků. Stále dolaďujeme návrhy, jak povzbudit více. Děkujeme a přizpůsobujeme nováčkům, ale doufáme, že brzy představíme další nápady na vývojn.
😐 Škálování personalizované pochvaly může být problém, protože zkušeným redaktorům zabere více času. Mentoři jsou již zaneprázdněni, takže doufáme, že najdeme způsob, jak dostat na povrch "chvályhodné" mentorované. Probereme také další nápady, které se nespoléhají pouze na mentory.
😐 Měli bychom používat stávající systémy (Thanks, WikiLove atd.) Plány nejsou hotové, ale rozhodně plánujeme využít stávajících systémů.

Další nápady:

Členové komunity navrhli několik dalších nápadů, jak zlepšit zapojení a udržení nováčků. Myslíme si, že to jsou všechno cenné nápady (některé z nich již zkoumáme nebo na nich chceme v budoucnu pracovat), ale následující nápady nezapadají do rozsahu současného projektu:

  • Posílejte nové příchozí a uvítací e-maily (tým Growth aktuálně zkoumá e-maily o zapojení ve spolupráci s marketingovými a fundraisingovými týmy).
  • Vystavte nováčky projektům Wiki, které se týkají jejich zájmů.
  • Zahrňte na domovskou stránku pro nováčky přizpůsobitelný widget, který umožní wikinám propagovat určité úkoly nebo události pro nováčky.
  • Odesílejte upozornění uživatelům, kteří vítají nováčky, jakmile nováček dosáhne určitých milníků úprav (aby uživatele přiměl k poděkování nebo Wikilove).

Druhá konzultace s komunitou:

V únoru 2023 jsme dokončili komunitní konzultaci, ve které jsme zkontrolovali nejnovější návrhy zvyšování úrovně s Growth Pilot wikin. Tato konzultace byla dokončena v anglické Mediawiki a na arabské Wikipedii, bengálské Wikipedii, české Wikipedii a španělské Wikipedii. (T328356) Obecně byla zpětná vazba velmi pozitivní. Tyto dva úkoly pomáhají řešit zpětnou vazbu zmíněnou těmi, kteří odpověděli na naše otázky:

  • Zvyšování úrovně: Konfigurace komunity (T328386)
  • Zvyšování úrovně: Druhý návrh iterace dialogu "Vyzkoušejte nový úkol" (T330543)

V březnu 2023 jsme dokončili komunitní konzultaci, ve které jsme zkontrolovali nejnovější personalizované návrhy chvály pomocí wikin Growth Pilot. Tato konzultace byla dokončena na anglické Wikipedii, arabské Wikipedii, bengálské Wikipedii, české Wikipedii, francouzské Wikipedii, španělské Wikipedii a na Mediawiki v angličtině. (T328356) Většina zpětné vazby podporovala funkce přizpůsobené chvály, ale bylo požadováno několik dalších vylepšení. Pro tato další vylepšení jsme vytvořili úlohy Phabricator.

  • Na arabské Wikipedii a dalších wikinách s označenými revizemi chtějí mentoři vidět nejen počet úprav, které uživatel provedl, ale i další podrobnosti o stavu kontroly úprav. (T333035)
  • Mentoři chtějí mít možnost zobrazit počet nebo procento revertů, které jejich svěřenec má, a přizpůsobit, kolik revertů může mít nováček, aby byl považován za chvályhodného. (T333036)
  • Mentoři by ocenili, kdyby věděli, za kterou úpravu je mentorovanému poděkováno. (T51087)

Testy použitelnosti

Spolu s diskusí v komunitě jsme chtěli ověřit a doplnit naše původní návrhy a hypotézy testováním návrhů se čtenáři a editory z několika zemí. Náš tým pro výzkum designu tedy provedl uživatelské testování Positive Reinforcement, jehož cílem bylo lépe porozumět dopadu projektu na příspěvek nováčků v několika různých jazycích.

Testovali jsme několik statických návrhů Positive Reinforcement se čtenáři a editory Wikipedie v arabštině, španělštině a angličtině. Spolu s testováním návrhů Positive Reinforcement jsme zavedli vizualizace dat z xtools jako způsob, jak lépe porozumět tomu, jak tyto vizualizace dat vnímají nováčci.

 
Shrnutí uživatelského testování pozitivního posílení

Výsledky uživatelského testování

  • Zajištění, aby data dopadu byla použitelná: Údaje o dopadu byly působivou funkcí pro účastníky s většími zkušenostmi s úpravami, z nichž někteří souviseli s jejich zájmem o data – pro Wikipedisty nepřekvapivá kvalita. Pro ty, kteří s úpravami začínají, mohou být data dopadu nad rámec zobrazení a základní činnosti úprav působivější, pokud jsou spojena s nastavením cílů a optimalizací dopadu.
  • Vyhodnocení ideálního intervalu úprav: Napříč funkcemi se denní intervaly zdály být pro nové a příležitostné editory příliš ambiciózní. Účastníci také uvažovali o ignorování podobných mechanismů na jiných platformách, když byly nereálné. Zvážíme konzultaci s analytickými nástroji k identifikaci "přirozených" intervalů pro nové a příležitostné editory, aby byly cíle lépe dosažitelné.
  • Zajištění důvěryhodnosti hodnocení: Účastníky začínající editory zajímalo ujištění o jejich dovednostech a pokroku ve skóre kvality, hodnocení článků a nabídky odznaků. Někteří doufali, že odznaky mohou propůjčit důvěryhodnost jejich práce recenzované zkušenějšími redaktory. S tímto potenciálem by mohlo být cenné vyhodnotit, že hodnocení jsou smysluplnými měřítky dovedností, a dále zkoumat, jak je nejlépe využít k získání důvěry komunity nově příchozích.
  • Odměnění kvality a spolupráce nad kvantitou: Účastníci redakce i čtenáře z esWiki se více zajímali o uznání jejich znalostí nebo odbornosti (kvalita) než o počet úprav (množství), které provedli. Podobně jsou někteří arabští a angličtí redaktoři motivováni k editaci svými profesními zájmy a rozvojem dovedností. Zaměření cílů a odměn na další ukazatele kvalifikovaných úprav, jako je přidávání referencí nebo aktuálních příspěvků, a spolupráce nebo zapojení komunity, může také pomoci zmírnit obavy z předbíhání ke konkurenci.
  • Upřednostnění lidského poznání: Zatímco skóre a odznaky prostřednictvím úkolů Growth jsou potenciálně ceněny, uznání od ostatních editorů se zdá být více motivující. Funkce, které podporují udílení, přijímání a opětovné navštěvování poděkování, se zdály nejpřesvědčivější a redaktoři mohou těžit z výběru údajů o dopadu, které demonstrují zapojení se čtenáři nebo editory, které je pro ně nejpůsobivější.
  • Experimentování s hravostí designů: Zatímco některé pozitivní posilovací prvky lze považovat za produkt "gamifikace" (aplikace prvků herního designu a herních principů (dynamika a mechanika) v neherním kontextu), někteří účastníci (především z EsWiki) se domnívali, že jednoduché, zábavné návrhy jsou na vážnost Wikipedie příliš dětinské nebo hravé. Zvažte experimentování s vizuálními návrhy, které se liší úrovní hravosti, abyste mohli vyhodnotit širší reakce na "zábavu" na Wikipedii.

Vývoj

 
Návrhy modulů dopadu

Níže jsou uvedeny aktuální návrhy pro Positive Reinforcement. Vylepšili jsme tři hlavní myšlenky nastíněné výše, ale rozsah plánů a skutečné návrhy se vyvíjely na základě zpětné vazby z diskusí komunity a testování uživatelů.

Dopad

Revidovaný modul dopadu poskytuje novým editorům více kontextu o jejich dopadu. Nový návrh obsahuje mnohem více personalizovaných informací a vizualizací dat než předchozí návrh. Tento nový návrh je docela podobný návrhu, který jsme sdíleli dříve, když jsme o této funkci diskutovali s komunitami. Můžete zobrazit aktuální technický pokrok na beta wiki a doufáme, že tuto funkci brzy uvolníme na pilotní wiki Growth.

Zvýšení úrovně

Funkce Zvýšení úrovně se zaměřují na povzbuzení nováčků, aby postupovali k hodnotnějším úkolům. Nápady také zahrnují některé výzvy pro nové editory, aby vyzkoušeli navrhované úpravy, protože se ukázalo, že strukturované úkoly zlepšují aktivaci a udržení nováčků.

  • Dialogová zpráva po úpravě "Zvýšení úrovně": Byl přidán nový typ dialogové zprávy po úpravě, aby nováčky vyzval, aby vyzkoušeli nový typ úkolu. Doufáme, že to povzbudí některé uživatele, aby se naučili nové editační dovednosti, když budou postupovat k různým, náročnějším úkolům.
  • Dialogové okno po úpravách pro nenavrhované úpravy: Představí nováčkům, kteří dokončí "normální" úpravy, navrhované úpravy. Plánujeme experimentovat tím, že nováčkům ukážeme rychlý příspěvek 3. a 7. úprava. Uživatelé počítačů, kteří prokliknou a vyzkouší navrhovanou úpravu, uvidí také svůj modul Dopad, který, jak doufáme, pomůže zapojit nováčky a poskytne malý stupeň automatického pozitivního posílení. Tento experiment pečlivě změříme a zajistíme, aby nedošlo k žádným neúmyslným negativním účinkům.
  • Nová upozornění: Nová ozvěna upozornění, která povzbudí nováčky k zahájení nebo pokračování navrhovaných úprav. Funguje jako proxy pro e-maily "win-back" (získat zpět) pro ty, kteří mají e-mailovou adresu a nastavení pro příjem e-mailových upozornění.

Personalizovaná pochvala

Personalizované funkce chvály jsou založeny na výsledcích výzkumu, které ukazují, že povzbuzení a poděkování od ostatních uživatelů zvyšuje udržení editora.

  • Povzbuzení od mentorů: Na Panel mentora přidáme nový modul, který je navržen tak, aby povzbudil mentory, aby posílali personalizované zprávy nováčkům, kteří splňují určitá kritéria. Umožníme mentorům přizpůsobit a kontrolovat, jak a kdy se "chvályhodní" svěřenci objeví.
  • Stále dík na wiki: Plánujeme splnit položku seznamu přání komunity Aktivovat ve výchozím nastavení tlačítko Díky v seznamech sledovaných a posledních změn ([[<tvar name="1">phab:T51541|T51541]], [[<tvar name="1">phab:T90404|T90404]]). Doufáme, že to zvýší díky a pozitivitu napříč wikinami a doufejme, že nováčci z toho budou mít přímý nebo nepřímý prospěch.

Měření a výsledky

Hypotézy

Cílem funkcí pozitivního posilování je poskytnout nebo vylepšit nástroje dostupné nováčkům a mentorům ve třech konkrétních oblastech, které budou podrobněji popsány níže. Naší hypotézou je, že jakmile nováček přispěje (řekněme provedením úpravy strukturovaného úkolu), tyto funkce pomohou vytvořit cyklus pozitivní zpětné vazby, který zvýší motivaci nováčka.

Níže jsou uvedeny konkrétní hypotézy, které se snažíme ověřit napříč populací nově příchozích. Budeme mít také hypotézy pro každou ze tří sad funkcí, které tým plánuje vyvinout. Tyto hypotézy určují, jaká data budeme shromažďovat a jak je budeme analyzovat.

  1. Funkce Positive Reinforcement zvyšují naše základní metriky udržení a produktivity.
  2. Vzhledem k tomu, že funkce Positive Reinforcement neobsahují výzvu k akci, která žádá nováčky, aby provedli úpravy, neuvidíme žádný rozdíl v naší základní metrice aktivace.
  3. Nováčci, kteří získají funkce Positive Reinforcement, jsou schopni určit, že je žádoucí provádět nevrácené úpravy, a zaznamenáme pokles podílu vrácených úprav.
  4. Cyklus pozitivní zpětné vazby vytvořený funkcemi Positive Reinforcement povede k výrazně vyššímu podílu "vysoce aktivních" nováčků.
  5. Funkce pozitivního posílení zvyšují počet denních aktivních uživatelů navrhovaných úprav.
  6. Průměrný počet relací úprav během období pro nováčky (prvních 15 dní) se zvyšuje.
  7. "Personalizovaná chvála" zvýší proaktivní komunikaci mentora s jejich svěřenci, což povede ke zvýšení udržení a produktivity.

Plán experimentu

Podobně jako u předchozích projektů Growth týmu chceme naše hypotézy otestovat prostřednictvím řízených experimentů (nazývaných také "A/B testy"). To nám umožní vytvořit kauzální vztah (např. "Funkce Leveling Up způsobí zvýšení retence o xx %") a umožní nám to detekovat menší účinky, než kdybychom to měli dát všem a analyzovat účinky před /po nasazení.

V tomto kontrolovaném experimentu náhodně vybraná polovina uživatelů získá přístup k funkcím pozitivního posilování ("hostovaná" skupina) a druhá náhodně vybraná polovina místo toho získá aktuální (září 2022) zkušenost s funkcí růstu ("kontrolní" skupina ). V předchozích experimentech kontrolní skupina nezískala přístup k funkcím růstu. Tým se rozhodl od toho ustoupit (1 $), což znamená, že současná sada funkcí je novou základní linií pro kontrolní skupinu.

Funkce Personalizovaná chvála je zaměřena na mentory. Na každé wiki je omezený počet mentorů, zatímco pokud jde o nováčky, jejich počet se každým dnem neustále zvyšuje, jak se na wikinách registrují noví uživatelé. I když bychom mohli s mentory experimentovat, pravděpodobně narazíme na dvě klíčové výzvy. Za prvé, omezený počet mentorů by mohl znamenat, že experimenty budou muset běžet po dlouhou dobu. Za druhé, a co je důležitější, mentoři jsou dobře integrováni do komunity a komunikují spolu, což znamená, že pravděpodobně zjistí, zda někteří mají přístup k funkcím, které jiní nemají. Proto poskytneme funkce Personalizované chvály všem mentorům a prozkoumáme aktivitu a účinky na nováčky před nasazením/po nasazení, abychom porozuměli účinnosti funkce.

V souhrnu to znamená, že se chystáme spustit dva po sobě jdoucí experimenty s funkcemi Impact a Leveling up, po kterých bude následovat nasazení funkcí Personalized Praise všem mentorům. Tyto experimenty budou nejprve spuštěny na pilotních wikinách. Můžeme to rozšířit na další wikiny, pokud zjistíme, že je to potřeba, ale stalo by se to až poté, co bychom analyzovali hlavní ukazatele a nenašli žádné obavy.

Každý experiment bude probíhat přibližně jeden měsíc a pro každý experiment budeme mít doprovodnou sadu hlavních indikátorů, které budeme analyzovat dva týdny po nasazení. Níže uvedený seznam ukazuje, jaké budou plánované experimenty:

  1. Dopad: Skupina, která bude hostována získá aktualizovaný modul Impact.
  2. Leveling up: Hostovaná skupina získá jak aktualizovaný Impact modul, tak funkce Leveling up.
  3. Personalizovaná chvála: Všichni mentoři dostanou funkce přizpůsobené chvály.

Hlavní ukazatele a akční plán

I když věříme, že funkce, které vyvíjíme, nejsou pro wiki komunity škodlivé, chceme se ujistit, že při experimentování s nimi budeme opatrní. Je dobrou praxí definovat soubor hlavních indikátorů spolu s plány, jaká opatření podniknout, pokud hlavní indikátor naznačuje, že něco nejde tak, jak by mělo. Udělali jsme to pro všechny naše minulé experimenty a uděláme to znovu pro experimenty, které plánujeme spustit jako součást tohoto projektu.

Dopad

Dopad modulu Impact – výsledky zveřejněny 24. ledna 2023.
Indikátor Očekávaný výsledek Plán akce Výsledky
Interakce modulu Impact Žádný rozdíl ani nárůst Pokud se interakce modulu Impact sníží, znamená to, že můžeme mít problémy s výkonem nebo kompatibilitou s novým modulem Impact. Pokud je podíl nově příchozích, kteří interagují s novým modulem Impact, výrazně nižší než se starým modulem, prozkoumáme příčinu a v případě potřeby se vrátíme zpět ke starému modulu. Výrazný pokles
Interakce modulu Mentor Bez rozdílu Nový modul Impact zabírá více obrazovky než starý modul, což může vést k tomu, že nováčci nenajdou modul Mentor tak snadno jako dříve. If the number of newcomers who interact with the Mentor module is significantly lower for those who get the new Impact module, we investigate the need for design changes. Žádný výrazný rozdíl
Otázky modulu Mentor Bez rozdílu Podobné obavy jako u interakcí s modulem Mentor, pokud je počet otázek položených mentorům výrazně nižší pro nováčky, kteří získají nový modul Impact, zkoumáme potřebu změn ve vývoji. Žádný výrazný rozdíl
Úprava a návrat rychlosti Žádný rozdíl v úpravách a vrácení, nebo zvýšení počtu úprav a snížení rychlosti vrácení Pokud dojde ke zvýšení míry vracení, může to naznačovat, že nováčci provádějí nekonstruktivní úpravy, aby zvýšili počet svých úprav nebo sérií. Pokud je míra vracení nových uživatelů, kteří získají nový modul Impact, výrazně vyšší než u starého, prozkoumáme jejich úpravy a rozhodneme, zda jsou nutné změny. Žádný významný rozdíl (po odstranění odlehlých hodnot)

Interakce modulu Impact: Zjistili jsme, že podíl nově příchozích, kteří interagují se starým modulem (6,1 %), je výrazně vyšší než u nového modulu (5,0 %):   Tento rozdíl se ukázal na začátku experimentu a my jsme zkoumali data blíže, abychom pochopili, co se děje. Jeden problém, který jsme identifikovali na začátku, byl ten, že ne všechny události interakce byly využívány, což jsme následně vyřešili. Při dalším zkoumání jsme zjistili, že mnoho z těch, kteří získali starý modul, kliká na odkazy na články nebo na zobrazení stránek. V novém modulu je k dispozici graf zobrazení stránek, čímž odpadá nutnost navštěvovat nástroj zobrazení stránek. V důsledku toho jsme se rozhodli, že žádné změny nejsou potřebné.

Interakce modulu Mentor: Nenašli jsme žádný významný rozdíl v podílu nováčků, kteří komunikují s modulem Mentor. Podíl nově příchozích, kteří získají starý modul, je 2,4 %, u těch, kteří získají nový modul, jsou to 2,2 %. A Chi-square test finds this difference not significant:  

Otázky modulu Mentor: Nevidíme podstatný rozdíl v počtu položených otázek mezi starým modulem (269 úprav) a novým modulem (281 úprav). Podíl nováčků, kteří položí otázku svému mentorovi, je také stejný pro obě skupiny, a to 1,5 %.

Úprava a návrat rychlosti: Nevidíme podstatný rozdíl v počtu úprav ani v míře vracení mezi těmito dvěma skupinami měřený na základě průměru na uživatele. Mezi skupinami existují rozdíly, ale ty jsou řízeny některými vysoce plodnými editory, zejména na mobilní platformě.

Zvýšení úrovně

Hlavní ukazatele pro experiment Leveling up
Indikátor Očekávaný výsledek Plán akce Výsledky
Vyrovnání dialogu Levelling up: interakce Žádný rozdíl ani nárůst Procento uživatelů, kteří kliknou / klepnou na dialogové okno po úpravě Levelling up, by mělo být podobné nebo vyšší než procento uživatelů, kteří kliknou nebo klepnou na standardní dialogové okno po úpravách. Pokud dojde k poklesu, pak musíme prozkoumat, co tento rozdíl způsobuje. Vyšší na mobilu, bez rozdílu na desktopu
Dialogové okno po úpravě Levelling up: Klikněte na možnost "Vyzkoušet navrhovanou úpravu". >10 % kliknutí na navrhované úpravy Pokud dialogové okno "Vyzkoušet navrhovanou úpravu" nevede k tomu, že další nováčci prozkoumají navrhované úpravy, pak je toto upozornění pro nováčky jen další šum a měli bychom tuto funkci prozkoumat nebo zvážit odstranění. Výrazně vyšší než 10 %
Dialogové okno po úpravě Levelling up: "Zvyšte svou úroveň dovedností" proklikejte >10% kliknutí na Vyzkoušejte nový úkol Pokud "zvýšení úrovně dovedností" nevede k tomu, že více nováčků zkusí obtížnější úkoly, pak je toto upozornění pro nováčky jen šum navíc a měli bychom tuto funkci prozkoumat nebo zvážit odstranění. Výrazně vyšší než 10 %
Oznámení Levelling up: Klikněte na tlačítko "začít". >5 % uživatelů, kteří si toto oznámení zobrazí, na něj klikne Nemáme dobrý základ, se kterým bychom to mohli porovnat, ale pokud je toto číslo příliš nízké, měli bychom prozkoumat, zda se nevyskytly technické problémy nebo problém s použitým jazykem. Více než 5 % na počítači, méně než 5 % na mobilu
Oznámení na Levelling up: proklikání "pokračujte". >5 % uživatelů, kteří si toto oznámení zobrazí, na něj klikne Nemáme dobrý základ, se kterým bychom to mohli porovnat, ale pokud je toto číslo příliš nízké, měli bychom prozkoumat, zda se nevyskytly technické problémy nebo problém s použitým jazykem. Více než 5 % na počítači, méně než 5 % na mobilu
Aktivace Žádný rozdíl ani nárůst Pokud zaznamenáme významný pokles v hostované skupině, podobný tomu, který jsme objevili u experimentu New Impact Module, pak zkoumáme data z monitorování a událostí, abychom se pokusili identifikovat příčinu tohoto rozdílu. Pokles

Vyrovnání dialogu Levelling up interakce: Zjistili jsme, že vyšší podíl nováčků interagujících s dialogem Levelling Up ve skupině Vyrovnávání (90,8 %) ve srovnání se standardním dialogem (86,5 %). To je z velké části způsobeno mobilními zařízeními, kde je podíl interakce s Levelling Up (88,0 %) mnohem vyšší než u druhé skupiny (81,6 %). Podíl je stále vyšší u skupiny Leveling Up na počítači (93,6 % v porovnání s kontrolní skupinou (92,2 %)), ale považujeme ji za "prakticky identickou", protože vysoký podíl v kontrolní skupině znamená, že je jen malý prostor pro zvýšení.

Vyzkoušení navrhované úpravy míry prokliku: 21,9 % nově příchozích, kterým se zobrazí dialogové okno po úpravě "Vyzkoušet navrhovanou úpravu", se rozhodne prokliknout, což je výrazně vyšší hodnota, než je nastavená prahová hodnota. Tento podíl je vyšší na počítačích (24,0 %) než na mobilních zařízeních (19,7 %), ale ani v jednom případě není důvod k obavám.

Zvýšení své úrovně dovedností proklikem: Zjistili jsme, že 73,1 % nově příchozích, kterým se zobrazí dialogové okno "zvýšení úrovně dovedností", kliknutím zobrazí nový úkol, což je mnohem více, než je náš očekávaný práh nižší než 10 %. Poměry jsou vysoké jak na počítačích (71,1 %), tak na mobilních zařízeních (77,3 %).

Výskyty prokliků: 3,8 % nově příchozích, kteří dostanou oznámení "Začínáme", se proklikne na domovskou stránku. Uživatelé, kteří se zaregistrovali na počítači, s větší pravděpodobností kliknou na oznámení (5,5 %) než uživatelé na mobilních zařízeních (2,5 %). Protože je splněna hranice 5 $, zkoumáme dále, abychom pochopili tento rozdíl mezi chováním na počítačích a mobilech, zejména abychom zjistili, zda je naše hranice 5 % přiměřená.

Pokračování v proklikávání výskytů: Zjistili jsme, že 9,6 % uživatelů, kteří obdrží oznámení "Pokračujte", se proklikne na domovskou stránku. Podobně jako u oznámení "Začínáme" najdeme mnohem vyšší podíl na počítačích (16,2 %) ve srovnání s mobilními zařízeními (4,7 %). Naše zkoumání rozdílů v chování oznámení podle platformy nám snad poskytne více informací o tomto rozdílu.

Aktivace: Zjistili jsme pokles konstruktivní aktivace článku (provedení nevrácené úpravy článku do 24 hodin od registrace) o 27,0 % ve srovnání s 27,7 %. Jakmile jsme si toho všimli, otevřeli jsme T334411, abychom problém prozkoumali se zaměřením na vzorce v geografii (země a wiki) a technologii (zařízení a prohlížeče). Nenašli jsme jasné vzorce vysvětlující problém. Vyšetřování tohoto poklesu aktivace bude dále zkoumáno: T337320.

Personalizovaná pochvala

Hlavní ukazatele pro experiment přizpůsobené pochvaly
Indikátor Očekávaný výsledek Plán akce Výsledky
Proklikání personalizovaného upozornění na pochvalu Klikne na něj alespoň 10 % mentorů, kteří si prohlížejí personalizované oznámení o pochvale Pokud je toto číslo mnohem nižší než počet kliknutí na jiná oznámení, měli bychom prozkoumat, zda se nevyskytly technické problémy nebo problém s použitým jazykem. 73% of Mentors who received a notification clicked on it
Proklikání učitele modulem panelu personalizovaného chvály Alespoň 10 % mentorů, kteří si prohlédnou přizpůsobený návrh chvály na svém hlavním panelu mentora, nakonec kliknutím odešle chválu Pokud je tato hranice splněna, měli bychom prozkoumat, zda se nevyskytly technické problémy nebo problém s tím, jak si mentoři vykládají tuto výzvu k akci. 27.5% of Mentors who view a Personalized praise list click through

Data byla shromážděna 2023-06-13 ze čtyř pilotních wikin, kde je funkce nasazena (arabská Wikipedie, bengálská Wikipedie, česká Wikipedie a španělská Wikipedie).

Personalized praise notification click through: Přestože se stále jedná o relativně malý vzorek, výsledky se zdají být zdravé a ukazují, že mentoři skutečně dostávají upozornění a proklikávají se, aby si prohlédli své svěřence, kteří si zaslouží pochvalu.

Personalized praise mentor dashboard module click through: Pouze 27,5 % mentorů se prokliká na diskusní stránku mentorovaného, nicméně lze očekávat, že někteří z mentorovaných, se kterými se setkáváme, si pochvalu nezaslouží. Na základě těchto údajů a zpětné vazby od mentorů bude tým Growth provádět následující úkoly, které pomohou tuto funkci zlepšit:

  • Přidání revert scorecard do modulu Personalizované chvály na řídicím panelu Mentor (T337510)
  • Vyloučení zablokovaných účtů z personalizovaných návrhů pochval (T338525)

Experiment Results

Many of the experiments that the Growth team runs will focus on the same set of key metrics (commonly referred to as KPIs), and this includes all of the Positive Reinforcement experiments. The key metrics are defined as follows:

  • Constructive activation is defined as a newcomer making their first edit within 24 hours of registration, and that edit not being reverted within 48 hours.
    • Activation is similarly defined as constructive activation, but without the non-revert requirement.
  • Constructive retention is defined as a newcomer coming back on a different day in the two weeks after constructive activation and making another edit, with said edit also not being reverted within 48 hours.
    • Retention is similarly defined as constructive retention, but without the non-revert requirements.
  • Constructive edit volume is the overall count of edits made in a user's first two weeks, with edits that were reverted within 48 hours removed.
  • Revert rate is the proportion of edits that were reverted within 48 hours out of all edits made. This is by definition 0% for users who made no edits, and we generally exclude these users from the analysis.
Impact module experiment results
 
The New Impact module reduced activation for mobile web newcomers

We initially found a significant decrease in constructive activation for newcomers who registered on mobile web and got the New Impact module.

There was no difference in activation for newcomers who registered on desktop.

This was quite surprising as the empty state for the old Impact module was nearly identical to the empty state of the new Impact module.

First-day activity correlates strongly with later activity, and as a result we also found a significant decrease in edit volume for mobile web users.

Again, there was no difference for desktop users.

We found no difference in retention rates and revert rates. While there are features in the New Impact module that focuses on staying active and making good contributions, such as the number of thanks received and the streak counter, we often do not see significant impacts on metrics unless there's a clear call to action or we are able to isolate a specific subgroup motivated by the feature.

 
Activation is identical between the experiment and control group

As soon as we learned about the decrease in activation we started investigations into probable causes of this in T330614. Unfortunately we could not identify a specific reason and we also found that the issue was not replicated in another dataset.

We decided to add activation as a leading indicator to the Levelling Up experiment so that we could take action more quickly. When we noticed that the issue persisted, we started a new investigation in T334411 and created an "epic" task that connects all relevant subtasks: T342150.

We restarted experiment data collection after making several small changes, and we now see that activation is identical between the experiment and control group, which is what we would expect.

Although we are pleased that we have received positive feedback from new editors regarding the new Impact module, we have found that the Impact module alone hasn't resulted in significant changes in newcomer retention, edit volume, or revert rates.

Our next experiment will combine the new Impact module with the Leveling up features. We hope that this combination of Positive Reinforcement features will lead to substantial improvements in activation, retention, and edit volume. We will soon publish a detailed report that highlights the outcomes of this experiment.

Levelling up experiment results

For this experiment, we completed both an analysis of the overall effects across the whole newcomer population, and individually for each of the four components of the Levelling up features. These consist of the two notifications sent to newcomers 48 hours after registration, and two post-edit dialogues. The notifications are based on the number of suggested edits a newcomer might have done. If the newcomer has not made any suggested edits they get the "Get started" notification, and if they have made one to four suggested edits they get the "Keep going" notification. Newcomers who have made five or more suggested edits do not get any notifications.

The post-edit dialogues are shown after completed edits to articles based on certain criteria. If a newcomer has made three or eight article edits and not yet made any suggested edits, they get the "Try suggested edits" dialogue asking them if they want to try that feature. If a newcomer has completed five suggested edits of a specific task type, they get the "Try new task" dialogue suggesting a different type of task.

 
The Get Started notification increased editing within one week after receiving it.

Our overall analysis did not find any significant effects on the team's key metrics (described above), and so we focus instead on the individual components. For the "Get started" notification, we find that this is sent to the vast majority of newcomers as making suggested edits is fairly uncommon. In our dataset, more than 97% of newcomers got this notification. We find that the notification leads to a significant increase in newcomer activity in the week following the notifications being sent. Newcomers are more likely to return and make an edit, which also increases the average number of edits made during that week. We also find that this effect is lower for those who registered on mobile web, and reduced or negative for highly active newcomers. Based on this, we decided to introduce a threshold so that those who make ten or more edits will not receive the notification.

(T342819)

 
The Keep Going notification increased editing within one week for desktop users.

When it comes to the "Keep going" notification, we again find a significant increase in newcomer activity in the week following notifications being sent for those who registered on the desktop platform. For users who registered on mobile web, we find that it does not increase their probability of returning to edit but does increase the average number of edits made.

For the "Try suggested edits" dialogue, our analysis finds that while it has a reasonably high click-through rate it does not lead to newcomers successfully completing suggested edits. In our leading indicators report above, the click-through rate was 21.9%, and in a dataset from late July 2023 we found the rate to be higher at 25.3%. Using event data, we find that few newcomers find a task they are interested in, and subsequently only a fraction of newcomers go through and complete an edit. We plan to make a few improvements to this "Try suggested edits" dialog to see if we can increase the percentage of editors who click through and go on to complete an edit.

(T348205)

For the "Try new task" dialogue, which is shown to users who complete five suggested edits of a given task type, we find both high click-through rates and a reasonably high rate of completed edits. We reported a click-through rate of 73.1% in our leading indicators, and in our more recent dataset from late July 2023 the rate is 81.9%. Our analysis of subsequent edits shows that 33.3% of desktop users and 20.0% of mobile web users go through and complete a suggested edit of the new task type. One thing to keep in mind is that this dialogue is not shown to a large number of newcomers, and we therefore cannot draw conclusions about whether there are meaningful differences between platforms. What we can conclude, is that this dialogue is successful in introducing new task types. In order to show the dialogue to a larger number of newcomers, we decided to reduce the number of edits needed to see it from five to three.

(T348814)


Personalized praise experiment results

For this experiment, we focused on the effect of praise on newcomer retention and productivity. Since praise is a response to editing activity, it means there will be some time period between registration and receiving a praise message. We therefore started with an analysis of the time between registration and a mentor clicking the "Send praise" button. In that analysis, we found that most newcomers get it within 30 days of registration. This led us to redefine the time period for retention and productivity to also use this 30-day period (instead of our default of 14 days).

The Personalized praise feature was deployed to the Arabic, Bangla, Czech, and Spanish Wikipedias in late May 2023. We analyzed the Spanish Wikipedia separately from the other three because on the Spanish Wikipedia 50% of newcomers are randomly assigned a mentor, which means the feature is part of a controlled experiment. All newcomers are assigned a mentor on the other three Wikipedias.

Using a Difference-in-Differences analysis approach, we compared a three-month period prior to deployment (January through March) with a similar period after deployment (June through August), and compared data from 2023 with data from 2022 and 2018. We use two comparison time periods as a robustness check since 2022 was affected by the COVID pandemic.

For the Arabic, Bangla, and Czech Wikipedia, we found no significant impact of Personalized praise on neither retention nor productivity. Digging further into this we found that usage of the feature was limited (we're not releasing specific counts in accordance with our data publication guidelines). In discussions with wiki ambassadors we learned that sending praise is a time-consuming process as the mentors need to check a mentee's edits, thus explaining why the feature isn't more widely used.

 
Personalized praise increased number of non-reverted edits made within 30 days of registration on Spanish Wikipedia.

When it comes to the Spanish Wikipedia, we found the feature has been more widely used. While we again found no significant impact on retention, we found a significant positive impact on newcomer productivity. This finding is encouraging since our preliminary analysis of mentorship found conflicting results of none or a negative impact.

As these results were not positive enough to justify the time investment from Mentors, we have decided to start conversations with our ambassadors and communities and consider further improvements before releasing the feature more widely. We will consider improvements related to reducing the amount of work needed by Mentors, potential design improvements, and improvements to how newcomers are selected to be displayed in the Personalized praise module.