هندسة موثوقية موقع ويكيميديا

This page is a translated version of the page Wikimedia Site Reliability Engineering and the translation is 100% complete.

فريق هندسة موثوقية الموقع، أو SRE باختصار، هو الفريق المسؤول عن تطوير وصيانة البنية التحتية للإنتاج في ويكيميديا. كانت تُعرف سابقًا باسم العمليات الفنية، وهي مسؤولة عن التأكد من أن جميع مواقع وخدمات ويكيميديا ​​التي يستخدمها الجمهور (بما في ذلك ميدياويكي وجميع الخدمات المرتبطة بها) تعمل بشكل موثوق وآمن وبأداء عالٍ.

أبلغنا بحالات الطوارئ باستخدام Klaxon.

#wikimedia-sre تواصل

يمكن العثور على وثائق إضافية تتعلق بالبنية التحتية لدينا وعمل الفريق على Wikitech.

هيكل الفريق

Collaboration Services

We are responsible for building and maintaining the infrastructure aspects of the source code management, CI and CD, task and ticket management systems as well as hosting non-Mediawiki websites and other collaboration services.

عمليات مركز البيانات

يتولى فريق عمليات مركز البيانات مسؤولية جميع عمليات نشر مركز بيانات ويكيميديا ​​والخدمات اللوجستية بالإضافة إلى الحفاظ على تواجدنا في مواقع حول العالم. إنهم يؤدون العمل في الموقع ويحافظون على دورة الحياة الكاملة البالغة 5 سنوات (المواصفات، والشراء، والتثبيت الفعلي، والكسر/الإصلاح، وإيقاف التشغيل) لجميع الأجهزة.

#wikimedia-dcops تواصل

أسس البنية التحتية

يركز الفريق على بناء وصيانة منصتنا الأساسية ("السحابة المعدنية") التي تشكل الأسس التي يعتمد عليها كل شيء آخر تقريبًا في بنيتنا التحتية. علاوة على عمليات النشر المخصصة لدينا، تشمل مسؤولياتهم (على سبيل المثال لا الحصر) أنظمة إدارة التكوين وأتمتة البنية التحتية وأدوات التنسيق وأمن البنية التحتية وعمليات الشبكة.

#wikimedia-sre-foundations تواصل

إمكانية الملاحظة

يعمل فريق Observability، أو "o11y" باختصار، عبر SRE والتكنولوجيا لتزويد الفرق بأدوات التشخيص والأنظمة الأساسية والرؤى حول كيفية أداء الأنظمة والخدمات. فهو يستفيد من تقنيات مثل Grafana وKibana/Logstash وOpenSearch وPrometheus وAlertManager والمزيد.

#wikimedia-observability تواصل

حركة المرور

يتولى فريق المرور مسؤولية الطبقة الأولى المهمة من البنية التحتية ذات حركة المرور العالية والتي تمتد الآن في معظم أنحاء العالم، بما في ذلك طبقات إنهاء TLS والتخزين المؤقت (ATS، Varnish)، وموازنة التحميل، وDNS، وشبكتنا الخاصة.

#wikimedia-traffic تواصل

ثبات البيانات

يركز فريق استمرارية البيانات على أنظمة تخزين واسترجاع البيانات المستمرة في ويكيميديا، بما في ذلك قواعد بيانات SQL وتخزين الكائنات (الموزعة) وتخزين الملفات وأنظمة النسخ الاحتياطي.

#wikimedia-data-persistence تواصل

عمليات الخدمة

يعتني فريق عمليات الخدمة بالخدمات العامة و"المرئية للمستخدم" بالتعاون الوثيق مع كل من فريقي التكنولوجيا والمنتجات. يتضمن ذلك منصة MediaWiki الخاصة بنا، والبنية التحتية لخدمة SOA المستندة إلى Kubernetes، بالإضافة إلى الخدمات التي تواجه المجتمع والمطورين مثل Gitlab وGerrit وPhabricator وVRTS.

#wikimedia-serviceops تواصل

الاتصال بالفريق

إذا كنت بحاجة إلى الاتصال بالفريق، هناك تعليمات مفصلة على wikitech:SRE Team requests.