Parsoid/Установка для разработчиков

This page is a translated version of the page Parsoid/Developer Setup and the translation is 85% complete.
This page describes Parsoid/JS , which has been replaced by Parsoid/PHP in MW 1.35 and newer.

Здесь описывается установка Parsoid/JS из исходного кода. В первую очередь это полезно для разработчиков Parsoid, однако, если для вашей операционной системы нет скомпилированных пакетов Parsoid, вы также найдете это полезным.

Начальный этап

node -v # должна быть версия 6.x или выше
git clone https://gerrit.wikimedia.org/r/mediawiki/services/parsoid
cd parsoid
git review -s # эта строка опциональна, см. ниже
npm install
npm test # возможно также - requires nsp, eslint to be installed
cp config.example.yaml config.yaml
edit config.yaml
npm start

Для обратной совместимости и для продолжения поддержки не-статичных конфигурационных файлов, localsettings.js должен быть настроен следующим образом:

edit localsettings.js
// Note that a config.yaml is still required
edit config.yaml
// Add a path to the file as, "localsettings: ./localsettings.js"
// See the comments in config.yaml for details
npm start

См. Parsoid/Setup#Configuration для подробностей этапы "edit config.yaml" и "edit localsettings.js". См. Gerrit 'getting started' документацию для справки по "git review", что необходимо только в случае, если вы планируете поделиться изменениями кода с нами.

Если команды выше для вас непонятны, почитайте более подробные инструкции.

Убедитесь, что у вас самая последняя версия Node

Перед установкой Parsoid вы должны убедиться, что у вас установлена самая последняя версия Node.

Для Parsoid нужно node версии v6.x или выше. У нас мы используем версию v6.9.1.

Если у вас установлен node достаточно свежей версии, следуйте инструкциям на Parsoid/Installing Node , а затем возвращайтесь сюда.

Установка из исходников на Linux или Mac OS X

Вариант 1. Клонировать репозиторий mediawiki/services/parsoid/deploy

Возможно, это самый простой способ установить Parsoid, если вы просто хотите немного поиграться и не связываться с установкой npm.

$ git clone --recursive https://gerrit.wikimedia.org/r/mediawiki/services/parsoid/deploy

Это установит версию Parsoid, которая развернута на данный момент в производстве наряду со всеми зависимыми элементами node. Сам код parsoid будет находиться в поддиректории src/. Модули npm будут находиться в поддиректории node_modules/.

Вариант 2. Клонировать репозиторий mediawiki/services/parsoid

Вы можете установить код Parsoid куда угодно, его не обязательно устанавливать или запускать от пользователя root.

Проверка исходников:

git clone https://gerrit.wikimedia.org/r/mediawiki/services/parsoid

Или, если вы планируете хакнуть Parsoid, следуйте документации Gerrit 'getting started' и настроить git-review в новой ветке. (Это также создаст подлинную копию с названием gerrit в вашем репозитории.)

cd parsoid
git-review -s

Проверка версии Node: наберите node --version (или nodejs --version в Debian/Ubuntu) и это должно вывести v10.x. (Если версия выше, тоже подойдет.) Смотрите Parsoid/Installing Node , если это не так.

Установите JS-зависимости.

Запустите эту команду в директории Parsoid (содержащей package.json):

npm install

Настройка

Если вы хотите указать веб-службу Parsoid для своей wiki, зайдите в директорию parsoid и отредактируйте файл config.yaml.

Используйте параметр uri, чтобы указать экземпляр(ы) MediaWiki, который(е) вы хотите использовать, как здесь:

        mwApis:
        - # Это единственный требуемый параметр - конечный URL вашей MediaWiki API.
          uri: 'http://yoursite.com/w/api.php'
          # "domain" используется для обмена данными с Visual Editor и RESTBase.
          # По умолчанию он указывает на часть имени хоста свойства `uri` ниже, но вы можете вручную выставить его в произвольной строке.
          domain: 'yoursite.com'  # по желанию

Если вы хотите указать веб-службу Parsoid для своей wiki, используя файл localsettings.js, раскомментируйте в файле config.yaml путь localsettings как здесь:

        # Для обратной совместимости, а также чтобы пока поддерживать непостоянные конфигурации, опционально задайте путь к файлу localsettings.js.
        # См. localsettings.example.js
        localsettings: ./localsettings.js

а также закомментируйте параметры mwApis, uri и domain как здесь:

        #mwApis:
        #- # Это единственный требуемый параметр - конечный URL вашей MediaWiki API.
          #uri: 'http://localhost/w/api.php'
          # "domain" используется для обмена данными с Visual Editor и RESTBase.
          # По умолчанию он указывает на часть имени хоста свойства `uri` ниже, но вы можете вручную выставить его в произвольной строке.
          #domain: 'localhost'  # по желанию

перейдите в папку parsoid и создайте файл localsettings.js на основе файла localsettings.js.example. Используйте parsoidConfig.setMwApi, чтобы указать экземпляр(ы) MediaWiki, который(е) вы хотите использовать, как здесь:

parsoidConfig.setMwApi({ uri: 'http://yoursite.com/w/api.php', domain: 'yoursite.com', prefix: 'someuniqueid' });
На данный момент Parsoid поддерживает публичные wiki, а также частные wiki, используя перенаправление cookie. (См. bug T69313, чтобы узнать хитрости как заставить это работать. Также посмотрите эту тему Обсуждения для обхода проблемы)

Потом вы сможете получить доступ к страницам Вики в Parsoid с указанием относительного URL '/yoursite.com/v3/page/html/<page-title>/'

См. Parsoid/Setup#Configuration для более детальной информации.

Parsoid may not be able to communicate with an API if it is behind a local virtual-host. In such cases, use a non-virtual-host URI for the mwApis config values (this will typically be a localhost URI instead).

Запуск сервера

Вам необходимо запустить веб-службу Parsoid из директории parsoid, используя:

node bin/server.js

а в Ubuntu 14.04 наберите вот это в директории /parsoid:

nodejs bin/server.js

Это запустит HTTP службу Parsoid, который по умолчанию в localsettings.js будет слушать порт 8000. Чтобы его проверить, перейдите в браузере по адресу http://localhost:8000/. Если вы настроили Parsoid правильно, то вы сможете просматривать страницы через http://localhost:8000/yoursite.com/v3/page/html/<pagename>. Учтите, что эта проверка может также закончиться неудачно в случае, если ваш хостинг-провайдер отключил порт 8000 для вашей учётной записи.

Две переменные окружения доступны для контроля назначенного интерфейса и/или порта:

export INTERFACE=127.0.0.1
export PORT=8142 
nodejs bin/server.js

Автоматический запуск сервиса Parsoid

Существует много способов автоматического запуска сервисов, обратитесь к документации операционной системы вашего сервера.

Upstart (Ubuntu)

В Ubuntu и других операционных системах, использующих Upstart, это достигается за счёт:

sudo ln -s /lib/init/upstart-job /etc/init.d/parsoid
sudo vi /etc/init/parsoid.conf

где /etc/init/parsoid.conf содержит конфигурацию подобную MediaWiki-Vagrant 's parsoid.conf:

# vim: set ft=upstart:

# Настройка задачи Upstart для Parsoid

description "Parsoid HTTP service"

start on (local-filesystems and net-device-up IFACE!=lo)
stop on runlevel [!2345]

setuid "www-data"
setgid "www-data"

env VCAP_APP_PORT="8000"
env NODE_PATH="/js/node_modules"

chdir "/path/to/parsoid"
exec nodejs bin/server.js

respawn

To test your configuration type

init-checkconf /etc/init/parsoid.conf

If the answer is "syntax ok" you can start the service:

sudo service parsoid start

To check, if the service is running, type

service parsoid status

And if you want to stop your node.js-parsoid-server you can do this with

sudo service parsoid stop

You can find more helpful instructions to get node running as server with ubuntu in this article: The Upstart Event System: What It Is And How To Use It

Fedora

В последних версиях Fedora и других операционных системах, использующих systemd, используйте файл от parsoid.service, подобный следующему шаблону (измените соответствующие пути файла):

[Unit]
Description=MediaWiki Parsoid web service on node.js
Documentation=https://www.mediawiki.org/wiki/Parsoid
Wants=local-fs.target network.target
After=local-fs.target network.target

[Install]
WantedBy=multi-user.target

[Service]
Type=simple
# or better, use a dedicated user "parsoid"
User=nobody
WorkingDirectory=/path/to/parsoid
EnvironmentFile=-/etc/parsoid/parsoid.env
ExecStart=/usr/bin/nodejs /path/to/parsoid/bin/server.js
PrivateTmp=true
PrivateDevices=true
ProtectSystem=full
ProtectHome=true
NoNewPrivileges=true
CapabilityBoundingSet=
ReadOnlyPaths=/

Опциональная директива EnvironmentFile выше может указывать путь к файлу, подобный следующему шаблону:

PORT=8000
NODE_PATH=/path/to/parsoid/node_modules

Вы также можете использовать PM2, чтобы демонизировать приложение server.js.

Установка с помощью npm:

npm install -g pm2

Запуск server.js через PM2:

pm2 start /path/to/parsoid/bin/server.js

Сервер Parsoid теперь работает и управляется с помощью PM2. Сохраните список процессов:

pm2 save

Теперь, когда запускается PM2, сервер Parsoid будет запускаться и управляться с помощью PM2. Последний шаг - заставить PM2 автоматически запускаться при загрузке системы:

# Скрипт автозапуска для определенной платформы, [platform] может быть одной из:
#   ubuntu|centos|redhat|gentoo|systemd|darwin|amazon
$ pm2 startup [platform]

Для более старых релизов Ubuntu, которые используют systemd, используйте это в качестве [platform] вместо 'ubuntu'.

См. баг T69313 для порядка упаковки, что позволит сделать общую установку проще.

Автоматический запуск на macOS

На macOS вы можете создать файл plist. This is an example of a suitable plist (adapt the parsoid and config.yaml paths to your system):

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE plist PUBLIC "-//Apple Computer//DTD PLIST 1.0//EN"
"http://www.apple.com/DTDs/PropertyList-1.0.dtd">
<plist version="1.0">
  <dict>
  <key>Label</key>
  <string>org.mediawiki.parsoid.start</string>
  <key>ProgramArguments</key>
  <array>
    <string>/usr/local/bin/node</string>
    <string>/path/to/parsoid/bin/server.js</string>
    <string>--config</string>
    <string>/path/to/config.yaml</string>
  </array>
  <key>RunAtLoad</key>
  <true/>
  <key>KeepAlive</key>
  <true/>
  <key>UserName</key>
  <string>root</string>
  </dict>
</plist>

Save it as org.mediawiki.parsoid.start.plist in /Library/LaunchDaemons and change to root user & wheel group, correct permissions, and add it as a persistent launchd job (so that it will restart on the next reboot).

sudo chown root:wheel /Library/LaunchDaemons/org.mediawiki.parsoid.start.plist
sudo chmod o-w /Library/LaunchDaemons/*
sudo launchctl load -w /Library/LaunchDaemons/org.mediawiki.parsoid.start.plist

Passenger

This is probably not recommended. If using passenger, make sure that num_workers in config.yaml is set to 0, otherwise it won't bind to passenger's socket properly.

Gentoo Linux, Funtoo Linux

emerge -av '>=dev-lang/nodejs-0.10' # install nodejs in the 0.10.x series or higher
git clone https://gerrit.wikimedia.org/r/mediawiki/services/parsoid # check out source
cd parsoid # enter checked-out source
npm install -g # download parsoid's nodejs library dependencies and install system-wide

Add a config.yaml file in the install location (/usr/lib64/node_modules/parsoid), see example file.

Касательно файла init.d, считая что Node установлен в папку по умолчанию, а Parsoid установлен общесистемно (npm install -g)

pidfile="/var/run/parsoid.pid"
command="/usr/bin/node"
command_args="/usr/lib64/node_modules/parsoid/bin/server.js"
command_background="true"

depend() {
   need net
}

Лучшей идеей будет запустить Parsoid без прав root. Создадим непривилегированную системную учетную запись:

useradd -r -s /sbin/nologin -d /dev/null -M -c 'Unprivileged system account for Parsoid' parsoid

И наш скрипт init.d изменится таким образом (предполагая каталоги по умолчанию, общесистемную установку):

#!/sbin/runscript

PARSOID_PIDFILE="/var/run/parsoid.pid"
NODE="/usr/bin/node"
NODE_FOLDER="/usr/lib64/node_modules/parsoid"
NODE_OPTS="/usr/lib64/node_modules/parsoid/bin/server.js"

depend() {
        need net
}

start() {
        ebegin "Starting parsoid"
        start-stop-daemon --start --quiet \
                --pidfile "${PARSOID_PIDFILE}" \
                --chdir ${NODE_FOLDER} \
                --make-pidfile --background \
                --user parsoid --group parsoid \
                --exec ${NODE} -- ${NODE_OPTS}
        eend $?
}

stop() {
        ebegin "Stopping parsoid"
        start-stop-daemon --stop --quiet \
                --pidfile "${PARSOID_PIDFILE}"
        eend $?
}

FreeBSD

#!/bin/sh
#
# PROVIDE: parsoid
# REQUIRE: LOGIN nginx
# KEYWORD: shutdown

# parsoid_enable="yes"

. /etc/rc.subr

name="parsoid"
rcvar=parsoid_enable

parsoid_pid=/var/run/parsoid.pid

# Can also be -9 etc. -HUP usually will only cause sadness.
sig_stop=-KILL

start_cmd=parsoid_start
stop_cmd=parsoid_kill
#restart_cmd=parsoid_restart    # didn't bother to implement

load_rc_config ${name}

# Set to either 'node' to use default or set EXPLICIT e.g. '/usr/local/bin/node1.10'
command_interpreter="node"
# Command path must always be explicit.
command="/opt/extl/parsoid/api/server.js"
# Contain arguments in quotes, use ' and \"
command_args=""

parsoid_start()
{
    # See daemon(8) for more details.
    daemon -f -p $parsoid_pid $command_interpreter $command $command_args
    # This is another favorite method. Select only one of these.
    #app_root="/opt/extl/parsoid/api"
    #nginx_user="nginx"
    #daemon -p $parsoid_pid -c $app_root -f -r -u $nginx_user $command_interpreter $command $command_args
    if [ $? -ne 0 ]; then
        echo "Error starting Parsoid."
        exit 1
    fi
    echo "Starting Parsoid."
}

parsoid_kill()
{
    echo "Stopping Parsoid."
    kill $sig_stop `cat $parsoid_pid`
}

run_rc_command "$1"

Установка на Windows

Шаги те же самые, что и при установке Parsoid на Linux:

git clone https://gerrit.wikimedia.org/r/mediawiki/services/parsoid
cd parsoid
npm install

Если npm install дает сбой, говоря, что npm неизвестная команда, попробуйте добавить каталог nodesjs в переменную среды PATH, как описывалось ранее в секции Установки необходимого ПО, и запустите npm install напрямую из папки parsoid, созданной командой git clone.

Если установка снова не удается, можно попробовать отключить брандмауэр в маршрутизаторе.

Когда установка завершится, настройте Parsoid и запустите его (server.js должен быть расположен в папке bin\, а не в api\ в более новых версиях Parsoid):

node bin\server.js

Чтобы запустить parsoid в фоне, создайте командный файл в папке Parsoid с названием parsoid.bat. Создайте задачу в "планировщике" для ее запуска при загрузке. В качестве альтернативы в интернете существуют несколько команд "запуск командного файла как сервис".

@echo off
"%ProgramFiles(x86)%\nodejs\node.exe" bin\server.js

Если используется командный файл в качестве "назначенного задания", может потребоваться использовать полный путь к файлу server.js (например, C:\www\parsoid\bin\server.js) вместо bin\server.js.

Git выдаст ошибку при скачивании, если вы используете корпоративный прокси, поэтому вам может потребоваться сделать сначала следующее:

git config --global -e

Это запустит редактор. Теперь нажмите i один раз, и в режиме вставки наберите:

[http] proxy = http://proxy.company.com:8080

И, наконец, нажмите ESC, а затем наберите :wq и нажмите Enter, чтобы сохранить изменения. Теперь прокси включен.

Windows Server 2008 R2

MediaWiki должен быть установлен, а также установлено расширение Visual Editor.

Troubleshooting

If things are still not working, then see our troubleshooting page.

См. также

Рекомендации