Add rolling restart utility docs

author: mbabich <mbabich@ydb.tech> 2023-03-15 16:32:02 +0300
committer: mbabich <mbabich@ydb.tech> 2023-03-15 16:32:02 +0300
commit: 8e75ef6ede12714180dcf561d8d51988cfb538c1 (patch)
tree: 95250cf86603273c1a60bfc417109c53541d6982
parent: bd1aa575a8eff44e5f6b7d58d7d4dedb931c6112 (diff)
download: ydb-8e75ef6ede12714180dcf561d8d51988cfb538c1.tar.gz
4 files changed, 62 insertions, 4 deletions
diff --git a/ydb/docs/ru/core/administration/rolling-restart.md b/ydb/docs/ru/core/administration/rolling-restart.md
new file mode 100644
index 0000000000..2d8ccb342e
--- /dev/null
+++ b/ydb/docs/ru/core/administration/rolling-restart.md
@@ -0,0 +1,54 @@
+# Роллинг рестарт
+
+Механизм роллинг рестарта используется для обновления версии {{ ydb-short-name }} и применения изменений в конфигурации.
+
+## Утилита ydb-rolling-restart {#description}
+
+Запуск роллинг рестарта производится утилитой ydb-rolling-restart. Контроль процесса перезагрузки со стороны перезагружаемого кластера {{ ydb-short-name }} позволяет избежать деградации. Утилита использует системный ssh-клиент для для подключения к узлам кластера и выполнения команды перезагрузки процессов {{ ydb-short-name }}.
+
+Пример запуска перезагрузки storage узлов:
+
+### Перезагрузка storage {#storage}
+
+Примеры перезагрузки storage узлов:
+
+  ```
+  ydb-rolling-restart --addr <node list> --service storage
+  ```
+
+где `<node list>` - это список узлов кластера разделенных запятыми.
+
+### Перезагрузка динамических узлов {#dynnode}
+
+Примеры перезагрузки узлов базы данных:
+
+  ```
+  ydb-rolling-restart --addr <node list> --service dynnode --database <database name>
+  ```
+
+где:
+  - `<node list>` - это список узлов кластера разделенных запятыми
+  - `<database name>` - имя рестартуемой базы данных
+
+### Выбор режим доступности при рестарте storage узлов {#availability-mode}
+
+Процесс рестарта storage узлов учитывает структуру и тип erasue blob storage групп кластера. Это позволяет перезагружать узлы в рамках модели отказа без фатальной деградации (недоступности).
+С помощю опции ```--availability-mode <mode>``` возможно выбрать режим доступности.
+где `<mode>` может принимать один из трех вариантов:
+  - `max` - разрешается рестарт узлов если он приведет к недоступность максимум одного диска из blob storage групп
+  - `keep` - разрешается рестарт узлов если он не приведет к недоступности blob storage групп
+  - `force` - рестарт с недоступностью blob storage групп
+
+{% note warning %}
+
+Использование режима ```--availability-mode force``` приведет к одновременной перезагрузке всех узлов. Используйте этот режим в случае крайней необходимости.
+
+{% endnote %}
+
+
+### Параметры утилиты рестарта {#parameters}
+
+Есть возможность управлять запуском рестарта с помощю параметров:
+  - `--hosts <host list>` - перезагрузить узлы только на хостах из указанного списка
+  - `--exclude-hosts <host list>` - исключить из перезагрузки узлы на хостах из списка
+  - `--ssh-pool-size <number>` - лимит на число удаленных соединений с узлами кластера через ssh
diff --git a/ydb/docs/ru/core/administration/upgrade.md b/ydb/docs/ru/core/administration/upgrade.md
index 48c7738a66..ae4e0df583 100644
--- a/ydb/docs/ru/core/administration/upgrade.md
+++ b/ydb/docs/ru/core/administration/upgrade.md
@@ -1,4 +1,4 @@
-# Обновление {{ ydb-short-name }}
+# Обновление
 
 {{ ydb-short-name }} распределенная система, поддерживающая плавное обновление (rolling restart) без даунтайма и деградации производительности.
 
@@ -9,8 +9,9 @@
 1. Обновление и рестарт storage узлов;
 1. Обновление и рестар динамических узлов.
 
-Процесс остановки и запуска описан на странице [Безопасные рестарт и выключение узлов](../maintenance/manual/node_restarting.md). 
+Процесс остановки и запуска описан на странице [Безопасные рестарт и выключение узлов](../maintenance/manual/node_restarting.md).
 Узлы {{ ydb-short-name }} следует обновлять последовательно по одному, после каждого шага контролировать состояние кластера через [{{ ydb-short-name }} Monitoring](../maintenance/embedded_monitoring/ydb_monitoring.md) - на вкладке `Storage` не должно быть пулов в состоянии `Degraded` (как на примере ниже). В противном случае обновление необходимо остановить.
+<!-- Процесс автоматизированного rolling рестарта описан на странице [Роллинг рестарт](rolling-restart.md) -->
 
 
 ![Monitoring_storage_state](../maintenance/embedded_monitoring/_assets/monitoring_storage_state.png)
@@ -31,7 +32,7 @@
 **Примеры совместимых версий:**
 
 v.22.2.5	->	v.22.2.47 - обновление возможно
-v.22.2.47	->	v.22.4.21 - обновление возможно 
+v.22.2.47	->	v.22.4.21 - обновление возможно
 v.22.2.40	->	v.22.4.21 - обновление невозможно, необходимо сначала обновиться до последней версии (v.22.2.47)
 v.22.2.47	->	v.22.5.5 - обновление невозможно, необходимо обновиться до следующей мажорной версии v.22.4.*
 
diff --git a/ydb/docs/ru/core/cluster/index.md b/ydb/docs/ru/core/cluster/index.md
index 6860bcb927..7b8cf0c0f2 100644
--- a/ydb/docs/ru/core/cluster/index.md
+++ b/ydb/docs/ru/core/cluster/index.md
@@ -8,3 +8,4 @@
 * [{#T}](../troubleshooting/system_views_cluster.md).
 * [{#T}](../administration/monitoring.md).
 * [{#T}](../administration/upgrade.md).
+<!-- * [{#T}](../administration/rolling-restart.md). -->
diff --git a/ydb/docs/ru/core/cluster/toc_i.yaml b/ydb/docs/ru/core/cluster/toc_i.yaml
index 1567c1bf4b..dbfa5a536b 100644
--- a/ydb/docs/ru/core/cluster/toc_i.yaml
+++ b/ydb/docs/ru/core/cluster/toc_i.yaml
@@ -17,8 +17,10 @@ items:
       href: ../administration/monitoring.md
     - name: Дашборды Grafana
       href: ../administration/grafana-dashboards.md
-- name: Обновление YDB
+- name: Обновление
   href: ../administration/upgrade.md
+# - name: Роллинг рестарт
+#   href: ../administration/rolling-restart.md
 - name: Изменение конфигурации актор-системы
   href: ../maintenance/manual/change_actorsystem_configs.md
 - name: Изменение конфигураций через CMS
author	mbabich <mbabich@ydb.tech>	2023-03-15 16:32:02 +0300
committer	mbabich <mbabich@ydb.tech>	2023-03-15 16:32:02 +0300
commit	8e75ef6ede12714180dcf561d8d51988cfb538c1 (patch)
tree	95250cf86603273c1a60bfc417109c53541d6982
parent	bd1aa575a8eff44e5f6b7d58d7d4dedb931c6112 (diff)
download	ydb-8e75ef6ede12714180dcf561d8d51988cfb538c1.tar.gz