aboutsummaryrefslogtreecommitdiffstats
diff options
context:
space:
mode:
authormbabich <mbabich@ydb.tech>2023-03-15 16:32:02 +0300
committermbabich <mbabich@ydb.tech>2023-03-15 16:32:02 +0300
commit8e75ef6ede12714180dcf561d8d51988cfb538c1 (patch)
tree95250cf86603273c1a60bfc417109c53541d6982
parentbd1aa575a8eff44e5f6b7d58d7d4dedb931c6112 (diff)
downloadydb-8e75ef6ede12714180dcf561d8d51988cfb538c1.tar.gz
Add rolling restart utility docs
-rw-r--r--ydb/docs/ru/core/administration/rolling-restart.md54
-rw-r--r--ydb/docs/ru/core/administration/upgrade.md7
-rw-r--r--ydb/docs/ru/core/cluster/index.md1
-rw-r--r--ydb/docs/ru/core/cluster/toc_i.yaml4
4 files changed, 62 insertions, 4 deletions
diff --git a/ydb/docs/ru/core/administration/rolling-restart.md b/ydb/docs/ru/core/administration/rolling-restart.md
new file mode 100644
index 0000000000..2d8ccb342e
--- /dev/null
+++ b/ydb/docs/ru/core/administration/rolling-restart.md
@@ -0,0 +1,54 @@
+# Роллинг рестарт
+
+Механизм роллинг рестарта используется для обновления версии {{ ydb-short-name }} и применения изменений в конфигурации.
+
+## Утилита ydb-rolling-restart {#description}
+
+Запуск роллинг рестарта производится утилитой ydb-rolling-restart. Контроль процесса перезагрузки со стороны перезагружаемого кластера {{ ydb-short-name }} позволяет избежать деградации. Утилита использует системный ssh-клиент для для подключения к узлам кластера и выполнения команды перезагрузки процессов {{ ydb-short-name }}.
+
+Пример запуска перезагрузки storage узлов:
+
+### Перезагрузка storage {#storage}
+
+Примеры перезагрузки storage узлов:
+
+ ```
+ ydb-rolling-restart --addr <node list> --service storage
+ ```
+
+где `<node list>` - это список узлов кластера разделенных запятыми.
+
+### Перезагрузка динамических узлов {#dynnode}
+
+Примеры перезагрузки узлов базы данных:
+
+ ```
+ ydb-rolling-restart --addr <node list> --service dynnode --database <database name>
+ ```
+
+где:
+ - `<node list>` - это список узлов кластера разделенных запятыми
+ - `<database name>` - имя рестартуемой базы данных
+
+### Выбор режим доступности при рестарте storage узлов {#availability-mode}
+
+Процесс рестарта storage узлов учитывает структуру и тип erasue blob storage групп кластера. Это позволяет перезагружать узлы в рамках модели отказа без фатальной деградации (недоступности).
+С помощю опции ```--availability-mode <mode>``` возможно выбрать режим доступности.
+где `<mode>` может принимать один из трех вариантов:
+ - `max` - разрешается рестарт узлов если он приведет к недоступность максимум одного диска из blob storage групп
+ - `keep` - разрешается рестарт узлов если он не приведет к недоступности blob storage групп
+ - `force` - рестарт с недоступностью blob storage групп
+
+{% note warning %}
+
+Использование режима ```--availability-mode force``` приведет к одновременной перезагрузке всех узлов. Используйте этот режим в случае крайней необходимости.
+
+{% endnote %}
+
+
+### Параметры утилиты рестарта {#parameters}
+
+Есть возможность управлять запуском рестарта с помощю параметров:
+ - `--hosts <host list>` - перезагрузить узлы только на хостах из указанного списка
+ - `--exclude-hosts <host list>` - исключить из перезагрузки узлы на хостах из списка
+ - `--ssh-pool-size <number>` - лимит на число удаленных соединений с узлами кластера через ssh
diff --git a/ydb/docs/ru/core/administration/upgrade.md b/ydb/docs/ru/core/administration/upgrade.md
index 48c7738a66..ae4e0df583 100644
--- a/ydb/docs/ru/core/administration/upgrade.md
+++ b/ydb/docs/ru/core/administration/upgrade.md
@@ -1,4 +1,4 @@
-# Обновление {{ ydb-short-name }}
+# Обновление
{{ ydb-short-name }} распределенная система, поддерживающая плавное обновление (rolling restart) без даунтайма и деградации производительности.
@@ -9,8 +9,9 @@
1. Обновление и рестарт storage узлов;
1. Обновление и рестар динамических узлов.
-Процесс остановки и запуска описан на странице [Безопасные рестарт и выключение узлов](../maintenance/manual/node_restarting.md).
+Процесс остановки и запуска описан на странице [Безопасные рестарт и выключение узлов](../maintenance/manual/node_restarting.md).
Узлы {{ ydb-short-name }} следует обновлять последовательно по одному, после каждого шага контролировать состояние кластера через [{{ ydb-short-name }} Monitoring](../maintenance/embedded_monitoring/ydb_monitoring.md) - на вкладке `Storage` не должно быть пулов в состоянии `Degraded` (как на примере ниже). В противном случае обновление необходимо остановить.
+<!-- Процесс автоматизированного rolling рестарта описан на странице [Роллинг рестарт](rolling-restart.md) -->
![Monitoring_storage_state](../maintenance/embedded_monitoring/_assets/monitoring_storage_state.png)
@@ -31,7 +32,7 @@
**Примеры совместимых версий:**
v.22.2.5 -> v.22.2.47 - обновление возможно
-v.22.2.47 -> v.22.4.21 - обновление возможно
+v.22.2.47 -> v.22.4.21 - обновление возможно
v.22.2.40 -> v.22.4.21 - обновление невозможно, необходимо сначала обновиться до последней версии (v.22.2.47)
v.22.2.47 -> v.22.5.5 - обновление невозможно, необходимо обновиться до следующей мажорной версии v.22.4.*
diff --git a/ydb/docs/ru/core/cluster/index.md b/ydb/docs/ru/core/cluster/index.md
index 6860bcb927..7b8cf0c0f2 100644
--- a/ydb/docs/ru/core/cluster/index.md
+++ b/ydb/docs/ru/core/cluster/index.md
@@ -8,3 +8,4 @@
* [{#T}](../troubleshooting/system_views_cluster.md).
* [{#T}](../administration/monitoring.md).
* [{#T}](../administration/upgrade.md).
+<!-- * [{#T}](../administration/rolling-restart.md). -->
diff --git a/ydb/docs/ru/core/cluster/toc_i.yaml b/ydb/docs/ru/core/cluster/toc_i.yaml
index 1567c1bf4b..dbfa5a536b 100644
--- a/ydb/docs/ru/core/cluster/toc_i.yaml
+++ b/ydb/docs/ru/core/cluster/toc_i.yaml
@@ -17,8 +17,10 @@ items:
href: ../administration/monitoring.md
- name: Дашборды Grafana
href: ../administration/grafana-dashboards.md
-- name: Обновление YDB
+- name: Обновление
href: ../administration/upgrade.md
+# - name: Роллинг рестарт
+# href: ../administration/rolling-restart.md
- name: Изменение конфигурации актор-системы
href: ../maintenance/manual/change_actorsystem_configs.md
- name: Изменение конфигураций через CMS