diff options
author | Nikolay Perfilov <pnv902@gmail.com> | 2022-04-29 00:52:47 +0300 |
---|---|---|
committer | Nikolay Perfilov <pnv902@gmail.com> | 2022-04-29 00:52:47 +0300 |
commit | a1ec6fbc1f4546f0a431e1dc273cbf337b416e43 (patch) | |
tree | bbb11f25e9f1d362288f4b91d4793275c2550f7e | |
parent | ad89dfecc3248af5b9da70bf74c140e99795214b (diff) | |
download | ydb-a1ec6fbc1f4546f0a431e1dc273cbf337b416e43.tar.gz |
Remove batch upload section from FAQ section, KIKIMR-14347
ref:a1bac5f5c517228bee7b9412ec7beedbba5b9d43
-rw-r--r-- | ydb/docs/en/core/faq/_includes/common.md | 11 | ||||
-rw-r--r-- | ydb/docs/ru/core/faq/_includes/common.md | 11 |
2 files changed, 0 insertions, 22 deletions
diff --git a/ydb/docs/en/core/faq/_includes/common.md b/ydb/docs/en/core/faq/_includes/common.md index a141adcdc11..f80e16ed010 100644 --- a/ydb/docs/en/core/faq/_includes/common.md +++ b/ydb/docs/en/core/faq/_includes/common.md @@ -67,17 +67,6 @@ To organize paginated output, we recommend selecting data sorted by primary key For more information, see [Paginated output](../../best_practices/paging.md). -#### How do I efficiently upload large amounts of data to {{ ydb-short-name }}? {#batch_upload} - -To increase upload speed for large amounts of data, follow the recommendations below: - -* When creating a table, explicitly specify the required number of partitions or their boundaries. This will help you effectively use system bandwidth as soon as you start uploading data by avoiding unnecessary re-partitioning of the table. -* Don't insert data in separate transactions for each row. It's more efficient to insert multiple rows at once (batch inserts). This reduces the overhead on the transaction mechanism itself. -* In addition to the previous step, within each transaction (batch), insert rows from the primary key-sorted set of data to minimize the number of partitions that the transaction affects. -* Avoid writing data sequentially in ascending or descending order of the primary key value to evenly distribute the load across all table partitions. - -For more detail, see [Uploading large volumes of data](../../best_practices/batch_upload.md). - #### How do I delete expired data? {#ttl} To effectively remove expired data, we recommend using [TTL](../../concepts/ttl.md). diff --git a/ydb/docs/ru/core/faq/_includes/common.md b/ydb/docs/ru/core/faq/_includes/common.md index e8a30ee739d..a702028c8d3 100644 --- a/ydb/docs/ru/core/faq/_includes/common.md +++ b/ydb/docs/ru/core/faq/_includes/common.md @@ -66,17 +66,6 @@ description: "Что такое YDB? Для каких задач стоит и Подробнее читайте в разделе [Постраничный вывод](../../best_practices/paging.md). -#### Как эффективно загружать в {{ ydb-short-name }} большие объемы данных? {#batch_upload} - -Для увеличения скорости загрузки больших объемов данных необходимо следовать следующим рекомендациям: - -* При создании таблицы стоит явно указать необходимое количество партиций или их границы. Это поможет эффективно использовать пропускную способность системы сразу после начала загрузки данных, поскольку поможет избежать ненужных перепартиционирований таблицы. -* Не стоит вставлять данные отдельными транзакциями для каждой строки. Более эффективно производить вставки по несколько строк (батчами). В этом случае накладные расходы на сам механизм транзакций будут меньше. -* В дополнение к предыдущему пункту — в каждой транзакции (батче) вставляйте строки из уже отсортированного по первичному ключу набора данных, чтобы минимизировать количество партиций, затрагиваемых транзакцией. -* Следует избегать последовательной записи данных в порядке возрастания или убывания значения первичного ключа, чтобы равномерно распределить нагрузку на все партиции таблицы. - -Подробнее читайте в разделе [Загрузка больших объемов данных](../../best_practices/batch_upload.md). - #### Как удалять устаревшие данные? {#ttl} Для эффективного удаления устаревших данных рекомендуется использовать [TTL](../../concepts/ttl.md). |