summaryrefslogtreecommitdiffstats
diff options
context:
space:
mode:
authoramnosov <[email protected]>2022-10-28 18:59:50 +0300
committeramnosov <[email protected]>2022-10-28 18:59:50 +0300
commitecb397a4c1a5e1a3a281940f23c607af2777032f (patch)
treef23aee08a60376faccc72fd3a94da26454733b11
parenta2ebf2fd23270451bdc97599eff54fb5c1cd7596 (diff)
Docs for Unicode::Strip and Unicode::Is{Category}
-rw-r--r--ydb/docs/ru/core/yql/reference/yql-core/udf/list/_includes/unicode.md33
1 files changed, 30 insertions, 3 deletions
diff --git a/ydb/docs/ru/core/yql/reference/yql-core/udf/list/_includes/unicode.md b/ydb/docs/ru/core/yql/reference/yql-core/udf/list/_includes/unicode.md
index 9e172fb8510..c18b0479142 100644
--- a/ydb/docs/ru/core/yql/reference/yql-core/udf/list/_includes/unicode.md
+++ b/ydb/docs/ru/core/yql/reference/yql-core/udf/list/_includes/unicode.md
@@ -86,12 +86,12 @@ select Unicode::RemoveAll("abandon", "an"); -- "bdo"
```
* ```Unicode::ToCodePointList(Utf8{Flags:AutoMap}) -> List<Uint32>```
-
+
Разбить строку на unicode'ую последовательность codepoint'ов.
* ```Unicode::FromCodePointList(List<Uint32>{Flags:AutoMap}) -> Utf8```
Сформировать unicode строку из codepoint'ов.
-
+
```sql
select Unicode::ToCodePointList("Щавель"); -- [1065, 1072, 1074, 1077, 1083, 1100]
select Unicode::FromCodePointList(AsList(99,111,100,101,32,112,111,105,110,116,115,32,99,111,110,118,101,114,116,101,114)); -- "code points converter"
@@ -140,4 +140,31 @@ select Unicode::JoinFromList(["One", "two", "three", "four", "five"], ";"); -- "
select Unicode::ToUint64("77741"); -- 77741
select Unicode::ToUint64("-77741"); -- 18446744073709473875
select Unicode::TryToUint64("asdh831"); -- Null
-``` \ No newline at end of file
+```
+
+* ```Unicode::Strip(string:Utf8{Flags:AutoMap}) -> Utf8```
+
+ Вырезает из строки крайние символы Unicode-категории Space.
+```sql
+select Unicode::Strip("\u200ыкль\u2002"u); -- "ыкль"
+```
+
+* ```Unicode::IsAscii(string:Utf8{Flags:AutoMap}) -> Bool```
+
+ Проверяет, состоит ли utf-8 строка исключительно из символов ascii.
+* ```Unicode::IsSpace(string:Utf8{Flags:AutoMap}) -> Bool```
+* ```Unicode::IsUpper(string:Utf8{Flags:AutoMap}) -> Bool```
+* ```Unicode::IsLower(string:Utf8{Flags:AutoMap}) -> Bool```
+* ```Unicode::IsAlpha(string:Utf8{Flags:AutoMap}) -> Bool```
+* ```Unicode::IsAlnum(string:Utf8{Flags:AutoMap}) -> Bool```
+* ```Unicode::IsHex(string:Utf8{Flags:AutoMap}) -> Bool```
+
+ Проверяют, отвечает ли utf-8 строка указанному условию.
+
+* ```Unicode::IsUnicodeSet(string:Utf8{Flags:AutoMap}, unicode_set:Utf8) -> Bool```
+
+ Проверяет, состоит ли utf-8 строка ```string``` исключительно из символов, указанных в ```unicode_set```. Символы в ```unicode_set``` нужно указывать в квадратных скобках.
+```sql
+select Unicode::IsUnicodeSet("ваоао"u, "[вао]"u); -- true
+select Unicode::IsUnicodeSet("ваоао"u, "[ваб]"u); -- false
+```