Timescale Cloud:性能、扩展、企业级

自托管产品

MST

简介

使用概率性 count-min sketch 数据结构及其相关算法,计算某个值在列中出现的次数。对于可接受少量错误率的应用,这可以节省大量的 CPU 时间和内存,尤其是在处理大型数据集时。

相关 Hyperfunction 函数组
警告

此函数组包含一些实验性函数。实验性函数在未来的版本中可能会更改或删除。我们不建议在生产环境中使用它们。实验性函数标有“实验性”标签。

聚合

count_min_sketch
实验性将数据聚合成一个 CountMinSketch 对象,用于近似计数

访问器

approx_count
实验性CountMinSketch 估算某个值出现的次数
count_min_sketch(
values TEXT,
error DOUBLE PRECISION,
probability DOUBLE PRECISION,
) RETURNS CountMinSketch

将数据聚合成一个 CountMinSketch 对象,您可以使用它来估算给定项在列中出现的次数。该 sketch 产生一个有偏的频率估算器。它可能会高估项的计数,但不会低估。

您可以控制相对误差以及估算值超出误差范围的概率。

所需参数
名称类型描述
valuesTEXT要计数的列值
errorDOUBLE PRECISION估算中的误差容限,相对于添加到 sketch 中的值数量计算
probabilityDOUBLE PRECISION估算值超出误差范围的概率
返回
类型描述
count_min_sketchCountMinSketch存储计数器表的对象
approx_count (
item TEXT,
agg CountMinSketch
) RETURNS INTEGER

估算给定文本值在列中出现的次数。

所需参数
名称类型描述
itemTEXT您希望估算出现次数的值
aggCountMinSketch使用 count_min_sketch 创建的 CountMinSketch 对象
返回
类型描述
approx_countINTEGER估算 item 在 sketch 中出现的次数
示例

给定股票数据表,估算符号 AAPL 出现的次数

WITH t AS (
SELECT toolkit_experimental.count_min_sketch(symbol, 0.01, 0.01) AS symbol_sketch
FROM crypto_ticks
)
SELECT toolkit_experimental.approx_count('AAPL', symbol_sketch)
FROM t;

关键词

此页面有问题?报告问题 或 在 GitHub 中编辑此页面