count_min_sketch() 函数
工具包TimescaleDB 工具包函数在 Timescale 社区版下可用。它们自动包含在 Timescale 中,但对于自托管的 TimescaleDB,必须单独安装。点击了解更多。Timescale Cloud:性能、扩展、企业级
自托管产品
MST
简介
使用概率性 count-min sketch
数据结构及其相关算法,计算某个值在列中出现的次数。对于可接受少量错误率的应用,这可以节省大量的 CPU 时间和内存,尤其是在处理大型数据集时。
相关 Hyperfunction 函数组
警告
此函数组包含一些实验性函数。实验性函数在未来的版本中可能会更改或删除。我们不建议在生产环境中使用它们。实验性函数标有“实验性”标签。
聚合
- count_min_sketch
- 实验性将数据聚合成一个
CountMinSketch
对象,用于近似计数
访问器
- approx_count
- 实验性从
CountMinSketch
估算某个值出现的次数
count_min_sketch(values TEXT,error DOUBLE PRECISION,probability DOUBLE PRECISION,) RETURNS CountMinSketch
将数据聚合成一个 CountMinSketch
对象,您可以使用它来估算给定项在列中出现的次数。该 sketch 产生一个有偏的频率估算器。它可能会高估项的计数,但不会低估。
您可以控制相对误差以及估算值超出误差范围的概率。
所需参数
名称 | 类型 | 描述 |
---|---|---|
values | TEXT | 要计数的列值 |
error | DOUBLE PRECISION | 估算中的误差容限,相对于添加到 sketch 中的值数量计算 |
probability | DOUBLE PRECISION | 估算值超出误差范围的概率 |
返回
列 | 类型 | 描述 |
---|---|---|
count_min_sketch | CountMinSketch | 存储计数器表的对象 |
approx_count (item TEXT,agg CountMinSketch) RETURNS INTEGER
估算给定文本值在列中出现的次数。
所需参数
名称 | 类型 | 描述 |
---|---|---|
item | TEXT | 您希望估算出现次数的值 |
agg | CountMinSketch | 使用 count_min_sketch 创建的 CountMinSketch 对象 |
返回
列 | 类型 | 描述 |
---|---|---|
approx_count | INTEGER | 估算 item 在 sketch 中出现的次数 |
示例
给定股票数据表,估算符号 AAPL
出现的次数
WITH t AS (SELECT toolkit_experimental.count_min_sketch(symbol, 0.01, 0.01) AS symbol_sketchFROM crypto_ticks)SELECT toolkit_experimental.approx_count('AAPL', symbol_sketch)FROM t;
关键词
此页面有问题?报告问题 或 在 GitHub 中编辑此页面
。