Hyperloglog

Timescale Cloud：性能、扩展、企业级

自托管产品

MST

Hyperloglog 通常用于查找超大型数据集的基数。如果要查找数据集中唯一值的数量（即基数），处理此查询所需的时间与数据集的大小成正比。因此，如果您想查找仅包含 20 个条目的数据集的基数，计算速度会非常快。但是，查找包含 2000 万个条目的数据集的基数可能需要大量时间和计算资源。

Hyperloglog 不计算数据集的精确基数，而是估算唯一值的数量。它通过将原始数据转换为代表数据集基数的随机数哈希来实现这一点。这不是基数的完美计算，但通常在 2% 的误差范围内。

Hyperloglog 在时序数据上的优势在于，它可以在数据集随时间变化时持续计算其近似基数。它通过在检索新数据时向 hyperloglog 哈希添加条目来实现这一点，而不是在每次需要时都重新计算整个数据集的结果。这使其成为与连续聚合配合使用的理想选择。

有关近似去重计数 API 调用的更多信息，请参阅超函数 API 文档。