简介

对您的数据进行降采样以可视化趋势,同时保留较少的数据点。降采样用高度代表原始数据的一组更小的值替换一组值。这对于图表应用程序特别有用。

警告

此函数组包含一些实验性函数。实验性函数可能会在将来的版本中更改或删除。我们不建议在生产环境中使用它们。实验性函数标记有 **实验性** 标签。

函数

asap_smooth
使用 ASAP 平滑算法对时间序列进行降采样
gp_lttb
实验性使用最大三角形三桶方法对时间序列进行降采样,同时保留原始数据中的间隙
lttb
使用最大三角形三桶方法对时间序列进行降采样
asap_smooth(
ts TIMESTAMPTZ,
value DOUBLE PRECISION,
resolution INT
) RETURNS Timevector

使用 ASAP 平滑算法 对您的数据进行降采样。该算法保留了输入数据的近似形状和较大趋势,同时最大程度地减少了点之间的局部方差。

必需参数
名称类型描述
tsTIMESTAMPTZ每个数据点的 timestamps
valueDOUBLE PRECISION每个 timestamp 的值
resolutionINT要返回的点的近似数量。确定结果图的水平分辨率。
返回值
类型描述
asap_smoothTimevector一个表示从起始时间开始以设定间隔发生的系列值的 object。它可以通过 unnest 解包。有关更多信息,请参阅有关 时间向量 的文档。
示例

此示例使用一个名为 metrics 的表,其中包含 datereading 的列。这些列包含在较长的时间间隔内累积的测量值。此示例采用这些数据并提供约 10 个点的平滑表示,但仍然显示任何异常读数:

SET TIME ZONE 'UTC';
CREATE TABLE metrics(date TIMESTAMPTZ, reading DOUBLE PRECISION);
INSERT INTO metrics
SELECT
'2020-1-1 UTC'::timestamptz + make_interval(hours=>foo),
(5 + 5 * sin(foo / 12.0 * PI()))
FROM generate_series(1,168) foo;
SELECT * FROM unnest(
(SELECT asap_smooth(date, reading, 8)
FROM metrics)
);
time | value
------------------------+---------------------
2020-01-01 01:00:00+00 | 5.3664814565722665
2020-01-01 21:00:00+00 | 5.949469264090644
2020-01-02 17:00:00+00 | 5.582987807518377
2020-01-03 13:00:00+00 | 4.633518543427733
2020-01-04 09:00:00+00 | 4.050530735909357
2020-01-05 05:00:00+00 | 4.417012192481623
2020-01-06 01:00:00+00 | 5.366481456572268
2020-01-06 21:00:00+00 | 5.949469264090643
gp_lttb(
ts TIMESTAMPTZ,
value DOUBLE PRECISION,
resolution INT
[, gapsize INTERVAL]
) RETURNS Timevector

使用 最大三角形三桶算法 对您的数据进行降采样,同时保留基础数据中的间隙。此方法是 LTTB 算法的专门形式。

必需参数
名称类型描述
tsTIMESTAMPTZ每个数据点的 timestamps
valueDOUBLE PRECISION每个 timestamp 的值
resolutionINT要返回的点的近似数量。确定结果图的水平分辨率。
可选参数
名称类型描述
gapsizeINTERVAL分割输入的最小间隙大小
返回值
类型描述
gp_lttbTimevector一个表示从起始时间开始以设定间隔发生的系列值的 object。它可以通过 unnest 解包。有关更多信息,请参阅有关 时间向量 的文档。
示例

此示例使用一个包含作为正弦波生成的原始数据的表,并从数据中间删除一天。您可以使用间隙保留 LTTB 对数据进行降采样,同时保留缺失区域的边界

SET TIME ZONE 'UTC';
CREATE TABLE metrics(date TIMESTAMPTZ, reading DOUBLE PRECISION);
INSERT INTO metrics
SELECT
'2020-1-1 UTC'::timestamptz + make_interval(hours=>foo),
(5 + 5 * sin(foo / 24.0 * PI()))
FROM generate_series(1,168) foo;
DELETE FROM metrics WHERE date BETWEEN '2020-1-4 UTC' AND '2020-1-5 UTC';
SELECT time, value
FROM unnest((
SELECT toolkit_experimental.gp_lttb(date, reading, 8)
FROM metrics))
time | value
-----------------------+-------------------
2020-01-01 01:00:00+00 | 5.652630961100257
2020-01-02 12:00:00+00 | 0
2020-01-03 23:00:00+00 | 5.652630961100255
2020-01-05 01:00:00+00 | 5.652630961100259
2020-01-05 13:00:00+00 | 9.957224306869051
2020-01-06 12:00:00+00 | 0
2020-01-07 10:00:00+00 | 9.82962913144534
2020-01-08 00:00:00+00 | 5.000000000000004
lttb(
ts TIMESTAMPTZ,
value DOUBLE PRECISION,
resolution INT
) RETURNS Timevector

使用 最大三角形三桶算法 对您的数据进行降采样。该算法试图保留降采样数据与原始数据集之间的视觉相似性。

必需参数
名称类型描述
tsTIMESTAMPTZ每个数据点的 timestamps
valueDOUBLE PRECISION每个 timestamp 的值
resolutionINT要返回的点的近似数量。确定结果图的水平分辨率。
返回值
类型描述
lttbTimevector一个表示从起始时间开始以设定间隔发生的系列值的 object。它可以通过 unnest 解包。有关更多信息,请参阅有关 时间向量 的文档。
示例

此示例使用一个包含作为正弦波生成的原始数据的表。您可以使用 LTTB 大幅减少点数,同时仍然捕获数据中的峰值和谷值

SET TIME ZONE 'UTC';
CREATE TABLE metrics(date TIMESTAMPTZ, reading DOUBLE PRECISION);
INSERT INTO metrics
SELECT
'2020-1-1 UTC'::timestamptz + make_interval(hours=>foo),
(5 + 5 * sin(foo / 24.0 * PI()))
FROM generate_series(1,168) foo;
SELECT time, value
FROM unnest((
SELECT lttb(date, reading, 8)
FROM metrics))
time | value
------------------------+---------------------
2020-01-01 01:00:00+00 | 5.652630961100257
2020-01-01 13:00:00+00 | 9.957224306869053
2020-01-02 11:00:00+00 | 0.04277569313094798
2020-01-03 11:00:00+00 | 9.957224306869051
2020-01-04 13:00:00+00 | 0.04277569313094709
2020-01-05 16:00:00+00 | 9.330127018922191
2020-01-06 20:00:00+00 | 2.4999999999999996
2020-01-08 00:00:00+00 | 5.000000000000004

关键字

在此页面上发现问题?报告问题 或 编辑此页面 在 GitHub 上。