纽约市约有 900 万人口。本教程使用纽约市出租车和豪华轿车委员会 NYC TLC 提供的纽约黄色出租车网络的历史数据。NYC TLC 追踪超过 20 万辆汽车,每天出行约 100 万次。由于几乎所有这些数据都是时间序列数据,因此正确的分析需要专门构建的时间序列数据库,例如 Timescale。
在初学者纽约出租车教程中,您学习了构建查询来查看乘坐了多少次出租车以及何时乘坐。纽约出租车数据集还包含有关每次乘车上车地点的信息。这是地理空间数据,您可以使用名为 PostGIS 的 PostgreSQL 扩展来检查乘车的起始地点。此外,您还可以在 Grafana 中可视化数据,方法是将其覆盖在地图上。
在开始之前,请确保您已拥有
- 注册了免费 Timescale 帐户。
- 可选 如果您想绘制查询图表,请注册一个 Grafana 帐户。
本教程涵盖
- 设置您的数据集:设置并连接到 Timescale 服务,并使用
psql
将数据加载到您的数据库中。 - 查询您的数据集:使用 Timescale 和 PostgreSQL 分析包含纽约市出租车行程数据集,并在 Grafana 中绘制结果。
本教程使用 NYC 出租车数据 向您展示如何构建地理空间时间序列数据的查询。您在本教程中进行的分析类似于公民组织为规划新道路和公共服务而进行的分析。
它首先教您如何设置和连接到 Timescale 数据库,创建表,并使用 psql
将数据加载到表中。如果您已经完成了第一个纽约出租车教程,那么您已经加载了数据集,您可以跳过直接进入查询。
然后,您将学习如何对数据集进行分析和监控。它将引导您使用带有 PostGIS 扩展的 PostgreSQL 查询来获取信息,并在 Grafana 中绘制结果。
关键词
在此页面上发现问题?报告问题 或 在 GitHub 上编辑此页。