如果没理解错的话,Geomesa 用的 XZorder 做时空索引,默认的 XZ-Index Precision 是 12,拿纬度举例也就是 180 除以 12 个 2,大概 0.0439 换算到纬度上索引精度大概是 4km 。
然后我有一个大概 1kmx1km 的时间范围为一个月的范围查询:
query BBOX(geom, -73.92,-73.91,40.762,40.772) AND dtg DURING 2010-01-02T15:05:00+00:00/2010-01-31T15:25:00+00:00
在 HBase 上用了 GeoMesa-tutorial 导入了 NYC Taxi 的数据集执行上面的查询,发现速度比较慢要 10~20s,返回了 354450 条数据,而实际上这个范围内只有 8501 条数据。我想这个可能是和索引精度有关( 4km>1km ),导致会多读很多不在这个范围内的数据,造成速度比较慢。
于是尝试提高索引精度,通过在 createScheme 时设置 geomesa.xz.precision 这个参数(应该是设置成功的,在 HBase 的表中可以看到 GeoMesa 记录了这个信息,其余都是用的默认参数)
SimpleFeatureType sft = ...
sft.getUserData().put("geomesa.xz.precision", 18);
但是查询返回的结果数量还有响应时间都几乎没有变化,按照我的理解,索引精度改变后至少结果数量应该会有比较大的变化,这个情况是哪里没配置对还是 Geomesa 本身的问题?还有 Geomesa 本身是否能比较快的处理上面的这种查询?
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.