ES 中物联网数据获取最新一条,那种写法性能最好?

2021-02-07 13:12:19 +08:00
 tairan2006

目前 schema 设计的是每台设备每天建一个 index,比如 iot_env_info_1_2020.02.07 ,id 是时间戳(@timestamp )。在 index template 里面 alias 所有 info_env_info*为 info_env_info 。

物联网比较常用的查询是显示设备最新一条数据。最简单查询就是按@timestamp对 iot_env_info_1*排倒序,size=1,就完事了。

还有一种写法,是用_cat/indices/info_env_info_1*?format=json&s=index:desc,先看这个设备建立了哪些索引,按名称排倒序,取出第一个。然后对这个特定的索引按时间戳排倒序取出第一条。

理论上后者需要查询的数据更少,但是比较尴尬的是_cat 这个 API 不支持分页,取出的是全量索引,一年 365 天,存个几年之后这个返回数据量还是有点大,费内存…

个人对 es 的排序机制不是很明确,请教一下用第一种写法在数据量大的时候性能下降明显么?不太想做无谓的优化。

4204 次点击
所在节点    Elasticsearch
24 条回复
tairan2006
2021-02-07 13:34:04 +08:00
当然最简单的还是直接缓存设备最新一条数据到 redis 里,这个就不用说了( ̄▽ ̄")
misaka19000
2021-02-07 13:44:55 +08:00
改成按月拆分索引
tairan2006
2021-02-07 13:52:36 +08:00
@misaka19000 这样也行,10 秒采集一次的话,单索引一个月也就 26 万左右,Emmm
misaka19000
2021-02-07 13:53:26 +08:00
@tairan2006 #3 才 26 万数据?那整一个索引得了
misaka19000
2021-02-07 13:53:49 +08:00
一个索引一年也才 300 万数据
luofan004
2021-02-07 13:55:42 +08:00
tairan2006
2021-02-07 13:58:11 +08:00
@misaka19000 拆分还要考虑方便删除旧数据,比如只给用户保留最近半年的数据…毕竟有的项目设备上千个
YouLMAO
2021-02-07 14:00:00 +08:00
物联网,opentsdb
est
2021-02-07 14:08:30 +08:00
看看 routing ?
Morriaty
2021-02-07 14:35:03 +08:00
再弄个 iot_hot 别名指向最近七天(具体时间看业务)不就行了吗,建议看下 es7 之后的 ILM 索引生命周期管理(冷热分离)
tairan2006
2021-02-07 15:55:54 +08:00
@Morriaty 需求是最新一条…有的设备可能好几天没数据(比如过年把设备断电了…)
tairan2006
2021-02-07 16:03:57 +08:00
@est 小厂,就一个副本…靠 routing 提高性能好像不太可行?
est
2021-02-07 16:29:32 +08:00
@tairan2006 看下上面说的那个 ILM 冷热分离。感觉有戏。
tairan2006
2021-02-07 16:58:52 +08:00
@est 这个我研究过 ,感觉最多用个 delete…
Morriaty
2021-02-07 17:26:51 +08:00
@tairan2006 #11 ilm 除了时间策略,还有 doc 数策略,超过多少条才触发 rollover
AS4694lAS4808
2021-02-07 17:37:48 +08:00
改成_cat/indices/info_env_info_1*?h=index&format=json&s=index:desc 这样呢?一年的索引名也就十多 KB
无脑方法,大神请无视
tairan2006
2021-02-07 17:53:33 +08:00
@Morriaty 嗯 物联数据其实还好 大部分采样周期是固定的,用时间没啥问题…
tairan2006
2021-02-07 17:58:21 +08:00
@AS4694lAS4808 我改成按月建 index 了,这样比较均衡。
AS4694lAS4808
2021-02-07 18:10:07 +08:00
@tairan2006 我公司用的 aws 双核 16G 的多个实例,每个索引几亿条 IOT 日志数据,查起来都挺快的。。其实第一种感觉可以放心的用
tairan2006
2021-02-07 18:15:58 +08:00
@AS4694lAS4808 那更好:-D

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/752038

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX