现有数据在 es 中 关键的字段是 nested 结构 一个结构体的数组 例如字段叫 subsidy_data 值是:[{"id":3,"commission":0},{"id":12,"commission":3}] 现在想同步到 doris 中 做一些聚合计算 例如查询 subsidy_data.id=3 的所有数据
doris 目标表是 UNIQUE 类型 doris 版本是 3.0 阿里云的 selected 实例 同步类型是 stream load 批量 同步到 doris 的时候目前可以针对 subsidy_data 这个字段 变成 json 或者 ARRAY<STRUCT<>>
但是目前看 doris 的文档 貌似不能通过函数对“json 数组”或者“ARRAY<STRUCT<>> ” 进行类似 es 的查询
subsidy_data 的字段 可能存在各种变化 例如从长度等于 2 变成等于 0 所以可能更新数据的时候需要删除之前同 ralation_id 的所有数据 再执行插入
无法直接 cdc 同步原始表 因为中间还做了一些其他的逻辑处理 subsidy_data 只是一个示例 实际上还有类似的字段好几个
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.