现有数据在 es 中 关键的字段是 nested 结构 一个结构体的数组 例如字段叫 subsidy_data 值是:[{"id":3,"commission":0},{"id":12,"commission":3}] 现在想同步到 doris 中 做一些聚合计算 例如查询 subsidy_data.id=3 的所有数据
doris 目标表是 UNIQUE 类型 doris 版本是 3.0 阿里云的 selected 实例 同步类型是 stream load 批量 同步到 doris 的时候目前可以针对 subsidy_data 这个字段 变成 json 或者 ARRAY<STRUCT<>>
但是目前看 doris 的文档 貌似不能通过函数对“json 数组”或者“ARRAY<STRUCT<>> ” 进行类似 es 的查询
subsidy_data 的字段 可能存在各种变化 例如从长度等于 2 变成等于 0 所以可能更新数据的时候需要删除之前同 ralation_id 的所有数据 再执行插入
无法直接 cdc 同步原始表 因为中间还做了一些其他的逻辑处理 subsidy_data 只是一个示例 实际上还有类似的字段好几个