使用 impala insert, hive insert 后表查询性能出现巨大的差距？ - V2EX

Home Sign Up Sign In

This topic created in 2332 days ago, the information mentioned may be changed or developed.

源数据表是`a` , 目标数据表是`b`, 格式：parquet-snappy

insert sql： `insert owerwrite table b select * from a`

使用 impala 执行 insert sql , 再用 impala 对 b 表查询
使用 hive 执行 insert sql ,再用 impala invalidate metadata/ refresh table, 再用 impala 对 b 表查询

用 impala 查询这两种方式生成的表数据，性能会差别非常大，impala insert的方式比 hive insert性能要好几十倍？？为什么会这样子，同一个表，一模一样的数据

No Comments Yet

insert Impala Hive SQL

About · Help · Advertise · Blog · API · FAQ · Solana · 924 Online Highest 6679 ·

Select Language

创意工作者们的社区

World is powered by solitude

VERSION: 3.9.8.5 · 25ms · UTC 19:43 · PVG 03:43 · LAX 12:43 · JFK 15:43
♥ Do have faith in what you're doing.