ClickHouse 数据表导出导入

导出: echo 'select * from hello' | curl ${clickhouse-ip}:8123?database=hello_db -d @- > hello_exported.sql 导入: cat hello_exported.sql |clickhouse-client --query="INSERT INTO hello_db.hello FORMAT Tab

ClickHouse 分布式表数据去重

场景 有一个部署在两台机器上的 ClickHouse 集群,里面有张分布式表。一部分数据存在机器 A 的 Shard 表上,一部分数据在机器 B 的 Shard 表上。访问任意一台机器,都可以看到全量的表数据。(更多细节略过) 这张分布式表里有一些重复数据,想要去重。怎么处理呢? 思路 创建一张临时的分布式表,从原表中查出去重后的数据,插入到临时表中。清空原表数据,然后再从临时表插回原表。 SQL