Clickhouse - davidkhala/data-warehouse GitHub Wiki

Against Elasticsearch

  • Elasticsearch 数据量超过千万或者亿级时,若聚合的列数太多,性能也到达瓶颈
  • 不支持深度二次聚合,导致一些复杂的聚合需求,需要人工编写代码在外部实现,这又增加很多开发工作量。
  • 相同点:ClickHouse 与 Elasticsearch 一样,都采用列式存储结构,都支持副本分片
  • 不同点:ClickHouse 独特实现
    • MergeTree 合并树表引擎,提供了数据分区、一级索引、二级索引。
    • Vector Engine 向量引擎,数据不仅仅按列存储,同时还按向量(列的一部分)进行处理,这样可以更加高效地使用 CPU