clickhouse
clickhouse简介
国产改进
ByConity
简介
- 项目仓库:https://github.com/ByConity/ByConity
- 项目文档:https://byconity.github.io/zh-cn/
- 参考文章:https://zhuanlan.zhihu.com/p/632076596
- 商业版:https://www.volcengine.com/product/bytehouse
- ByConity 是分布式的云原生SQL数仓引擎,擅长交互式查询和即席查询,具有支持多表关联复杂查询、集群扩容无感、离线批数据和实时数据流统一汇总等特点。
核心优势
-
高性能低成本
- 支持在海量数据规模下,通过向量化执行引擎、列式存储和CBO+RBO优化器达成亚秒级查询响应能力。同时超高压缩比率帮助用户节省大量存储空间,降低磁盘成本。
-
多种场景统一支持
- 支持实时数据流和离线批数据写入,具有交互式事物能力和多表关联查询能力,既可以满足线上系统的交互式查询需求,也可以满足后台实时监控、报表大屏等。
-
生态友好
- 兼容ClickHouse大多数接口和工具,支持Kafka、Spark、Flink等多种数据导入,也支持Superset,Tableau等数据可视化工具。
相对clickhouse的改进点
-
架构全新升级
- 1个管理组件
- 3个计算组件
- worker read 读数据
- worker write 写数据
- daemon manager负责后台任务
- 2个存储组件
- hdfs-datanode用来存储数据
- foundationdb用来存储元数据,满足ACID事务型要求
-
存算分离
-
多表join,分布式join相对clickhouse有5倍提升
-
多副本管理
对比文章
- 从使用的角度看 ByConity 和 ClickHouse 的差异:https://zhuanlan.zhihu.com/p/665244505
- ByConity与主流开源OLAP引擎(ClickHouse、Doris、Presto)性能对比分析:https://zhuanlan.zhihu.com/p/633176865
myscaledb
myscaledb简介
- 官方网站:<myscale.com>
- 项目仓库:https://github.com/myscale/MyScaleDB
- 增强文本搜索的SQL向量数据库
- 针对向量搜索进行了 优化 的 ClickHouse 开源分支,并集成了 Tantivy,支持bm25全文搜索
myscaledb核心优势
- 为AI应用而建立: 在单一平台上管理和支持结构化和向量化数据的分析处理。
- 为性能而建立: 先进的OLAP数据库架构,以惊人的速度对向量化数据进行操作。
- 为普遍可访问性而建立: SQL是与MyScale交互所需的唯一编程语言
- MyScale的专有MSTG向量引擎利用NVMe SSD将数据密度提高了10倍
- MyScale在性能和成本效益方面均能超越最专业的向量数据库4到10倍
- 无缝集成了高性能文本搜索功能,使MyScale成为ElasticSearch的高效升级
Databend-新一代云数据+AI分析,Snowflake开源替代
- 项目仓库:https://github.com/datafuselabs/databend
- 仅企业版支持全文检索,集成Tantivy实现
- 支持向量检索