【转】SparkSQL扩展到自定义数据源之Druid-Spark查询druid

Druid是Apache 下开源的一款存储与计算一体的olap查询引擎,spark则是纯计算引擎。Druid的数据存储在历史节点,通过broker节点查询,整体的查询流程是两阶段的聚合。数据分布在多个历史节点,查询时,第一阶段在各个历史节点并行计算,第二阶段,多个历史节点的数据汇聚到broker节点
posted @ 2022-07-09 15:00  江东邮差  阅读(278)  评论(0编辑  收藏  举报