Kafka简介(一)

一、入门 1.1 绪论 Kafka是一个分布式流处理平台。为什么? 一个流处理平台有三个关键能力: 发布和订阅流式记录,类似于消息队列或企业级消息系统 以高容错方式存储流记录 ...

1 minute read

ZooKeeper简介

ZooKeeper:一个分布式协调服务 ZooKeeper是一个分布式的,开源的分布式应用协调服务。它公开了一组简单的原语,分布式应用程序可以在这些原语的基础上实现更高级别的服务,以实现同步、...

1 minute read

VerdictDB Universalizing Approximate Query Processing

摘要 近似查询处理学术研究很充裕,工业实践比较少 来自各数据库内部的阻力—-不想改代码! 近似查询的使用将迫使用户抛弃现使用的数据库—-不现实! 因此作者提出一种通用的解决方...

1 minute read

Approximate Query Processing No Silver Bullet

摘要 在这篇论文,我们对近似查询处理的最新技术进行综述。尽管在这一研究领域取得了很多技术进步,但我们尚未看到它对产品和服务的影响。我们讨论了将 近似查询处理集成到数据平台中的两种有希望的途径。...

3 minute read

Online Aggregation and Continuous Query support in MapReduce

一些问题 Online Aggregation 是什么? 在线聚合是一种用于改进处理昂贵分析查询的数据库系统的交互行为的技术。几乎所有数据库操作都以批处理模式执行,即用户发出查询并等待...

1 minute read